Google Gemini: IA Integrada na sua Vida Digital

O Google Gemini evoluiu rapidamente de um otimizador de pesquisa na web para um chatbot de IA abrangente, capaz de lidar com uma ampla gama de tarefas. Agora, ele pode processar arquivos, gerar vídeos com som e lidar com problemas complexos, tudo isso se beneficiando do armazenamento em nuvem e da perfeita integração com os aplicativos Google. Desde responder a perguntas sobre páginas do Chrome até gerenciar o Gmail, o Gemini oferece uma experiência de IA unificada. No entanto, suas capacidades de pesquisa de fontes e geração de imagens nem sempre brilham, e como outros chatbots, ele pode, por vezes, fornecer informações imprecisas.

Gemini como Assistente Virtual

Pense no Gemini como um assistente virtual avançado, hábil em lidar com uma variedade de tarefas. Ele pode analisar documentos, responder a perguntas, gerar imagens e vídeos, conduzir pesquisas, auxiliar na escrita criativa, pesquisar na web e resolver problemas matemáticos. Ele está acessível por meio de texto ou voz, semelhante ao Microsoft Copilot ou ChatGPT.

O Gemini também possui funcionalidades adaptadas para codificadores, incluindo o Gemini Code Assist e o agente de codificação assíncrono Jules. Essas ferramentas podem auxiliar em tarefas como a criação de plug-ins WordPress personalizados e a depuração de código.

A Funcionalidade Principal: Prompts e Respostas

Em sua essência, o Gemini recebe prompts do usuário e gera respostas, alimentado por grandes modelos de linguagem (LLMs) treinados em vastos conjuntos de dados. Esses modelos fornecem ao Gemini acesso a uma riqueza de informações em vários tópicos, complementada por pesquisas na internet em tempo real.

Quanto mais os usuários interagem com o Gemini, melhor ele se torna. O envolvimento do usuário ajuda a treinar os modelos subjacentes, permitindo que o Gemini forneça respostas mais precisas e reduza erros ao longo do tempo. Esse processo de aprendizagem contínua é gradual, mas essencial.

As Linhas de Modelo do Gemini: Flash e Pro

O Gemini emprega duas linhas de modelo primárias: Flash e Pro. A linha Flash é projetada para interações conversacionais, enquanto a linha Pro é especializada em tarefas de raciocínio complexas, como codificação, matemática e ciência. Cada modelo nessas linhas exibe pontos fortes únicos. Os modelos mais recentes são o 2.5 Flash e o 2.5 Pro, com testes frequentemente focados no 2.5 Flash padrão e no 2.5 Pro para tarefas especializadas.

Gratuito Versus Premium: O Que Você Ganha?

O Gemini oferece planos gratuitos e premium, com os planos premium desbloqueando funcionalidades adicionais.

Plano Gratuito

Usuários gratuitos têm acesso ao modelo 2.5 Flash, acesso limitado ao modelo 2.5 Pro, modo de voz (Gemini Live), capacidades limitadas de pesquisa profunda e assistentes de IA personalizados (Gems). Eles também recebem acesso limitado à ferramenta de animação Whisk e 15 GB de armazenamento em nuvem do Google Drive.

Planos Premium

Os planos premium incluem o Google AI Pro (US$ 19,99 por mês) e o Google AI Ultra (US$ 249,99 por mês). O nível AI Pro oferece limites de uso mais altos, a ferramenta de filmagem Flow, o Gemini no Google Chrome, a geração de vídeo via modelo Veo 2 do Gemini e uma janela de contexto maior para prompts complexos. O armazenamento em nuvem do Google Drive aumenta para 2 TB com o AI Pro, e o Gemini se integra com aplicativos do Google Workspace como Gmail, Calendar, Docs e Sheets.

O plano AI Ultra inclui tudo no AI Pro, com limites de uso ainda mais altos e várias novas funcionalidades: 30 TB de armazenamento em nuvem do Google Drive, acesso antecipado ao agente de otimização de tarefas do Gemini, acesso exclusivo ao próximo modo 2.5 Pro Deep Think do Gemini, o mais recente modelo de geração de vídeo Veo 3 do Google e YouTube Premium. O plano AI Pro é geralmente mais econômico para a maioria dos usuários. Uma assinatura do Google One, focada no armazenamento em nuvem por meio do Google Drive, permite que você obtenha o Gemini AI Pro com mais de 2 TB de armazenamento em nuvem, como 5 TB (US$ 25 por mês) ou 10 TB (US$ 50 por mês).

Proposta de Valor: Gemini vs. Concorrentes

Os principais chatbots como Copilot, ChatGPT e Gemini têm preços em torno de US$ 20 por mês para seus planos premium. O Gemini e o Copilot se destacam por sua integração com os aplicativos Google e Microsoft 365, respectivamente. O ChatGPT se concentra exclusivamente na funcionalidade do chatbot. Embora o Copilot Pro tenha funcionalidades exclusivas, a integração de armazenamento em nuvem do Gemini oferece um valor excepcional.

Acessibilidade: Web, Mobile e Integrações

O Gemini está acessível via web e aplicativos móveis (Apple e Android). Embora não haja aplicativo desktop ou extensão oficial do navegador, o Chrome oferece uma integração com o Gemini. O Gemini pode ser usado dentro de aplicativos do Google como Calendar, Docs, Drive, Gmail, Maps, Keep, Photos, Sheets e YouTube Music.

Começando: Interface e Experiência do Usuário

O Gemini não requer uma conta, mas fazer login é recomendado para alterar modelos, usar pesquisa profunda e salvar chats.

A interface é simples, apresentando um campo de texto “Pergunte ao Gemini” e chats recentes na barra lateral. Prompts de amostra clicáveis oferecem orientação sobre o que o Gemini pode fazer. As respostas são normalmente rápidas, especialmente para a geração de imagens. Os usuários podem copiar, ouvir, regenerar ou compartilhar respostas. Problemas ocasionais no servidor podem fazer com que as respostas travem, semelhante ao ChatGPT e ao Copilot.

Tom e Memória

O Gemini é mais direto e menos conversacional do que o ChatGPT. Não é possível personalizar o tom do Gemini, mas certas informações do usuário podem ser salvas para o Gemini se lembrar. A memória robusta do Gemini permite experiências de chat mais satisfatórias, lembrando-se de chats passados, mesmo ao iniciar novos.

Modo de Voz: Gemini Live

O ícone do microfone permite a entrada de fala para texto, e o Gemini Live, como o modo de voz do ChatGPT ou o Copilot Voice, permite que os usuários conversem naturalmente com vozes diferentes.

O Gemini Live suporta compartilhamento de câmera e tela, permitindo que os usuários discutam assuntos do mundo real. Embora as capacidades de reconhecimento de imagem do Gemini sejam geralmente competentes, a funcionalidade serve mais como um economizador de tempo.

Project Mariner: Um Agente de Otimização de Tarefas

O Project Mariner, exclusivo para usuários do AI Ultra, é um assistente de IA que completa tarefas como busca de emprego ou busca de apartamento. O Google chama o Project Mariner de "protótipo de pesquisa", o que indica que ele ainda precisa de mais refinamento.

Pesquisa na Web e Recuperação de Informações

A pesquisa na web é uma funcionalidade padrão de todos os chatbots convencionais. O Gemini, o ChatGPT e o Copilot podem responder a perguntas sobre eventos atuais. Embora a maioria das perguntas seja respondida corretamente, algumas podem confundir os chatbots.

As respostas do Gemini e do Copilot são normalmente curtas e diretas, enquanto o ChatGPT fornece informações mais detalhadas. O Gemini e o ChatGPT têm ícones de origem que linkam para artigos conectados, mas a interface do ChatGPT mostra o nome da fonte e o título completo do artigo.

AI Mode e Compras

O AI Mode na página de pesquisa do Google, alimentado pelo Gemini, pode ser acessado por meio de um botão AI Mode. Ele permite que os usuários façam perguntas com base nos resultados da web, com blocos de artigos relacionados e fotos relevantes em respostas semelhantes ao ChatGPT. Ele também fornece acesso conveniente à pesquisa do Google e à pesquisa de imagens.

O Gemini também pode auxiliar nas compras, fornecendo conselhos de compra junto com blocos do Google Shopping com avaliações de usuários, links de varejistas e rastreamento de preços. A funcionalidade de compras do Gemini oferece recomendações relevantes.

Pesquisa Profunda: Relatórios Aprofundados

A pesquisa profunda é uma funcionalidade valiosa dos chatbots de IA, permitindo que os usuários façam perguntas ou sugiram tópicos para o Gemini pesquisar e relatar. Os relatórios podem citar inúmeras fontes e gerar em cerca de 10 minutos.

Ambos os chatbots lidam com tópicos de pesquisa simples com facilidade, mas perguntas sem respostas definitivas e que exigem fontes diversas são mais desafiadoras.

O Gemini cita mais fontes, mas a fonte do ChatGPT é mais amigável para o usuário. O Gemini permite exportar relatórios para o Google Docs, mas a interface de pesquisa profunda do ChatGPT é essencialmente apenas uma barra de carregamento.

O tom do relatório difere significativamente, com os relatórios do Gemini se assemelhando a artigosacadêmicos e os do ChatGPT se assemelhando a postagens em fóruns.

Geração de Imagens: Uma Comparação Visual

A geração de imagens é outra funcionalidade básica dos chatbots de IA. Os testes se concentram em ilustrações fotorrealistas e complexas.

Na geração de imagens fotorrealistas, o Gemini gera imagens rapidamente e visualmente atraentes, embora possa conter erros.

Para ilustrações complexas, o quadrinho do Gemini tende a ser incoerente, enquanto o quadrinho do ChatGPT se aproxima mais do cumprimento de seu objetivo.

Na geração de diagramas técnicos, o ChatGPT produz diagramas altamente precisos, solidificando sua força.

Geração de Vídeo: Um Campo Em Expansão

A geração de vídeo por IA é uma funcionalidade cada vez mais comum. O Gemini tem a ferramenta de cineasta Flow, o modelo de geração de vídeo Veo 3 e o animador Whisk AI. Sua capacidade de gerar vídeos com áudio o diferencia da geração de vídeo Sora do ChatGPT, embora seja exclusivo para assinantes do AI Ultra.

O Veo 3 representa um avanço significativo, mas requer uma calibração cuidadosa do prompt. Cada geração requer 150 créditos (12.500 créditos por mês com o AI Ultra).

O Flow permite aparar clipes de vídeo e estendê-los com base em novos prompts. Com créditos suficientes, um filme poderia ser feito inteiramente com o Flow.

O Whisk, a ferramenta de animação AI do Google, permite que os usuários carreguem fotos. Os resultados podem ser divertidos, mas têm erros e distorções.

Análise de Arquivos: Compreendendo o Conteúdo Carregado

O Gemini pode analisar e entender arquivos carregados, criticando currículos, interpretando imagens ou traduzindo texto.

No reconhecimento de imagem, os chatbots são testados em sua capacidade de identificar componentes em uma imagem carregada. O ChatGPT pode incluir um volume maior de detalhes.

Para o processamento de documentos, os chatbots são encarregados de responder a perguntas com base apenas em documentos carregados. Tanto o Gemini quanto o ChatGPT fornecem respostas corretas, mas cautela é aconselhada ao carregar arquivos. O ChatGPT pode ter uma ligeira vantagem no processamento de arquivos sobre o Gemini, mas é uma margem tênue.

Escrita Criativa: Geração de Poemas

Os chatbots de IA podem auxiliar na escrita criativa, incluindo piadas, monólogos e poemas.

Quando encarregado de escrever um poema de versos livres, o ChatGPT adere mais de perto às instruções. O poema do Gemini não usa pontuação, enquanto o poema do Copilot parece carente com suas quebras de linha.

Raciocínio Complexo: Perguntas de Exame

O raciocínio complexo é testado apresentando aos chatbots perguntas de exame de graduação em ciência da computação, matemática e física.

Os chatbots têm um desempenho muito bom, respondendo efetivamente a todas as perguntas de física. O ChatGPT retorna o menor número de respostas incorretas em geral.

Gemini no Chrome: Integração Perfeita

O Chrome agora integra o Gemini. Os titulares de contas pagas podem clicar no ícone do Gemini para abrir uma janela de chat, interagindo com o Gemini como de costume e consultando o conteúdo da guia ativa. A integração do Gemini no Chrome permite que os usuários eliminem a necessidade de abrir uma nova guia para perguntar algo ao Gemini por meio de funcionalidades semelhantes ao Copilot Vision no Edge, embora a função Live do Gemini não esteja disponível em sua interface da Web.

As respostas de texto são impressionantemente rápidas. A velocidade das respostas me faz pensar se o Gemini tem algum nível de acesso às páginas da web antes de você compartilhá-las com ele.

Embora o Gemini no Chrome tenha algumas limitações; o Gemini não consegue entender vídeos e as respostas com o Live não são tão rápidasquanto são por texto, é geralmente útil, pois elimina a necessidade de copiar e colar. No entanto, a menos que você use o Gemini o tempo todo, o tempo que você economiza por tê-lo a um clique de distância pode não ser grande coisa. A funcionalidade Live é igualmente útil, permitindo-me fazer perguntas sobre o que estou vendo sem precisar tocar em um teclado.

O Gemini no Chrome tem algumas restrições sobre o que pode ver e entender. Como resultado, o Gemini pode parecer invasivo. O Gemini pode ver e responder a perguntas sobre determinadas guias assim que você as compartilha.

Integração com Aplicativos do Google: Produtividade Aprimorada

Os assinantes do plano AI Pro obtêm funcionalidades de IA em aplicativos do Google, incluindo Calendar, Docs, Drive, Gmail, Maps, Keep, Photos, Sheets e YouTube Music.

O Google destaca as integrações no próprio site do Gemini. Você pode adicionar eventos ao Google Calendar com base em um flyer, gerar listas de compras no Google Keep ou deixar o Gemini selecionar playlists no YouTube Music. O Gemini no Docs, Gmail, Sheets e Slides espelha o Copilot nos aplicativos do Microsoft 365, criando slides com base em prompts, redigindo e-mails, gerando texto e sugerindo fórmulas.

O Gemini no Gmail se destaca, concedendo ao Gemini acesso total ao seu histórico de e-mails, permitindo que ele procure informações específicas ou forneça conselhos de limpeza da caixa de entrada. No entanto, não é uma funcionalidade onipotente. O Gemini não pode fazer tudo. Essa integração parece uma invasão de privacidade.

Dependendo do grau em que você utiliza as integrações disponíveis do Gemini; pode não haver aquelas que atendam às suas demandas específicas. No entanto, pode ser benéfico devido à multiplicidade de funcionalidades.

Gems: Especialistas de IA Personalizados

Gems são versões personalizadas do Gemini adaptadas para finalidades específicas. Os instrutores podem adicionar arquivos e criar um Gem de Montador de PC para ajudar construtores de computadores iniciantes.

As respostas são marginalmente diferentes de conversar com o Gemini. Aqueles que planejam conversar com o Gemini sobre um tópico especificado, podem criar um Gem. No entanto, os Gems não parecem realmente cumprir a promessa do Google.

Segurança e Privacidade

O Gemini não é consciente e não pode pensar ou entender coisas como um humano.

Conteúdo adulto, atividades ilegais, imagens realistas de pessoas e assuntos tabus são contra as políticas do Gemini, o Gemini é o mais frouxo com seu sistema de filtragem.

O Gemini tem uma janela de contexto. A janela de contexto do Gemini em seu plano AI Pro pode lidar com até 1.500 páginas de texto ou 30.000 linhas de código de uma vez com pago. Os assinantes podem encontrar obstáculos se a versão gratuita for usada extensivamente.

O Google coleta dados quando você usa o Gemini, incluindo arquivos, informações de localização, uso do produto e chats. Esses dados são usados para melhorar os produtos do Google e as tecnologias de aprendizado de máquina.

Os usuários podem desativar a Atividade de Aplicativos do Gemini. Por padrão, o Google armazena dados de chat por 18 meses.

Quanto às integrações do Google Workspace do Gemini, como no Gmail, Docs, Drive, Sheets e Slides, o Google promete não usar modelos treinados, vendê-los ou usá-los para anúncios direcionados.

O Google já teve problemas no passado, que incluem atores maliciosos que exploraram falhas do Google Chrome, reguladores italianos que citaram o Google por suas práticas de dados e coleta de dados sem consentimento, levando a perdas de bilhões. Como tal, é recomendado não compartilhar dados confidenciais.