IA: Saúde Google, xAI e Mistral

O mundo da Inteligência Artificial está em constante fluxo, com avanços e movimentos estratégicos moldando o futuro de vários setores. Vamos mergulhar em alguns dos desenvolvimentos mais recentes e impactantes, focando nos avanços do Google em IA para saúde, na aquisição de uma startup de vídeo de IA generativa pela xAI e no lançamento de um modelo de IA poderoso, porém compacto, pela Mistral AI.

Avanços do Google em IA para Saúde

O Google revelou recentemente um conjunto de atualizações de Health AI em seu evento anual ‘The Check Up’, mostrando o compromisso da empresa em alavancar a IA para diversas aplicações de saúde. Essas atualizações abrangem desde a melhoria de consultas relacionadas à saúde no Google Search até a introdução de novos modelos de IA ‘abertos’ projetados para aumentar a eficiência da descoberta de medicamentos com tecnologia de IA.

O Google está implantando IA e sistemas sofisticados de qualidade e classificação para ampliar o escopo das respostas do ‘painel de conhecimento’ para uma ampla gama de tópicos relacionados à saúde. Essa expansão inclui a adição de suporte para consultas de saúde em vários idiomas, como espanhol, português e japonês, inicialmente em plataformas móveis. Embora a Pesquisa já fornecesse respostas do painel de conhecimento para problemas de saúde prevalentes, como influenza ou resfriado comum, esta atualização aumenta significativamente a variedade de tópicos que esses painéis abrangem.

Além disso, o Google apresenta um novo recurso na Pesquisa chamado ‘What People Suggest’ (‘O que as pessoas sugerem’). Este recurso foi projetado para apresentar aos usuários informações derivadas de indivíduos que compartilharam experiências médicas semelhantes. Essa adição oferece um caminho único para os usuários obterem insights. Ele permite que os usuários descubram rapidamente perspectivas autênticas de outras pessoas com a mesma condição, completo com links para exploração adicional. ‘What People Suggest’ está atualmente acessível em dispositivos móveis nos Estados Unidos.

Simplificando Registros Médicos com Novas APIs

O Google também lançou globalmente novas interfaces de programação de aplicativos (APIs) de registros médicos para sua plataforma Health Connect, compatível com dispositivos Android. Essas APIs capacitam os aplicativos a ler e gravar dados de registros médicos, abrangendo alergias, medicamentos, imunizações e resultados de laboratório, todos no formato FHIR padronizado. Esses aprimoramentos trazem o suporte do Health Connect para mais de 50 tipos de dados, abrangendo atividade, sono, nutrição, sinais vitais e, agora, registros médicos. Essa integração facilita uma conexão perfeita entre os dados de saúde diários dos usuários e as informações de seus provedores de saúde.

O Co-Cientista de IA: Um Parceiro de Pesquisa Virtual

Uma inovação revolucionária do Google é o ‘co-cientista de IA’, um novo sistema sustentado pelo Gemini 2.0. Este sistema é concebido como um ‘colaborador científico virtual’ para pesquisadores e cientistas. O co-cientista de IA é projetado para auxiliar os pesquisadores na navegação em extensa literatura científica, facilitando assim a geração de novas hipóteses. Ao auxiliar na análise de vastos conjuntos de dados e artigos de pesquisa complexos, o co-cientista de IA visa capacitar os especialistas a descobrir novas ideias e acelerar seus esforços de pesquisa. O Google está colaborando ativamente com instituições como o Imperial College London, Houston Methodist e a Stanford University para explorar as aplicações práticas desta ferramenta e pretende iniciar um programa de testadores confiáveis.

TxGemma: Acelerando a Descoberta de Medicamentos

O Google também apresentou o TxGemma, uma compilação de modelos abertos baseados em Gemma destinados a aumentar a eficiência da descoberta de medicamentos orientada por IA. O TxGemma possui a capacidade de compreender tanto o texto padrão quanto as estruturas de várias entidades terapêuticas, incluindo pequenas moléculas, produtos químicos e proteínas. O lançamento do TxGemma está previsto para breve.

Ferramenta de IA Capricorn: Avançando na Oncologia Pediátrica

Em colaboração com o Princess Maxima Center for Pediatric Oncology na Holanda, o Google tem desenvolvido uma ferramenta de IA chamada Capricorn. Esta ferramenta ressalta a dedicação do Google em aplicar a IA a campos médicos especializados, particularmente em oncologia pediátrica.

Impacto Mais Amplo da IA na Saúde

O Google destacou anteriormente a influência positiva da IA nos resultados de saúde globais. A empresa desenvolveu modelos de IA para auxiliar na detecção de doenças como câncer de mama, câncer de pulmão e retinopatia diabética. Em maio de 2024, o Google anunciou o Med-Gemini, uma família de modelos Gemini ajustados para aplicações médicas multimodais. Além disso, em junho de 2024, o Google apresentou o Personal Health Large Language Model para dispositivos móveis e vestíveis. Esta versão ajustada do Gemini é projetada para interpretar dados de sensores e fornecer insights e recomendações personalizadas sobre os padrões de sono e condicionamento físico de um indivíduo.

Aquisição da Hotshot pela xAI: Um Movimento para Vídeo de IA Generativa

A empresa de IA de Elon Musk, xAI, adquiriu a Hotshot, uma startup especializada em ferramentas de geração de vídeo com tecnologia de IA. Esta aquisição posiciona a xAI para competir com o Sora da OpenAI, uma plataforma líder no espaço de vídeo de IA generativa. A Hotshot anunciou em seu site que começou a eliminar gradualmente a criação de novos vídeos em 14 de março, com os clientes existentes tendo até 30 de março para baixar seus vídeos criados.

Grok 3: O Ambicioso Chatbot de IA da xAI

Em 19 de fevereiro, a xAI revelou o Grok 3, a mais recente iteração de seu chatbot, que Elon Musk proclamou como ‘a IA mais inteligente da Terra’. Posteriormente, a empresa anunciou o lançamento beta de dois modelos de raciocínio, Grok 3 (Think) e Grok 3 Mini (Think). A xAI afirmou que o Grok 3, treinado em seu supercluster Colossus com dez vezes o poder computacional dos modelos de ponta anteriores, exibe melhorias substanciais em tarefas de raciocínio, matemática, codificação, conhecimento do mundo e seguimento de instruções.

Mistral Small 3.1 da Mistral AI: Compacto e Poderoso

A startup francesa de IA Mistral AI apresentou um novo modelo de código aberto em 17 de março, chamado Mistral Small 3.1. A empresa afirma que este modelo supera modelos comparáveis como o Gemma 3 do Google e o GPT-4o Mini da OpenAI, intensificando assim a competição em um mercado amplamente dominado por gigantes da tecnologia dos EUA.

O Mistral Small 3.1 processa texto e imagens com 24 bilhões de parâmetros – um tamanho significativamente menor em comparação com os principais modelos proprietários – enquanto iguala ou excede seu desempenho. A Mistral AI enfatizou que o Mistral Small 3.1 é o primeiro modelo de código aberto a não apenas atender, mas superar o desempenho dos principais modelos proprietários pequenos em várias dimensões.

Com base no Mistral Small 3, este novo modelo apresenta desempenho de texto aprimorado, compreensão multimodal e uma janela de contexto expandida de até 128.000 tokens. A Mistral AI afirma que o modelo processa informações a velocidades de 150 tokens por segundo, tornando-o adequado para aplicações que exigem tempos de resposta rápidos.

Versatilidade e Acessibilidade do Mistral Small 3.1

O Mistral Small 3.1 é projetado para rodar em hardware tão acessível quanto uma única RTX 4090 ou um Mac com 32 GB de RAM, tornando-o altamente adequado para aplicações em dispositivos. O modelo pode ser ajustado para domínios especializados, permitindo a criação de especialistas em assuntos altamente precisos, particularmente útil em áreas como aconselhamento jurídico, diagnóstico médico e suporte técnico.

O novo modelo é adaptado para um amplo espectro de aplicações empresariais e de consumo que exigem compreensão multimodal. Os casos de uso potenciais incluem verificação de documentos, diagnóstico, processamento de imagem no dispositivo, inspeções visuais para controle de qualidade, detecção de objetos em sistemas de segurança, suporte ao cliente baseado em imagem e assistência de propósito geral.

Mistral OCR: Compreensão Avançada de Documentos

No início de março, a Mistral AI anunciou o Mistral OCR, que a empresa apresenta como a ‘Melhor API de compreensão de documentos do mundo’. O Mistral OCR é uma API de Reconhecimento Óptico de Caracteres (OCR) capaz de extrair texto, tabelas, equações e imagens de documentos complexos. A Mistral AI acredita que essa tecnologia revolucionará a forma como as organizações processam e utilizam vastos repositórios de informações.

De acordo com a empresa, o Mistral OCR processa até 2.000 páginas por minuto, suporta capacidades multilíngues e multimodais e oferece saídas estruturadas como JSON para integração perfeita em fluxos de trabalho de IA. Testes internos indicam que o Mistral OCR lidera o mercado em precisão de extração de texto, especialmente para documentos digitalizados, conteúdo matemático e texto multilíngue. Ao contrário das soluções OCR tradicionais, ele também extrai imagens incorporadas, tornando-o ideal para pesquisa científica, registros regulatórios e digitalização de documentos históricos.

A Mistral AI relata que o OCR já está auxiliando empresas e instituições de pesquisa na digitalização de literatura, simplificação do atendimento ao cliente e preservação de arquivos históricos. Além disso, o OCR está ajudando as empresas a converter literatura técnica, desenhos de engenharia, notas de aula, apresentações, registros regulatórios e muito mais em formatos indexados e prontos para resposta. Os recursos do Mistral OCR estão disponíveis para teste gratuito no le Chat, e a empresa antecipa novas melhorias no modelo nas próximas semanas. Esses desenvolvimentos contínuos refletem a natureza dinâmica da IA e seu potencial para remodelar diversos setores.