Les avancées de Google dans l’IA pour la santé
Google a récemment dévoilé une série de mises à jour de Health AI lors de son événement annuel ‘The Check Up’, démontrant l’engagement de l’entreprise à exploiter l’IA pour diverses applications de soins de santé. Ces mises à jour vont de l’amélioration des requêtes liées à la santé dans la recherche Google à l’introduction de nouveaux modèles d’IA ‘ouverts’ conçus pour stimuler l’efficacité de la découverte de médicaments assistée par l’IA.
Amélioration de l’accès à l’information sur la santé via la recherche Google
Google déploie l’IA et des systèmes sophistiqués de qualité et de classement pour élargir la portée des réponses du ‘panneau de connaissances’ pour un large éventail de sujets liés à la santé. Cette expansion comprend l’ajout de la prise en charge des requêtes de soins de santé dans plusieurs langues, telles que l’espagnol, le portugais et le japonais, initialement sur les plateformes mobiles. Alors que la recherche fournissait déjà des réponses du panneau de connaissances pour des problèmes de santé courants comme la grippe ou le rhume, cette mise à jour élargit considérablement l’éventail des sujets couverts par ces panneaux.
Au-delà de cela, Google introduit une nouvelle fonctionnalité dans la recherche appelée ‘What People Suggest’. Cette fonctionnalité est conçue pour présenter aux utilisateurs des informations provenant de personnes ayant partagé des expériences médicales similaires. Cet ajout offre une voie unique aux utilisateurs pour obtenir des informations. Il permet aux utilisateurs de découvrir rapidement des perspectives authentiques d’autres personnes atteintes de la même condition, avec des liens pour une exploration plus approfondie. ‘What People Suggest’ est actuellement accessible sur les appareils mobiles aux États-Unis.
Rationalisation des dossiers médicaux avec de nouvelles API
Google a également lancé à l’échelle mondiale de nouvelles interfaces de programmation d’applications (API) de dossiers médicaux pour sa plateforme Health Connect, compatibles avec les appareils Android. Ces API permettent aux applications de lire et d’écrire des données de dossiers médicaux, y compris les allergies, les médicaments, les vaccinations et les résultats de laboratoire, le tout au format FHIR standardisé. Ces améliorations portent la prise en charge de Health Connect à plus de 50 types de données, couvrant l’activité, le sommeil, la nutrition, les signes vitaux et désormais les dossiers médicaux. Cette intégration facilite une connexion transparente entre les données de santé quotidiennes des utilisateurs et les informations de leurs prestataires de soins de santé.
Le co-scientifique IA : un partenaire de recherche virtuel
Une innovation révolutionnaire de Google est le ‘co-scientifique IA’, un nouveau système soutenu par Gemini 2.0. Ce système est envisagé comme un ‘collaborateur scientifique virtuel’ pour les chercheurs et les scientifiques. Le co-scientifique IA est conçu pour aider les chercheurs à naviguer dans une vaste littérature scientifique, facilitant ainsi la génération de nouvelles hypothèses. En aidant à l’analyse de vastes ensembles de données et d’articles de recherche complexes, le co-scientifique IA vise à permettre aux experts de découvrir de nouvelles idées et d’accélérer leurs efforts de recherche. Google collabore activement avec des institutions telles que l’Imperial College London, Houston Methodist et l’Université de Stanford pour explorer les applications pratiques de cet outil et a l’intention de lancer un programme de testeurs de confiance.
TxGemma : Accélérer la découverte de médicaments
Google a également présenté TxGemma, une compilation de modèles ouverts basés sur Gemma destinés à améliorer l’efficacité de la découverte de médicaments pilotée par l’IA. TxGemma possède la capacité de comprendre à la fois le texte standard et les structures de diverses entités thérapeutiques, y compris les petites molécules, les produits chimiques et les protéines. La sortie de TxGemma est prévue pour un avenir proche.
Outil d’IA Capricorn : Faire progresser l’oncologie pédiatrique
En collaboration avec le Princess Maxima Center for Pediatric Oncology aux Pays-Bas, Google a développé un outil d’IA nommé Capricorn. Cet outil souligne l’engagement de Google à appliquer l’IA à des domaines médicaux spécialisés, en particulier en oncologie pédiatrique.
L’impact plus large de l’IA sur les soins de santé
Google a précédemment souligné l’influence positive de l’IA sur les résultats de santé mondiaux. L’entreprise a développé des modèles d’IA pour aider à la détection de maladies telles que le cancer du sein, le cancer du poumon et la rétinopathie diabétique. En mai 2024, Google a annoncé Med-Gemini, une famille de modèles Gemini affinés pour les applications médicales multimodales. De plus, en juin 2024, Google a présenté le Personal Health Large Language Model pour les appareils mobiles et portables. Cette version affinée de Gemini est conçue pour interpréter les données des capteurs et fournir des informations et des recommandations personnalisées concernant le sommeil et les habitudes de remise en forme d’un individu.
L’acquisition de Hotshot par xAI : une entrée dans la vidéo générative par IA
L’entreprise d’IA d’Elon Musk, xAI, a acquis Hotshot, une startup spécialisée dans les outils de génération de vidéos alimentés par l’IA. Cette acquisition positionne xAI pour rivaliser avec Sora d’OpenAI, une plateforme leader dans l’espace vidéo génératif de l’IA. Hotshot a annoncé sur son site Web qu’il avait commencé à supprimer progressivement la création de nouvelles vidéos le 14 mars, les clients existants ayant jusqu’au 30 mars pour télécharger leurs vidéos créées.
Grok 3 : le chatbot IA ambitieux de xAI
Le 19 février, xAI a dévoilé Grok 3, la dernière itération de son chatbot, qu’Elon Musk a proclamé comme ‘l’IA la plus intelligente sur Terre’. Par la suite, la société a annoncé la sortie bêta de deux modèles de raisonnement, Grok 3 (Think) et Grok 3 Mini (Think). xAI a déclaré que Grok 3, entraîné sur son supercluster Colossus avec une puissance de calcul dix fois supérieure à celle des modèles de pointe précédents, présente des améliorations substantielles dans les tâches de raisonnement, de mathématiques, de codage, de connaissance du monde et de suivi des instructions.
Mistral Small 3.1 de Mistral AI : Compact et puissant
La startup française d’IA Mistral AI a présenté un nouveau modèle open-source le 17 mars, nommé Mistral Small 3.1. La société affirme que ce modèle surpasse les modèles comparables comme Gemma 3 de Google et GPT-4o Mini d’OpenAI, intensifiant ainsi la concurrence sur un marché largement dominé par les géants technologiques américains.
Mistral Small 3.1 traite à la fois du texte et des images avec 24 milliards de paramètres – une taille considérablement plus petite par rapport aux principaux modèles propriétaires – tout en égalant ou dépassant leurs performances. Mistral AI a souligné que Mistral Small 3.1 est le premier modèle open-source à non seulement atteindre, mais aussi dépasser les performances des principaux petits modèles propriétaires dans diverses dimensions.
S’appuyant sur Mistral Small 3, ce nouveau modèle offre des performances de texte améliorées, une compréhension multimodale et une fenêtre contextuelle étendue jusqu’à 128 000 jetons. Mistral AI affirme que le modèle traite les informations à une vitesse de 150 jetons par seconde, ce qui le rend adapté aux applications exigeant des temps de réponse rapides.
Polyvalence et accessibilité de Mistral Small 3.1
Mistral Small 3.1 est conçu pour fonctionner sur du matériel aussi accessible qu’un seul RTX 4090 ou un Mac avec 32 Go de RAM, ce qui le rend parfaitement adapté aux applications sur appareil. Le modèle peut être affiné pour des domaines spécialisés, permettant la création d’experts en la matière très précis, particulièrement utiles dans des domaines tels que les conseils juridiques, les diagnostics médicaux et le support technique.
Le nouveau modèle est adapté à un large éventail d’applications d’entreprise et grand public nécessitant une compréhension multimodale. Les cas d’utilisation potentiels incluent la vérification de documents, les diagnostics, le traitement d’images sur appareil, les inspections visuelles pour le contrôle qualité, la détection d’objets dans les systèmes de sécurité, le support client basé sur l’image et l’assistance générale.
Mistral OCR : Compréhension avancée des documents
Plus tôt en mars, Mistral AI a annoncé Mistral OCR, que la société présente comme ‘la meilleure API de compréhension de documents au monde’. Mistral OCR est une API de reconnaissance optique de caractères (OCR) capable d’extraire du texte, des tableaux, des équations et des images à partir de documents complexes. Mistral AI pense que cette technologie va révolutionner la façon dont les organisations traitent et utilisent de vastes référentiels d’informations.
Selon l’entreprise, Mistral OCR traite jusqu’à 2000 pages par minute, prend en charge les capacités multilingues et multimodales et fournit des sorties structurées comme JSON pour une intégration transparente dans les flux de travail de l’IA. Des tests internes indiquent que Mistral OCR est en tête du marché en matière de précision d’extraction de texte, en particulier pour les documents numérisés, le contenu mathématique et le texte multilingue. Contrairement aux solutions OCR traditionnelles, il extrait également les images intégrées, ce qui le rend idéal pour la recherche scientifique, les dépôts réglementaires et la numérisation de documents historiques.
Mistral AI rapporte que l’OCR aide déjà les entreprises et les instituts de recherche à numériser la littérature, à rationaliser le service client et à préserver les archives historiques. De plus, l’OCR aide les entreprises à convertir la littérature technique, les dessins techniques, les notes de cours, les présentations, les dépôts réglementaires, etc. en formats indexés et prêts à répondre. Les capacités de Mistral OCR sont disponibles pour un essai gratuit sur le Chat, et l’entreprise prévoit d’autres améliorations du modèle dans les semaines à venir. Ces développements continus reflètent la nature dynamique de l’IA et son potentiel à remodeler diverses industries.