Le paysage des grands modèles linguistiques (LLM) a connu une transformation significative, Google émergeant comme un acteur de premier plan tandis que Meta et OpenAI font face à des défis notables. Initialement, OpenAI dominait le domaine avec ses modèles GPT révolutionnaires, établissant de nouvelles références en matière de performances LLM. Meta a également assuré une position substantielle en offrant des modèles open-weight qui se vantaient de capacités impressionnantes et permettaient une utilisation, une modification et un déploiement sans restriction de leur code accessible au public.
Cependant, cette domination précoce a laissé d’autres géants de la technologie, dont Google, à la traîne. Malgré l’article de recherche crucial de Google en 2017 sur l’architecture de transformateur qui sous-tend les LLM, les efforts initiaux de l’entreprise ont été éclipsés par le lancement largement critiqué de Bard en 2023.
Récemment, les marées se sont inversées avec l’introduction de nouveaux LLM puissants de Google, associée aux revers rencontrés par Meta et OpenAI. Ce changement a considérablement modifié la dynamique du paysage LLM.
Llama 4 de Meta : Un faux pas ?
La sortie inattendue de Llama 4 par Meta le samedi 5 avril a soulevé des questions dans l’industrie.
La décision de lancer un modèle majeur un week-end a été perçue comme non conventionnelle, conduisant à un accueil modéré et obscurcissant l’annonce au milieu du flux d’actualités de la semaine suivante.
Bien que Llama 4 possède certains atouts, notamment ses capacités multimodales (gestion des images, de l’audio et d’autres modalités) et sa disponibilité en trois versions (Llama 4 Behemoth, Maverick et Scout) avec des tailles et des forces variables, son déploiement a été accueilli par des critiques. La version Llama 4 Scout, en particulier, comportait une fenêtre de contexte substantielle allant jusqu’à 10 millions de jetons, permettant au modèle de traiter et de générer de grandes quantités de texte en une seule session.
Cependant, la réception du modèle s’est aigrie lorsque des divergences sont apparues concernant l’approche de classement de Meta sur LMArena, une plateforme qui classe les LLM en fonction des votes des utilisateurs. Il a été découvert que le modèle Llama 4 spécifique utilisé pour les classements différait de celui mis à la disposition du grand public. LMArena a déclaré que Meta avait fourni ‘un modèle personnalisé pour optimiser la préférence humaine’.
De plus, les affirmations de Meta concernant la fenêtre de contexte de 10 millions de jetons de Llama 4 Scout ont été accueillies avec scepticisme. Malgré l’exactitude technique de ce chiffre, des benchmarks ont révélé que Llama 4 était à la traîne par rapport aux modèles concurrents en termes de performances de contexte long.
Ajoutant aux préoccupations, Meta s’est abstenu de publier un modèle de ‘raisonnement’ ou de ‘pensée’ Llama 4 et a retenu des variantes plus petites, bien que l’entreprise ait indiqué qu’un modèle de raisonnement était à venir.
Ben Lorica, fondateur de la société de conseil en IA Gradient Flow, a noté que Meta s’était écarté de la pratique standard d’une publication plus systématique, où tous les composants sont entièrement préparés. Cela suggère que Meta était peut-être impatient de présenter un nouveau modèle, même s’il lui manquait des éléments essentiels tels qu’un modèle de raisonnement et des versions plus petites.
GPT-4.5 d’OpenAI : Une retraite prématurée
OpenAI a également été confronté à des défis ces derniers mois.
GPT-4.5, dévoilé comme un aperçu de recherche le 27 février, a été présenté comme le ‘modèle le plus grand et le meilleur de l’entreprise pour le chat jusqu’à présent’. Les benchmarks d’OpenAI ont indiqué que GPT-4.5 surpassait généralement son prédécesseur, GPT-4o.
Cependant, la structure de prix du modèle a suscité des critiques. OpenAI a fixé le prix d’accès à l’API à 150 $ US par million de jetons de sortie, une augmentation stupéfiante de 15 fois par rapport au prix de GPT-4o de 10 $ par million de jetons. L’API permet aux développeurs d’intégrer les modèles OpenAI dans leurs applications et services.
Alan D. Thompson, consultant et analyste en IA chez Life Architect, a estimé que GPT-4.5 était probablement le plus grand LLM traditionnel publié au cours du premier trimestre de 2025, avec environ 5,4 billions de paramètres. Il a soutenu qu’une telle échelle immense est difficile à justifier compte tenu des limitations matérielles actuelles et pose des défis importants pour servir une large base d’utilisateurs.
Le 14 avril, OpenAI a annoncé sa décision d’interrompre l’accès à GPT-4.5 via l’API après moins de trois mois. Bien que GPT-4.5 reste accessible, il sera limité aux utilisateurs de ChatGPT via l’interface ChatGPT.
Cette annonce a coïncidé avec l’introduction de GPT-4.1, un modèle plus économique au prix de 8 $ par million de jetons. Les benchmarks d’OpenAI indiquent que GPT-4.1 n’est pas tout à fait aussi performant que GPT-4.5 dans l’ensemble, bien qu’il affiche des performances supérieures dans certains benchmarks de codage.
OpenAI a également récemment publié de nouveaux modèles de raisonnement, o3 et o4-mini, le modèle o3 démontrant des performances de référence particulièrement solides. Cependant, le coût reste une préoccupation, car l’accès à l’API à o3 est au prix de 40 $ par million de jetons de sortie.
L’ascendance de Google : Saisir l’opportunité
La réception mitigée de Llama 4 et ChatGPT-4.5 a créé une ouverture pour les concurrents à exploiter, et ils ont saisi l’opportunité.
Le lancement difficile de Llama 4 par Meta est peu susceptible de dissuader les développeurs d’adopter des alternatives telles que DeepSeek-V3, Gemma de Google et Qwen2.5 d’Alibaba. Ces LLM, introduits fin 2024, sont devenus les modèles open-weight préférés sur les classements LMArena et HuggingFace. Ils rivalisent ou surpassent Llama 4 dans les benchmarks populaires, offrent un accès API abordable et, dans certains cas, sont disponibles en téléchargement et en utilisation sur du matériel grand public.
Cependant, c’est le LLM de pointe de Google, Gemini 2.5 Pro, qui a vraiment capté l’attention.
Lancé le 25 mars, Google Gemini 2.5 Pro est un ‘modèle de pensée’ semblable à GPT-o1 et DeepSeek-R1, utilisant l’auto-prompting pour raisonner à travers les tâches. Gemini 2.5 Pro est multimodal, dispose d’une fenêtre de contexte d’un million de jetons et prend en charge la recherche approfondie.
Gemini 2.5 a rapidement remporté des victoires en matière de benchmarks, notamment la première place sur SimpleBench (bien qu’il ait cédé cette position à o3 d’OpenAI le 16 avril) et sur l’indice combiné d’intelligence artificielle d’Artificial Analysis. Gemini 2.5 Pro occupe actuellement la première position sur LMArena. Au 14 avril, les modèles Google occupaient 5 des 10 premières places sur LMArena, notamment Gemini 2.5 Pro, trois variantes de Gemini 2.0 et Gemma 3-27B.
Au-delà de ses performances impressionnantes, Google est également un chef de file en matière de prix. Google Gemini 2.5 est actuellement disponible gratuitement via l’application Gemini de Google et le site Web AI Studio de Google. La tarification API de Google est également compétitive, avec Gemini 2.5 Pro au prix de 10 $ par million de jetons de sortie et Gemini 2.0 Flash au prix de seulement 40 cents par million de jetons.
Lorica note que pour les tâches de raisonnement à volume élevé, il opte souvent pour DeepSeek-R1 ou Google Gemini, tandis que l’utilisation des modèles OpenAI nécessite un examen plus attentif des prix.
Bien que Meta et OpenAI ne soient pas nécessairement au bord de l’effondrement, OpenAI bénéficie de la popularité de ChatGPT, qui compterait un milliard d’utilisateurs. Néanmoins, les classements solides et les performances de référence de Gemini indiquent un changement dans le paysage LLM, qui favorise actuellement Google.
Le succès croissant de Google dans le domaine des LLM n’est pas seulement une question de prouesses technologiques, mais aussi d’une approche stratégique qui englobe la performance, l’accessibilité et la tarification. Alors que Meta et OpenAI ont rencontré des obstacles dans leurs efforts respectifs, Google a su saisir l’opportunité et s’imposer comme un leader de l’industrie.
L’avenir des LLM est incertain, mais il est clair que la concurrence s’intensifie et que les utilisateurs auront de plus en plus de choix à leur disposition. Google, avec son Gemini 2.5 Pro et ses autres modèles innovants, est bien placé pour continuer à jouer un rôle de premier plan dans ce domaine en constante évolution.
Il est important de noter que le paysage des LLM est en constante évolution, et de nouveaux modèles et technologies émergent régulièrement. Les performances et la tarification des différents modèles peuvent varier en fonction de la tâche à accomplir et des exigences spécifiques de l’utilisateur. Il est donc essentiel de rester informé des dernières tendances et de choisir le modèle qui convient le mieux à ses besoins.
En outre, il est important de tenir compte des implications éthiques et sociales de l’utilisation des LLM. Ces modèles peuvent être utilisés à des fins néfastes, telles que la diffusion de fausses informations ou la manipulation de l’opinion publique. Il est donc crucial de développer et d’utiliser ces technologies de manière responsable et éthique.
En conclusion, l’ascension de Google dans le domaine des LLM témoigne de la puissance de l’innovation et de la stratégie. Alors que Meta et OpenAI rencontrent des défis, Google a su saisir l’opportunité et s’imposer comme un leader de l’industrie. L’avenir des LLM est incertain, mais il est clair que la concurrence s’intensifie et que les utilisateurs auront de plus en plus de choix à leur disposition. Il est donc essentiel de rester informé des dernières tendances et de choisir le modèle qui convient le mieux à ses besoins, tout en tenant compte des implications éthiques et sociales de l’utilisation de ces technologies.