Baidu lance de nouveaux modèles d'IA

Ernie 4.5 : Un mastodonte multimodal

Ernie 4.5, avec ses vastes capacités multimodales englobant les images, l’audio et la vidéo, a démontré des performances supérieures à celles du GPT-4o d’OpenAI. Cette performance supérieure a été observée sur une série de plateformes de référence, notamment les notables CCBench et OCRBench, comme détaillé dans un communiqué publié par Baidu sur la plateforme WeChat. De plus, la société affirme que les capacités de traitement de texte du modèle fondamental Ernie 4.5 dépassent non seulement celles de DeepSeek V3, mais atteignent également un niveau de performance à peu près comparable à celui du GPT-4.5 d’OpenAI, sur la base d’une série d’évaluations de référence.

Le rôle pionnier de Baidu et la montée de la concurrence

Baidu détient la distinction d’être la première grande entreprise technologique chinoise à introduire un LLM en Chine. Cette initiative pionnière a eu lieu en mars 2023, surfant sur la vague d’enthousiasme générée par le lancement de ChatGPT d’OpenAI. Cependant, l’avantage initial de Baidu a été de plus en plus contesté par d’autres acteurs émergents de l’IA en Chine au cours des deux dernières années. La récente manœuvre stratégique du géant de la recherche pour renforcer sa position sur le marché chinois de l’IA intervient à un moment où DeepSeek a déclenché une tendance open-source. Simultanément, des géants de l’industrie comme Alibaba, Tencent et ByteDance courtisent agressivement les entreprises et les consommateurs pour leurs modèles d’IA respectifs.

Ernie X1 : Performances et tarification

Bien que Baidu n’ait pas divulgué les résultats de référence spécifiques pour son modèle de raisonnement nouvellement introduit, Ernie X1, la société a déclaré qu’il “offre des performances comparables à celles de DeepSeek R1 à seulement la moitié du prix”. Cette déclaration suggère un avantage concurrentiel significatif en termes de rentabilité.

Pour les entreprises cherchant à intégrer les capacités d’Ernie X1, la tarification pour l’accès à son interface de programmation d’application (API) est structurée comme suit : 2 yuans (environ 0,28 $ US) par million de jetons d’entrée et 8 yuans par million de jetons de sortie. En revanche, DeepSeek facture actuellement 0,55 $ US par million de jetons d’entrée et 2,19 $ US par million de jetons de sortie pour son DeepSeek-reasoner, qui est piloté par son modèle de raisonnement R1. Il convient de noter que DeepSeek, une start-up basée à Hangzhou, a récemment mis en œuvre une augmentation de ses prix d’API en réponse à une augmentation substantielle de la demande.

Le virage de Baidu vers l’open source

Robin Li Yanhong, fondateur, président et PDG de Baidu, a fait une annonce notable le mois dernier concernant l’avenird’Ernie 4.5. Il a révélé que le modèle serait rendu open source à partir du 30 juin. Cette décision représente un changement significatif par rapport à son soutien auparavant indéfectible au développement de l’IA à code source fermé, marquant un virage à 180 degrés dans son approche.

Li a développé ce changement stratégique lors d’une conférence téléphonique sur les résultats avec des analystes en février, déclarant : “Une chose que nous avons apprise de DeepSeek est que l’open sourcing des meilleurs modèles peut grandement aider à l’adoption.” Il a ajouté : “Lorsque le modèle est open source, les gens veulent naturellement l’essayer par curiosité, ce qui contribue à stimuler une adoption plus large.” Cette reconnaissance des avantages du développement open-source souligne l’évolution de la stratégie de Baidu dans le paysage concurrentiel de l’IA.

Les performances commerciales de Baidu au milieu des avancées de l’IA

Malgré les progrès notables réalisés par Baidu dans le domaine de l’intelligence artificielle, l’ensemble de l’activité de l’entreprise est confronté à des vents contraires en raison de la faiblesse des revenus publicitaires. Des rapports financiers récents indiquent que le chiffre d’affaires total de Baidu pour le quatrième trimestre a connu une baisse de 2 % en glissement annuel. De plus, le chiffre d’affaires annuel a également diminué de 1 %. Ces chiffres mettent en évidence les défis auxquels Baidu est confronté pour équilibrer ses investissements dans la technologie de pointe de l’IA avec la nécessité de maintenir de solides performances financières.

Développement des aspects clés

Pour fournir une compréhension plus complète, examinons plus en détail certains des aspects critiques de l’annonce de Baidu et le contexte plus large du paysage de l’IA en Chine.

L’importance de la multimodalité:

L’accent mis sur les capacités “multimodales” d’Ernie 4.5 et d’Ernie X1 est crucial. Les LLM traditionnels se concentraient principalement sur le traitement textuel. Cependant, la capacité de traiter et de comprendre des informations provenant de diverses modalités – images, audio et vidéo – ouvre un vaste éventail de nouvelles possibilités. Ceci comprend:

  • Reconnaissance d’image améliorée: Les modèles d’IA peuvent désormais non seulement identifier des objets dans des images, mais aussi comprendre le contexte et les relations entre eux.
  • Transcription et analyse audio améliorées: Transcrire le langage parlé avec une plus grande précision et même détecter des nuances comme l’émotion et l’intention dans les enregistrements audio.
  • Compréhension vidéo: Analyser le contenu vidéo pour identifier les scènes, les actions et même prédire les événements futurs.

Le débat sur l’open source:

La décision de Robin Li d’ouvrir le code source d’Ernie 4.5 est un développement significatif dans le débat en cours entre le développement de l’IA à code source fermé et à code source ouvert.

  • Code source fermé: Les partisans de cette approche soutiennent qu’elle permet un meilleur contrôle de la technologie, garantissant son utilisation responsable et empêchant les abus. Elle permet également aux entreprises de protéger leur propriété intellectuelle et de conserver un avantage concurrentiel.
  • Code source ouvert: Les défenseurs du développement open source estiment qu’il favorise la collaboration, accélère l’innovation et promeut la transparence. Il permet aux chercheurs et aux développeurs du monde entier de contribuer à l’avancement de la technologie de l’IA.

Le virage de Baidu vers l’open source, du moins pour Ernie 4.5, suggère une reconnaissance de l’élan croissant du mouvement open source et de ses avantages potentiels.

Le paysage concurrentiel:

La course à l’IA en Chine est intense, avec de nombreuses entreprises rivalisant pour la domination.

  • Alibaba: Le LLM Tongyi Qianwen d’Alibaba est un concurrent majeur, et l’entreprise intègre activement l’IA dans ses différentes unités commerciales, notamment le commerce électronique, le cloud computing et la logistique.
  • Tencent: Le LLM Hunyuan de Tencent est un autre acteur important, et l’entreprise tire parti de l’IA pour améliorer ses plateformes de médias sociaux, ses offres de jeux et ses services cloud.
  • ByteDance: La société mère de TikTok, ByteDance, investit également massivement dans l’IA, l’utilisant pour alimenter ses algorithmes de recommandation et développer de nouveaux produits.
  • DeepSeek: DeepSeek est un concurrent redoutable dans l’espace LLM.

L’impact de la tarification:

La stratégie de tarification agressive de Baidu pour Ernie X1, réduisant de moitié les prix de DeepSeek, est une indication claire de son intention de gagner des parts de marché. Cette guerre des prix pourrait potentiellement profiter aux entreprises et aux consommateurs en rendant la technologie de l’IA plus accessible et abordable.

Les implications plus larges:

Les avancées de Baidu en matière d’IA, ainsi que la concurrence intense sur le marché chinois, ont des implications considérables:

  • Avancement technologique: Le rythme rapide de l’innovation stimule le développement de modèles d’IA de plus en plus sophistiqués avec des capacités plus larges.
  • Impact économique: L’IA est sur le point de transformer diverses industries, d’augmenter la productivité, de créer de nouveaux emplois et potentiellement de remodeler le paysage économique mondial.
  • Impact sociétal: L’adoption généralisée de l’IA soulève d’importantes questions éthiques et sociétales qui doivent être abordées, notamment les questions liées aux biais, à la confidentialité et au déplacement d’emplois.

Développement supplémentaire sur la stratégie de Baidu

La stratégie de Baidu semble être multiforme, englobant à la fois l’innovation technologique et le positionnement sur le marché.

1. Prouesse technologique:

  • Concentration sur la multimodalité: Baidu donne clairement la priorité au développement de modèles d’IA multimodaux, reconnaissant le potentiel de cette technologie pour débloquer de nouvelles applications et capacités.
  • Amélioration continue: La sortie d’Ernie 4.5 et d’Ernie X1 démontre l’engagement de Baidu envers la recherche et le développement continus, repoussant constamment les limites des performances de l’IA.
  • Adoption de l’open source: La décision d’ouvrir le code source d’Ernie 4.5 témoigne d’une volonté de s’engager avec la communauté de l’IA au sens large et de contribuer à l’avancement collectif du domaine.

2. Positionnement sur le marché:

  • Tarification compétitive: La tarification agressive d’Ernie X1 est une démarche stratégique pour attirer les utilisateurs et gagner des parts de marché dans le paysage très concurrentiel des LLM.
  • Ciblage des entreprises: L’accent mis sur l’accès à l’API suggère que Baidu cible activement les entreprises cherchant à intégrer l’IA dans leurs opérations.
  • Remédier aux faiblesses: L’entreprise reconnaît et corrige ses faiblesses, telles que la baisse des revenus publicitaires, en tirant parti de ses avancées en matière d’IA pour diversifier ses offres et explorer de nouvelles sources de revenus.

3. Vision à long terme:

  • Leadership en IA: Les actions de Baidu suggèrent une ambition claire de devenir un leader dans le paysage mondial de l’IA, et pas seulement en Chine.
  • Technologie transformatrice: L’entreprise semble considérer l’IA comme une technologie transformatrice ayant le potentiel de remodeler son activité et de contribuer à un progrès sociétal plus large.
  • Adaptabilité: La volonté de Baidu d’adapter sa stratégie, comme en témoigne le passage au développement open source, démontre son agilité et sa réactivité face à l’évolution de la dynamique de l’industrie de l’IA.

En substance, Baidu se positionne comme une force majeure dans la révolution de l’IA, combinant l’innovation technologique avec des manœuvres stratégiques sur le marché pour atteindre ses objectifs ambitieux. Les progrès de l’entreprise et la concurrence continue sur le marché chinois de l’IA seront suivis de près car ils ont des implications significatives pour l’avenir de l’IA à l’échelle mondiale.