Mistral Medium 3 : Mythe ou Réalité ?

Le lancement récent de Mistral Medium 3 par la startup française Mistral AI a suscité un vif intérêt. Annoncé comme un modèle multimodal aux performances comparables, voire supérieures, à celles de Claude Sonnet 3.7 d’Anthropic, tout en étant plus abordable que DeepSeek V3 chinois, il promettait de bousculer la domination américaine dans le domaine de l’IA.

Toutefois, la réalité s’est avérée moins idyllique. Les tests effectués par divers médias et utilisateurs ont révélé des performances décevantes, loin des promesses initiales. Certains ont même qualifié le modèle de “décevant” et déconseillé de perdre du temps et des ressources à le télécharger.

Mistral Medium 3 : L’écart entre la publicité et la réalité

Mistral AI a largement promu Mistral Medium 3, affirmant qu’il atteignait plus de 90 % des performances de Claude Sonnet 3.7 dans plusieurs benchmarks et qu’il excellait dans des applications professionnelles telles que la programmation et la compréhension multimodale. La société a également souligné l’avantage de coût de Mistral Medium 3, avec un coût d’entrée de 0,4 $ par million de tokens et un coût de sortie de 2 $, bien inférieur à DeepSeek V3.

Cependant, les tests pratiques ont révélé un écart significatif entre les performances de Mistral Medium 3 et celles de Claude Sonnet 3.7. Dans certaines évaluations, Mistral Medium 3 s’est même avéré moins performant que certains modèles open source. Par exemple, dans un test basé sur les questions de vocabulaire de la rubrique Connections du New York Times, Mistral Medium 3 s’est classé dernier.

Plus décevant encore, certains utilisateurs ont constaté que les capacités d’écriture de Mistral Medium 3 ne s’étaient pas améliorées de manière significative et qu’il présentait toujours des problèmes courants tels qu’un manque de clarté logique et une expression peu fluide. De plus, Mistral Medium 3 s’est avéré impuissant face à des tâches complexes, peinant à fournir des réponses satisfaisantes.

Les points forts de Mistral Medium 3

Malgré les performances globalement décevantes de Mistral Medium 3, le modèle n’est pas sans qualités. Dans certains domaines spécifiques, Mistral Medium 3 a démontré certains atouts. Par exemple, en matière de programmation, Mistral Medium 3 a été relativement stable, capable de générer un code concis et clair et d’exceller dans des tâches de codage simples.

En outre, Mistral Medium 3 offre certaines fonctionnalités de niveau entreprise, telles que la prise en charge du déploiement en cloud hybride, du déploiement local et du déploiement dans un VPC, l’entraînement post-personnalisation et l’intégration dans des outils et systèmes d’entreprise. Ces fonctionnalités permettent à Mistral Medium 3 de mieux répondre aux besoins réels des entreprises, en leur fournissant des solutions d’IA plus flexibles et personnalisables.

Le “grand” plan de Mistral : Mistral Large

Malgré les performances inférieures aux attentes de Mistral Medium 3, Mistral AI n’a pas baissé les bras. Lors du lancement de Mistral Medium 3, Mistral AI a également révélé qu’elle développait un modèle plus puissant appelé Mistral Large, affirmant que ses performances dépasseraient largement celles de Mistral Medium 3 et pourraient même surpasser les modèles d’IA les plus avancés à l’heure actuelle.

Cette initiative de Mistral AI a suscité de nouvelles attentes. Si Mistral Large atteint réellement le niveau de performance revendiqué par Mistral AI, il pourrait devenir une étoile montante dans le domaine de l’IA et insuffler une nouvelle énergie au développement de l’IA en Europe.

Service de chatbot d’entreprise : Le Chat Enterprise

En plus de Mistral Medium 3 et Mistral Large, Mistral AI a également lancé un service de chatbot d’entreprise appelé Le Chat Enterprise. Propulsé par le modèle Mistral Medium 3, Le Chat Enterprise vise à fournir aux entreprises une plateforme d’IA unifiée pour résoudre les défis d’IA auxquels elles sont confrontées, tels que la fragmentation des outils, l’intégration de connaissances non sécurisée, les modèles rigides et les retours sur investissement lents.

Le Chat Enterprise propose un outil de création d’agents IA qui peut intégrer les modèles de Mistral à des services tiers tels que Gmail, Google Drive et SharePoint. De plus, Le Chat Enterprise prendra également en charge le protocole MCP, la norme proposée par Anthropic pour connecter l’IA aux systèmes de données et aux logiciels.

Tests des utilisateurs : performances médiocres de Mistral Medium 3

Bien que Mistral AI ait fortement promu Mistral Medium 3, de nombreux utilisateurs ont constaté après des tests pratiques que ses performances n’étaient pas aussi bonnes que ce que la société avait annoncé. Certains utilisateurs ont même déconseillé de télécharger Mistral Medium 3 afin d’éviter de gaspiller du trafic et de l’espace disque.

Un utilisateur nommé “karminski-dentiste” a déclaré après des tests pratiques que les performances de Mistral Medium 3 étaient “décevantes” et a déconseillé aux utilisateurs de “perdre du temps et des ressources à le télécharger”. Un autre utilisateur a déclaré que les capacités d’écriture de Mistral Medium 3 ne s’étaient “pas améliorées de manière significative” et qu’il présentait toujours des problèmes courants.

Commentaires des médias : Mistral Medium 3, un bilan mitigé

À l’instar des commentaires des utilisateurs, les critiques des médias sur Mistral Medium 3 ont également été mitigées. Certains médias ont estimé que Mistral Medium 3 excellait dans certains domaines spécifiques, tels que la programmation. Mais d’autres médias ont estimé que les performances globales de Mistral Medium 3 étaient décevantes et qu’il existait un écart significatif entre ses performances et celles de Claude Sonnet 3.7.

Par exemple, The Verge a souligné dans un article de revue que Mistral Medium 3 semblait impuissant face à des tâches complexes et qu’il peinait à fournir des réponses satisfaisantes. TechCrunch a déclaré dans un article de revue que les capacités d’écriture de Mistral Medium 3 ne s’étaient “pas améliorées de manière significative” et qu’il présentait toujours des problèmes courants.

Les limites de Mistral Medium 3

Dans l’ensemble, les limites de Mistral Medium 3 se manifestent principalement dans les domaines suivants :

  • Performances insuffisantes : Les performances de Mistral Medium 3 et celles de Claude Sonnet 3.7 présentent un écart significatif, ce qui rend difficile la satisfaction de certaines applications qui exigent des performances élevées.
  • Capacité d’écriture limitée : La capacité d’écriture de Mistral Medium 3 ne s’est pas améliorée de manière significative et elle présente toujours des problèmes courants, tels qu’un manque de clarté logique et une expression peu fluide.
  • Capacité insuffisante à traiter des tâches complexes : Mistral Medium 3 semble impuissant face à des tâches complexes et peine à fournir des réponses satisfaisantes.

Applications potentielles de Mistral Medium 3

Bien qu’il existe certaines limites, Mistral Medium 3 présente tout de même certaines applications potentielles, telles que :

  • Programmation : Mistral Medium 3 est relativement stable en matière de programmation et peut être utilisé pour générer un code concis et clair.
  • Applications d’entreprise : Mistral Medium 3 offre certaines fonctionnalités de niveau entreprise, telles que la prise en charge du déploiement en cloud hybride, du déploiement local et du déploiement dans un VPC, l’entraînement post-personnalisation et l’intégration dans des outils et systèmes d’entreprise, ce qui peut être utilisé pour répondre aux besoins réels des entreprises.
  • Chatbot : Mistral Medium 3 peut être utilisé pour piloter des chatbots et fournir aux utilisateurs des services de dialogue intelligents.

Stratégie de tarification de Mistral Medium 3

Mistral AI a adopté une stratégie de tarification basse pour Mistral Medium 3 afin d’attirer plus d’utilisateurs. Le coût d’entrée de Mistral Medium 3 est de seulement 0,4 $ par million de tokens et le coût de sortie est de 2 $, ce qui est bien inférieur à DeepSeek V3.

La stratégie de tarification basse rend Mistral Medium 3 plus compétitif et devrait lui permettre d’acquérir une certaine part de marché.

Méthodes de déploiement de Mistral Medium 3

Mistral Medium 3 prend en charge plusieurs méthodes de déploiement, notamment :

  • API : L’API Mistral Medium 3 est disponible sur Mistral La Plateforme et Amazon Sagemaker et sera bientôt disponible sur IBM WatsonX, NVIDIA NIM, Azure AI Foundry et Google Cloud Vertex.
  • Déploiement autonome : Mistral Medium 3 peut être déployé sur n’importe quel cloud, y compris dans des environnements auto-hébergés avec au moins quatre GPU.

Les différentes méthodes de déploiement permettent à Mistral Medium 3 de mieux répondre aux besoins des différents utilisateurs, en leur fournissant des solutions de déploiement plus flexibles et pratiques.

Mistral Medium 3 : l’espoir de l’IA européenne ?

Le lancement de Mistral Medium 3 a sans aucun doute donné un nouvel espoir à l’IA européenne. En tant que startup européenne d’IA, l’essor de Mistral AI devrait briser le monopole des sociétés américaines dans le domaine de l’IA et insuffler une nouvelle énergie au développement de l’IA en Europe.

Cependant, les performances de Mistral Medium 3 ont été décevantes et il existe un écart significatif entre ses performances et celles de Claude Sonnet 3.7. Cela montre que l’IA européenne doit encore déployer des efforts constants sur le plan technologique pour réellement rattraper le niveau avancé des États-Unis.

Mistral Large : peut-il apporter une surprise ?

Bien que les performances de Mistral Medium 3 aient été inférieures aux attentes, Mistral AI n’a pas baissé les bras et continue de développer le modèle plus puissant Mistral Large. Il reste à voir si Mistral Large apportera une surprise et deviendra une étoile montante dans le domaine de l’IA.

Conclusion

Le lancement de Mistral Medium 3 a suscité une grande attention dans le domaine de l’IA, mais ses performances réelles diffèrent de la publicité officielle. Bien que Mistral Medium 3 ait démontré certains avantages dans des domaines spécifiques, ses performances globales doivent encore être améliorées. L’avenir de Mistral AI, et la question de savoir si Mistral Large peut apporter une surprise, resteront des points d’intérêt.

Résumé

Le lancement de Mistral Medium 3 est une étape importante dans le développement de l’IA européenne, mais ses performances nous rappellent également que l’IA européenne doit déployer des efforts constants sur le plan technologique. Nous espérons que Mistral Large apportera une surprise et insufflera une nouvelle énergie au développement de l’IA européenne.