Le discours entourant l’interopérabilité de l’IA s’intensifie. Suite à l’annonce par Baidu de ses services MCP complets lors de sa conférence des développeurs la semaine dernière, les grandes entreprises technologiques chinoises comme Alibaba, ByteDance et Tencent se sont toutes lancées dans l’aventure MCP.
MCP, ou Model Context Protocol, est envisagé comme une norme unificatrice qui permet à l’IA de s’interfacer de manière transparente avec une multitude d’applications et de services. On peut le comparer à l’interface USB omniprésente que l’on trouve dans les ordinateurs et les smartphones, permettant l’intégration plug-and-play de divers périphériques externes. En substance, MCP vise à fournir à l’IA un ‘port USB’ universel pour accéder aux outils et exécuter des tâches.
En novembre 2024, Anthropic, une société américaine d’IA, a introduit la norme MCP, qui a été rapidement adoptée par des concurrents tels qu’OpenAI et Google, signalant une rupture avec la pratique concurrentielle conventionnelle des écosystèmes propriétaires. À partir d’avril, les principales entreprises technologiques chinoises, notamment Bailian d’Alibaba Cloud, Knowledge Engine de Tencent Cloud, Kouzi Space de ByteDance et Baidu AI Cloud, ont lancé leurs propres services MCP complets.
La promesse et les défis de l’unification
L’objectif principal de MCP est de favoriser l’unification, mais cette entreprise se heurte à des défis importants. Selon de nombreux développeurs et chercheurs, bien que MCP soit efficace pour accéder aux données locales de l’entreprise, il rencontre des obstacles lorsqu’il tente de s’intégrer aux applications Internet pour des tâches telles que la réservation de vols, la vérification des prix et la création de guides de voyage. Ces défis découlent de l’immaturité des processus d’invocation de l’IA et de la disponibilité limitée des outils Internet, de nombreuses plates-formes n’offrant qu’un accès aux fonctionnalités périphériques.
Toutes les plateformes Internet ne sont pas aussi enthousiastes à l’idée d’adopter cette norme commune et de rejoindre le réseau de fournisseurs de services MCP. La nature fermée de l’écosystème Internet chinois, associée à une sensibilité accrue à la confidentialité des données, a rendu de nombreuses plateformes prudentes. Elles préfèrent évaluer la viabilité et le développement de l’écosystème MCP avant de s’y engager pleinement.
Le paysage de l’IA est connu pour son évolution rapide en termes de terminologie et de concepts. Lorsqu’Anthropic a initialement publié en open source le protocole MCP à la fin de l’année dernière, l’industrie a largement adopté une approche attentiste. Cependant, la popularité explosive de Manus a depuis alimenté l’intérêt pour MCP en Chine.
MCP comme catalyseur de l’agentivité de l’IA
Selon Hou Xinyi de l’Université des sciences et technologies de Huazhong, l’étape cruciale pour transcender les limitations des ‘chatbots’ consiste à permettre à l’IA d’interagir avec des données et des outils externes, ce que MCP cherche précisément à faciliter.
Avant MCP, d’autres approches ont été explorées pour pallier le manque perçu d’’agentivité de l’IA’. Fin 2023, OpenAI a introduit le concept d’un app store (GPT Store), permettant à ChatGPT d’exploiter des outils externes via des plugins basés sur un ensemble de normes définies. Des app stores d’IA similaires, tels que Kouzi de ByteDance, Qianfan de Baidu et Bailian d’Alibaba, ont suivi le mouvement.
Cependant, ces approches ont fini par atteindre leurs limites. Les plugins et les app stores partageaient un problème commun : le cloisonnement. Chaque outil possédait sa propre documentation de développement, ses formats de paramètres et ses spécifications d’interface uniques. Cela signifiait que les développeurs devaient réinventer la roue à chaque fois qu’ils intégraient un nouvel outil dans l’IA, ce qui entraînait des inefficacités.
Au fil du temps, le nombre de nouveaux outils ajoutés aux app stores a diminué, et la qualité des plugins a considérablement varié, ce qui a entravé la capacité à effectuer des tâches complexes. Cela indiquait que les approches existantes approchaient de leurs limites.
MCP comme solution unificatrice
MCP est considérée comme une solution prometteuse en raison de son accent sur l’unification. Dans sa documentation officielle, Anthropic compare MCP à une interface USB-C universelle pour le monde de l’IA. Hou Xinyi préfère le décrire comme une ‘station d’accueil’ - un adaptateur polyvalent qui permet à l’IA de se connecter à plusieurs outils externes simultanément, éliminant ainsi le besoin de conversions de format.
Beaucoup prévoient que MCP aura un impact transformateur, à l’instar de la standardisation des poids et mesures par Qin Shi Huang, qui a facilité le commerce et la communication entre les États auparavant fragmentés de la période du Printemps et de l’Automne.
Selon un responsable technique du groupe de travail sur l’interconnexion intelligente d’une grande entreprise technologique, MCP optimise également les interactions linguistiques de l’IA. Auparavant, l’IA exigeait des utilisateurs qu’ils indiquent précisément ‘Je veux naviguer’ pour utiliser l’API d’un service de navigation. Même un léger écart pouvait faire échouer l’IA. Désormais, chaque outil doit fournir des noms, des paramètres et des descriptions fonctionnelles standardisés. En conséquence, l’IA n’a besoin que de comprendre l’intention de l’utilisateur, puis de la faire correspondre avec le serveur MCP le plus approprié en fonction des descriptions.
Cette approche s’aligne plus étroitement sur les capacités inhérentes aux grands modèles de langage, permettant aux utilisateurs d’invoquer des services avec une seule phrase, s’éloignant ainsi de l’exigence précédente de communication directe interface à interface.
L’adoption actuelle et les limites de MCP
Malgré son potentiel perçu, MCP n’a pas encore atteint une adoption généralisée, et ses applications pratiques restent limitées. Actuellement, MCP est surtout populaire parmi le personnel technique des entreprises et les développeurs indépendants.
En tant qu’ingénieur front-end, Gong Dian s’appuie fortement sur l’assistant de programmation d’IA Cursor. Cependant, Cursor a eu du mal à s’intégrer de manière transparente aux systèmes de projets internes de son entreprise, nécessitant une intervention manuelle. Bien que des plugins ou des appels de fonction puissent être utilisés auparavant, l’IA externe ne pouvait pas accéder aux systèmes internes de l’entreprise, et l’invocation en temps réel soulevait des problèmes de sécurité. MCP, en revanche, peut être lancé au sein du réseau interne de l’entreprise, ce qui le rend plus fiable et conforme.
Le développeur indépendant Zhu Mama a récemment demandé à Cursor d’apprendre la documentation MCP et d’empaqueter les API Google Maps et Search dans un serveur MCP, qui a ensuite été utilisé pour invoquer le grand modèle de langage Gemini de Google. Le Gemini équipé de MCP qui en a résulté a été transformé en un assistant de guide de voyage. Lorsqu’on lui a demandé des itinéraires de transport en commun de l’aéroport de Singapour vers diverses attractions, l’assistant a fourni des informations plus détaillées et plus précises que la réponse de Doubao.
Divers assistants de voyage émergent au sein de la communauté des développeurs. Lorsque Kouzi Space de ByteDance a lancé sa version bêta interne le 19 avril, le cas de démonstration était également un assistant IA de voyage, ce qui a incité certains à plaisanter sur l’obsession de l’industrie pour le voyage.
Zhu Mama admet candidement que l’accent mis sur les scénarios de voyage est principalement dû à leur pertinence pour les besoins quotidiens des consommateurs. Une autre raison est la disponibilité limitée de logiciels Internet compatibles avec MCP en Chine, ce qui limite le potentiel du marché.
Selon les dernières statistiques de la plateforme de navigation MCP.so, il existe plus de 11 028 fournisseurs de services MCP dans le monde, et ce nombre croît rapidement. Cependant, en Chine, seules quelques grandes applications de localisation géographique, telles qu’AutoNavi, Baidu Maps et Tencent Maps, fonctionnent actuellement comme des serveurs MCP à grande échelle.
Cette limitation est la raison pour laquelle le plan de Zhu Mama visant à créer une version chinoise d’un assistant de voyage s’est rapidement enlisée. Pour développer un guide de voyage chinois, il serait idéal d’utiliser les services de cartographie nationaux. Cependant, Zhu Mama a découvert que le serveur MCP officiel fourni par AutoNavi offrait des informations très limitées. Bien qu’il puisse fournir des requêtes d’itinéraire entre deux emplacements, il manquait des informations détaillées sur les points de repère, les avis, les prix des billets d’hôtel et d’autres détails essentiels.
En revanche, l’API Google Maps fournit des méthodes de réservation détaillées, des prix d’hôtel, des avis d’hôtel, des installations d’hôtel et même des comparaisons de prix sur plusieurs plateformes, un niveau de détail difficile à imaginer au sein de l’écosystème chinois.
Bien que les produits Tencent, Alibaba, ByteDance et Baidu adoptent MCP, leurs applications à haute fréquence n’ont pas encore officiellement rejoint le réseau de fournisseurs de services MCP. Les plateformes telles que WeChat, Xiaohongshu et Douyin, ainsi que les plateformes de services de style de vie comme Ele.me, Meituan et Ctrip, sont visiblement absentes.
Défis liés à la disponibilité des outils et à la planification de l’IA
Outre la disponibilité limitée des outils, les capacités de planification de l’IA constituent également une contrainte. Zhu Mama a empaqueté 6 à 8 interfaces API, notamment Google Hotels, Maps et Search, dans un seul serveur MCP, ce qui est bien en deçà de la limite maximale (Cursor autorise un maximum de 40 outils par agent). Cependant, l’IA avait déjà du mal à déterminer quel outil invoquer. Face à des demandes complexes, l’IA n’était pas en mesure de décomposer le processus et d’invoquer MCP par étapes, essayant plutôt de tout gérer en même temps.
Selon Gong Dian, la valeur de MCP dépend de la qualité des côtés client et serveur. Tout comme un port USB n’a pas de capacités inhérentes et s’appuie sur les services qui le sous-tendent, MCP a besoin de services robustes pour réaliser son potentiel.
MCP jette les bases des agents d’IA, mais ne résout pas tous les problèmes. Une norme qui reste inutilisée n’est qu’un simple bout de papier.
Le responsable technique susmentionné suggère que l’adoption généralisée de la norme MCP d’Anthropic est due à sa nature open-source, à but non lucratif et à la crédibilité de son créateur. D’autres organisations sont disposées à suivre une norme établie par une entité réputée.
Actuellement, les petites et moyennes entreprises et les grandes entreprises Internet qui cherchent à diversifier leurs sources de revenus sont les principaux adoptants de la norme MCP.
La société de compagnonnage d’IA MiniMax a récemment lancé un serveur MCP, la responsable de la communauté Cai Jiaren déclarant que les développeurs peuvent utiliser MCP pour invoquer les capacités multi-modales de MiniMax pour la génération de vidéos, la génération de voix et le clonage de voix. Le MCP comprend des mécanismes de contrôle d’accès stricts pour garantir la conformité lorsque les entreprises accèdent aux données internes. Le processus d’invocation global est également simplifié, sans ajout de coûts de jetons supplémentaires.
La décision de MiniMax de lancer un serveur MCP a été motivée par le désir de permettre aux développeurs du monde entier d’exploiter facilement les capacités de modèle de MiniMax et de débloquer une création plus flexible et plus efficace.
D’autres startups partagent des aspirations similaires. Biu Technology a mentionné dans une interview que les développeurs peuvent utiliser AutoNavi MCP pour obtenir des données de transport, puis utiliser les produits de Biu pour générer un PPT. MCP abaisse la barrière à l’entrée en fournissant un accès à l’interface d’AutoNavi, qui serait autrement inaccessible.
Le responsable technique susmentionné estime que MCP est essentiellement une histoire de fournisseurs de services. En encapsulant leurs API conformément à la norme MCP, les fournisseurs de services d’application peuvent rendre leurs services accessibles à toutes les IA.
Divergences et préoccupations des fournisseurs de services
Cependant, des désaccords surviennent entre les fournisseurs de services. De nombreuses entreprises ne sont pas pleinement attachées à l’idée. Bien que les grandes plateformes comme AutoNavi et Baidu Maps aient lancé des serveurs MCP, elles reconditionnent principalement les interfaces API existantes, offrant des fonctionnalités conventionnelles tout en maintenant un contrôle strict sur les autorisations utilisateur de base et les données de transaction.
Outre les services de localisation cartographique, l’éditeur automatique Xiaohongshu d’un développeur tiers, qui automatise la recherche et la publication de contenu, est actuellement l’élément le plus populaire sur la place MCP de la communauté Modeng. Hou Xinyi suggère que cela pourrait avoir un impact limité sur les plateformes de contenu social comme Xiaohongshu, mais les données et les autorisations deviennent particulièrement sensibles dans les scénarios à forte intensité de transactions comme les plateformes de livraison de nourriture.
L’une des principales préoccupations des fournisseurs de services est le contrôle de l’expérience utilisateur.
Par exemple, l’ouverture d’un service complet de livraison de nourriture nécessite d’accorder aux agents d’IA l’accès à des données personnelles sensibles telles que les prix, les informations sur les magasins, et les adresses et coordonnées des utilisateurs. Anthropic a reconnu que le système de sécurité de MCP, y compris la gestion des autorisations et l’audit d’invocation, est encore en développement. Par conséquent, certaines plateformes s’inquiètent du risque d’invocation non autorisée lors de la connexion à MCP.
Certaines plateformes testent des scénarios de transaction relativement sûrs. Par exemple, Alipay a récemment lancé un serveur MCP, affirmant donner aux agents d’IA ‘un accès en un clic aux capacités de paiement’. Cependant, un examen plus attentif révèle qu’il offre principalement des services d’encaissement plutôt que de paiement.
Selon Hou Xinyi, l’approche d’Alipay se concentre sur la facilitation de l’encaissement des paiements des commerçants plutôt que de permettre à l’IA d’effectuer des paiements au nom des consommateurs. C’est une option viable, car permettre à l’IA de contrôler les portefeuilles et de passer des commandes librement n’est pas encore assez sûr pour le confort de tous. C’est aussi la principale raison pour laquelle les services de transaction ne peuvent pas être largement promus.
Un problème plus profond est que si l’IA participe librement au processus de transaction - en aidant les utilisateurs à comparer les prix ou en recommandant le restaurant le plus rentable - cela offrirait sans aucun doute un confort important aux utilisateurs. Cependant, cela signifierait également que les plateformes de services perdraient le contrôle sur le processus de sélection de l’utilisateur, et leurs principaux avantages algorithmiques seraient marginalisés, les réduisant à de simples fournisseurs.
Résoudre les problèmes de sécurité et promouvoir l’universalité
De nombreuses personnes interrogées estiment que MCP doit résoudre deux problèmes clés : la sécurité et l’universalité.
Premièrement, la sécurité. Hou Xinyi souligne que MCP est confronté à deux défis de sécurité : un manque de supervision centralisée de la sécurité et un mécanisme incomplet de vérification d’identité et d’autorisation de données. Actuellement, il n’existe pas de ‘place de découverte’ officielle pour MCP. De nombreuses plateformes de navigation tierces collectent des services MCP en extrayant directement des projets de code de GitHub, ce qui est rapide et simple, mais manque d’un processus d’examen formel. Anthropic a déclaré qu’il s’attaquera formellement au mécanisme d’hébergement et aux problèmes de découvrabilité de MCP cette année. Le projet de protocole récemment mis à jour par Anthropic s’efforce de combler cette lacune. En outre, des organisations nationales telles que IIFAA (Internet Trusted Authentication Alliance) tentent de combler le fossé de sécurité.
Il existe également des problèmes de longue date dans le domaine des agents d’IA, tels que le détournement d’invites et les attaques par combinaison d’outils. Cependant, le responsable technique susmentionné estime qu’il ne s’agit pas de vulnérabilités MCP, mais plutôt de risques qui existent pour tout agent d’IA. Actuellement, aucune vulnérabilité de sécurité évidente n’a été trouvée dans le protocole MCP lui-même, et les mécanismes de transmission et d’interaction des données sont généralement fiables.
La sécurité n’est que le premier obstacle. Le véritable défi consiste à surmonter les défenses d’intérêt des fabricants et à persuader davantage de fabricants de devenir des serveurs MCP.
Selon Hou Xinyi, cela est lié à la compréhension de la nature de ‘jardin clos’ des plateformes Internet. Les données sont une barrière concurrentielle importante pour diverses plateformes, de sorte que de nombreux fabricants n’ouvriront que certaines fonctions périphériques en tant que serveurs MCP pour des tests. Les fabricants devront peut-être attendre et voir quel impact aura l’écosystème MCP.
La personne responsable susmentionnée a déclaré que s’il est connecté à l’IA en tant que serveur MCP, il peut obtenir plus de données et d’habitudes des utilisateurs, et les restituer à son propre modèle de base, ce qui pourrait devenir la plus grande motivation pour les fabricants à adhérer activement.
Lorsque le marché des serveurs MCP est vraiment abondant, des problèmes plus lointains doivent être pris en compte.
Par exemple, comment les corps intelligents appellent-ils différentes applications sur les téléphones mobiles ? La personne responsable a mentionné que pour réveiller une autre application via le corps intelligent d’IA local du téléphone mobile, il y aura une couche supplémentaire d’autorisation d’application et de vérification d’identité, ce qui n’est pas aussi simple que l’appel MCP des services cloud, et il n’y a actuellement aucune solution particulièrement appropriée.
Par exemple, lorsque l’offre de services est excessive, comment les corps intelligents font-ils des choix - appeler JD takeaway ou Meituan takeaway ? Utiliser Gaode map ou Baidu map ? De nombreuses personnes interrogées ont mentionné que la logique d’invocation MCP d’aujourd’hui est encore très élémentaire, principalement déterminée par la ‘description fonctionnelle’ du fournisseur de services, et qu’il n’existe aucun mécanisme de tri et d’optimisation. Si un fournisseur de services ajoute délibérément un langage inductif à la description, tel que ‘le plus efficace’ et ‘choix obligatoire’, l’IA peut être induite en erreur et détournée vers des endroits où elle ne devrait pas aller.
Comme l’a expliqué la personne responsable de la technologie susmentionnée, ‘C’est comme si vous ne trouviez pas le service que vous voulez dans le moteur de recherche, mais qu’une foule d’informations désordonnées apparaissaient. Comment faire correspondre avec précision le service dont les utilisateurs ont le plus besoin, l’écosystème MCP futur sera également confronté au même problème.’
En fin de compte, le processus de mise en œuvre de toute norme est plein de défis. Hou Xinyi a déclaré que pour promouvoir la popularisation de MCP, une opportunité clé similaire à Manus pourrait être nécessaire pour faire vraiment réaliser à l’ensemble de l’industrie la puissance de MCP.