Décryptage des protocoles A2A et MCP

Récemment, Google a dévoilé un nouveau protocole ouvert pour les Agents appelé Agent2Agent, ou A2A en abrégé. Simultanément, Bailian d’Alibaba Cloud a également annoncé son incursion dans le MCP. Examinons de plus près ce que sont A2A et MCP.

Pour comprendre ces protocoles, prenons l’analogie de la diplomatie entre les nations. Imaginez chaque agent IA comme un petit pays avec sa propre langue et ses propres coutumes. Ces ‘pays’ ont des ambassades situées dans le même bâtiment, essayant de communiquer, de commercer et d’échanger des informations.

Dans un scénario idéal, ces nations entretiendraient des relations amicales et adhéreraient à un ensemble clair de règles diplomatiques, leur permettant d’interagir de manière transparente, de signer des accords et de collaborer sur des projets internationaux autour d’une table de conférence.

Cependant, la réalité est que chaque ambassade fonctionne indépendamment avec des protocoles disparates. Par conséquent, l’initiation d’un simple accord commercial avec ‘Pays A’ nécessite de satisfaire une pléthore d’exigences, y compris des dispositions, des certifications, des traductions et des clés spécialisées. S’engager avec ‘Pays B’ et ‘Pays C’ nécessite de répéter des procédures similaires à plusieurs reprises. Cette approche ad hoc, fragmentée et multi-facettes gonfle les coûts de communication, chaque interaction entraînant un ‘tarif d’information’ supplémentaire.

Dans le passé, les agents d’IA rencontraient des situations similaires lorsqu’ils tentaient de collaborer.

Par exemple, vous pourriez avoir un agent qui répond automatiquement aux e-mails et un autre intégré à une application de calendrier pour aider à la planification. Cependant, ces entités d’IA ont du mal à communiquer directement, ce qui nécessite de copier et coller manuellement des informations ou de s’appuyer sur des interfaces personnalisées.

En conséquence, les agents d’IA fonctionnent de manière isolée, présentant une mauvaise interopérabilité. Cette fragmentation frustre les utilisateurs qui doivent naviguer entre plusieurs applications d’IA et limite le potentiel de l’IA. Les tâches complexes qui pourraient être accomplies grâce à la collaboration multi-agents sont artificiellement confinées dans des silos individuels.

Cette situation reflète le paysage de l’après-Seconde Guerre mondiale, où chaque agent d’IA agit de manière autonome, sans règles unifiées et confronté à des barrières de communication. L’écosystème actuel de l’IA ressemble à un terrain vague d’après-guerre, nécessitant le respect d’interfaces et de protocoles spécifiques pour accéder aux données et aux fonctionnalités. L’absence de normes impose des ‘tarifs’ supplémentaires à chaque nouvelle relation de collaboration, conduisant à un écosystème d’IA désarticulé et inefficace, caractérisé par l’isolement et l’intérêt personnel.

L’industrie de l’IA explore la possibilité d’établir un protocole universellement accepté pour faciliter une interaction transparente entre les agents et les outils externes. Google et Anthropic sont apparus comme des leaders, chacun proposant une solution: le protocole A2A et le protocole MCP.

Le Protocole A2A

Le protocole A2A, abréviation de Agent2Agent, permet aux agents d’IA de communiquer et de collaborer directement.

L’objectif principal du protocole A2A est de permettre aux agents de diverses origines et fournisseurs de se comprendre et de coopérer les uns avec les autres, à l’image des efforts de l’Organisation Mondiale du Commerce pour réduire les barrières commerciales.

En adoptant A2A, les agents de différents fournisseurs et cadres peuvent rejoindre une zone de libre-échange, communiquant en utilisant une langue commune et collaborant de manière transparente pour accomplir des tâches complexes dépassant les capacités des agents individuels.

Pour illustrer le fonctionnement d’A2A, considérez les analogies suivantes:

1. Agent = Diplomate National

Chaque agent fonctionne comme un diplomate représentant l’ambassade d’un pays. Le protocole A2A vise à établir une étiquette diplomatique et des procédures de communication uniformes. Auparavant, les diplomates du ‘Pays A’ communiquaient exclusivement en français, tandis que ceux du ‘Pays B’ utilisaient l’alphabet cyrillique, et ‘Pays C’ exigeait une correspondance via d’anciennes lettres en feuille d’or. Le protocole A2A garantit que tous les participants peuvent communiquer dans une langue convenue à l’avance, soumettre des documents dans le même format et exécuter les résultats convenus.

2. Carte d’Agent = Accréditations Diplomatiques / Carte de Visite d’Ambassadeur

Dans le cadre d’A2A, chaque agent est tenu de publier une ‘Carte d’Agent’, analogue à la carte de visite d’un diplomate, contenant des détails tels que le nom de l’agent, la version, les capacités et les langues ou formats pris en charge.

De la même manière que la carte de visite d’un diplomate identifie son rôle et son affiliation, la Carte d’Agent répertorie les compétences de l’agent, les méthodes d’authentification et les formats d’entrée/sortie. Cela permet à d’autres diplomates d’identifier et de comprendre rapidement les capacités, minimisant ainsi les barrières de communication.

3. Tâche = Projet Diplomatique Bilatéral ou Multilatéral

Le concept de Tâche est au cœur d’A2A. Lorsqu’un agent a l’intention de déléguer une tâche à un autre agent, il émet une ‘lettre d’intention de projet de coopération’. Dès son acceptation, les deux parties enregistrent un ID de tâche pour suivre les progrès et échanger des informations jusqu’à l’achèvement.

En termes diplomatiques, une nation pourrait proposer à une autre: ‘Nous souhaitons collaborer à la construction d’une ligne ferroviaire à grande vitesse transfrontalière; veuillez dépêcher votre équipe d’ingénierie.’ Ceci reflète une tâche A2A, où la partie initiatrice décrit les exigences, l’agent distant accepte et les deux parties mettent régulièrement à jour les progrès tout au long du projet.

Les messages représentent les communications échangées pendant les phases initiale ou intermédiaire du projet, à l’instar des câbles diplomatiques, des notes et des échanges d’envoyés.

4. Notifications Push = Bulletins de l’Ambassade Diplomatique

Dans A2A, si une tâche est un projet à long terme nécessitant un temps d’achèvement prolongé, l’agent distant peut mettre à jour la partie initiatrice par le biais de notifications push, de la même manière qu’un pays fournit des mises à jour périodiques sur un projet d’infrastructure à long terme. Cela améliore les capacités de collaboration asynchrone.

5. Authentification et Sécurité = Privilèges et Protocoles Diplomatiques

A2A utilise des stratégies d’authentification de niveau entreprise, exigeant que les deux parties communicantes vérifient les informations d’identification pour empêcher l’usurpation d’identité ou l’écoute malveillante. Ce mécanisme est parallèle aux privilèges et protocoles diplomatiques.

Essentiellement, A2A reflète la dynamique de la diplomatie internationale ou de la collaboration commerciale, en mettant l’accent sur la communication standardisée et la sécurité.

Le Protocole MCP

Le protocole MCP, ou Model Context Protocol, est une norme introduite et open source par Anthropic en novembre 2024.

Alors qu’A2A aborde le processus de communication entre les diplomates de l’IA, un défi persistant demeure: l’absence de sources d’informations fiables. Même le diplomate ou le dirigeant d’entreprise le plus éloquent est mal équipé pour fonctionner efficacement sans informations précises sur le paysage international et l’allocation des ressources.

Les diplomates modernes s’appuient sur des outils externes, tels que les systèmes de visas, les systèmes de règlement internationaux et les bases de données de renseignement, pour exercer leurs fonctions. De même, un agent assumant des responsabilités complexes doit se connecter à diverses bases de données, systèmes de documents, applications d’entreprise et même des appareils matériels.

Cela peut être assimilé à la mise en place d’une agence de renseignement complète pour les diplomates et à leur accorder l’accès à des outils pour faciliter leur travail.

Auparavant, les agents devaient développer des plugins personnalisés et s’intégrer profondément à différents outils, ce qui était à la fois laborieux et chronophage. Cependant, MCP est désormais disponible pour rationaliser le processus.

MCP standardise les interactions entre les grands modèles linguistiques et les sources de données et les outils externes. Anthropic compare MCP à un port USB-C pour les applications d’IA.

L’USB-C sert d’interface universelle pour les appareils, gérant la charge et le transfert de données via un seul port. MCP vise à créer une interface universelle dans le domaine de l’IA, permettant à divers modèles et systèmes externes de se connecter en utilisant le même protocole, plutôt que de développer des solutions d’intégration personnalisées à chaque fois.

Les modèles d’IA se connectant à des bases de données, des moteurs de recherche ou des applications tierces peuvent communiquer de manière transparente s’ils prennent tous en charge MCP.

MCP utilise une architecture client-serveur:

1. Serveur MCP = Agence de Renseignement Consolidée

Les organisations ou les individus peuvent encapsuler des bases de données, des systèmes de fichiers, des calendriers et des services tiers dans des serveurs MCP. Ces serveurs adhèrent au protocole MCP, exposant des points d’accès formatés de manière uniforme, permettant à tout agent conforme aux normes du client MCP d’envoyer des requêtes, de récupérer des informations ou d’exécuter des opérations.

2. Client MCP = Équipement Terminal Utilisé par les Diplomates

Un agent diplomate transporte un équipement terminal dédié, lui permettant d’entrer des commandes, telles que ‘Récupérer les données d’inventaire du système financier’, ‘Soumettre une requête à une API’ ou ‘Récupérer un document PDF’.

Sans MCP, l’intégration à divers systèmes nécessite l’écriture de différents codes d’accès, ce qui est fastidieux. Cependant, avec MCP, les clients prenant en charge le protocole peuvent facilement basculer entre différents serveurs MCP, récupérer des informations et exécuter des processus métier.

Essentiellement, MCP facilite une intégration transparente entre les agents d’IA et les ressources externes.

La Distinction Entre A2A et MCP

Pour clarifier la distinction entre A2A et MCP, considérez un sommet international hypothétique où les chefs d’État (représentant les agents d’IA des entreprises) se réunissent pour collaborer sur une tâche transnationale, telle que la production d’un rapport d’analyse économique mondiale.

Sans protocole universel, une telle réunion serait pratiquement impossible, car chaque représentant parle une langue différente. Cependant, avec le protocole A2A, tous les représentants signent la ‘Convention Diplomatique de Vienne A2A’ avant d’entrer dans la réunion, acceptant de communiquer en utilisant un format uniforme, de s’identifier, d’indiquer leurs intentions et de citer les ID de发言 précédents lors de la réponse.

Cela permet à ‘Agent G’ d’envoyer un message à ‘Agent O’ au format A2A, et ‘Agent O’ répond en conséquence. Cela marque la première instance de communication sans entrave entre les agents d’IA de différentes entreprises.

Au cours des discussions, les représentants de l’IA doivent consulter des données ou utiliser des outils d’analyse. ‘Agent A’ d’Anthropic suggère d’utiliser le système MCP pour les données externes ou le support d’outils.

Une ‘salle d’interprétation simultanée MCP’ est installée à côté de la salle de conférence, avec des experts qui peuvent répondre dans une langue uniforme via MCP dès la réception des demandes.

Par exemple, ‘Agent Q’ doit accéder à sa base de données cloud pour des calculs. Au lieu de renvoyer quelqu’un dans le pays, ils envoient une requête MCP pour des données de la base de données X. L’administrateur de la base de données MCP traduit la requête, récupère les résultats et répond à ‘Agent Q’ en langue MCP. L’ensemble du processus est transparent pour les autres agents, qui comprennent les données citées par ‘Agent Q’ car la traduction MCP est dans un format reconnu.

Au fur et à mesure de la rédaction du rapport, ‘Agent G’ et ‘Agent A’ se rendent compte qu’ils doivent intégrer leurs contributions respectives. ‘Agent G’ est spécialisé dans l’analyse numérique, tandis que ‘Agent A’ excelle dans le résumé linguistique.

‘Agent G’ communique les données du taux de croissance du PIB via A2A, et ‘Agent A’ se connecte à un plugin de feuille de calcul Excel via MCP, vérifie les tendances des données et répond avec un paragraphe de résumé.

Dans ce scénario, A2A facilite la communication entre les agents, tandis que MCP permet aux agents d’accéder à des outils et des informations externes. Ensemble, les protocoles créent un accord de communication sur mesure pour une version IA des Nations Unies. Grâce à ces protocoles, les agents d’IA peuvent collaborer efficacement, formant un écosystème d’IA interconnecté.

A2A s’apparente à une ligne directe dédiée à la communication diplomatique, traitant de la communication directe entre agents. MCP est similaire à un système d’interprétation simultanée et de partage de ressources, traitant de la question des entités intelligentes se connectant à des informations externes.

L’essor d’A2A et de MCP annonce l’évolution de l’industrie de l’IA vers la collaboration plutôt que la concurrence. D’innombrables agents d’IA seront déployés comme des sites Web, découvrant et communiquant via A2A et accédant aux ressources et partageant les connaissances via MCP.