Decodificando A2A y MCP en el Mundo Agent

Recientemente, Google presentó un nuevo protocolo abierto para Agentes llamado Agent2Agent, o A2A para abreviar. Simultáneamente, Bailian de Alibaba Cloud también anunció su incursión en MCP. Profundicemos en lo que son A2A y MCP.

Para entender estos protocolos, considere la analogía de la diplomacia entre naciones. Imagine cada agente de IA como un pequeño país con su propio idioma y costumbres. Estos ‘países’ tienen embajadas alojadas dentro del mismo edificio, intentando comunicarse, comerciar e intercambiar información.

En un escenario ideal, estas naciones mantendrían relaciones amistosas y se adherirían a un conjunto claro de reglas diplomáticas, permitiéndoles interactuar sin problemas, firmar acuerdos y colaborar en proyectos internacionales alrededor de una mesa de conferencia.

Sin embargo, la realidad es que cada embajada opera independientemente con protocolos dispares. En consecuencia, iniciar un simple acuerdo comercial con el ‘País A’ requiere cumplir con una plétora de requisitos, incluyendo provisiones, certificaciones, traducciones y claves especializadas. Interactuar con el ‘País B’ y el ‘País C’ requiere repetir procedimientos similares múltiples veces. Este enfoque ad-hoc, fragmentado y multifacético infla los costos de comunicación, con cada interacción incurriendo en un ‘arancel de información’ adicional.

En el pasado, los agentes de IA encontraban predicamentos similares al intentar colaborar.

Por ejemplo, podría tener un agente que responde automáticamente a los correos electrónicos y otro integrado en una aplicación de calendario para ayudar con la programación. Sin embargo, estas entidades de IA tienen dificultades para comunicarse directamente, necesitando la copia y pega manual de información o la dependencia de interfaces construidas a medida.

Como resultado, los agentes de IA operan en aislamiento, exhibiendo una pobre interoperabilidad. Esta fragmentación frustra a los usuarios que deben navegar entre múltiples aplicaciones de IA y limita el potencial de la IA. Las tareas complejas que podrían lograrse a través de la colaboración multi-agente están artificialmente confinadas dentro de silos individuales.

Esta situación refleja el panorama posterior a la Segunda Guerra Mundial, donde cada agente de IA actúa autónomamente, careciendo de reglas unificadas y enfrentando barreras de comunicación. El ecosistema de IA actual se asemeja a un páramo de posguerra, requiriendo la adhesión a interfaces y protocolos específicos para acceder a datos y funcionalidades. La ausencia de estándares impone ‘aranceles’ adicionales con cada nueva relación de colaboración, llevando a un ecosistema de IA desarticulado e ineficiente caracterizado por el aislamiento y el interés propio.

La industria de la IA está explorando la posibilidad de establecer un protocolo universalmente aceptado para facilitar la interacción fluida entre agentes y herramientas externas. Google y Anthropic han emergido como líderes, cada uno proponiendo una solución: el protocolo A2A y el protocolo MCP.

El Protocolo A2A

El protocolo A2A, abreviatura de Agent2Agent, permite a los agentes de IA comunicarse y colaborar directamente.

El objetivo principal del protocolo A2A es permitir que agentes de diversos orígenes y proveedores se comprendan y cooperen entre sí, similar a los esfuerzos de la Organización Mundial del Comercio para reducir las barreras comerciales.

Al adoptar A2A, los agentes de diferentes proveedores y marcos pueden unirse a una zona de libre comercio, comunicándose utilizando un lenguaje común y colaborando sin problemas para lograr tareas complejas más allá de las capacidades de los agentes individuales.

Para ilustrar cómo opera A2A, considere las siguientes analogías:

1. Agente = Diplomático Nacional

Cada agente funciona como un diplomático que representa la embajada de un país. El protocolo A2A tiene como objetivo establecer una etiqueta diplomática y procedimientos de comunicación uniformes. Anteriormente, los diplomáticos del ‘País A’ se comunicaban exclusivamente en francés, mientras que los del ‘País B’ utilizaban escritura cirílica, y el ‘País C’ exigía correspondencia a través de antiguas cartas de hoja de oro. El protocolo A2A asegura que todos los participantes puedan comunicarse en un idioma preestablecido, presentar documentos en el mismo formato y ejecutar los resultados acordados.

2. Tarjeta de Agente = Credenciales Diplomáticas / Tarjeta de Visita del Embajador

Dentro del marco A2A, cada agente está obligado a publicar una ‘Tarjeta de Agente’, análoga a la tarjeta de visita de un diplomático, que contiene detalles como el nombre del agente, la versión, las capacidades y los idiomas o formatos soportados.

Similar a cómo la tarjeta de visita de un diplomático identifica su rol y afiliación, la Tarjeta de Agente lista las habilidades del agente, los métodos de autenticación y los formatos de entrada/salida. Esto permite a otros diplomáticos identificar y entender rápidamente las capacidades, minimizando las barreras de comunicación.

3. Tarea = Proyecto Diplomático Bilateral o Multilateral

El concepto de Tarea es central para A2A. Cuando un agente pretende delegar una tarea a otro agente, emite una ‘carta de intención de proyecto de cooperación’. Al ser aceptada, ambas partes registran un ID de Tarea para rastrear el progreso e intercambiar información hasta la finalización.

En términos diplomáticos, una nación podría proponer a otra, ‘Deseamos colaborar en la construcción de una línea ferroviaria de alta velocidad transfronteriza; por favor, envíe a su equipo de ingeniería’. Esto refleja una Tarea A2A, donde la parte iniciadora describe los requisitos, el agente remoto acepta, y ambas partes actualizan regularmente el progreso a lo largo del proyecto.

Los mensajes representan las comunicaciones intercambiadas durante las etapas iniciales o intermedias del proyecto, similares a los cables diplomáticos, notas e intercambios de enviados.

4. Notificaciones Push = Boletines de la Embajada Diplomática

En A2A, si una Tarea es un proyecto a largo plazo que requiere un tiempo de finalización extendido, el agente remoto puede actualizar a la parte iniciadora a través de notificaciones push, similar a un país que proporciona actualizaciones periódicas sobre un proyecto de infraestructura a largo plazo. Esto mejora las capacidades de colaboración asíncrona.

5. Autenticación y Seguridad = Privilegios y Protocolos Diplomáticos

A2A emplea estrategias de autenticación de nivel empresarial, requiriendo que ambas partes comunicantes verifiquen las credenciales para prevenir la suplantación de identidad o escuchas maliciosas. Este mecanismo es paralelo a los privilegios y protocolos diplomáticos.

En esencia, A2A refleja la dinámica de la diplomacia internacional o la colaboración empresarial, enfatizando la comunicación estandarizada y la seguridad.

El Protocolo MCP

El protocolo MCP, o Protocolo de Contexto del Modelo, es un estándar introducido y de código abierto por Anthropic en noviembre de 2024.

Mientras que A2A aborda el proceso de comunicación entre diplomáticos de IA, un desafío persistente permanece: la ausencia de fuentes de información confiables. Incluso el diplomático o ejecutivo de negocios más elocuente está mal equipado para operar eficazmente sin información precisa sobre el panorama internacional y la asignación de recursos.

Los diplomáticos modernos confían en herramientas externas, como sistemas de visas, sistemas de liquidación internacional y bases de datos de inteligencia, para realizar sus funciones. Similarmente, un agente que asume responsabilidades complejas debe conectarse a varias bases de datos, sistemas de documentos, aplicaciones empresariales e incluso dispositivos de hardware.

Esto puede compararse con el establecimiento de una agencia de inteligencia integral para diplomáticos y la concesión de acceso a herramientas para facilitar su trabajo.

Anteriormente, los agentes tenían que desarrollar plugins personalizados e integrarse profundamente con diferentes herramientas, lo cual era laborioso y requería mucho tiempo. Sin embargo, MCP ahora está disponible para optimizar el proceso.

MCP estandariza las interacciones entre grandes modelos de lenguaje y fuentes de datos y herramientas externas. Anthropic compara MCP con un puerto USB-C para aplicaciones de IA.

USB-C sirve como una interfaz universal para dispositivos, manejando la carga y la transferencia de datos a través de un solo puerto. MCP tiene como objetivo crear una interfaz universal en el dominio de la IA, permitiendo que varios modelos y sistemas externos se conecten utilizando el mismo protocolo, en lugar de desarrollar soluciones de integración personalizadas cada vez.

Los modelos de IA que se conectan a bases de datos, motores de búsqueda o aplicaciones de terceros pueden comunicarse sin problemas si todos soportan MCP.

MCP emplea una arquitectura cliente-servidor:

1. Servidor MCP = Agencia de Inteligencia Consolidada

Las organizaciones o individuos pueden encapsular bases de datos, sistemas de archivos, calendarios y servicios de terceros en Servidores MCP. Estos servidores se adhieren al protocolo MCP, exponiendo puntos finales de acceso con formato uniforme, permitiendo que cualquier agente que cumpla con los estándares de cliente MCP envíe solicitudes, recupere información o ejecute operaciones.

2. Cliente MCP = Equipo Terminal Utilizado por los Diplomáticos

Un agente diplomático lleva consigo un equipo terminal dedicado, permitiéndoles introducir comandos, como ‘Recuperar datos de inventario del sistema financiero’, ‘Enviar una solicitud a una API’ o ‘Recuperar un documento PDF’.

Sin MCP, la integración con varios sistemas requiere escribir diferentes códigos de acceso, lo cual es engorroso. Sin embargo, con MCP, los clientes que soportan el protocolo pueden cambiar fácilmente entre diferentes servidores MCP, recuperando información y ejecutando procesos de negocio.

En esencia, MCP facilita la integración fluida entre los agentes de IA y los recursos externos.

La Distinción Entre A2A y MCP

Para aclarar la distinción entre A2A y MCP, considere una hipotética cumbre internacional donde los jefes de estado (que representan a los Agentes de IA de las empresas) se reúnen para colaborar en una tarea transnacional, como la producción de un informe de análisis económico global.

Sin un protocolo universal, tal reunión sería virtualmente imposible, ya que cada representante habla un idioma diferente. Sin embargo, con el protocolo A2A, todos los representantes firman la ‘Convención Diplomática de Viena A2A’ antes de entrar a la reunión, acordando comunicarse utilizando un formato uniforme, identificarse, declarar sus intenciones y citar los IDs de 발언 anteriores al responder.

Esto permite que ‘Agente G’ envíe un mensaje a ‘Agente O’ en formato A2A, y ‘Agente O’ responda en consecuencia. Esto marca la primera instancia de comunicación sin obstáculos entre agentes de IA de diferentes empresas.

Durante las discusiones, los representantes de IA necesitan consultar datos o utilizar herramientas para el análisis. ‘Agente A’ de Anthropic sugiere utilizar el sistema MCP para datos externos o soporte de herramientas.

Una ‘sala de interpretación simultánea MCP’ se instala junto al salón de conferencias, atendida por expertos que pueden responder en un lenguaje uniforme a través de MCP al recibir solicitudes.

Por ejemplo, ‘Agente Q’ necesita acceder a su base de datos en la nube para los cálculos. En lugar de enviar a alguien de vuelta al país, envían una solicitud MCP para datos de la base de datos X. El administrador de la base de datos MCP traduce la solicitud, recupera los resultados y responde a ‘Agente Q’ en lenguaje MCP. Todo el proceso es transparente para los otros agentes, que entienden los datos citados por ‘Agente Q’ porque la traducción MCP está en un formato reconocido.

A medida que avanza la escritura del informe, ‘Agente G’ y ‘Agente A’ se dan cuenta de que necesitan integrar sus respectivas contribuciones. ‘Agente G’ se especializa en análisis numérico, mientras que ‘Agente A’ sobresale en la síntesis del lenguaje.

‘Agente G’ comunica los datos de la tasa de crecimiento del PIB a través de A2A, y ‘Agente A’ se conecta a un plugin de hoja de cálculo de Excel a través de MCP, verifica las tendencias de los datos y responde con un párrafo resumen.

En este escenario, A2A facilita la comunicación entre agentes, mientras que MCP permite a los agentes acceder a herramientas e información externas. Juntos, los protocolos crean un acuerdo de comunicación a medida para una versión de IA de las Naciones Unidas. Con estos protocolos en su lugar, los agentes de IA pueden colaborar eficazmente, formando un ecosistema de IA interconectado.

A2A es similar a una línea directa dedicada a la comunicación diplomática, abordando la comunicación directa entre agentes. MCP es similar a un sistema de interpretación simultánea y de intercambio de recursos, abordando el problema de las entidades inteligentes que se conectan con información externa.

El auge de A2A y MCP anuncia la evolución de la industria de la IA hacia la colaboración en lugar de la competencia. Innumerables agentes de IA se desplegarán como sitios web, descubriendo y comunicándose a través de A2A y accediendo a recursos y compartiendo conocimientos a través de MCP.