Decodificando A2A e MCP no Mundo dos Agentes

Recentemente, o Google revelou um novo protocolo aberto para Agentes chamado Agent2Agent, ou A2A para abreviar. Simultaneamente, a Bailian da Alibaba Cloud também anunciou sua incursão no MCP. Vamos nos aprofundar no que são A2A e MCP.

Para entender esses protocolos, considere a analogia da diplomacia entre nações. Imagine cada agente de IA como um pequeno país com sua própria língua e costumes. Esses ‘países’ têm embaixadas instaladas no mesmo edifício, tentando se comunicar, negociar e trocar informações.

Num cenário ideal, essas nações manteriam relações amigáveis e adeririam a um conjunto claro de regras diplomáticas, permitindo-lhes interagir, assinar acordos e colaborar em projetos internacionais em torno de uma mesa de conferência.

No entanto, a realidade é que cada embaixada opera independentemente com protocolos díspares. Consequentemente, iniciar um simples acordo comercial com o ‘País A’ requer o cumprimento de uma série de requisitos, incluindo provisões, certificações, traduções e chaves especializadas. Envolver-se com o ‘País B’ e o ‘País C’ exige a repetição de procedimentos semelhantes várias vezes. Essa abordagem ad-hoc, fragmentada e multifacetada inflaciona os custos de comunicação, com cada interação incorrendo em uma ‘tarifa de informação’ adicional.

No passado, os agentes de IA encontraram predicados semelhantes ao tentar colaborar.

Por exemplo, você pode ter um agente que responde automaticamente a e-mails e outro integrado a um aplicativo de calendário para ajudar no agendamento. No entanto, essas entidades de IA lutam para se comunicar diretamente, necessitando de cópia e colagem manual de informações ou dependência de interfaces personalizadas.

Como resultado, os agentes de IA operam isoladamente, exibindo baixa interoperabilidade. Essa fragmentação frustra os usuários que devem navegar entre vários aplicativos de IA e limita o potencial da IA. Tarefas complexas que poderiam ser realizadas por meio da colaboração multiagente são artificialmente confinadas em silos individuais.

Essa situação espelha o cenário pós-Segunda Guerra Mundial, onde cada agente de IA atua autonomamente, sem regras unificadas e enfrentando barreiras de comunicação. O atual ecossistema de IA se assemelha a um terreno baldio pós-guerra, exigindo adesão a interfaces e protocolos específicos para acessar dados e funcionalidades. A ausência de padrões impõe ‘tarifas’ adicionais a cada novo relacionamento colaborativo, levando a um ecossistema de IA desconjuntado e ineficiente, caracterizado pelo isolamento e interesse próprio.

A indústria de IA está explorando a possibilidade de estabelecer um protocolo universalmente aceito para facilitar a interação perfeita entre agentes e ferramentas externas. Google e Anthropic surgiram como líderes, cada um propondo uma solução: o protocolo A2A e o protocolo MCP.

O Protocolo A2A

O protocolo A2A, abreviação de Agent2Agent, permite que os agentes de IA se comuniquem e colaborem diretamente.

O principal objetivo do protocolo A2A é permitir que agentes de diversas origens e fornecedores compreendam e cooperem uns com os outros, semelhante aos esforços da Organização Mundial do Comércio para reduzir as barreiras comerciais.

Ao adotar o A2A, agentes de diferentes fornecedores e estruturas podem ingressar em uma zona de livre comércio, comunicando-se em uma linguagem comum e colaborando perfeitamente para realizar tarefas complexas além das capacidades de agentes individuais.

Para ilustrar como o A2A opera, considere as seguintes analogias:

1. Agente = Diplomata Nacional

Cada agente funciona como um diplomata representando a embaixada de um país. O protocolo A2A visa estabelecer etiqueta diplomática e procedimentos de comunicação uniformes. Anteriormente, diplomatas do ‘País A’ comunicavam-se exclusivamente em francês, enquanto os do ‘País B’ utilizavam escrita cirílica, e o ‘País C’ exigia correspondência por meio de antigas cartas folheadas a ouro. O protocolo A2A garante que todos os participantes possam se comunicar em uma linguagem pré-acordada, enviar documentos no mesmo formato e executar os resultados acordados.

2. Cartão de Agente = Credenciais Diplomáticas / Cartão de Visita do Embaixador

Dentro da estrutura A2A, cada agente é obrigado a publicar um ‘Cartão de Agente’, análogo ao cartão de visita de um diplomata, contendo detalhes como o nome do agente, versão, capacidades e idiomas ou formatos suportados.

Semelhante a como o cartão de visita de um diplomata identifica sua função e afiliação, o Cartão de Agente lista as habilidades do agente, métodos de autenticação e formatos de entrada/saída. Isso permite que outros diplomatas identifiquem e compreendam rapidamente as capacidades, minimizando as barreiras de comunicação.

3. Tarefa = Projeto Diplomático Bilateral ou Multilateral

O conceito de Tarefa é central para A2A. Quando um agente pretende delegar uma tarefa a outro agente, ele emite uma ‘carta de intenção de projeto de cooperação’. Após a aceitação, ambas as partes registram um ID de Tarefa para acompanhar o progresso e trocar informações até a conclusão.

Em termos diplomáticos, uma nação pode propor a outra: ‘Desejamos colaborar na construção de uma linha ferroviária de alta velocidade transfronteiriça; envie sua equipe de engenharia’. Isso espelha uma Tarefa A2A, onde a parte iniciadora descreve os requisitos, o agente remoto aceita e ambas as partes atualizam regularmente o progresso ao longo do projeto.

As mensagens representam as comunicações trocadas durante os estágios inicial ou intermediário do projeto, semelhantes aos cabos diplomáticos, notas e trocas de enviados.

4. Notificações Push = Boletins da Embaixada Diplomática

Em A2A, se uma Tarefa é um projeto de longo prazo que exige um tempo de conclusão prolongado, o agente remoto pode atualizar a parte iniciadora por meio de notificações push, semelhante a um país que fornece atualizações periódicas sobre um projeto de infraestrutura de longo prazo. Isso aprimora as capacidades de colaboração assíncrona.

5. Autenticação e Segurança = Privilégios e Protocolos Diplomáticos

A2A emprega estratégias de autenticação de nível empresarial, exigindo que ambas as partes comunicantes verifiquem as credenciais para evitar a representação ou escuta maliciosa. Esse mecanismo é paralelo aos privilégios e protocolos diplomáticos.

Em essência, o A2A espelha a dinâmica da diplomacia internacional ou colaboração empresarial, enfatizando a comunicação e segurança padronizadas.

O Protocolo MCP

O protocolo MCP, ou Model Context Protocol, é um padrão introduzido e de código aberto pela Anthropic em novembro de 2024.

Enquanto o A2A aborda o processo de comunicação entre diplomatas de IA, um desafio persistente permanece: a ausência de fontes de informação confiáveis. Mesmo o diplomata ou executivo de negócios mais eloquente está mal equipado para operar efetivamente sem informações precisas sobre o cenário internacional e a alocação de recursos.

Os diplomatas modernos contam com ferramentas externas, como sistemas de visto, sistemas de liquidação internacional e bancos de dados de inteligência, para desempenhar suas funções. Da mesma forma, um agente que assume responsabilidades complexas deve se conectar a vários bancos de dados, sistemas de documentos, aplicativos corporativos e até mesmo dispositivos de hardware.

Isso pode ser comparado a estabelecer uma agência de inteligência abrangente para diplomatas e conceder-lhes acesso a ferramentas para facilitar seu trabalho.

Anteriormente, os agentes tinham que desenvolver plugins personalizados e integrar-se profundamente com diferentes ferramentas, o que era trabalhoso e demorado. No entanto, o MCP agora está disponível para simplificar o processo.

O MCP padroniza as interações entre grandes modelos de linguagem e fontes de dados e ferramentas externas. Anthropic compara o MCP a uma porta USB-C para aplicativos de IA.

O USB-C serve como uma interface universal para dispositivos, lidando com o carregamento e a transferência de dados por meio de uma única porta. O MCP visa criar uma interface universal no domínio da IA, permitindo que vários modelos e sistemas externos se conectem usando o mesmo protocolo, em vez de desenvolver soluções de integração personalizadas a cada vez.

Os modelos de IA que se conectam a bancos de dados, mecanismos de busca ou aplicativos de terceiros podem se comunicar perfeitamente se todos suportarem o MCP.

O MCP emprega uma arquitetura cliente-servidor:

1. Servidor MCP = Agência de Inteligência Consolidada

Organizações ou indivíduos podem encapsular bancos de dados, sistemas de arquivos, calendários e serviços de terceiros em Servidores MCP. Esses servidores aderem ao protocolo MCP, expondo endpoints de acesso formatados uniformemente, permitindo que qualquer agente compatível com os padrões de cliente MCP envie solicitações, recupere informações ou execute operações.

2. Cliente MCP = Equipamento Terminal Usado por Diplomatas

Um agente diplomata carrega um equipamento terminal dedicado, permitindo que ele insira comandos, como ‘Recuperar dados de inventário do sistema financeiro’, ‘Enviar uma solicitação para uma API’ ou ‘Recuperar um documento PDF’.

Sem o MCP, a integração com vários sistemas requer a escrita de diferentes códigos de acesso, o que é complicado. No entanto, com o MCP, os clientes que suportam o protocolo podem alternar facilmente entre diferentes servidores MCP, recuperando informações e executando processos de negócios.

Em essência, o MCP facilita a integração perfeita entre agentes de IA e recursos externos.

A Distinção Entre A2A e MCP

Para esclarecer a distinção entre A2A e MCP, considere uma hipotética cúpula internacional onde chefes de estado (representando os Agentes de IA das empresas) se reúnem para colaborar em uma tarefa transnacional, como a produção de um relatório de análise econômica global.

Sem um protocolo universal, tal reunião seria praticamente impossível, pois cada representante fala uma língua diferente. No entanto, com o protocolo A2A, todos os representantes assinam a ‘Convenção Diplomática de Viena A2A’ antes de entrar na reunião, concordando em se comunicar usando um formato uniforme, identificar-se, declarar suas intenções e citar IDs de发言 anteriores ao responder.

Isso permite que o ‘Agente G’ envie uma mensagem para o ‘Agente O’ no formato A2A, e o ‘Agente O’ responde de acordo. Isso marca a primeira instância de comunicação desimpedida entre agentes de IA de diferentes empresas.

Durante as discussões, os representantes de IA precisam consultar dados ou utilizar ferramentas para análise. O ‘Agente A’ da Anthropic sugere o uso do sistema MCP para dados externos ou suporte a ferramentas.

Uma ‘sala de interpretação simultânea MCP’ é montada ao lado do salão de conferências, com pessoal especializado que pode responder em uma linguagem uniforme via MCP ao receber solicitações.

Por exemplo, o ‘Agente Q’ precisa acessar seu banco de dados em nuvem para cálculos. Em vez de enviar alguém de volta ao país, eles enviam uma solicitação MCP de dados do banco de dados X. O administrador do banco de dados MCP traduz a solicitação, recupera os resultados e responde ao ‘Agente Q’ na linguagem MCP. Todo o processo é transparente para os outros agentes, que entendem os dados citados pelo ‘Agente Q’ porque a tradução MCP está em um formato reconhecido.

À medida que a redação do relatório avança, o ‘Agente G’ e o ‘Agente A’ percebem que precisam integrar suas respectivas contribuições. O ‘Agente G’ é especializado em análise numérica, enquanto o ‘Agente A’ se destaca no resumo de idiomas.

O ‘Agente G’ comunica os dados da taxa de crescimento do PIB via A2A, e o ‘Agente A’ se conecta a um plugin de planilha Excel via MCP, verifica as tendências dos dados e responde com um parágrafo de resumo.

Nesse cenário, o A2A facilita a comunicação entre agentes, enquanto o MCP permite que os agentes acessem ferramentas e informações externas. Juntos, os protocolos criam um acordo de comunicação personalizado para uma versão de IA das Nações Unidas. Com esses protocolos em vigor, os agentes de IA podem colaborar efetivamente, formando um ecossistema de IA interconectado.

O A2A é semelhante a uma linha direta dedicada para comunicação diplomática, abordando a comunicação direta do agente. O MCP é semelhante a um sistema de interpretação simultânea e compartilhamento de recursos, abordando a questão das entidades inteligentes que se conectam com informações externas.

A ascensão de A2A e MCP anuncia a evolução da indústria de IA para a colaboração, em vez da competição. Inúmeros agentes de IA serão implantados como sites, descobrindo e se comunicando por meio de A2A e acessando recursos e compartilhando conhecimento por meio de MCP.