Recentemente, Google ha presentato un nuovo protocollo aperto per gli Agent, chiamato Agent2Agent, o A2A in breve. Contemporaneamente, Bailian di Alibaba Cloud ha annunciato il suo ingresso in MCP. Approfondiamo cosa sono A2A e MCP.
Per comprendere questi protocolli, considera l’analogia della diplomazia tra le nazioni. Immagina ogni agente AI come un piccolo paese con la propria lingua e i propri costumi. Questi ‘paesi’ hanno ambasciate situate nello stesso edificio, che cercano di comunicare, commerciare e scambiare informazioni.
In uno scenario ideale, queste nazioni manterrebbero relazioni amichevoli e aderirebbero a una chiara serie di regole diplomatiche, consentendo loro di interagire senza problemi, firmare accordi e collaborare a progetti internazionali attorno a un tavolo di conferenza.
Tuttavia, la realtà è che ogni ambasciata opera in modo indipendente con protocolli disparati. Di conseguenza, avviare un semplice accordo commerciale con ‘Paese A’ richiede l’adempimento di una miriade di requisiti, tra cui disposizioni, certificazioni, traduzioni e chiavi specializzate. Interagire con ‘Paese B’ e ‘Paese C’ richiede la ripetizione di procedure simili più volte. Questo approccio ad hoc, frammentato e sfaccettato gonfia i costi di comunicazione, con ogni interazione che comporta un ‘tariffa informativa’ aggiuntiva.
In passato, gli agenti AI incontravano difficoltà simili quando tentavano di collaborare.
Ad esempio, potresti avere un agente che risponde automaticamente alle e-mail e un altro integrato in un’applicazione di calendario per aiutare con la pianificazione. Tuttavia, queste entità AI faticano a comunicare direttamente, rendendo necessaria la copia e l’incolla manuale delle informazioni o l’affidamento a interfacce personalizzate.
Di conseguenza, gli agenti AI operano in isolamento, mostrando una scarsa interoperabilità. Questa frammentazione frustra gli utenti che devono navigare tra più applicazioni AI e limita il potenziale dell’AI. Compiti complessi che potrebbero essere svolti attraverso la collaborazione multi-agente sono confinati artificialmente all’interno di singoli silos.
Questa situazione rispecchia il panorama post-seconda guerra mondiale, in cui ogni agente AI agisce autonomamente, senza regole unificate e affrontando barriere di comunicazione. L’attuale ecosistema AI assomiglia a una terra desolata del dopoguerra, che richiede l’adesione a interfacce e protocolli specifici per l’accesso a dati e funzionalità. L’assenza di standard impone ‘tariffe’ aggiuntive con ogni nuova relazione di collaborazione, portando a un ecosistema AI disgiunto e inefficiente, caratterizzato da isolamento e interesse personale.
L’industria dell’AI sta esplorando la possibilità di stabilire un protocollo universalmente accettato per facilitare l’interazione senza soluzione di continuità tra agenti e strumenti esterni. Google e Anthropic sono emersi come contendenti, ciascuno proponendo una soluzione: il protocollo A2A e il protocollo MCP.
Il Protocollo A2A
Il protocollo A2A, abbreviazione di Agent2Agent, consente agli agenti AI di comunicare e collaborare direttamente.
L’obiettivo principale del protocollo A2A è quello di consentire agli agenti di diverse origini e fornitori di comprendere e cooperare tra loro, in modo simile agli sforzi dell’Organizzazione mondiale del commercio per ridurre le barriere commerciali.
Adottando A2A, gli agenti di diversi fornitori e framework possono aderire a una zona di libero scambio, comunicando utilizzando un linguaggio comune e collaborando senza problemi per svolgere compiti complessi al di là delle capacità dei singoli agenti.
Per illustrare come funziona A2A, considera le seguenti analogie:
1. Agente = Diplomatico Nazionale
Ogni agente funge da diplomatico che rappresenta l’ambasciata di un paese. Il protocollo A2A mira a stabilire un’etichetta diplomatica e procedure di comunicazione uniformi. In precedenza, i diplomatici del ‘Paese A’ comunicavano esclusivamente in francese, mentre quelli del ‘Paese B’ utilizzavano la scrittura cirillica e il ‘Paese C’ richiedeva la corrispondenza tramite antiche lettere a foglia d’oro. Il protocollo A2A garantisce che tutti i partecipanti possano comunicare in una lingua concordata in precedenza, presentare documenti nello stesso formato ed eseguire risultati concordati.
2. Agent Card = Credenziali Diplomatiche / Biglietto da Visita dell’Ambasciatore
All’interno del framework A2A, ogni agente è tenuto a pubblicare una ‘Agent Card’, analoga al biglietto da visita di un diplomatico, contenente dettagli come il nome dell’agente, la versione, le capacità e le lingue o i formati supportati.
Similmente a come il biglietto da visita di un diplomatico identifica il suo ruolo e la sua affiliazione, l’Agent Card elenca le competenze dell’agente, i metodi di autenticazione e i formati di input/output. Ciò consente ad altri diplomatici di identificare e comprendere rapidamente le capacità, riducendo al minimo le barriere di comunicazione.
3. Task = Progetto Diplomatico Bilaterale o Multilaterale
Il concetto di Task è centrale per A2A. Quando un agente intende delegare un compito a un altro agente, rilascia una ‘lettera di intenti del progetto di cooperazione’. Al momento dell’accettazione, entrambe le parti registrano un Task ID per tenere traccia dei progressi e scambiare informazioni fino al completamento.
In termini diplomatici, una nazione potrebbe proporre a un’altra: ‘Desideriamo collaborare alla costruzione di una linea ferroviaria ad alta velocità transfrontaliera; si prega di inviare il vostro team di ingegneri’. Questo rispecchia un A2A Task, in cui la parte iniziatrice delinea i requisiti, l’agente remoto accetta ed entrambe le parti aggiornano regolarmente i progressi durante tutto il progetto.
I messaggi rappresentano le comunicazioni scambiate durante le fasi iniziali o intermedie del progetto, simili a cavi diplomatici, note e scambi di inviati.
4. Push Notifications = Bollettini dell’Ambasciata Diplomatica
In A2A, se un Task è un progetto a lungo termine che richiede tempi di completamento prolungati, l’agente remoto può aggiornare la parte iniziatrice tramite notifiche push, in modo simile a un paese che fornisce aggiornamenti periodici su un progetto infrastrutturale a lungo termine. Ciò migliora le capacità di collaborazione asincrona.
5. Autenticazione e Sicurezza = Privilegi e Protocolli Diplomatici
A2A impiega strategie di autenticazione di livello aziendale, richiedendo a entrambe le parti comunicanti di verificare le credenziali per impedire l’imitazione o l’intercettazione dannosa. Questo meccanismo è parallelo ai privilegi e ai protocolli diplomatici.
In sostanza, A2A rispecchia le dinamiche della diplomazia internazionale o della collaborazione commerciale, enfatizzando la comunicazione standardizzata e la sicurezza.
Il Protocollo MCP
Il protocollo MCP, o Model Context Protocol, è uno standard introdotto e open-source da Anthropic nel novembre 2024.
Mentre A2A affronta il processo di comunicazione tra i diplomatici AI, rimane una sfida persistente: l’assenza di fonti di informazione affidabili. Anche il diplomatico o dirigente aziendale più eloquente è mal equipaggiato per operare efficacemente senza informazioni accurate sul panorama internazionale e sull’allocazione delle risorse.
I diplomatici moderni si affidano a strumenti esterni, come sistemi di visti, sistemi di regolamento internazionali e database di intelligence, per svolgere le proprie funzioni. Allo stesso modo, un agente che si assume responsabilità complesse deve connettersi a vari database, sistemi di documenti, applicazioni aziendali e persino dispositivi hardware.
Questo può essere paragonato alla creazione di un’agenzia di intelligence completa per i diplomatici e alla concessione loro dell’accesso a strumenti per facilitare il loro lavoro.
In precedenza, gli agenti dovevano sviluppare plugin personalizzati e integrarsi profondamente con diversi strumenti, il che era sia laborioso che dispendioso in termini di tempo. Tuttavia, MCP è ora disponibile per semplificare il processo.
MCP standardizza le interazioni tra modelli linguistici di grandi dimensioni e fonti di dati e strumenti esterni. Anthropic paragona MCP a una porta USB-C per applicazioni AI.
USB-C funge da interfaccia universale per i dispositivi, gestendo la ricarica e il trasferimento dei dati tramite una singola porta. MCP mira a creare un’interfaccia universale nel dominio dell’AI, consentendo a vari modelli e sistemi esterni di connettersi utilizzando lo stesso protocollo, anziché sviluppare soluzioni di integrazione personalizzate ogni volta.
I modelli AI che si connettono a database, motori di ricerca o applicazioni di terze parti possono comunicare senza problemi se supportano tutti MCP.
MCP impiega un’architettura client-server:
1. MCP Server = Agenzia di Intelligence Consolidata
Organizzazioni o individui possono incapsulare database, file system, calendari e servizi di terze parti in MCP Server. Questi server aderiscono al protocollo MCP, esponendo endpoint di accesso formattati in modo uniforme, consentendo a qualsiasi agente conforme agli standard client MCP di inviare richieste, recuperare informazioni o eseguire operazioni.
2. MCP Client = Apparecchiatura Terminale Utilizzata dai Diplomatici
Un agente diplomatico porta con sé un’apparecchiatura terminale dedicata, che gli consente di inserire comandi, come ‘Recupera i dati di inventario dal sistema finanziario’, ‘Invia una richiesta a un’API’ o ‘Recupera un documento PDF’.
Senza MCP, l’integrazione con vari sistemi richiede la scrittura di diversi codici di accesso, il che è ingombrante. Tuttavia, con MCP, i client che supportano il protocollo possono passare facilmente tra diversi server MCP, recuperando informazioni ed eseguendo processi aziendali.
In sostanza, MCP facilita l’integrazione senza soluzione di continuità tra gli agenti AI e le risorse esterne.
La Distinzione Tra A2A e MCP
Per chiarire la distinzione tra A2A e MCP, considera un ipotetico vertice internazionale in cui i capi di stato (che rappresentano gli agenti AI delle aziende) si riuniscono per collaborare a un compito transnazionale, come la produzione di un rapporto di analisi economica globale.
Senza un protocollo universale, un simile incontro sarebbe praticamente impossibile, poiché ogni rappresentante parla una lingua diversa. Tuttavia, con il protocollo A2A, tutti i rappresentanti firmano la ‘Convenzione diplomatica di Vienna A2A’ prima di entrare nella riunione, accettando di comunicare utilizzando un formato uniforme, identificarsi, dichiarare le proprie intenzioni e citare gli ID dei precedenti interventi quando rispondono.
Ciò consente all’’Agente G’ di inviare un messaggio all’’Agente O’ in formato A2A e l’’Agente O’ risponde di conseguenza. Questo segna la prima istanza di comunicazione senza impedimenti tra agenti AI di diverse società.
Durante le discussioni, i rappresentanti dell’AI devono consultare i dati o utilizzare strumenti per l’analisi. ‘Agente A’ di Anthropic suggerisce di utilizzare il sistema MCP per dati o supporto di strumenti esterni.
Una ‘sala di interpretazione simultanea MCP’ è allestita a fianco della sala conferenze, dotata di esperti che possono rispondere in una lingua uniforme tramite MCP alla ricezione delle richieste.
Ad esempio, ‘Agente Q’ deve accedere al proprio database cloud per i calcoli. Invece di rimandare qualcuno nel paese, inviano una richiesta MCP per i dati dal database X. L’amministratore del database MCP traduce la richiesta, recupera i risultati e risponde a ‘Agente Q’ in lingua MCP. L’intero processo è trasparente agli altri agenti, che comprendono i dati citati da ‘Agente Q’ perché la traduzione MCP è in un formato riconosciuto.
Man mano che la stesura del rapporto avanza, ‘Agente G’ e ‘Agente A’ si rendono conto di dover integrare i rispettivi contributi. ‘Agente G’ è specializzato in analisi numerica, mentre ‘Agente A’ eccelle nella sintesi linguistica.
‘Agente G’ comunica i dati del tasso di crescita del PIL tramite A2A e ‘Agente A’ si connette a un plug-in di foglio di calcolo Excel tramite MCP, verifica le tendenze dei dati e risponde con un paragrafo riassuntivo.
In questo scenario, A2A facilita la comunicazione tra gli agenti, mentre MCP consente agli agenti di accedere a strumenti e informazioni esterni. Insieme, i protocolli creano un accordo di comunicazione su misura per una versione AI delle Nazioni Unite. Con questi protocolli in atto, gli agenti AI possono collaborare efficacemente, formando un ecosistema AI interconnesso.
A2A è simile a una hotline dedicata per la comunicazione diplomatica, che affronta la comunicazione diretta tra agenti. MCP è simile a un sistema di interpretazione simultanea e condivisione delle risorse, che affronta il problema delle entità intelligenti che si connettono con informazioni esterne.
L’ascesa di A2A e MCP preannuncia l’evoluzione dell’industria dell’AI verso la collaborazione piuttosto che la concorrenza. Innumerevoli agenti AI verranno distribuiti come siti Web, scoprendo e comunicando tramite A2A e accedendo alle risorse e condividendo la conoscenza tramite MCP.