MCP: Accoglienza tiepida tra i giganti del web

Il dibattito sull’interoperabilità dell’IA si sta intensificando. A seguito dell’annuncio da parte di Baidu dei suoi servizi MCP completi durante la sua conferenza per sviluppatori la scorsa settimana, importanti aziende tecnologiche cinesi come Alibaba, ByteDance e Tencent hanno tutte intrapreso il percorso dell’MCP.

MCP, o Model Context Protocol, è concepito come uno standard unificante che consente all’IA di interfacciarsi senza problemi con una moltitudine di applicazioni e servizi. Può essere paragonato all’interfaccia USB onnipresente che si trova nei computer e negli smartphone, consentendo l’integrazione plug-and-play di diversi dispositivi esterni. In sostanza, MCP mira a fornire all’IA una ‘porta USB’ universale per accedere agli strumenti ed eseguire attività.

Nel novembre 2024, Anthropic, una società americana di IA, ha introdotto lo standard MCP, che è stato rapidamente abbracciato da concorrenti come OpenAI e Google, segnalando un allontanamento dalla pratica competitiva convenzionale degli ecosistemi proprietari. A partire da aprile, le principali aziende tecnologiche cinesi, tra cui Bailian di Alibaba Cloud, Knowledge Engine di Tencent Cloud, Kouzi Space di ByteDance e Baidu AI Cloud, hanno lanciato i propri servizi MCP completi.

La promessa e le sfide dell’unificazione

L’obiettivo principale di MCP è promuovere l’unificazione, ma questo sforzo affronta sfide significative. Secondo diversi sviluppatori e ricercatori, sebbene MCP sia efficace per accedere ai dati aziendali locali, incontra ostacoli quando si tenta di integrarsi con le applicazioni Internet per attività come la prenotazione di voli, il controllo dei prezzi e la creazione di guide di viaggio. Queste sfide derivano dall’immaturità dei processi di invocazione dell’IA e dalla disponibilità limitata di strumenti Internet, con molte piattaforme che offrono solo l’accesso a funzionalità periferiche.

Non tutte le piattaforme Internet sono ugualmente entusiaste di adottare questo standard comune e di aderire alla rete di fornitori di servizi MCP. La natura chiusa dell’ecosistema Internet cinese, unita a una maggiore sensibilità alla privacy dei dati, ha reso molte piattaforme caute. Preferiscono valutare la fattibilità e lo sviluppo dell’ecosistema MCP prima di impegnarsi completamente in esso.

Il panorama dell’IA è noto per la sua terminologia e i suoi concetti in rapida evoluzione. Quando Anthropic ha inizialmente reso open source il protocollo MCP alla fine dello scorso anno, il settore ha ampiamente adottato un approccio attendista. Tuttavia, la popolarità esplosiva di Manus ha da allora alimentato l’interesse per MCP in Cina.

MCP come catalizzatore per l’agency dell’IA

Secondo Hou Xinyi dell’Università di Scienza e Tecnologia di Huazhong, il passo cruciale per trascendere i limiti dei ‘chatbot’ risiede nel consentire all’IA di interagire con dati e strumenti esterni, che è precisamente ciò che MCP cerca di facilitare.

Prima di MCP, sono stati esplorati approcci alternativi per affrontare la percepita mancanza di ‘agency dell’IA’. Alla fine del 2023, OpenAI ha introdotto il concetto di un app store (GPT Store), consentendo a ChatGPT di sfruttare strumenti esterni tramite plugin basati su una serie definita di standard. App store di IA simili, come Kouzi di ByteDance, Qianfan di Baidu e Bailian di Alibaba, hanno seguito l’esempio.

Tuttavia, questi approcci alla fine hanno raggiunto i loro limiti. Plugin e app store condividevano un problema comune: la siloizzazione. Ogni strumento possedeva la propria documentazione di sviluppo unica, formati di parametri e specifiche di interfaccia. Ciò significava che gli sviluppatori dovevano reinventare la ruota ogni volta che integravano un nuovo strumento nell’IA, con conseguenti inefficienze.

Nel tempo, il numero di nuovi strumenti aggiunti agli app store è diminuito e la qualità dei plugin è variata in modo significativo, ostacolando la capacità di affrontare compiti complessi. Ciò indicava che gli approcci esistenti si stavano avvicinando ai loro limiti.

MCP come soluzione unificante

MCP è visto come una soluzione promettente grazie alla sua enfasi sull’unificazione. Nella sua documentazione ufficiale, Anthropic paragona MCP a un’interfaccia USB-C universale per il mondo dell’IA. Hou Xinyi preferisce descriverlo come una ‘docking station’: un adattatore versatile che consente all’IA di connettersi a più strumenti esterni contemporaneamente, eliminando la necessità di conversioni di formato.

Molti prevedono che MCP avrà un impatto trasformativo, simile alla standardizzazione dei pesi e delle misure di Qin Shi Huang, che ha facilitato il commercio e la comunicazione tra gli stati precedentemente frammentati del periodo delle primavere e degli autunni.

Secondo un responsabile tecnico del gruppo di lavoro sull’interconnessione intelligente di una grande azienda tecnologica, MCP ottimizza anche le interazioni linguistiche dell’IA. In precedenza, l’IA richiedeva agli utenti di dichiarare con precisione ‘Voglio navigare’ per utilizzare l’API di un servizio di navigazione. Anche una leggera deviazione potrebbe causare il fallimento dell’IA. Ora, ogni strumento deve fornire nomi, parametri e descrizioni funzionali standardizzati. Di conseguenza, l’IA deve solo comprendere l’intento dell’utente e quindi abbinarlo al server MCP più appropriato in base alle descrizioni.

Questo approccio si allinea più strettamente alle capacità intrinseche dei modelli linguistici di grandi dimensioni, consentendo agli utenti di invocare servizi con una sola frase, allontanandosi dal precedente requisito di comunicazione diretta interfaccia-interfaccia.

L’adozione attuale e le limitazioni di MCP

Nonostante il suo potenziale percepito, MCP non ha ancora raggiunto un’adozione diffusa e le sue applicazioni pratiche rimangono limitate. Attualmente, MCP è più popolare tra il personale tecnico aziendale e gli sviluppatori indipendenti.

Come ingegnere front-end, Gong Dian fa molto affidamento sull’assistente di programmazione AI Cursor. Tuttavia, Cursor ha avuto difficoltà a integrarsi senza problemi con i sistemi di progetto interni della sua azienda, richiedendo un intervento manuale. Mentre plugin o chiamate di funzione potevano essere utilizzati in precedenza, l’IA esterna non poteva accedere ai sistemi interni dell’azienda e l’invocazione in tempo reale sollevava problemi di sicurezza. MCP, d’altra parte, può essere avviato all’interno della rete interna dell’azienda, rendendolo più affidabile e conforme.

Lo sviluppatore indipendente Zhu Mama ha recentemente incaricato Cursor di apprendere la documentazione MCP e di impacchettare le API di Google Maps e Search in un server MCP, che è stato quindi utilizzato per invocare il modello linguistico di grandi dimensioni Gemini di Google. Il Gemini dotato di MCP risultante è stato trasformato in un assistente di guida turistica. Quando gli è stato chiesto dei percorsi di trasporto pubblico dall’aeroporto di Singapore a varie attrazioni, l’assistente ha fornito informazioni più dettagliate e accurate rispetto alla risposta di Doubao.

Diversi assistenti di viaggio stanno emergendo all’interno della comunità degli sviluppatori. Quando Kouzi Space di ByteDance ha lanciato la sua beta interna il 19 aprile, il caso dimostrativo era anche un assistente AI di viaggio, spingendo alcuni a scherzare sull’ossessione del settore per i viaggi.

Zhu Mama ammette candidamente che l’attenzione agli scenari di viaggio è principalmente dovuta alla loro rilevanza per le esigenze quotidiane dei consumatori. Un altro motivo è la disponibilità limitata di software Internet compatibile con MCP in Cina, che limita il potenziale del mercato.

Secondo le ultime statistiche della piattaforma di navigazione MCP.so, ci sono oltre 11.028 fornitori di servizi MCP in tutto il mondo e il numero sta crescendo rapidamente. Tuttavia, in Cina, solo alcune importanti applicazioni di localizzazione geografica, come AutoNavi, Baidu Maps e Tencent Maps, funzionano attualmente come server MCP su larga scala.

Questa limitazione è il motivo per cui il piano di Zhu Mama di creare una versione cinese di un assistente di viaggio si è rapidamente bloccato. Per sviluppare una guida turistica cinese, sarebbe ideale utilizzare i servizi di mappe nazionali. Tuttavia, Zhu Mama ha scoperto che il server MCP ufficiale fornito da AutoNavi offriva informazioni molto limitate. Sebbene potesse fornire query di percorso tra due posizioni, mancava di informazioni dettagliate su punti di riferimento, recensioni, prezzi dei biglietti d’albergo e altri dettagli essenziali.

Al contrario, l’API di Google Maps fornisce metodi di prenotazione dettagliati, prezzi degli hotel, recensioni degli hotel, servizi alberghieri e persino confronti di prezzi tra più piattaforme, un livello di dettaglio difficile da immaginare all’interno dell’ecosistema cinese.

Mentre i prodotti Tencent, Alibaba, ByteDance e Baidu stanno abbracciando MCP, le loro applicazioni ad alta frequenza non si sono ancora unite formalmente alla rete di fornitori di servizi MCP. Piattaforme come WeChat, Xiaohongshu e Douyin, nonché piattaforme di servizi per lo stile di vita come Ele.me, Meituan e Ctrip, sono vistosamente assenti.

Sfide nella disponibilità degli strumenti e nella programmazione dell’IA

Oltre alla disponibilità limitata di strumenti, anche le capacità di programmazione dell’IA rappresentano un vincolo. Zhu Mama ha impacchettato 6-8 interfacce API, tra cui Google Hotels, Maps e Search, in un singolo server MCP, che è ben al di sotto del limite massimo (Cursor consente un massimo di 40 strumenti per agente). Tuttavia, l’IA stava già lottando per determinare quale strumento invocare. Di fronte a richieste complesse, l’IA non è stata in grado di scomporre il processo e invocare MCP in fasi, tentando invece di gestire tutto in una volta.

Secondo Gong Dian, il valore di MCP dipende dalla qualità sia del lato client che del lato server. Proprio come una porta USB non ha capacità intrinseche e si basa sui servizi dietro di essa, MCP richiede servizi robusti per realizzare il suo potenziale.

MCP getta le basi per gli agenti AI, ma non risolve tutti i problemi. Uno standard che rimane inutilizzato è semplicemente un pezzo di carta.

Il suddetto responsabile tecnico suggerisce che l’adozione diffusa dello standard MCP di Anthropic è dovuta alla sua natura open source, senza scopo di lucro e alla credibilità del suo creatore. Altre organizzazioni sono disposte a seguire uno standard stabilito da un’entità affidabile.

Attualmente, le piccole e medie imprese e le grandi aziende Internet che cercano di diversificare i propri flussi di entrate sono i principali utenti dello standard MCP.

La società di companionship AI MiniMax ha recentemente lanciato un server MCP, con il community manager Cai Jiaren che ha affermato che gli sviluppatori possono utilizzare MCP per invocare le capacità multi-modali di MiniMax per la generazione di video, la generazione di voce e la clonazione della voce. L’MCP include rigidi meccanismi di controllo degli accessi per garantire la conformità quando le aziende accedono ai dati interni. Anche il processo di invocazione complessivo è semplificato, senza aggiungere costi aggiuntivi per il token.

La decisione di MiniMax di lanciare un server MCP è stata guidata dal desiderio di consentire agli sviluppatori globali di sfruttare facilmente le capacità del modello di MiniMax e sbloccare una creazione più flessibile ed efficiente.

Altre startup condividono aspirazioni simili. Biu Technology ha menzionato in un’intervista che gli sviluppatori possono utilizzare AutoNavi MCP per ottenere dati di trasporto e quindi utilizzare i prodotti di Biu per generare un PPT. MCP abbassa la barriera all’ingresso fornendo l’accesso all’interfaccia di AutoNavi, che altrimenti non sarebbe disponibile per loro.

Il suddetto responsabile tecnico ritiene che MCP sia essenzialmente una storia sui fornitori di servizi. Incapsulando le loro API secondo lo standard MCP, i fornitori di servizi applicativi possono rendere i loro servizi accessibili a tutta l’IA.

Divergenze e preoccupazioni tra i fornitori di servizi

Tuttavia, sorgono disaccordi tra i fornitori di servizi. Molte aziende non sono pienamente impegnate nell’idea. Mentre le principali piattaforme come AutoNavi e Baidu Maps hanno lanciato server MCP, principalmente riconfezionano le interfacce API esistenti, offrendo funzionalità convenzionali mantenendo un controllo rigoroso sulle autorizzazioni utente principali e sui dati delle transazioni.

Oltre ai servizi di localizzazione delle mappe, l’autopubblicatore Xiaohongshu di uno sviluppatore di terze parti, che automatizza la ricerca e la pubblicazione di contenuti, è attualmente l’elemento più popolare sulla piazza MCP della comunità Modeng. Hou Xinyi suggerisce che ciò potrebbe avere un impatto limitato su piattaforme di contenuti social come Xiaohongshu, ma i dati e le autorizzazioni diventano particolarmente sensibili in scenari ad alta intensità di transazioni come le piattaforme di consegna di cibo.

Una delle principali preoccupazioni per i fornitori di servizi è il controllo dell’esperienza utente.

Ad esempio, l’apertura di un servizio completo di consegna di cibo richiede la concessione agli agenti AI dell’accesso a dati personali sensibili come prezzi, informazioni sui negozi e indirizzi e informazioni di contatto degli utenti. Anthropic ha riconosciuto che il sistema di sicurezza di MCP, inclusa la gestione delle autorizzazioni e il controllo delle invocazioni, è ancora in fase di sviluppo. Di conseguenza, alcune piattaforme sono preoccupate per il rischio di invocazione non autorizzata quando si collegano a MCP.

Alcune piattaforme stanno testando scenari di transazione relativamente sicuri. Ad esempio, Alipay ha recentemente lanciato un server MCP, affermando di dare agli agenti AI ‘accesso con un clic alle funzionalità di pagamento’. Tuttavia, un’analisi più approfondita rivela che offre principalmente servizi di riscossione piuttosto che servizi di pagamento.

Secondo Hou Xinyi, l’approccio di Alipay si concentra sulla facilitazione della riscossione dei pagamenti dei commercianti piuttosto che sul consentire all’IA di effettuare pagamenti per conto dei consumatori. Questa è un’opzione praticabile, poiché consentire all’IA di controllare i portafogli ed effettuare ordini liberamente non è ancora abbastanza sicuro per il comfort di tutti. Questo è anche il motivo principale per cui i servizi di transazione non possono essere ampiamente promossi.

Un problema più profondo è che se l’IA partecipa liberamente al processo di transazione - aiutando gli utenti a confrontare i prezzi o raccomandando il ristorante più conveniente - fornirebbe senza dubbio una comodità significativa per gli utenti. Tuttavia, significherebbe anche che le piattaforme di servizi perderebbero il controllo sul processo di selezione dell’utente e i loro principali vantaggi algoritmici sarebbero marginalizzati, riducendoli a fornitori ordinari.

Affrontare la sicurezza e promuovere l’universalità

Diversi intervistati ritengono che MCP debba affrontare due questioni chiave: la sicurezza e l’universalità.

Innanzitutto, la sicurezza. Hou Xinyi sottolinea che MCP deve affrontare due sfide di sicurezza: una mancanza di supervisione centralizzata della sicurezza e un meccanismo incompleto di verifica dell’identità e autorizzazione dei dati. Attualmente, non esiste una ‘piazza di scoperta’ ufficiale per MCP. Molte piattaforme di navigazione di terze parti raccolgono i servizi MCP estraendo direttamente i progetti di codice da GitHub, il che è veloce e semplice ma privo di un processo di revisione formale. Anthropic ha affermato che affronterà formalmente il meccanismo di hosting MCP e i problemi di rilevabilità quest’anno. La bozza di protocollo recentemente aggiornata di Anthropic sta lavorando per affrontare questa carenza. Inoltre, organizzazioni nazionali come IIFAA (Internet Trusted Authentication Alliance) stanno tentando di colmare il divario di sicurezza.

Ci sono anche problemi di lunga data nel campo degli agenti AI, come il dirottamento dei prompt e gli attacchi di combinazione di strumenti. Tuttavia, il suddetto responsabile tecnico ritiene che queste non siano vulnerabilità MCP, ma piuttosto rischi che esistono per qualsiasi agente AI. Attualmente, non sono state riscontrate vulnerabilità di sicurezza ovvie nel protocollo MCP stesso e i meccanismi di trasmissione e interazione dei dati sono generalmente affidabili.

La sicurezza è solo il primo ostacolo. La vera sfida è superare le difese degli interessi dei produttori e persuadere più produttori a diventare server MCP.

Secondo Hou Xinyi, questo è legato alla comprensione della natura di ‘giardino recintato’ delle piattaforme Internet. I dati sono un’importante barriera competitiva per varie piattaforme, quindi molti produttori potrebbero aprire solo alcune funzioni periferiche come server MCP per i test. I produttori potrebbero aver bisogno di aspettare e vedere quanto impatto avrà l’ecosistema MCP.

La suddetta persona responsabile ha affermato che se è connesso all’IA come server MCP, può ottenere più dati e abitudini degli utenti e restituirli al proprio modello di base, il che potrebbe diventare la più grande motivazione per i produttori a unirsi attivamente.

Quando il mercato dei server MCP è veramente abbondante, devono essere considerati problemi più distanti.

Ad esempio, come fanno i corpi intelligenti a chiamare diverse app sui telefoni cellulari? La persona responsabile ha menzionato che per riattivare un’altra app tramite il corpo intelligente AI locale del telefono cellulare, ci sarà un ulteriore livello di autorizzazione dell’applicazione e verifica dell’identità, che non è semplice come MCP che chiama i servizi cloud e al momento non esiste una soluzione particolarmente adatta.

Ad esempio, quando l’offerta di servizi è eccessiva, come fanno i corpi intelligenti a fare delle scelte: chiamare il cibo da asporto di JD o il cibo da asporto di Meituan? Utilizzare la mappa Gaode o la mappa Baidu? Diversi intervistati hanno menzionato che la logica di invocazione MCP odierna è ancora molto elementare, determinata principalmente dalla ‘descrizione funzionale’ del fornitore di servizi e non esiste alcun meccanismo di ordinamento e ottimizzazione. Se un fornitore di servizi aggiunge deliberatamente un linguaggio induttivo alla descrizione, come ‘il più efficiente’ e ‘deve scegliere’, l’IA potrebbe essere fuorviata e dirottata verso luoghi in cui non dovrebbe andare.

Come ha spiegato la persona responsabile della suddetta tecnologia, ‘È come se non riesci a trovare il servizio che desideri nel motore di ricerca, ma viene visualizzata una serie di informazioni disordinate. Come abbinare accuratamente il servizio di cui gli utenti hanno più bisogno, il futuro ecosistema MCP dovrà affrontare lo stesso problema.’

In definitiva, il processo di implementazione di qualsiasi standard è pieno di sfide. Hou Xinyi ha affermato che per promuovere la divulgazione di MCP, potrebbe essere necessaria un’opportunità chiave simile a Manus per far sì che l’intero settore si renda conto del potere di MCP.