Negli ultimi anni, il campo dell’Intelligenza Artificiale ha assistito a rapidi progressi tecnologici, dando origine a una pletora di nuovi termini come MoE, Reinforcement Learning, Agents, computer-use e A2A. Per gli utenti ordinari, privi di un background tecnico, questi termini e concetti tecnologici possono essere travolgenti, portando a un significativo carico cognitivo. Di conseguenza, la loro interazione con l’IA è spesso limitata a semplici scambi di domande e risposte all’interno di finestre di chat.
MCP, o Model Context Protocol, è uno di questi concetti tecnici. Nell’ultimo anno, gli agenti AI si sono evoluti rapidamente e i protocolli MCP sono emersi come una capacità fondamentale sottostante a supporto dell’automazione di attività complesse. Tuttavia, l’attuale rivoluzione MCP sembra ancora essere il dominio esclusivo degli sviluppatori, con documentazione di protocollo oscura, registrazione di strumenti complessa e barriere elevate alla configurazione personalizzata. Di conseguenza, la maggior parte degli utenti ordinari può solo osservare da lontano e trovare difficile fare una vera esperienza pratica.
Tuttavia, questa situazione sta cambiando. Il 23 aprile, Nano AI, una filiale di 360, ha annunciato il lancio del “MCP Toolbox“ progettato per i singoli utenti. Questo prodotto è fatto su misura per gli utenti ordinari senza un background tecnico, consentendo a tutti di padroneggiare l’utilizzo dell’IA all’avanguardia con costi di apprendimento minimi.
Questo prodotto non solo supporta completamente il protocollo MCP, ma può anche eseguire attività dell’agente basate su varie infrastrutture di modelli di grandi dimensioni. Inoltre, vanta potenti capacità come l’invocazione automatica di strumenti esterni, l’accesso a basi di conoscenza AI e il supporto di flussi di attività definiti dall’utente. Fondamentalmente, la soglia operativa è stata significativamente abbassata, non richiedendo competenze di programmazione e può essere utilizzata semplicemente aprendo una finestra di chat.
Attualmente, Super Agent ha lanciato test pubblici. Dai modelli ai protocolli, dagli ecosistemi di strumenti all’orchestrazione di attività personalizzate, Nano AI sembra puntare a un’innovazione a livello di prodotto che porti veramente gli agenti AI nella vita quotidiana di tutti.
Allora, quanto è buono il “MCP Toolbox” di Nano AI? Per rispondere a questa domanda, il team di Machine Heart, avendo ottenuto le qualifiche per i test interni, ha condotto una serie di test.
Esperienza pratica con il Toolbox: MCP reso semplice
L’utilizzo del “MCP Toolbox” di Nano AI ha una barriera all’ingresso molto bassa. Gli utenti devono solo scaricare e installare l’applicazione Nano AI e quindi registrarsi ed effettuare il login, senza alcuna configurazione aggiuntiva.
Entrando nella pagina “Agent” aggiornata, possiamo vedere che Nano AI ha classificato gli agenti esistenti in diverse categorie ampie, tra cui la ricerca approfondita, il lavoro e l’efficienza e gli assistenti alla vita. Allo stesso tempo, fornisce anche l’accesso al Toolbox e a una piazza di casi di studio.
Entrando nel Toolbox, possiamo vedere che Nano AI ha già configurato oltre 100 MCP Server (questo numero è aumentato da 120 a 132 durante la stesura di questo articolo), tra cui una dozzina di strumenti MCP sviluppati da Nano AI stesso e centinaia di strumenti MCP di terze parti, che coprono vari scenari come la collaborazione in ufficio, gli accademici, i servizi di vita, i motori di ricerca, la finanza, l’intrattenimento multimediale e il data crawling, rendendolo il più grande ecosistema MCP in Cina. Inoltre, Nano AI supporta anche gli utenti nella configurazione dei propri MCP Server. In seguito, utilizzeremo il termine “Tool“ invece di “MCP Server” e il motivo di ciò sarà spiegato in dettaglio in seguito.
Innanzitutto, testiamo un’applicazione che i lettori di Machine Heart troveranno più interessante: la ricerca e l’organizzazione dei recenti risultati della ricerca su arXiv relativi a un argomento di ricerca specifico.
Cerchiamo prima il Toolbox e scopriamo che gli strumenti preimpostati di Nano AI includono già “arXiv Search”, quindi non abbiamo bisogno di configurarlo da soli. Guardando indietro, possiamo anche vedere che Nano AI ha già molti agenti che supportano il recupero di documenti arXiv. Sceglieremo “Professional Paper Search” come primo passo. Possiamo vedere che questo agente è configurato con quattro strumenti: Nano AI Super Search, arXiv Search, Google Scholar e Academic Search, che soddisfano perfettamente le nostre esigenze. Scrivi un prompt ed esegui:
Recupera i risultati della ricerca relativi al reinforcement learning su arXiv nell’ultimo mese, classificali in base alla ricerca teorica, ai miglioramenti tecnologici e alle applicazioni e fornisci una semplice interpretazione dei progressi importanti.
Il processo di lavoro di “Professional Paper Search” è il seguente:
Questo compito è molto semplice. L’agente ha chiamato lo strumento “arXiv Search” solo una volta e quindi ha completato il compito in meno di mezzo minuto, selezionando due risultati di ricerca rappresentativi in ciascuna delle tre categorie.
Successivamente, prova l’agente di pianificazione del ciclismo utilizzando il comando: “Ci sono buoni percorsi ciclabili vicino al ponte Guanyin a Chongqing?”
Possiamo vedere che questo agente ha utilizzato tre strumenti: le mappe di amapmcpserver-cloud_weather (per interrogare il meteo) e le mappe_direction_bicycling (per impostare i percorsi) e gen_html (per generare pagine web), eseguendo per un totale di 362 secondi e infine ottenendo la pagina web dinamica mostrata sopra. Puoi anche accedervi tramite questo link: . Sì, puoi condividere pubblicamente la pagina web generata!
Successivamente, aumentiamo la difficoltà. Questa volta il nostro requisito è “Cerca nella rete, analizza le attuali tendenze della moda femminile ed emetti un rapporto di analisi degli elementi della moda femminile”. Questa volta utilizzeremo direttamente “In-Depth Research Agent” di Nano AI, che può scegliere di utilizzare gli strumenti appropriati in base alle esigenze specifiche dell’utente, inclusi i server MCP e il browser integrato per completare varie attività di utilizzo del computer. Naturalmente, quindi, l’In-Depth Research Agent spesso impiega molto più tempo per eseguire un’attività, fino a decine di minuti.
Quando esegue l’attività, l’In-Depth Research Agent pianificherà prima i passaggi da eseguire in base ai requisiti dell’attività, quindi eseguirà i passaggi passo dopo passo in base al piano.
I passaggi di esecuzione generati dall’In-Depth Research Agent per questa attività specifica sono mostrati nella figura seguente.
Innanzitutto, ha cercato contenuti relativi alle attuali tendenze della moda femminile su più siti web, quindi ha analizzato il contenuto cercato e ha visualizzato i risultati. Infine, ha fornito il rapporto finale.
In questo processo, ha chiamato lo strumento di ricerca locale aiso_do_search tre volte, lo strumento di data crawling 360_crawl una volta, lo strumento sandbox di codice cloud cloud-sandbox nove volte, lo strumento di riepilogo riepilogo una volta e lo strumento di generazione di pagine web gen_html una volta.
Alla fine, abbiamo ottenuto un rapporto approfondito di 30 pagine, che copre sei sezioni principali: analisi del tema dello stile popolare, tendenze dei colori popolari, analisi degli stili popolari e degli elementi, valutazione completa degli elementi popolari, tendenze dei tessuti e della tecnologia e suggerimenti e applicazioni di abbinamento, superando di gran lunga il nostro compito iniziale di una frase.
Diverse pagine di contenuto estratte dal rapporto
Il seguente video mostra l’intero processo di completamento dell’attività da parte dell’In-Depth Research Agent di Nano AI:
Riproduci a velocità 4x
Non solo, Nano AI ha anche generato una pagina web dinamica che può visualizzare in modo più vivido i risultati dell’analisi ottenuti:
Inoltre, considerando che Google ha recentemente pubblicato il suo rapporto finanziario del primo trimestre, possiamo anche lasciare che l’agente “Chief Industry Insight Officer” di Nano AI ci aiuti a interpretarlo.
La sua versione web è accessibile all’indirizzo: , e l’intero processo di lavoro può essere visto nel seguente video:
Proviamo a usare Nano AI per scrivere una recensione di un film adatta per essere pubblicata su Xiaohongshu per la serie TV recentemente popolare “The Good Life” e il robot di navigazione Xiaohongshu preimpostato può fare il lavoro bene.
Attenzione! Il contenuto conterrà spoiler.
Il seguente video mostra l’intero processo di lavoro di Nano AI.
Possiamo vedere che in questo processo, Nano AI ha utilizzato due strumenti correlati a Xiaohongshu, tra cui collect_relate_info_redbook per la raccolta di informazioni su Xiaohongshu e red_book_generate per la generazione di contenuti Xiaohongshu; inoltre, ha anche utilizzato browser_automation_task - questo strumento può aprire il browser integrato nell’applicazione Nano AI per eseguire attività. Con le istruzioni appropriate, puoi anche utilizzare questo strumento per completare attività come la prenotazione di biglietti del treno, la pubblicazione su Weibo e la presa di appunti in una frase.
Infine, su Nano AI, gli utenti possono anche configurare facilmente il proprio MCP. Ad esempio, qui, abbiamo configurato con successo uno strumento per interrogare e analizzare le note di Obsidian con poche impostazioni dei parametri.
Quindi, basta configurare un agente che chiama lo strumento e possiamo recuperare e analizzare in modo intelligente le nostre note raccolte in Nano AI. Il seguente video mostra un esempio:
I casi di cui sopra sono solo la punta dell’iceberg delle capacità di Nano AI. Con il MCP Toolbox, ci sono molte altre cose che gli utenti possono fare, come eseguire la scansione e la ricerca di informazioni, generare immagini e contenuti video, lasciare che l’IA organizzi le note frammentate di flomo e metta i risultati nell’area di lavoro Notion, analizzare le azioni, trovare il percorso di volo più conveniente per viaggiare in Portogallo, specificare piani di viaggio o fitness, creare report aziendali, gestire repository di archiviazione cloud o file locali… L’unico limite è la tua immaginazione!
Nascondere MCP nel Toolbox: come lo fa Nano AI
MCP, o Model Context Protocol, è stato rilasciato per la prima volta da Anthropic nel novembre 2024. Si può dire che sia un importante “ponte” che collega modelli di grandi dimensioni con il mondo reale: consente ai modelli non solo di rispondere alle domande, ma anche di chiamare strumenti, ottenere dati ed eseguire attività come gli umani. Quest’anno, man mano che sempre più aziende adottano il protocollo, è diventato uno standard de facto nell’uso degli strumenti da parte di LLM, rilasciando ulteriormente il potenziale degli agenti AI.
Tuttavia, per la maggior parte degli utenti, le etichette tipiche del protocollo MCP sono “complessità”, “alta soglia tecnica” e “esclusiva per sviluppatori”. Come consegnare questa capacità, che originariamente apparteneva agli ingegneri professionisti, a ogni persona comune?
In risposta a questo problema reale, la risposta di 360 è: non insegnarti più a capire MCP, ma incapsularlo direttamente in una serie di toolbox “visibili, cliccabili e con risultati prevedibili”.
1. Dalla semplificazione del concetto alla riduzione dimensionale dell’interazione
Il team di Nano AI ha prima fatto la traduzione dei concetti: gli utenti non hanno bisogno di capire cosa sono MCP Server o API Key, devono solo sapere che questo è un “strumento“ o “abilità“ utilizzabile - motivo per cui abbiamo usato il termine “strumento” in precedenza. Il confezionamento dell’interfaccia del protocollo originariamente oscura in etichette di strumenti facili da capire come “ricerca”, “scrittura” e “analisi dei dati” riduce notevolmente la soglia cognitiva dell’utente e consente agli utenti di comprendere in modo più intuitivo il significato del cosiddetto MCP Server per i modelli di grandi dimensioni AI. Questa è la filosofia di progettazione del Nano AI Toolbox. Dietro a questo c’è la re-incapsulamento di Nano AI del protocollo MCP e la ricostruzione ingegneristica del livello di interfaccia.
Ciò che gli utenti vedono nell’interfaccia è una semplice selezione e trascinamento, ma in realtà, sta programmando più di 100 MCP Server sviluppati da Nano AI stesso o un’integrazione accuratamente selezionata. Questi strumenti coprono scenari come l’ufficio, gli accademici, la finanza, i motori di ricerca, la scansione web e l’elaborazione delle immagini. Gli utenti possono lasciare che modelli di grandi dimensioni chiamino automaticamente questi “cervelli esterni” per completare catene di attività complesse senza scrivere una riga di codice.
Nano AI ha anche API Key integrate per più strumenti MCP come Firecrawl, Brava Search e AutoNavi Maps.
2. Abbattere l’”ultimo miglio” tra modelli e strumenti
In passato, anche se i modelli di grandi dimensioni avevano potenti capacità di comprensione del linguaggio, erano ancora intrappolati nell’effetto isola “tool calling”. L’approccio di Nano AI è quello di utilizzare il protocollo MCP come linguaggio intermedio, abbattendo fondamentalmente il meccanismo di collaborazione di “modello di grandi dimensioni + strumento”.
Questo non solo risolve il problema della chiamata, ma espande anche notevolmente il confine delle capacità effettive del modello. Ad esempio, gli utenti devono solo dire all’agente “Aiutami a generare un rapporto di analisi del prezzo delle azioni NVIDIA” e l’agente può automaticamente scomporre i passaggi dell’attività, mobilitare i motori di ricerca, eseguire la scansione del contenuto della pagina, generare grafici di analisi e produrre un rapporto chiaramente strutturato. Durante il periodo, potrebbero essere chiamati da 5 a 7 strumenti, ma l’utente vede solo una pagina di risultati.
Questa è precisamente l’incarnazione della capacità di “combinazione di strumenti” di MCP: consente agli agenti di pianificare in modo indipendente le risorse, pianificare i processi e condurre feedback di prova ed errore e auto-ottimizzazione durante il funzionamento, formando un percorso di risoluzione dei problemi altamente antropomorfo.
3. Funzionamento locale, sicuro e affidabile: lucidatura approfondita dello stack tecnologico
A differenza di molti “corpi intelligenti cloud”, Nano AI ha scelto un percorso più difficile ma più promettente: distribuire localmente i client MCP, offrendo agli utenti un maggiore controllo.
Ciò offre almeno tre vantaggi chiave:
- Libertà di chiamata: i corpi intelligenti locali possono accedere al file system dell’utente, chiamare il browser e recuperare il database per ottenere una vera elaborazione delle attività personalizzata.
- Abbattimento delle barriere: in risposta alle esigenze specifiche dell’IA, 360 ha creato un browser AI dedicato per Nano AI e lo ha adattato alle principali piattaforme in Cina. Può abbattere i firewall di accesso, la verifica uomo-macchina e l’interferenza del flusso di informazioni e completare automaticamente operazioni come l’accesso e la verifica a scorrimento.
- Garanzia sandbox: basato sull’accumulo di tecnologia di sicurezza di 360, Nano AI introdurrà anche una sandbox di runtime locale in futuro, che può monitorare, avvertire in anticipo e limitare il modello di grandi dimensioni dall’operazione errata di file locali in tempo reale per garantire la sicurezza dei dati.
L’intero sistema non solo consente agli utenti di “usarlo”, ma anche di “usarlo in modo sicuro, efficiente e scalabile”.
4. Affrontare utenti enormi: costruire un ecosistema MCP veramente aperto
Nano AI non solo incapsula gli strumenti MCP, ma ha anche assunto la guida nell’aprire un ecosistema di competenze aperto. Attualmente, questa piattaforma con un volume di visite mensili di oltre 400 milioni ha oltre 100 strumenti MCP di alta qualità online e altri server MCP di terze parti vengono inseriti. Gli utenti possono caricare, riutilizzare e combinare liberamente le competenze degli strumenti per creare il proprio agente AI.
Per gli utenti ordinari, questo significa che non si tratta più di “usare l’IA impostata da altri”, ma può costruire un assistente AI personalizzato in base alle proprie esigenze. Analisi di documenti, generazione di dati, monitoraggio delle tendenze, costruzione di pagine web, previsione di azioni… Finché c’è una domanda, ci sono strumenti che possono essere utilizzati in combinazione e ci sono attività che possono essere eseguite automaticamente.
Per l’intero settore, questo significa che la tecnologia degli agenti si sta spostando dalla fase di “sistema chiuso” alla “rete ecologica”. Strumenti, modelli e attività non saranno più isolati, ma saranno collegati da MCP come linguaggio comune, creando un modello di collaborazione intelligente senza precedenti.
Le barriere tecniche sono state abbattute: i corpi intelligenti si affondano nell’estremità C
Un tempo, la soglia per l’utilizzo di corpi intelligenti era ancora alta sul telaio della porta degli sviluppatori. Ora, con il lancio di Nano AI “MCP Toolbox”, MCP, un protocollo noto come infrastruttura di automazione AI, è entrato per la prima volta nella visione degli utenti ordinari in una forma quasi “a prova di stupido”. Come ha affermato Zhou Hongyi, presidente del 360 Group, alla riunione di condivisione prima del rilascio: “Quale MCP Server viene chiamato automaticamente nell’agente, gli utenti non hanno bisogno di saperlo”. Con il toolbox, Nano AI sta abbattendo le barriere tecniche di MCP e consentendo ai corpi intelligenti di affondare ulteriormente nell’estremità C.
Trasformare MCP in un “toolbox” sembra facile, ma è difficile da fare. Ciò non solo mette alla prova la capacità di integrare la tecnologia, ma mette anche alla prova l’”empatia” del pensiero del prodotto e della comprensione dell’utente. Ciò che Nano AI sta facendo è incapsulare la complessità nel core e dare libertà agli utenti, in modo che ogni persona comune possa avere il permesso di “chiamare il mondo AI” come gli sviluppatori.
Questo processo non è una semplice costruzione di un’interfaccia visiva, ma un profondo cambiamento di paradigma dell’applicazione AI: i corpi intelligenti non sono più solo modelli in grado di parlare e rispondere, ma veri partner con la capacità di pianificare capacità, chiamare strumenti e completare attività.
Da allora, MCP ha veramente iniziato a muoversi verso gli utenti C-end, che potrebbe essere un punto di partenza storico degno di essere ricordato.