Qwen3 di Alibaba: IA più potente a costi inferiori | it

Il panorama dell’Intelligenza Artificiale (IA) è in costante evoluzione, con nuovi modelli e progressi che emergono a un ritmo vertiginoso. Tra i recenti sviluppi, il rilascio open-source da parte di Alibaba del suo modello Tongyi Qianwen di nuova generazione, Qwen3, ha attirato un’attenzione significativa. Vantando una dimensione dei parametri più piccola, costi ridotti e prestazioni migliorate rispetto ad altri modelli leader, Qwen3 si è posizionato come un forte contendente nell’arena globale dell’IA.

Qwen3 si distingue come un modello di ragionamento ibrido pionieristico in Cina, offrendo una combinazione interessante di prestazioni migliorate e costi ridotti. Con un totale di 235 miliardi di parametri, richiede significativamente meno risorse per essere implementato rispetto ad altri modelli con capacità simili. Questa efficacia in termini di costi rende Qwen3 un’opzione interessante per le organizzazioni che cercano di sfruttare la potenza dei modelli linguistici di grandi dimensioni senza spendere una fortuna.

Potenziamento degli agenti e delle applicazioni IA

Uno dei punti salienti di Qwen3 è il suo potenziale per accelerare lo sviluppo e l’implementazione di agenti IA e applicazioni di modelli linguistici di grandi dimensioni. Nelle valutazioni delle capacità dell’agente modello, Qwen3 ha ottenuto punteggi impressionanti, superando altri modelli di alto livello. Ciò suggerisce che Qwen3 può abbassare la barriera all’ingresso per lo sviluppo e l’implementazione di agenti IA, portando potenzialmente a un’ondata di applicazioni innovative.

La crescente domanda di funzionalità di ‘tool-calling’ negli agenti IA

Gli agenti IA sono sempre più utilizzati per automatizzare compiti complessi e interagire con il mondo reale. Le capacità richieste a un agente IA dipendono dalla complessità e dall’autonomia dei compiti che è progettato per svolgere.

Un solido sistema di agenti IA richiede in genere le seguenti capacità dal modello sottostante:

Comprensione e generazione del linguaggio di base: La capacità di interpretare accuratamente le istruzioni, comprendere il contesto e generare risposte in linguaggio naturale.
Uso e ‘calling’ degli strumenti: La capacità di comprendere e utilizzare strumenti esterni, comprese le API, per svolgere compiti specifici.
Ragionamento e pianificazione: La capacità di scomporre obiettivi complessi in sotto-compiti più piccoli ed eseguirli in una sequenza logica.

Qwen3 affronta la necessità critica di migliorare le capacità di ‘tool-calling’ negli agenti IA. Può integrare strumenti esterni con precisione, sia in modalità di pensiero che non, rendendolo un modello open-source leader per compiti complessi basati su agenti.

Nelle valutazioni delle capacità dell’agente modello, Qwen3 ha ottenuto un punteggio elevato, superando altri modelli di alto livello. Ciò significa una significativa riduzione delle barriere all’ingresso per lo sviluppo e l’implementazione di agenti IA.

Qwen3 supporta nativamente il protocollo MCP e possiede solide capacità di ‘tool-calling’. In combinazione con il framework Qwen-Agent, che incapsula modelli e parser di ‘tool-calling’, semplifica il processo di sviluppo e consente operazioni di agenti efficienti su dispositivi mobili e computer. Gli sviluppatori possono definire gli strumenti disponibili in base ai file di configurazione MCP e integrarli utilizzando il framework Qwen-Agent o altri strumenti personalizzati. Ciò consente il rapido sviluppo di agenti intelligenti con basi di conoscenza e capacità di utilizzo di strumenti.

Inoltre, Qwen3 mostra forti prestazioni nella comprensione e generazione del linguaggio di base, nonché nelle capacità di ragionamento.

Ciò significa che, con capacità di modello equivalenti, il costo della chiamata ai modelli per agenti e settori di applicazioni IA è inferiore e la chiamata è più conveniente, il che promuoverà inevitabilmente l’emergere di più nuovi agenti e applicazioni IA.

Un impegno per l’Open Source

Alibaba ha riaffermato il suo impegno nei confronti della comunità open-source offrendo una vasta gamma di modelli Qwen3. Ciò include due modelli Mixture-of-Experts (MoE) con 30 miliardi e 235 miliardi di parametri, nonché sei modelli densi con dimensioni variabili.

Il modello MoE da 30 miliardi di parametri raggiunge un significativo aumento delle prestazioni, offrendo prestazioni paragonabili al modello Qwen2.5-32B di precedente generazione. Anche i modelli densi dimostrano prestazioni migliorate, con anche i modelli più piccoli che raggiungono risultati impressionanti.

Poiché tutti i modelli Qwen3 sono modelli di ragionamento ibrido, le API possono essere configurate secondo necessità per impostare ‘budget di pensiero’ (ovvero, il numero massimo previsto di token per il pensiero approfondito) per eseguire diversi gradi di pensiero e soddisfare in modo flessibile le diverse esigenze delle applicazioni IA e diversi scenari per prestazioni e costi. Le piccole e medie imprese e gli sviluppatori di IA possono scegliere in modo flessibile i modelli in base alle loro esigenze, il che ridurrà inevitabilmente la soglia e il costo dell’utilizzo di modelli di grandi dimensioni. Questi team con fondi e personale molto limitati possono investire più risorse ed energia nel mercato e nello scavo delle esigenze e dei punti deboli degli utenti in modo che possano sviluppare applicazioni più innovative.

La base tecnologica di Alibaba

Dopo 16 anni di sviluppo, Alibaba ha ricostruito in modo completo un sistema di architettura tecnologica full-stack dall’hardware sottostante al calcolo, allo storage, alla rete, all’elaborazione dei dati, all’addestramento dei modelli e alle piattaforme di ragionamento, rendendola la piattaforma di cloud computing leader nella regione Asia-Pacifico. Alibaba è anche una delle prime aziende tecnologiche al mondo a investire nella ricerca di modelli di grandi dimensioni.

In precedenza, Zhou Jingren ha dichiarato in un’intervista ai media che lo sviluppo di modelli di grandi dimensioni è inseparabile dal supporto del sistema cloud. Che si tratti di addestramento o ragionamento, ogni svolta nei modelli di grandi dimensioni, in superficie, è l’evoluzione delle capacità del modello, ma dietro c’è la cooperazione e l’aggiornamento completi dell’intera piattaforma di cloud computing e dati e ingegneria. La multimodalità è anche un modo importante per l’AGI.

Riconoscimento internazionale

Il rilascio di Qwen3 ha attirato l’attenzione su scala globale. Dopo il rilascio di Qwen 3 di Alibaba, Elon Musk ha dichiarato sulla piattaforma di social media X che una prima versione beta di Grok 3.5 sarebbe stata rilasciata agli abbonati SuperGrok la prossima settimana, affermando che è la prima IA in grado di rispondere accuratamente a domande sui motori a razzo o sulla tecnologia elettrochimica.

Guida all’innovazione e all’accessibilità

Sun Maosong, vicepresidente esecutivo dell’Istituto di Intelligenza Artificiale dell’Università di Tsinghua e accademico straniero dell’Accademia Europea di Scienze Umanistiche e Naturali, ha affermato che negli ultimi anni la Cina ha dato un forte contributo allo sviluppo dell’intelligenza artificiale, in particolare nel campo dei modelli di grandi dimensioni. L’emergere di DeepSeek e la serie di prodotti open-source di Tongyi Qianwen hanno notevolmente promosso il percorso open-source dei modelli nazionali di grandi dimensioni, il che è senza dubbio di grande importanza per alleviare i monopoli tecnologici, promuovere l’equità tecnologica e migliorare l’inclusività dell’intelligenza artificiale.

Attualmente, il numero di modelli derivati da Qwen nelle comunità open-source in patria e all’estero ha superato i 100.000, superando la serie di modelli derivati da Llama, e Tongyi Qianwen Qwen si classifica come il più grande gruppo di modelli linguistici generativi al mondo. Secondo l’ultimo elenco globale di modelli di grandi dimensioni open-source di Huggingface del 10 febbraio 2025, i primi dieci modelli di grandi dimensioni open-source sono tutti modelli derivati basati sui modelli open-source Tongyi Qianwen Qwen.

Sun Maosong ritiene che ciò significhi che la cultura dei modelli di grandi dimensioni della Cina è stata riconosciuta a livello internazionale, il che è un cambiamento culturale. Questo è molto prezioso e rappresenta il riconoscimento dello sviluppo e della tecnologia dei modelli di grandi dimensioni della Cina.

aggiornato il 2025-04-30

# Agent # Qwen # Alibaba