Oltre DeepSeek: L'AI Open-Source Cinese Rimodella il Mondo

L’esercito’ Open-Source Cinese Rimodella il Panorama Globale dell’IA

Il movimento open-source cinese si sta rapidamente consolidando in una forza da non sottovalutare. Con modelli fondamentali come DeepSeek e Qwen di Alibaba a guidare la carica, stabilendo nuovi standard per le capacità open-source cinesi, un numero crescente di piccole e medie imprese (PMI) sta sfruttando questi progressi per sviluppare modelli verticali più piccoli, ma più potenti. Questa ondata di innovazione ha accelerato il ritmo degli aggiornamenti dei grandi modelli in Cina, offrendo costantemente sviluppi freschi ed entusiasmanti. In contrasto con l’approccio prevalentemente closed-source prevalente negli Stati Uniti, le aziende cinesi stanno abbracciando l’open-source, mostrando la loro fiducia tecnologica e aprendo una nuova strada verso l’inclusività tecnologica e la collaborazione globale, espandendosi continuamente nei mercati esteri e spostando il panorama globale dell’IA da una ‘egemonia unipolare’ a una ‘coesistenza multipolare’.

La Convergenza dell’Open Source Cinese

All’inizio di febbraio, quando il grande modello open-source cinese DeepSeek ha superato le classifiche di download dell’application market in 140 paesi e regioni in tutto il mondo, OpenAI ha pubblicamente accusato DeepSeek di utilizzare dati distillati da ChatGPT senza permesso.

Piuttosto che salvare la reputazione di OpenAI, questa accusa è stata accolta con il ridicolo diffuso da ricercatori di tutto il mondo.

Ora, un altro contendente, abbracciando pienamente il buff di ‘distillazione’, è emerso.

Il 13 aprile, Kunlun Wanwei ha lanciato i modelli della serie Skywork-OR1 (Open Reasoner 1), superando Qwen-32B di Alibaba nella stessa scala e allineandosi con DeepSeek-R1.

Come può Kunlun Wanwei, un’azienda con risorse finanziarie limitate, creare un grande modello a livello SOTA? La spiegazione ufficiale è che i loro modelli sono basati su DeepSeek-R1-Distill-Qwen-7B e DeepSeek-R1-Distill-Qwen-32B.

Come suggeriscono i nomi, i modelli di DeepSeek hanno distillato i modelli della serie Qwen di Alibaba.

Pur sfruttando eccellenti modelli open-source, Kunlun Wanwei sta anche contribuendo alla comunità open-source. A differenza di DeepSeek, che ha reso open-source solo i pesi del modello, Kunlun Wanwei ha anche reso open-source i suoi set di dati e il codice di addestramento, allineandosi più strettamente al concetto di ‘vero open source’. Ciò significa che qualsiasi utente può tentare di replicare il processo di addestramento del modello.

Il risultato di Kunlun Wanwei dimostra l’aspetto più importante dell’open source: non solo fornisce agli utenti un prodotto gratuito e facilmente disponibile, ma consente anche a più sviluppatori di stare sulle spalle dei predecessori, facendo progredire la tecnologia in modo rapido ed economico.

Infatti, tra le discussioni del settore dello scorso anno sul collo di bottiglia nel pre-addestramento di grandi modelli, il ritmo di iterazione dei grandi modelli cinesi ha accelerato quest’anno, con sempre più aziende che investono in open source.

Tongyi Qianwen di Alibaba Cloud ha reso open-source il suo nuovo modello visivo Qwen2.5-VL alla vigilia del capodanno cinese e ha rilasciato e reso open-source il suo nuovo modello di ragionamento QwQ-32B all’inizio di marzo, superando la lista delle tendenze della comunità open-source di IA mainstream globale Hugging Face il giorno in cui è stato reso open-source.

Stepwise ha quindi reso open-source tre modelli multimodali di grandi dimensioni in circa un mese, l’ultimo dei quali è il modello da immagine a video Step-Video-TI2V, che supporta la generazione di video con ampiezza di movimento e movimento dell’obiettivo controllabili e viene fornito anche con determinate capacità di generazione di effetti speciali.

Zhipu ha annunciato ad aprile che avrebbe reso open-source i modelli GLM della serie 32B/9B, che coprono modelli di base, di ragionamento e contemplativi, tutti sotto l’accordo di licenza MIT.

Anche Baidu, che una volta era closed source, ha annunciato che avrebbe reso completamente open-source il grande modello Wenxin il 30 giugno.

Rispetto alla crescente prosperità dell’ecosistema open-source nazionale, le aziende americane di grandi modelli si concentrano ancora principalmente sul closed source, il che ha dato ai grandi modelli cinesi una rara opportunità di andare all’estero. DeepSeek ha consentito alla società di istruzione indonesiana Ruangguru di ottimizzare il suo modello di insegnamento a basso costo; La società di tecnologia di viaggio B2B di Singapore Atlas ha integrato Qwen nel suo sistema di assistenza clienti intelligente per ottenere supporto multilingue 24 ore su 24, 7 giorni su 7.

Perché Closed Source negli Stati Uniti, Open Source in Cina?

La tendenza verso il closed source nell’industria dell’IA statunitense e la crescente apertura dell’IA cinese sono i risultati inevitabili dei diversi ambienti di sviluppo dell’IA nei due paesi.

L’industria dell’IA statunitense è guidata principalmente da giganti tecnologici e VC (venture capitalist), che hanno enormi aspettative per i ritorni di capitale dall’IA. Pertanto, le società di modelli di IA statunitensi generalmente hanno una forte fede nella tecnologia, ovvero perseguire la leadership tecnologica, raggiungere un certo grado di monopolio di mercato e quindi creare enormi profitti, e il loro ecosistema è naturalmente incline al closed source.

Prendendo come esempio la storia dello sviluppo di OpenAI, è iniziata come un’entità senza scopo di lucro durante la sua costituzione, ma da allora è diventata sempre più chiusa. GPT-1 era completamente open source, GPT-2 era parzialmente open source e ha incontrato opposizione prima di essere completamente open source, GPT-3 è diventato ufficialmente closed source e quindi GPT-4 ha ulteriormente rafforzato la strategia closed-source, con architettura del modello e dati di addestramento completamente riservati, e persino limitando la frequenza di chiamata API degli utenti aziendali.

Sebbene OpenAI abbia affermato che la chiusura del codice sorgente si basa sulla conformità e sul controllo dell’abuso della tecnologia, il mercato generalmente ritiene che l’evento storico del passaggio di OpenAI al closed source sia stato il raggiungimento di una cooperazione da cento miliardi di dollari con Microsoft, incorporando GPT-3 nei servizi cloud di Azure per formare un anello chiuso ‘tecnologia-capitale’.

Quando Microsoft ha divulgato per la prima volta il suo investimento in OpenAI nel suo rapporto finanziario nell’ottobre dello scorso anno, ha dichiarato: ‘Abbiamo investito in OpenAIGlobal, LLC, con un impegno di investimento totale di 13 miliardi di dollari e l’investimento è contabilizzato utilizzando il metodo del patrimonio netto’.

Il cosiddetto metodo del patrimonio netto può anche essere inteso come il fatto che l’investimento di Microsoft in OpenAI mira a ottenere ritorni piuttosto che pura ricerca di beneficenza. Ovviamente, la vendita da parte di OpenAI di API a prezzi elevati attraverso un ecosistema closed-source è la sua attuale maggiore fonte di entrate ed è diventato il più grande ostacolo alla riluttanza di OpenAI ad aprire il codice sorgente.

Anthropic, che è stata fondata dalla ‘divisione’ di OpenAI, è stata determinata a intraprendere la strada closed-source fin dall’inizio e il suo grande modello di prodotto Claude ha adottato pienamente il modello closed-source.

Anche Llama di META, l’unico leader open-source negli Stati Uniti, ha aggiunto due clausole anti-amici quando ha aperto il codice sorgente:

  1. I modelli open-source non possono essere utilizzati per prodotti e servizi con più di 700 milioni di utenti attivi mensili prima che META li approvi.
  2. Il contenuto di output dei modelli Llama non può essere utilizzato per addestrare e migliorare altri grandi modelli linguistici.

Si può vedere che anche per i modelli open-source, lo scopo principale di Meta è ancora quello di costruire il proprio ecosistema di IA piuttosto che l’inclusività tecnica.

Gli Stati Uniti hanno scelto una strategia di IA basata sul closed source con l’open source come supplemento a livello di capitale, che si può dire siano considerazioni puramente commerciali. Al contrario, la progettazione top-down della Cina ha attribuito importanza all’open source fin dall’inizio, riflettendo un percorso in cui l’industria viene prima sotto il concetto di controllo indipendente.

Già nel 2017, il governo cinese ha rilasciato il ‘Piano di sviluppo dell’intelligenza artificiale di nuova generazione’, che proponeva chiaramente di accelerare la profonda integrazione dell’IA con l’economia e la società e di dispiegarsi per costruire il vantaggio pionieristico dello sviluppo dell’IA. Nel 2021, i contenuti relativi all’open source sono stati esplicitamente inclusi nel ‘14° piano quinquennale’ cinese, che ha innescato la promozione attiva dell’innovazione tecnologica da parte dei governi locali.

Mei Hong, un accademico dell’Accademia cinese delle scienze, ha detto una volta che il futuro sviluppo dei modelli linguistici deve basarsi su piattaforme open-source. Solo in un ambiente aperto è possibile garantire la sicurezza e l’affidabilità dei caricamenti di dati e dell’integrazione aziendale per gli utenti in vari settori.

Il ‘Piano d’azione speciale per l’empowerment digitale delle piccole e medie imprese (2025-2027)’ emesso dal Ministero dell’industria e della tecnologia dell’informazione e da altri quattro dipartimenti nel dicembre dello scorso anno supporta chiaramente la Open Atom Open Source Foundation per stabilire un ‘Progetto speciale open source di IA per piccole e medie imprese’ per fornire framework di addestramento riproducibili e facili da promuovere, strumenti di test e altre risorse per abbassare la soglia tecnica per le imprese.

Un problema più realistico è che, a causa del potenziale blocco tecnologico da parte degli Stati Uniti, la Cina non può semplicemente essere un follower nel campo dell’IA, ma deve costruire un ecosistema nazionale indipendente. Costruire un altro ecosistema closed-source sotto l’ecosistema che gli Stati Uniti hanno già costruito con il closed source come focus principale equivale a costruire un’auto a porte chiuse. Solo un ecosistema open-source può aiutare rapidamente lo sviluppo dell’industria dell’IA.

Oltre al supporto di alto livello, vari governi locali hanno anche effettuato investimenti reali nell’ecosistema open-source.

Il Z Fund, istituito congiuntamente da Zhipu e Beijing State-owned Assets, che si concentra sull’investimento nell’ecosistema di grandi modelli, ha annunciato che investirà 300 milioni di yuan per supportare lo sviluppo della comunità open-source di IA in tutto il mondo. Qualsiasi progetto di startup basato su modelli open-source (non limitato ai modelli open-source di Zhipu) può fare domanda.

La divergenza tra Cina e Stati Uniti nelle loro strategie open-source e closed-source per l’industria dell’IA è essenzialmente una differenza fondamentale nella logica di sviluppo. Gli Stati Uniti sono guidati dal capitale e le richieste di profitto dei giganti tecnologici e dei VC hanno generato un ecosistema closed-source di ‘monopolio tecnologico-realizzazione a prezzi elevati’. Anche se Meta cerca di aprire il codice sorgente, è difficile sfuggire alle catene degli ostacoli commerciali. La Cina si basa sulla progettazione di alto livello, con ‘equità tecnologica + collaborazione industriale’ come concetto centrale, e costruisce un ecosistema aperto attraverso l’empowerment delle politiche, rendendo l’open source un’infrastruttura di base per abbassare le soglie tecniche e promuovere l’integrazione dell’economia reale. Questa scelta strategica non solo modella i diversi percorsi delle industrie dell’IA nei due paesi, ma preannuncia anche l’accelerazione dell’ecosistema globale dell’IA dalla ‘concorrenza monopolistica’ a ‘open e win-win’.

Abbastanza Bene è Abbastanza

L’ecosistema open-source dell’IA cinese non solo sta accelerando lo sviluppo dell’industrializzazione dell’IA in Cina e nel mondo, ma sta anche mettendo la fede degli Stati Uniti nella tecnologia al primo posto in una trappola imbarazzante.

Di fronte alla crescente pressione esercitata dall’effetto DeepSeek, Meta ha rilasciato Llama4 il 5 aprile, affermando che è il più forte modello multimodale di grandi dimensioni nella storia.

Tuttavia, dopo i test effettivi, questo è un modello deludente. La lunghezza del contesto di 10 milioni di token spesso va male, il test della palla iniziale è difficile da completare e si verifica l’errore di dimensione del confronto 9.11 > 9.9. Entro pochi giorni dal lancio del modello, anche scandali come le dimissioni dei dirigenti e le frodi nei test sono stati confermati dai dipendenti interni.

Altre notizie dimostrano che Llama4 si può dire sia un prodotto che Zuckerberg si è affrettato a mettere sugli scaffali. Quindi la domanda è: perché Zuckerberg doveva lanciarlo ad aprile?

Come accennato in precedenza, l’industria dell’IA statunitense ha una fede confusa nella tecnologia, credendo che i suoi prodotti debbano essere i più forti e avanzati, quindi ha iniziato una corsa agli armamenti. Tuttavia, l’effetto marginale decrescente dell’addestramento dell’IA ha fatto sì che i grandi produttori consumassero enormi quantità di costi e non solo non sia stata costruita la soglia tecnica, ma sono caduti nel pantano dei colli di bottiglia della potenza di calcolo.

Dopo che OpenAI ha rilasciato la funzione di generazione di immagini di GPT-4o, Altman ha twittato alcuni giorni dopo che le loro GPU si stavano ‘bruciando’. Meno di una settimana dopo il rilascio di Gemini2.5, il responsabile di GoogleAIStudio ha affermato che erano ancora afflitti da ‘limiti di velocità’ e gli sviluppatori potevano inviare solo 20 richieste al minuto. Sembra che nessuna azienda possa far fronte alle esigenze di inferenza di modelli super-grandi.

In effetti, gli Stati Uniti stanno cadendo in un malinteso. Il responsabile dello Zhiyuan Research Institute ha affermato: ‘Se un nuovo modello utilizza 100 volte il costo per ottenere un aumento di 10 punti del punteggio di riferimento, allora questo nuovo modello è insignificante per più dell’80% degli scenari applicativi perché non c’è rapporto costo-efficacia’.

Le aziende cinesi di grandi modelli stanno accelerando l’ecosistema open-source. Sembra che non stiano più gareggiando per il primo posto, ma hanno invece conquistato più clienti, in particolare clienti industriali, con il loro approccio ‘abbastanza buono’.

Rispetto alle decine di milioni di budget per i clienti governativi e aziendali, molte aziende e istituzioni hanno urgenti esigenze di IA ma non hanno così tante soluzioni esistenti. L’utilizzo di modelli open-source per sviluppare le proprie soluzioni è quasi diventata la loro unica scelta:

  • Baosteel utilizza il ‘grande modello + piccolo modello’ per i processi chiave di ingegneria metallurgica per l’allarme rapido intelligente delle apparecchiature di produzione.
  • Il ‘Coal Science Guardian Large Model ChinamjGPT’ del China Coal Science and Industry Group riduce i tempi di inattività delle apparecchiature e i costi di manutenzione rispettivamente del 30% e del 20%.
  • Shanghai Mengbo Intelligent Internet of Things Technology ha creato una piattaforma applicativa per l’ottimizzazione del processo di rilevamento dei bordi e del forno di ricottura continua basata su un grande modello leggero.
  • Mifei Technology ha realizzato la previsione, la manutenzione e la gestione intelligenti dei sistemi di movimentazione automatizzata dei materiali nelle fabbriche di wafer semiconduttori basate sulla tecnologia di grandi modelli.

Questi sono tutti casi rappresentativi di modelli open-source implementati in scenari industriali.

Oltre agli usi industriali, l’ecosistema open-source può anche aiutare più iniziative di benessere pubblico.

Lo Shanshui Nature Conservation Center si impegna nella protezione dei leopardi delle nevi e degli ecosistemi degli altopiani. Le telecamere a infrarossi che installa scattano un gran numero di foto o video ogni trimestre. È estremamente inefficiente e dispendioso in termini di tempo fare affidamento sull’identificazione manuale delle tracce di leopardo delle nevi. Huawei Ascend sta collaborando con lo Shanshui Nature Conservation Center per identificare le tracce di leopardo delle nevi. Huawei ha reso open-source i modelli e gli strumenti pertinenti per il riconoscimento delle specie di immagini a infrarossi a Sanjiangyuan, abbassando la soglia per la partecipazione allo sviluppo dell’IA e consentendo a più istituti di ricerca e protezione che utilizzano il modello di trarne beneficio. Le persone possono lavorare insieme per ottimizzare il modello in termini di set di dati, elaborazione dei dati e pulizia dei dati.

L’’Effetto Bazaar’ dell’Open Source

Eric Raymond, il portabandiera del movimento del software open-source, ha proposto una metafora nel suo libro del 1999 ‘The Cathedral and the Bazaar’: il tradizionale modello di sviluppo del software closed-source è come costruire una cattedrale. Il software è progettato e costruito con cura da alcuni esperti (architetti) in un ambiente isolato e viene rilasciato agli utenti solo dopo che è stato finalmente completato; il modello di sviluppo open-source è come un bazar vivace, apparentemente caotico ma vibrante. Lo sviluppo del software è aperto, decentralizzato ed evolutivo.

Il libro ritiene che per molti tipi di progetti software, in particolare software complessi a livello di sistema (come i kernel del sistema operativo), il modello di sviluppo ‘bazaar’ aperto, collaborativo e decentralizzato, sebbene possa sembrare caotico, è in realtà più efficiente, produce software di qualità superiore e più robusto rispetto al tradizionale modello ‘cattedrale’ chiuso e centralizzato. Può scoprire e correggere gli errori più rapidamente e assorbire meglio il feedback degli utenti e i contributi della comunità attraverso meccanismi come ‘rilasciare presto, rilasciare spesso’ e sfruttare la peer review su larga scala (‘abbastanza occhi’), promuovendo così la rapida iterazione e l’innovazione del software.

L’enorme successo di progetti open-source come Linux ha verificato il punto di Raymond.

Il movimento open-source ha portato agli Stati Uniti e al mondo un enorme valore che supera di gran lunga il proprio investimento. Un rapporto di ricerca del 2024 dell’Università di Harvard ha affermato: ‘L’open-source ha investito 4,15 miliardi di dollari e ha creato 8,8 trilioni di dollari di valore per le aziende (ovvero, ogni dollaro investito crea 2.000 dollari di valore). Senza l’open source, la spesa aziendale per il software sarebbe 3,5 volte superiore a quella attuale’.

Oggi, le aziende cinesi hanno imparato questo. Le aziende americane di IA sembrano averlo dimenticato.

Infatti, per le aziende cinesi di grandi modelli, anche se non considerano i benefici sociali, scegliere di abbracciare l’ecosistema open-source non è improduttivo per le aziende stesse.

Molte aziende di grandi modelli hanno detto a Observer.com che l’open source non significa rinunciare alla commercializzazione. L’open source ha ancora la logica del profitto dell’open source. Rispetto al fatto che sia open source o meno, il modo migliore per servire tecnicamente i clienti è la questione chiave.

Prendendo come esempio Zhipu AI, afferma di essere l’unica azienda in Cina che confronta completamente OpenAI, ma rispetto alla strategia closed-source di OpenAI, è uno dei praticanti più determinati della strategia open-source nel settore.

Zhipu ha preso l’iniziativa di aprire il codice sorgente del primo grande modello Chat cinese ChatGLM-6B nel 2023. Dalla sua fondazione quasi sei anni fa, Zhipu ha reso open-source più di 55 modelli, con un volume di download cumulativo di quasi 40 milioni di volte nella comunità open-source internazionale.

Zhipu ha detto a Observer.com che Zhipu spera che la sua strategia open-source contribuirà a trasformare Pechino in una ‘capitale open-source globale’ per l’intelligenza artificiale.

Nello specifico, a livello commerciale, Zhipu ha scelto di attrarre un ecosistema di sviluppatori attraverso l’open source e fornire soluzioni personalizzate a pagamento ai clienti B-end e G-end.

Oltre a vendere soluzioni, anche la vendita di API è un importante collegamento di profitto.

Prendendo come esempio DeepSeek, la prima attività del modello open-source è la vendita di API ad alte prestazioni. Sebbene i servizi di base siano gratuiti, le aziende possono fornire servizi API ad alte prestazioni e addebitare in base all’utilizzo. Il prezzo API per DeepSeek-R1 è di 1 yuan per milione di token di input e 16 yuan per milione di token di output. Se la quota di token gratuita è esaurita o l’API di base non soddisfa le esigenze, gli utenti tendono a utilizzare la versione a pagamento per mantenere la stabilità dei processi aziendali.

Rispetto alle aziende che hanno solo servizi di modelli, Alibaba ha scelto un altro modello di monetizzazione open-source: il bundle dell’ecosistema.

La serie Qwen di Alibaba, in quanto pioniere dell’open-source, attrae gli sviluppatori a utilizzare il cloud computing e altre infrastrutture attraverso l’open-source full-modal, formando uno scenario a circuito chiuso. Il loro modello è solo un’introduzione nella fase iniziale e i beni con prezzi contrassegnati sono in realtà servizi cloud.

L’applicazione della globalizzazione dei grandi modelli open-source cinesi è passata dal ‘seguire la tecnologia’ al ‘dominio dell’ecosistema’. Quando gli Stati Uniti sono intrappolati nel dilemma del ‘monopolio closed-source’ e del ‘fuori controllo open-source’, la Cina sta ricostruendo la logica sottostante dell’ecosistema globale open-source di IA attraverso ‘innovazione dell’accordo + coltivazione dello scenario’. Il campo di battaglia finale di questo gioco non è nella concorrenza della scala dei parametri, ma nel mercato da trilioni di dollari della profonda integrazione della tecnologia IA e dell’economia reale.