Il panorama dell’intelligenza artificiale, un tempo apparentemente dominato da una manciata di titani della Silicon Valley come OpenAI, Google, Meta e Microsoft, sta subendo un’affascinante trasformazione. Mentre questi attori affermati continuano la loro corsa allo sviluppo ad alto rischio, spesso mettendo le loro capacità più avanzate dietro paywall di abbonamento, una potente controcorrente sta guadagnando slancio. Una nuova ondata di contendenti, in particolare dai centri di innovazione in Cina, sta dimostrando che l’IA all’avanguardia non richiede necessariamente costi esorbitanti o segretezza proprietaria. Aziende come DeepSeek, Alibaba e Baidu stanno entrando sotto i riflettori globali, sostenendo modelli potenti che vengono frequentemente offerti come alternative open-source o a basso costo, sfidando fondamentalmente i modelli di business prevalenti ed espandendo le possibilità per sviluppatori e utenti in tutto il mondo.
Questa dinamica emergente rappresenta più che semplici nuovi concorrenti che entrano nella mischia; segnala un potenziale cambiamento nella filosofia alla base dello sviluppo e dell’accessibilità dell’IA. La decisione di questi nuovi attori di rilasciare modelli sofisticati sotto licenze permissive, rendendo il codice sottostante prontamente disponibile su piattaforme come GitHub e Hugging Face, è in netto contrasto con l’approccio spesso opaco e chiuso (“closed-garden”) favorito da alcuni giganti occidentali. Questa apertura non solo democratizza l’accesso a strumenti potenti, ma promuove anche un ecosistema vibrante in cui gli sviluppatori possono liberamente sperimentare, personalizzare e costruire su questi modelli fondamentali, accelerando potenzialmente l’innovazione a un ritmo senza precedenti. Approfondiamo tre esempi importanti che guidano questa carica, esplorando le loro origini, capacità e le implicazioni delle loro strategie aperte.
DeepSeek: L’Agile Nuovo Arrivato che Scuote l’Establishment
Hangzhou DeepSeek Artificial Intelligence Basic Technology Research Co., Ltd., operante sotto il nome più conciso di DeepSeek, è esplosa sulla scena internazionale dell’IA con notevole velocità e impatto. Sebbene sia un’entità relativamente giovane, ufficialmente fondata nell’aprile 2023 come spin-off della società di trading quantitativo High-Flyer Quant, DeepSeek ha rapidamente attirato l’attenzione per lo sviluppo di modelli di IA che rivaleggiavano, e in alcuni benchmark avrebbero superato, quelli dei colossi del settore con cicli di sviluppo molto più lunghi e budget significativamente maggiori. Questa capacità di raggiungere prestazioni competitive con un’efficienza apparentemente maggiore ha mandato onde d’urto nel settore.
Il ciclo di iterazione rapida dell’azienda è degno di nota. Partendo dal suo DeepSeek-LLM iniziale, ha rapidamente seguito con modelli specializzati come DeepSeek-Math. L’annuncio di DeepSeek V2 e successivamente DeepSeek V3 alla fine del 2024 segnalava già l’ambiziosa traiettoria dell’azienda. Tuttavia, è stata la presentazione dei suoi modelli di ragionamento, DeepSeek-R1 e DeepSeek-R1-Zero, nel gennaio 2025, a catturare veramente l’immaginazione del settore e a segnare probabilmente un punto di svolta. Questi modelli hanno suscitato confronti diretti e spesso favorevoli con la serie avanzata GPT-4 di OpenAI e il suo atteso modello ‘o1’, innescando una discussione significativa sullo stato dell’arte nel ragionamento dell’IA. L’introduzione non è stata meramente accademica; secondo quanto riferito, ha influenzato i prezzi delle azioni dei concorrenti, ha spinto a rivalutazioni strategiche all’interno dei laboratori di IA affermati e ha persino sollevato discussioni tra gli organi governativi riguardo alle implicazioni di un’IA così potente e accessibile proveniente da nuovi attori globali.
DeepSeek impiega quella che definisce una strategia “open weight” per molti dei suoi modelli, rilasciandoli sotto la permissiva MIT License. Sebbene ciò possa non equivalere al 100% open source nella definizione più rigorosa (poiché alcuni aspetti dei dati di addestramento o della metodologia potrebbero rimanere proprietari), rappresenta un grado significativo di apertura. Fondamentalmente, i pesi del modello – i parametri che incapsulano la conoscenza appresa dal modello – sono resi disponibili. Ciò consente agli sviluppatori di scaricare i modelli da repository come GitHub e Hugging Face, permettendo loro di eseguire i modelli localmente, affinarli per compiti specifici, integrarli in applicazioni uniche o semplicemente studiarne l’architettura. Questo livello di accesso è molto lontano dall’interagire esclusivamente tramite un’API limitata o un’interfaccia web chiusa.
Dal punto di vista dell’utente, DeepSeek si manifesta principalmente come uno strumento AI in stile chatbot, accessibile tramite un’interfaccia web e applicazioni mobili dedicate per piattaforme iOS e Android. La sua crescente influenza è ulteriormente evidenziata da un elenco crescente di partnership. La tecnologia di DeepSeek viene integrata o esplorata da importanti attori tecnologici, tra cui, secondo quanto riferito, Lenovo, Tencent, Alibaba e Baidu, mostrando la sua potenziale applicabilità in diversi ecosistemi hardware e software. L’ascesa di DeepSeek sottolinea un tema chiave: le significative scoperte nell’IA non sono più dominio esclusivo dei laboratori di ricerca consolidati da tempo, e uno sviluppo efficiente abbinato a un’apertura strategica può rimodellare rapidamente il panorama competitivo.
Qwen di Alibaba: Apertura su Scala da un Titano dell’E-commerce
Mentre DeepSeek rappresenta la startup agile che sfida lo status quo, Alibaba Qwen (Tongyi Qianwen) significa un abbraccio strategico dell’apertura da parte di uno dei più grandi conglomerati tecnologici della Cina, e del mondo. Alibaba, rinomata per il suo vasto impero di e-commerce, servizi di cloud computing e diverse iniziative tecnologiche, è entrata nella corsa all’IA generativa con risorse e ambizioni considerevoli. La famiglia Qwen di modelli linguistici di grandi dimensioni si è rapidamente affermata tra le principali offerte open-source a livello globale.
Il viaggio è iniziato con una versione beta nell’aprile 2023, guadagnando rapidamente terreno all’interno della comunità AI mentre Alibaba rilasciava progressivamente vari modelli sotto licenze open-source durante quell’anno. Questo impegno per l’apertura è in gran parte continuato con le iterazioni successive. Sebbene alcune versioni altamente specializzate o commercialmente sensibili possano avere licenze diverse, i modelli principali della serie Qwen, tra cui Qwen 2, la serie multimodale Qwen-VL (che gestisce sia testo che immagini), Qwen-Audio e il matematicamente incline Qwen2-Math, sono stati spesso resi disponibili sotto licenze permissive come la Apache 2.0 License. Ciò consente un ampio uso commerciale e di ricerca, alimentando ulteriormente l’adozione. Come DeepSeek, questi modelli sono prontamente accessibili alla comunità globale degli sviluppatori tramite piattaforme come GitHub e Hugging Face.
Alibaba non ha esitato a posizionare i suoi modelli direttamente contro i migliori del settore. L’annuncio di Qwen 2.5-Max nel gennaio 2025 e del multimodale Qwen2.5-VL nel marzo 2025 è arrivato con affermazioni audaci, commercializzandoli come dotati di capacità superiori o rivaleggianti con modelli di spicco come GPT-4o di OpenAI, V3 di DeepSeek e il potente Llama-3.1-405B di Meta. Sebbene i risultati dei benchmark possano essere soggetti a interpretazione e valutazioni specifiche dei compiti, lo sviluppo costante e il posizionamento competitivo sottolineano la seria intenzione di Alibaba nel dominio dell’IA.
È interessante notare che il modello Qwen iniziale riconosceva la sua eredità, essendo basato in parte sul fondamentale LLM Llama di Meta – esso stesso una release open-source storica che ha catalizzato molta attività nel campo. Tuttavia, Alibaba ha significativamente modificato e costruito su questa base, sviluppando le proprie architetture e metodologie di addestramento uniche per le successive generazioni di Qwen. Questa evoluzione evidenzia un modello comune nel mondo open-source: costruire sul lavoro esistente per creare capacità nuove e migliorate.
L’impatto della strategia aperta di Qwen è forse meglio illustrato dalla sbalorditiva statistica citata: oltre 90.000 modelli indipendenti sarebbero stati sviluppati sulla base del codice open-source di Qwen. Questa cifra la dice lunga sulla potenza della diffusione aperta. Significa un ecosistema fiorente in cui ricercatori, startup e singoli sviluppatori stanno sfruttando il lavoro fondamentale di Alibaba per creare strumenti specializzati, condurre esperimenti innovativi e spingere i confini dell’IA in diverse direzioni. Per gli utenti finali, Qwen è tipicamente accessibile tramite una familiare interfaccia chatbot, disponibile sul web e tramite app mobili su iOS e Android. L’approccio di Alibaba dimostra che anche i giganti della tecnologia possono sfruttare strategicamente l’open source per promuovere l’innovazione, costruire comunità e competere efficacemente sulla scena globale dell’IA.
Ernie di Baidu: Un Cambiamento Strategico da un Gigante della Ricerca
Baidu, spesso definita la Google cinese a causa del suo dominio nel mercato dei motori di ricerca, porta un diverso tipo di eredità nella corsa all’IA. A differenza di DeepSeek o persino della spinta relativamente recente di Alibaba sugli LLM, Baidu è stata profondamente coinvolta nella ricerca sull’IA, in particolare nell’elaborazione del linguaggio naturale, per molti anni. La sua linea di modelli ERNIE (Enhanced Representation through Knowledge Integration) risale al 2019, precedendo la frenesia del rilascio pubblico innescata da ChatGPT.
La spinta pubblica verso l’IA generativa è iniziata seriamente con il rilascio di Ernie 3.0 LLM nel marzo 2023, seguito da Ernie 3.5 nel giugno 2023. Inizialmente, Baidu ha adottato un approccio a livelli più convenzionale, simile ad alcune controparti occidentali. Il più avanzato Ernie 4.0, rilasciato nell’ottobre 2023, era principalmente riservato ai prodotti basati su abbonamento di Baidu, mentre il capace Ernie 3.5 alimentava la versione gratuita del suo chatbot, noto come Ernie Bot.
Tuttavia, le dinamiche competitive all’interno dell’industria dell’IA, caratterizzate dai rapidi progressi dei rivali (sia nazionali che internazionali) e dalla crescente fattibilità delle strategie open-source, unite a costi di produzione dei modelli potenzialmente decrescenti, sembrano aver spinto a un significativo cambiamento strategico. Baidu ha segnalato un deciso spostamento verso una maggiore apertura. Sebbene gli attuali modelli Ernie che alimentano i suoi servizi principali non fossero inizialmente open source, l’azienda ha annunciato piani per cambiare drasticamente questa traiettoria.
Il rilascio dell’Ernie 4.5 LLM e di un modello di ragionamento dedicato, Ernie X1, a metà marzo 2025, ha immediatamente suscitato confronti rispettivamente con GPT-4.5 di OpenAI e R1 di DeepSeek, posizionando Baidu saldamente nel livello più alto dei fornitori di modelli AI. Fondamentalmente, insieme a queste affermazioni sulle prestazioni, Baidu ha annunciato una chiara roadmap verso l’apertura. L’azienda ha dichiarato la sua intenzione di rendere i suoi modelli principali open source a partire dal 30 giugno. Inoltre, ha annunciato che il suo chatbot Ernie Bot sarebbe diventato gratuito per tutti gli utenti a partire dal 1° aprile, rimuovendo la precedente barriera dell’abbonamento per accedere alla sua IA conversazionale più capace. Guardando al futuro, Baidu ha anche indicato che la sua prossima iterazione principale, Ernie 5, prevista nella seconda metà del 2025, abbraccerà analogamente una filosofia open-source e gratuita.
Questo riorientamento strategico da parte di un attore della statura di Baidu è molto significativo. Suggerisce un riconoscimento del fatto che l’apertura potrebbe diventare una necessità competitiva, non solo un percorso alternativo. Rendendo i suoi modelli all’avanguardia liberamente disponibili, Baidu mira a coltivare una comunità di sviluppatori, stimolare l’innovazione attorno alla sua piattaforma e potenzialmente catturare una significativa quota di attenzione tra gli utenti che cercano strumenti AI potenti e senza restrizioni.
Come i suoi concorrenti, l’interfaccia utente principale per Ernie è un chatbot, accessibile tramite web e app mobili (iOS e Android). Le capacità di Ernie hanno anche trovato la loro strada in prodotti di consumo tangibili, in particolare essendo integrate nelle funzionalità AI di una versione internazionale della serie di smartphone Samsung Galaxy S24. Questa integrazione fornisce un esempio concreto di come questi modelli linguistici avanzati si stiano spostando oltre i laboratori di ricerca e le interfacce web nei dispositivi che milioni di persone usano quotidianamente. La strategia in evoluzione di Baidu sottolinea la fluidità del panorama dell’IA, dove anche i giganti affermati stanno adattando i loro approcci in risposta al progresso tecnologico e alle mutevoli aspettative del mercato.
Navigare nell’Universo AI in Espansione
L’emergere di modelli AI potenti e accessibili da DeepSeek, Alibaba e Baidu significa più di una semplice maggiore concorrenza per attori affermati come OpenAI e Google. Rappresenta un’espansione fondamentale della scelta e delle opportunità per una vasta gamma di utenti e sviluppatori. La disponibilità di questi modelli, spesso sotto licenze permissive open-source o “open weight”, abbassa significativamente la barriera all’ingresso per l’innovazione. Piccole imprese, singoli sviluppatori, ricercatori e studenti possono ora accedere e sfruttare capacità di IA che prima erano confinate a grandi aziende o costosi livelli di abbonamento.
Questa proliferazione alimenta diverse tendenze positive:
- Personalizzazione: Gli sviluppatori possono affinare questi modelli aperti su set di dati specifici per creare strumenti AI altamente specializzati su misura per settori di nicchia o compiti unici, andando oltre le soluzioni generiche “taglia unica”.
- Sperimentazione: La capacità di scaricare e modificare i pesi dei modelli consente un’esplorazione più approfondita delle architetture e delle capacità dell’IA, promuovendo la ricerca accademica e l’innovazione di base.
- Riduzione dei Costi: Per utenti e organizzazioni stanchi delle ricorrenti quote di abbonamento, queste alternative gratuite o a basso costo offrono potenti funzionalità senza l’onere finanziario associato, democratizzando potenzialmente l’accesso a strumenti AI che migliorano la produttività.
- Crescita dell’Ecosistema: L’accessibilità tramite piattaforme come GitHub e Hugging Face coltiva comunità vivaci attorno a questi modelli, offrendo risorse condivise, supporto e opportunità di sviluppo collaborativo.
Tuttavia, navigare in questo universo espanso richiede un’attenta considerazione. La scelta di un modello AI implica più che il semplice confronto dei benchmark delle prestazioni. Fattori come la qualità e la disponibilità della documentazione, la reattività della comunità degli sviluppatori, i punti di forza e di debolezza specifici di un modello (ad esempio, competenza nella codifica vs scrittura creativa vs comprensione multimodale) e le risorse computazionali richieste per eseguire o affinare efficacemente il modello sono tutti elementi cruciali nel processo decisionale. Sebbene le piattaforme cloud offrano risorse scalabili, la possibilità di eseguire potenti modelli localmente su hardware capace è una proposta attraente resa possibile da alcune release aperte.
Inoltre, l’ascesa di queste potenti alternative solleva inevitabilmente questioni strategiche per gli attori incumbent. La pressione derivante da modelli open-source di alta qualità costringerà i giganti occidentali dell’IA ad adottare strategie più aperte, magari rilasciando modelli più vecchi o offrendo livelli gratuiti più generosi? Oppure raddoppieranno le funzionalità proprietarie, il lock-in dell’ecosistema e le soluzioni focalizzate sull’impresa per mantenere il loro vantaggio? L’interazione competitiva è dinamica e in continua evoluzione.
Anche la dimensione geopolitica aggiunge complessità, poiché lo sviluppo di capacità di IA all’avanguardia al di fuori dei tradizionali hub occidentali comporta significative implicazioni a lungo termine per la leadership tecnologica e gli standard globali. Man mano che questi potenti strumenti diventano più ampiamente distribuiti, le discussioni sullo sviluppo responsabile dell’IA, le linee guida etiche e il potenziale uso improprio diventano sempre più pertinenti per tutti gli attori, indipendentemente dalla loro origine o modello di licenza. La corsa all’IA si è inequivocabilmente ampliata, offrendo un panorama più ricco, complesso e, in definitiva, più accessibile che mai. La sfida e l’opportunità ora risiedono nello sfruttare questo potenziale ampliato in modo responsabile ed efficace.