L'egemonia USA nell'IA sfidata dalla startup cinese DeepSeek

La Sfida Cinese all’Egemonia USA nell’IA

Nel campo dell’intelligenza artificiale, si sta svolgendo una narrazione da Davide contro Golia. Gli Stati Uniti, con il loro ambizioso progetto “Stargate” e un investimento di 500 miliardi di dollari, mirano a consolidare la loro posizione di leader globale nell’IA. Questo sforzo monumentale, sostenuto dai giganti della tecnologia, cerca di stabilire una rete di data center all’avanguardia in tutta la nazione. Tuttavia, una startup cinese agile, operando con quello che alcuni potrebbero definire un “budget da ridere”, è emersa come una sfidante formidabile, gettando un’ombra sulle aspirazioni degli Stati Uniti.

DeepSeek, un’azienda con sede a Hangzhou, ha recentemente svelato una serie di modelli di IA open-source che non solo eguagliano, ma in alcuni casi superano le prestazioni dei modelli di OpenAI. Inoltre, hanno raggiunto questo risultato con notevole efficienza e a una frazione del costo. Questo sviluppo ha scosso la comunità dell’IA, sollevando interrogativi sull’efficacia della strategia degli Stati Uniti e sul futuro del dominio dell’IA.

Il Panorama Attuale dell’IA e l’Emergenza di DeepSeek

Il panorama dell’IA è attualmente dominato da pochi grandi attori, principalmente con sede negli Stati Uniti. Queste aziende, ricche di finanziamenti e risorse, sono state all’avanguardia nell’innovazione dell’IA, sviluppando modelli potenti che sono alla base di una vasta gamma di applicazioni. Tuttavia, l’emergere di DeepSeek segnala un potenziale cambiamento in questa dinamica, dimostrando che un’IA rivoluzionaria può essere sviluppata con risorse significativamente inferiori.

Il modello R1 di DeepSeek, rilasciato all’inizio di questa settimana, è un ottimo esempio di questa rottura. Secondo l’azienda, questo modello eguaglia e persino supera le prestazioni del modello o1 di OpenAI, rilasciato l’anno scorso e progettato per affrontare complessi problemi di ragionamento e matematici. Il fatto che il modello di DeepSeek sia open-source e facilmente disponibile al pubblico amplifica ulteriormente il suo impatto, consentendo a ricercatori e sviluppatori di tutto il mondo di sfruttarne le capacità. I recensori hanno lodato la capacità del modello R1 di gestire attività come la codifica e il ragionamento, ponendolo in diretta concorrenza con i modelli più avanzati sul mercato.

L’Efficienza di DeepSeek: Un Modello di Innovazione a Basso Costo

Questo risultato è tanto più notevole se si considerano le risorse a disposizione di DeepSeek. Il modello linguistico di grandi dimensioni V3 dell’azienda, annunciato a dicembre, è stato addestrato utilizzando un valore di potenza di calcolo di soli 5,6 milioni di dollari. Questo è un netto contrasto con gli oltre 100 milioni di dollari che sarebbero stati utilizzati per addestrare GPT-4 di OpenAI. Il modello V3 di DeepSeek è stato confrontato con i modelli di OpenAI e Anthropic, con DeepSeek che rivendica la parità nelle prestazioni. Andrej Karpathy, un importante ricercatore di IA che in precedenza ha lavorato presso Tesla e OpenAI, ha descritto la capacità di DeepSeek di addestrare la sua IA all’avanguardia con un “budget da ridere” come altamente impressionante.

La scalata di DeepSeek alla ribalta nel competitivo settore dell’IA cinese non è casuale. Il fondatore dell’azienda, Liang Wenfeng, di 40 anni, ha recentemente incontrato il premier cinese Li Qiang, sottolineando l’importanza dei risultati di DeepSeek all’interno della nazione. Questo incontro, a cui hanno partecipato altri importanti esperti del settore, evidenzia l’impegno della Cina nel promuovere l’innovazione tecnologica e le sue ambizioni nel campo dell’IA. Il successo di DeepSeek testimonia l’ingegnosità e l’intraprendenza del settore tecnologico cinese, dimostrando la sua capacità di competere sulla scena globale nonostante le restrizioni all’accesso a determinate tecnologie.

Le Origini di DeepSeek e la Strategia di Acquisizione di Chip

Le origini di DeepSeek risalgono a HighFlyer, un hedge fund quantitativo cinese che gestiva circa 1,4 miliardi di dollari di attività nel 2019. HighFlyer ha scorporato DeepSeek nel 2023, istituendola come startup dedicata all’IA focalizzata sullo sviluppo di modelli e sulla creazione di prodotti di IA. Liang Wenfeng, che ha una formazione in IA presso l’Università di Zhejiang, ha co-fondato HighFlyer e ha sfruttato le sue risorse finanziarie per acquisire migliaia di chip Nvidia AI prima dell’imposizione delle restrizioni statunitensi nel 2022. Questa mossa strategica ha fornito a DeepSeek un vantaggio significativo rispetto ad altre startup di IA, consentendole di continuare la sua ricerca e sviluppo mentre altre faticavano a garantire la potenza di elaborazione.

Mentre gli esperti hanno opinioni diverse sulle prestazioni di DeepSeek rispetto a ChatGPT di OpenAI e Claude di Anthropic, il consenso generale è che i modelli di DeepSeek si comportano eccezionalmente bene in specifiche configurazioni hardware. Tuttavia, potrebbero incontrare difficoltà in altri scenari. L’obiettivo di DeepSeek è migliorare l’efficienza e ridurre i costi, il che è evidente nel suo innovativo modello “mixture of experts”. Questo modello utilizza diverse parti dell’IA per gestire domande specifiche, ottimizzando le prestazioni e l’utilizzo delle risorse.

Trasparenza e Accessibilità: I Punti di Forza di DeepSeek

Un altro elemento distintivo dei modelli di DeepSeek è la loro natura open-source, che ne consente l’utilizzo su diverse piattaforme hardware. Ancora più importante, i modelli di DeepSeek forniscono trasparenza, rivelando come arrivano alle loro risposte, a differenza di o1 di OpenAI. Questa trasparenza è un punto di forza fondamentale per i clienti che cercano soluzioni di IA economiche, in particolare quelli esclusi dal mercato dei modelli sviluppati negli Stati Uniti a prezzi elevati e quelli che hanno restrizioni all’accesso alla potenza di calcolo americana.

La preoccupazione degli Stati Uniti per i progressi della Cina nell’IA non è infondata. Il governo degli Stati Uniti ha cercato attivamente di frenare lo sviluppo dell’IA cinese attraverso i controlli sulle esportazioni di chip IA avanzati dal 2022. Ciò ha effettivamente impedito alle aziende cinesi di acquisire i processori necessari per addestrare modelli di IA all’avanguardia. Nonostante queste restrizioni, i produttori di chip come Nvidia e Intel hanno tentato di creare processori conformi ai requisiti statunitensi per il mercato cinese, solo per affrontare un ulteriore inasprimento delle regole da parte di Washington.

Le Strategie Alternative della Cina per Superare le Restrizioni

Queste restrizioni hanno costretto le aziende cinesi di IA a esplorare strategie alternative. Alcune si affidano a chip di fabbricazione statunitense importati prima dei divieti, mentre altre si rivolgono a reti di contrabbando del mercato grigio che spediscono chip da località di terze parti. Alcune stanno esplorando data center al di fuori della Cina, mentre altre si affidano ad alternative di fabbricazione cinese da aziende come Huawei. Sebbene Huawei affermi che i suoi chip IA superano il processore A100 di Nvidia, ha incontrato difficoltà nel produrli in modo affidabile su larga scala.

Liang Wenfeng ha dichiarato che “il denaro non è mai stato un problema per noi; i divieti sulle spedizioni di chip avanzati sono il problema”. Questa affermazione sottolinea gli ostacoli significativi che le aziende cinesi devono affrontare nella loro ricerca della leadership nell’IA. Oltre ai divieti sull’esportazione di chip, l’amministrazione Biden ha anche vietato gli investimenti statunitensi nell’IA cinese, complicando ulteriormente la situazione.

L’Ecosistema dell’IA Cinese e la Guerra dei Prezzi

Nonostante queste sfide, la Cina ha coltivato un fiorente ecosistema di IA. Le principali aziende tecnologiche come Baidu, Alibaba e ByteDance stanno sviluppando i propri modelli fondamentali e offrendo servizi basati sull’IA. Startup cinesi di IA come MiniMax e Moonshot AI hanno lanciato servizi orientati al consumatore che hanno ottenuto successo anche nel mercato statunitense.

L’intensa concorrenza all’interno del settore dell’IA cinese ha portato a una guerra dei prezzi, con le aziende che hanno drasticamente ridotto i prezzi fino al 90% nel corso del 2024 per ottenere un vantaggio competitivo. Questa guerra dei prezzi evidenzia ulteriormente l’intraprendenza e l’adattabilità del settore dell’IA cinese.

Le Preoccupazioni degli Stati Uniti e la Risposta con il Progetto Stargate

Gli Stati Uniti sono sempre più preoccupati per i successi della Cina nell’IA, poiché ciò implica che le misure adottate per proteggere la leadership statunitense nell’IA non stanno funzionando. L’ex CEO di Google Eric Schmidt ha espresso la sua sorpresa per i progressi della Cina, affermando che “pensavo che le restrizioni che abbiamo imposto sui chip li avrebbero tenuti indietro”.

Anche OpenAI, lo sviluppatore di ChatGPT, ha sollevato preoccupazioni sui progressi dell’IA cinese. In un recente documento politico, OpenAI ha affermato che ci sono circa 175 miliardi di dollari in fondi globali in attesa di essere investiti in progetti di IA. L’azienda ha avvertito che “se gli Stati Uniti non attirano questi fondi, confluiranno in progetti sostenuti dalla Cina, rafforzando l’influenza globale del Partito Comunista Cinese”.

In risposta a queste preoccupazioni, il CEO di OpenAI Sam Altman, il CEO di SoftBank Masayoshi Son e il cofondatore di Oracle Larry Ellison hanno annunciato il Progetto Stargate, che si impegna a investire 500 miliardi di dollari in infrastrutture di IA negli Stati Uniti. Questo progetto è una chiara indicazione dell’impegno degli Stati Uniti a mantenere la propria leadership nel campo dell’IA.

L’Importanza dell’Innovazione e dell’Adattabilità

Tuttavia, l’emergere di aziende come DeepSeek suggerisce che il percorso verso il dominio dell’IA potrebbe non essere così semplice come investire ingenti somme di denaro. La capacità di innovare, adattarsi e raggiungere scoperte con risorse limitate è un fattore critico nell’attuale panorama dell’IA. Mentre la corsa all’IA continua a intensificarsi, il mondo osserverà attentamente come gli Stati Uniti e la Cina affronteranno queste complesse sfide. L’esito avrà implicazioni di vasta portata per il futuro della tecnologia e delle dinamiche di potere globali. La storia di DeepSeek serve a ricordare che l’ingegnosità e l’intraprendenza possono essere forze potenti nella corsa alla supremazia dell’IA. Mentre gli Stati Uniti stanno investendo pesantemente per mantenere il loro vantaggio, la sfida della Cina, in particolare da parte di startup innovative come DeepSeek, è formidabile. I prossimi anni saranno cruciali per determinare il vincitore finale in questa competizione ad alto rischio. Il panorama dell’IA è in rapida evoluzione e la dinamica tra queste due potenze globali continuerà a plasmare il futuro di questa tecnologia trasformativa.