L'Opportunità Malese: AI Open Source Cinese

L’alba del modello linguistico di grandi dimensioni (LLM) DeepSeek R1 all’inizio di quest’anno ha segnato un momento trasformativo per l’intelligenza artificiale generativa (Gen AI). Questo evento ha rappresentato un significativo passo avanti, non solo dal punto di vista tecnologico, ma anche da un punto di vista commerciale e strategico. DeepSeek ha dimostrato che LLM sofisticati possono essere sviluppati a costi significativamente inferiori rispetto a quanto si credeva in precedenza e, soprattutto, che questa innovazione non è confinata alla Silicon Valley.

L’emergere di DeepSeek presenta profonde implicazioni per l’ecosistema AI della Malesia, che si estendono oltre la rivalità tecnologica in corso tra Stati Uniti e Cina e il temporaneo raffreddamento dell’entusiasmo del mercato azionario malese per i data center.

Il significato dell’Open Source

Un aspetto chiave degli LLM di DeepSeek è la loro fondazione nella tecnologia open-source. Modelli come DeepSeek R1 sono disponibili con licenze open-source o open-weight, il che significa che possono essere scaricati, modificati e utilizzati liberamente. Questa natura open-source ha implicazioni sostanziali per l’evoluzione e la commercializzazione degli LLM.

Per anni, i giganti tecnologici cinesi come Baidu, Alibaba e Tencent hanno sviluppato attivamente modelli AI open-source. Questa strategia, sostenuta dalle università cinesi e dalle iniziative governative, adotta un approccio di “innovazione aperta”, con l’obiettivo di accelerare la ricerca e lo sviluppo e potenzialmente superare gli Stati Uniti nelle capacità di AI.

Tuttavia, l’impegno per l’AI open-source si estende oltre la Cina. Anche Meta e Google hanno rilasciato LLM open-weight, motivati da fattori competitivi. La logica alla base di questo è radicata nella strategia aziendale di “commoditizing the complement”. Se un’azienda dipende fortemente dalla Gen AI, potrebbe essere più vantaggioso investire in alternative open-source piuttosto che affidarsi esclusivamente a modelli proprietari come ChatGPT. Anche se gli LLM proprietari sono ancora utilizzati, la disponibilità di buoni modelli open-source indebolisce il potere di determinazione dei prezzi dei principali fornitori come OpenAI.

Questa strategia rispecchia le azioni intraprese da Oracle, un produttore di server e apparecchiature di rete. Oracle ha supportato il sistema operativo open-source Linux per frenare il dominio dei prezzi del sistema operativo Windows di Microsoft.

Indipendentemente dalle motivazioni, la disponibilità di LLM open-weight di alta qualità riduce significativamente i costi per paesi come la Malesia, aprendo nuove porte all’innovazione.

Vantaggi per il governo e le imprese

Per il governo malese, gli LLM open-source offrono l’opportunità di gestire i propri modelli AI senza la necessità di trasferire dati sensibili a terzi commerciali o nazioni straniere. Ciò rafforza l’autonomia e la sovranità dei dati.

Per le aziende malesi, in particolare le startup, gli LLM open-weight creano condizioni di parità. Possono accedere agli stessi LLM fondamentali delle loro controparti in Cina e negli Stati Uniti, promuovendo l’innovazione e la concorrenza.

Affrontare i pregiudizi culturali e politici

L’ascesa dell’AI cinese mette in luce anche una sfida significativa: il pregiudizio culturale e politico. Gli LLM cinesi sono spesso addestrati per riflettere la narrazione storica e le prospettive politiche del Partito Comunista Cinese (PCC), aderendo alle norme di censura all’interno della Cina continentale.

Anche senza una censura esplicita, i modelli AI portano intrinsecamente i pregiudizi presenti nei loro dati di addestramento. Se addestrati principalmente su testi in inglese, i modelli rifletteranno i punti di vista e i pregiudizi culturali occidentali.

La buona notizia è che gli LLM possono essere riqualificati relativamente facilmente. Similmente a come gli LLM cinesi ricevono protezioni per promuovere la lealtà al PCC, altri progetti open-source hanno dimostrato che DeepSeek R1 può essere post-addestrato per mitigare i pregiudizi percepiti.

Localizzazione e Sensibilità Culturale

Questa esperienza sottolinea la necessità per paesi come la Malesia di sviluppare la propria capacità di localizzare, addestrare e post-addestrare gli LLM per allinearli alle condizioni locali. I modelli che non tengono conto delle sensibilità razziali e religiose, delle gerarchie sociali o dello slang locale della Malesia potrebbero sottoperformare o generare contenuti dannosi.

La Malesia possiede già alcune capacità di sviluppo LLM. Ad esempio, la startup locale Mesolitica ha rilasciato l’LLM open-source MaLLaM a gennaio, dimostrando una comprensione più sfumata del Bahasa Malaysia rispetto agli LLM tradizionali come ChatGPT.

Tuttavia, la consapevolezza tra i politici malesi riguardo al potenziale dell’AI open-source e all’importanza dello sviluppo LLM locale rimane poco chiara.

Strategia nazionale di AI

La National AI Roadmap, redatta nel 2021, fa poco riferimento all’open source. Allo stesso modo, anche i documenti recenti del nuovo National AI Office (NAIO) non enfatizzano l’AI open-source.

Sebbene prevedere il futuro dello sviluppo dell’AI rimanga impegnativo, la natura open-source dell’attuale generazione di LLM offre alla Malesia un’eccezionale opportunità per raggiungere i leader tecnologici.

Cogliere l’opportunità

Per capitalizzare su questo, la Malesia deve aggiornare le sue politiche per accogliere l’emergere di LLM più piccoli e più convenienti. Ciò include la semplificazione dell’adozione di questi modelli, rendendo la Gen AI più accessibile alle piccole e medie imprese e consentendo la distribuzione locale, in particolare nelle aree rurali con accesso limitato a Internet.

Espandere la capacità della Malesia di sviluppare LLM, rendendoli più rilevanti per le lingue locali e consapevoli della cultura locale, è fondamentale. Investire nella formazione LLM, potenzialmente ancorata alle università locali, può essere considerato un bene pubblico, promuovendo il talento nazionale e promuovendo la ricerca e lo sviluppo locali.

Autonomia dei dati e sicurezza nazionale

Ospitare i propri LLM è vitale per garantire l’autonomia dei dati nazionali. I dati raccolti dagli LLM possono essere preziosi e, invece di essere sfruttati da entità straniere, queste informazioni dovrebbero essere archiviate e utilizzate da organizzazioni locali.

Ecco una ripartizione più dettagliata di come la Malesia può capitalizzare specificamente sul movimento AI open-source:

  • Aggiornamenti delle politiche: Le politiche esistenti devono essere riviste e aggiornate per riflettere l’attuale panorama dell’AI, con un focus specifico sulle opportunità e i vantaggi degli LLM open-source. Ciò include la semplificazione delle normative per l’utilizzo dei dati (pur mantenendo adeguate misure di salvaguardia della privacy), la fornitura di finanziamenti e incentivi per la ricerca e lo sviluppo dell’AI open-source e la promozione dell’adozione di soluzioni AI open-source in tutto il settore pubblico.

  • Investimento nello sviluppo dei talenti: Costruire una forza lavoro qualificata è fondamentale. La Malesia deve investire in programmi educativi e iniziative di formazione incentrati su AI, apprendimento automatico ed elaborazione del linguaggio naturale. Questi programmi dovrebbero enfatizzare gli strumenti e le tecnologie open-source, garantendo che i laureati siano ben attrezzati per contribuire all’ecosistema AI locale. Borse di studio, borse di ricerca e partnership industriali possono ulteriormente incoraggiare gli studenti a intraprendere una carriera nell’AI.

  • Ricerca guidata dall’università: Le università locali dovrebbero essere in prima linea nella ricerca e nello sviluppo dell’AI. Il governo può fornire finanziamenti per creare centri di ricerca sull’AI presso le università, concentrandosi su aree come la personalizzazione LLM, l’adattamento culturale e lo sviluppo di nuovi strumenti AI open-source su misura per le esigenze specifiche della Malesia. La creazione di piattaforme collaborative tra università e industria può accelerare il trasferimento di conoscenze e tecnologia.

  • Supporto per startup e PMI: L’AI open-source offre una significativa opportunità per startup e PMI di innovare e competere. La Malesia dovrebbe fornire un supporto mirato a queste aziende, compreso l’accesso a finanziamenti, tutoraggio e competenze tecniche. Questo supporto potrebbe includere sovvenzioni per lo sviluppo di prodotti e servizi basati sull’AI, incubatori e acceleratori incentrati sull’AI e programmi che collegano le startup con potenziali clienti e investitori.

  • Quadro di governance dei dati: Stabilire un solido quadro di governance dei dati è essenziale per garantire l’uso responsabile ed etico dell’AI. Questo quadro dovrebbe affrontare questioni come la privacy dei dati, la sicurezza e i pregiudizi e dovrebbe essere allineato alle migliori pratiche internazionali. Dovrebbe anche promuovere la condivisione dei dati all’interno dell’ecosistema AI, proteggendo al contempo le informazioni sensibili. Ciò potrebbe essere ottenuto attraverso la creazione di un repository nazionale di dati e la definizione di linee guida chiare per l’accesso e l’utilizzo dei dati.

  • Partenariati pubblico-privato: La collaborazione tra il settore pubblico e quello privato è fondamentale per promuovere l’innovazione nell’AI. Il governo può collaborare con aziende private per sviluppare e implementare soluzioni AI in aree come l’assistenza sanitaria, l’istruzione e i trasporti. Questi partenariati possono sfruttare l’esperienza e le risorse di entrambi i settori, portando a risultati più efficaci e di impatto.

  • Infrastruttura nazionale di AI: Investire in un’infrastruttura nazionale di AI, comprese risorse di calcolo ad alte prestazioni e strutture di archiviazione dati, è essenziale per supportare la ricerca e lo sviluppo dell’AI. Questa infrastruttura dovrebbe essere accessibile a ricercatori, startup e aziende in tutto il paese, fornendo loro gli strumenti necessari per innovare e competere.

  • Adattamento culturale degli LLM: La Malesia dovrebbe investire in progetti incentrati sull’adattamento di LLM open-source