Un fondo di trading quantitativo con sede a Shanghai sta suscitando grande interesse nella comunità dell’intelligenza artificiale (AI) presentando una tecnica di addestramento potenzialmente rivoluzionaria in una delle principali conferenze internazionali. Questo metodo innovativo, descritto in un documento di ricerca presentato alla prestigiosa Conference on Neural Information Processing Systems (NeurIPS), potrebbe rivaleggiare o addirittura superare l’efficacia degli approcci di addestramento AI consolidati utilizzati da importanti organizzazioni di ricerca come DeepSeek e OpenAI. Questa mossa rispecchia la stessa traiettoria di DeepSeek, che ha guadagnato notevole attenzione per i suoi progressi negli algoritmi di AI.
Decifrare il Framework di Addestramento SASR di Goku
Shanghai Goku Technologies, fondata nel 2015, ha introdotto un nuovo framework di addestramento AI denominato SASR, o addestramento ibrido adattivo passo-passo. Questo approccio mira ad affrontare le limitazioni percepite dei metodi prevalenti come il supervised fine-tuning (SFT) e il reinforcement learning (RL). Goku sostiene che SASR, ispirato al modo in cui gli esseri umani sviluppano le capacità di ragionamento, offre un percorso più adattivo ed efficiente per costruire modelli di AI avanzati.
SFT e RL sono considerati pietre miliari nel processo di addestramento AI, impiegati da giganti del settore come OpenAI e DeepSeek. DeepSeek ha esplicitamente sottolineato il ruolo fondamentale di queste tecniche nell’ottimizzazione delle prestazioni del suo modello V3, che è stato rilasciato a dicembre e ha suscitato un notevole interesse all’interno del settore tecnologico.
Secondo il documento di ricerca di Goku, co-autore con ricercatori della Shanghai Jiao Tong University e della sua nuova filiale AI, Shanghai AllMind Artificial Intelligence Technology, SASR dimostra prestazioni superiori rispetto alle metodologie di SFT, RL e addestramento ibrido statico. "I risultati sperimentali dimostrano che SASR supera i metodi di addestramento SFT, RL e ibrido statico", ha affermato il team di Goku nel loro documento di ricerca.
Le Implicazioni del Progresso di Goku
La svolta di Goku nell’addestramento AI sottolinea, a quanto riferito, il continuo progresso della Cina nel campo dell’IA. Evidenzia potenzialmente i limiti delle attuali politiche attuate dal governo degli Stati Uniti, volte a ostacolare il progresso dell’IA cinese attraverso restrizioni hardware. Jensen Huang, CEO di Nvidia, ha recentemente commentato la percepita inefficacia di queste restrizioni, affermando che "la Cina ha il 50% degli sviluppatori di IA del mondo".
DeepSeek, una startup cinese di AI nata dall’hedge fund High-Flyer, ha ottenuto un ampio riconoscimento per aver dimostrato il potenziale della Cina per la leadership dell’AI attraverso algoritmi avanzati e l’integrazione di hardware e software.
Il Ruolo di AllMind nella Strategia AI di Goku
La creazione di AllMind, in coincidenza con la pubblicazione della ricerca di Goku, indica una mossa strategica per dedicare risorse alla ricerca e allo sviluppo dell’IA. I registri delle imprese cinesi indicano che AllMind è stata ufficialmente registrata lo stesso giorno in cui Goku ha pubblicato la sua ricerca.
Wang Xiao, il fondatore di Goku e il rappresentante legale di AllMind, ha dichiarato che la nuova entità è stata creata per esplorare nuovi confini dell’IA. Questo rispecchia l’approccio adottato da High-Flyer, che ha istituito DeepSeek come entità separata nel 2023.
Alla fine dello scorso anno, Goku gestiva oltre 15 miliardi di yuan (circa 2,1 miliardi di dollari USA) in asset nazionali e internazionali, utilizzando strategie guidate dall’IA, secondo le informazioni disponibili sul suo sito web ufficiale.
Approfondimento in SASR: Un Framework di Addestramento Ibrido Adattivo Passo-Passo
Il framework SASR di Goku presenta un’alternativa interessante nel panorama dell’addestramento di modelli AI. Per apprezzare veramente il suo potenziale impatto, è essenziale una comprensione più dettagliata dei suoi componenti e del suo funzionamento.
L’aspetto "passo-passo" di SASR implica un processo di addestramento multi-fase in cui il modello AI subisce un perfezionamento iterativo. Ogni passo probabilmente coinvolge obiettivi specifici e utilizza dati di addestramento distinti per coltivare particolari capacità all’interno del modello. Questo approccio graduale può offrire vantaggi come mitigare le sfide dell’addestramento di modelli complessi da zero e consentire un’ottimizzazione su misura in ogni fase.
L’elemento "adattivo" suggerisce che il processo di addestramento non è statico ma risponde dinamicamente alle prestazioni e alle caratteristiche del modello. Questa adattabilità potrebbe comportare la regolazione degli iperparametri, la modifica della distribuzione dei dati di addestramento o la ponderazione dinamica del contributo di diversi obiettivi di addestramento. Un processo adattivo consente all’AI di apprendere e migliorare in modo più efficace.
La natura "ibrida" di SASR rivela che combina elementi di diverse metodologie di addestramento. Questo è un aspetto vitale perché ci sono punti di forza e di debolezza in SFT e RL. Una combinazione di metodi consente al modello di sfruttare i vantaggi di ciascun approccio affrontandone i limiti. Integrando queste tre caratteristiche, SARS è in teoria meglio sintonizzato per sviluppare logica e ragionamento.
Confronto tra SASR e i Metodi Tradizionali
Il supervised fine-tuning (SFT) si basa tradizionalmente su un ampio set di dati etichettato in cui il modello AI impara a mappare gli input sugli output desiderati. Il reinforcement learning (RL) prevede l’addestramento del modello attraverso tentativi ed errori, premiando o penalizzando le azioni per massimizzare un obiettivo specifico.
SASR tenta di integrare i due superando al contempo i limiti di ciascun metodo. Ad esempio, SFT può essere fortemente dipendente dalla qualità e dalla completezza dei dati etichettati. In molti scenari del mondo reale, ottenere dati sufficienti e accurati può essere sia dispendioso in termini di tempo che costoso. RL, pur non richiedendo dati etichettati, può essere instabile e incline all’reward hacking. L’reward hacking si verifica quando il modello AI scopre modi involontari per massimizzare la sua ricompensa, portando potenzialmente a un comportamento indesiderato.
Il framework di Goku ha la possibilità di essere un miglioramento rispetto alle limitazioni di SFT e RL. Tuttavia, sono necessari ulteriori e continui test per verificare i risultati iniziali documentati nel documento della società.
Innovazione Algoritmica e Vincoli Hardware
La notizia del framework SASR di Goku è particolarmente rilevante nel contesto delle relazioni tecnologiche USA-Cina. Per qualche tempo, il governo degli Stati Uniti ha tentato di limitare l’ascesa della Cina nel dominio dell’IA limitando l’accesso a hardware di calcolo avanzato, in particolare GPU di fascia alta da società come Nvidia. L’idea alla base di queste restrizioni è che limitare l’accesso della Cina a hardware potente rallenterà i suoi sforzi di sviluppo dell’IA.
Tuttavia, i commenti del CEO di Nvidia Jensen Huang e i progressi che emergono dai laboratori di AI cinesi sembrano suggerire che queste politiche potrebbero non essere efficaci come previsto. Huang ha notoriamente notato che la Cina possiede una parte significativa dei talenti di sviluppatori di AI del mondo e che limitare l’accesso all’hardware può incentivarli a trovare soluzioni alternative.
La presunta svolta nell’IA di Goku suggerisce che l’innovazione algoritmica può potenzialmente compensare i limiti hardware, almeno in una certa misura. Se i ricercatori cinesi possono sviluppare algoritmi di addestramento più efficienti, potrebbero essere in grado di ottenere prestazioni AI comparabili con hardware meno potente. Ciò potrebbe avere implicazioni significative per il panorama globale dell’IA, in quanto suggerisce che la Cina potrebbe essere in grado di continuare a far progredire le sue capacità di IA nonostante le restrizioni in corso.
Questo non vuol dire che l’hardware sia irrilevante. Le GPU avanzate sono ancora fondamentali per l’addestramento di modelli AI all’avanguardia e l’accesso all’hardware più recente offre senza dubbio un vantaggio competitivo significativo. Tuttavia, il lavoro di Goku dimostra l’importanza di investire sia in hardware che in software e che il progresso in un’area può potenzialmente compensare le limitazioni nell’altra.
L’Ascesa dell’IA Cinese: Oltre DeepSeek
L’emergere di DeepSeek come attore di spicco nell’arena dell’IA è stato un catalizzatore, dimostrando la determinazione della Cina a diventare un leader globale in questa tecnologia trasformativa. Tuttavia, DeepSeek è solo un esempio e l’ascesa di Goku, con il suo framework di addestramento SASR, illustra ulteriormente la crescente forza e innovazione all’interno dell’ecosistema AI cinese.
Diversi fattori contribuiscono a questo slancio. Innanzitutto, la Cina ha un vasto pool di dati, essenziale per l’addestramento di modelli AI. Con una vasta popolazione e l’adozione diffusa di tecnologie digitali, le aziende cinesi hanno accesso a enormi set di dati che possono essere utilizzati per sviluppare e perfezionare i propri algoritmi AI.
In secondo luogo, la Cina pone una forte enfasi sull’istruzione STEM, producendo un gran numero di ingegneri e scienziati di talento. Ciò ha creato una forza lavoro altamente qualificata in grado di guidare l’innovazione nell’IA e nei campi correlati.
In terzo luogo, il governo cinese ha reso l’IA una priorità strategica, fornendo finanziamenti e supporto significativi per la ricerca e lo sviluppo. Ciò ha creato un ambiente fertile per le startup di AI e ha promosso la collaborazione tra il mondo accademico e l’industria.
Infine, le aziende cinesi sono spesso disposte ad adottare un approccio più pragmatico e incline al rischio all’innovazione, il che consente loro di muoversi rapidamente e sperimentare nuove idee.
Come risultato di questi fattori, la Cina sta rapidamente raggiungendo gli Stati Uniti in termini di capacità di AI. Mentre gli Stati Uniti mantengono ancora un vantaggio in alcune aree, come la ricerca fondamentale e l’hardware di fascia alta, la Cina sta compiendo progressi significativi in aree come la visione artificiale, l’elaborazione del linguaggio naturale e la robotica.
L’emergere di aziende come Goku e DeepSeek suggerisce che la Cina è ben posizionata per continuare la sua ascesa nel dominio dell’IA negli anni a venire.
Shanghai Goku Technologies: L’Azienda Dietro l’Innovazione
Shanghai Goku Technologies è un fondo di trading quantitativo fondato nel 2015. Gestisce asset significativi utilizzando strategie guidate dall’IA. La missione dichiarata della società è quella di "combinare tecnologia e analisi fondamentali" per offrire rendimenti migliori ai propri clienti. Oltre alla sua attività principale nella gestione patrimoniale, Goku ha dimostrato un impegno a spingere i confini della ricerca sull’IA. AllMind Artificial Intelligence Technology, la sussidiaria AI, rappresenta una mossa strategica per formalizzare e accelerare i suoi sforzi di ricerca sull’IA.
I dettagli sulla struttura interna della società e le dinamiche operative rimangono relativamente scarsi. Tuttavia, le sue dichiarazioni pubbliche e le attività recenti offrono spunti di riflessione sul suo approccio. Lo slogan della società, che si traduce in "la logica e la verità sono gli unici principi che rispettiamo", riflette una cultura basata sui dati e sull’analisi. L’investimento nella ricerca e nello sviluppo dell’IA indica una visione a lungo termine e una consapevolezza del potenziale trasformativo dell’IA, non solo all’interno del settore finanziario ma anche in vari settori. È probabile che Goku intenda sfruttare gli spunti derivanti dalla ricerca sull’IA per migliorare le proprie strategie di trading e ottenere un vantaggio competitivo sul mercato.