L’Ascesa di RISC-V come Architettura di Calcolo AI-Nativa
La recente esplosiva popolarità di DeepSeek ha scosso l’industria dell’AI, e il suo impatto si estende oltre il semplice regno dell’intelligenza artificiale. L’industria dei semiconduttori, in particolare, ha preso nota. Durante il Capodanno cinese, la DAMO Academy Xuantie di Alibaba ha annunciato il suo adattamento del modello di distillazione della serie DeepSeek-R1, mostrando il forte slancio dell’emergente architettura di set di istruzioni open-source, RISC-V, nel dominio dell’AI.
Alla recente Xuantie RISC-V Ecosystem Conference, sono emerse notizie entusiasmanti: RISC-V ha ottenuto importanti risultati sia nel calcolo ad alte prestazioni che nell’AI. Xuantie C930, la prima CPU di livello server della DAMO Academy, inizierà le consegne il mese prossimo. La sua potenza di calcolo AI notevolmente migliorata accelera l’implementazione di un ecosistema RISC-V completo ‘high-performance + AI’.
L’architettura di calcolo open-source RISC-V potrebbe essere il partner ideale per l’AI open-source?
La Trasformazione dei Modelli AI Alimenta l’Innovazione nell’Architettura di Calcolo
Un esperto veterano nel settore dei chip ha spiegato che l’impatto di DeepSeek si fa sentire non solo nei circoli dell’AI, ma anche profondamente all’interno dell’industria dei chip. DeepSeek, attraverso il suo design altamente ottimizzato, ha drasticamente ridotto i costi di addestramento e inferenza dei modelli linguistici di grandi dimensioni. Questo cambiamento ha alterato drasticamente l’equilibrio esistente tra potenza di calcolo, memoria e interconnessione, creando significative opportunità per innovazioni nell’architettura di calcolo.
Tradizionalmente, i grandi modelli di AI, a causa dei loro intensivi requisiti di calcolo e memoria, erano più adatti per l’implementazione nel cloud piuttosto che sui dispositivi edge. Tuttavia, l’arrivo di DeepSeek ha messo in discussione questa dipendenza dall’elevata potenza di calcolo. Riducendo sia i costi di addestramento che di inferenza, sta aprendo la strada alla transizione dei grandi modelli dal cloud all’edge.
Nello specifico, le ridotte esigenze computazionali di DeepSeek rendono possibile l’implementazione su singola macchina, migliorando la sua compatibilità con i dispositivi edge e end-side. Man mano che l’AI cerca di penetrare in diversi settori e scenari, la necessità di passare dal cloud all’edge diventa sempre più critica. Questo cambiamento è necessario per soddisfare diverse esigenze come la sicurezza dei dati, la personalizzazione e l’implementazione privata.
È prevedibile che, con l’adozione diffusa della tecnologia DeepSeek, il panorama dei chip AI subirà una trasformazione. Da un calcolo parallelo su larga scala dipendente dall’infrastruttura cloud, i chip AI si stanno evolvendo verso design diversificati, efficienti e a basso consumo energetico, capaci di operare in modo indipendente sui dispositivi edge.
Questo ha spinto molti nel settore a chiedersi: quale architettura di calcolo è più adatta per l’AI?
Le GPU, con le loro capacità di elaborazione parallela, potrebbero non essere l’unica soluzione. Ancheil calcolo seriale (calcolo general-purpose) sta emergendo come una valida base per il calcolo AI. L’esperienza del settore dimostra che DeepSeek mostra una buona compatibilità con vari sistemi di calcolo. La sua capacità di essere rapidamente implementato ed eseguire inferenze efficaci sulle CPU ha riportato le CPU sotto i riflettori. Rispetto alle GPU specializzate, le CPU offrono il vantaggio della versatilità, della semplificazione della schedulazione, della significativa riduzione dei requisiti di potenza di calcolo e dei vantaggi del calcolo omogeneo.
Tra le CPU, la stella nascente, RISC-V, sta attirando un’attenzione significativa.
Durante il Capodanno cinese, la DAMO Academy ha adattato il modello di distillazione della serie DeepSeek-R1 su un chip alimentato dal processore RISC-V Xuantie C920. L’intero processo ha richiesto solo un’ora, dimostrando un’esperienza rapida e senza interruzioni. Ciò significa che i modelli della serie DeepSeek possono essere implementati ed eseguiti senza problemi sull’intera gamma di piattaforme CPU Xuantie e su altri dispositivi AI end-side dotati di chip con architettura RISC-V.
La preminenza di RISC-V deriva da diversi fattori. In primo luogo, come architettura di set di istruzioni emergente, si distingue dai modelli di licenza chiusi o a pagamento di x86 e ARM abbracciando un approccio open-source. Questo spirito open-source si allinea naturalmente con l’AI. La sua natura aperta ha attirato la partecipazione di oltre 1.000 aziende in tutto il mondo, favorendo una rapida crescita del suo ecosistema, dalla progettazione hardware alle toolchain software. Secondo la RISC-V International Foundation, più di 80 diversi prodotti chip RISC-V sono già entrati nel mercato.
In secondo luogo, RISC-V offre una notevole flessibilità e scalabilità. Consente agli sviluppatori di personalizzare il set di istruzioni in base alle esigenze specifiche. La natura modulare del suo set di istruzioni consente la personalizzazione per diversi scenari applicativi, un livello di flessibilità ineguagliato dalle architetture tradizionali.
Tecnicamente, RISC-V è anche adatto per nuovi tipi di calcolo AI. La sua estensione vettoriale (V-extension) può gestire efficacemente operazioni parallele su larga scala, soddisfacendo le esigenze di efficienza del calcolo AI. L’architettura aperta di RISC-V può funzionare in sinergia con moduli di accelerazione hardware per migliorare l’efficienza di esecuzione delle attività AI. Attraverso una profonda integrazione con gli algoritmi AI, l’architettura RISC-V può essere utilizzata per progettare unità di accelerazione hardware dedicate, ottimizzando le prestazioni per specifici modelli AI.
Pertanto, molti esperti veterani nel settore dei chip prevedono che RISC-V diventerà l’architettura di calcolo nativa dell’era dell’AI.
Alla terza Xuantie RISC-V Ecosystem Conference ospitata dalla DAMO Academy di Alibaba, questa aspettativa si è finalmente concretizzata.
La Prima CPU di Livello Server di Xuantie Pronta per la Consegna: Una Fusione di Alte Prestazioni e AI
Alla conferenza, Ni Guangnan, accademico dell’Accademia Cinese di Ingegneria, ha dichiarato: ‘RISC-V open-source non è solo un’innovazione tecnologica, ma anche una trasformazione globale che influenzerà il futuro dell’architettura di calcolo’. Come architettura di set di istruzioni per chip ‘nata open-source’, RISC-V ha dimostrato prestazioni notevoli in questo ciclo dell’industria dei semiconduttori. Ha accelerato i suoi progressi dai sistemi embedded a scenari complessi come il calcolo ad alte prestazioni, offrendo una nuova opzione per la potenza di calcolo AI.
Tra i 25 standard approvati dalla RISC-V International Foundation nel 2024, più della metà sono relativi alle alte prestazioni o all’AI. Lu Dai, Presidente del Consiglio di Amministrazione della RISC-V International Foundation, ha dichiarato alla conferenza che uno dei progressi più entusiasmanti nel set di istruzioni RISC-V è l’estensione Matrix, che spingerà RISC-V a diventare una forza formidabile nel campo dell’AI.
Si prevede che entro il 2030, la quota di mercato complessiva di RISC-V raggiungerà il 20%, con la sua quota negli acceleratori AI che potrebbe superare il 50%.
Alla conferenza, la DAMO Academy ha presentato il suo processore di punta di prossima generazione, e il primo processore di livello server, il C930.
Il C930 raggiunge un benchmark di potenza di calcolo general-purpose di 15/GHz nel test benchmark SPECint2006. Cosa significa questo? L’accademico Ni Guangnan ha sottolineato che affinché RISC-V possa entrare veramente nel mercato del calcolo ad alte prestazioni, deve ottenere un punteggio ad alte prestazioni superiore a 15 nel test software SPECint 2006. Pertanto, il C930 rappresenta un passo fondamentale per RISC-V.
Inoltre, il C930 è dotato di due motori: RVV1.0 a 512 bit e Matrix da 8 TOPS. Questo integra nativamente la potenza di calcolo general-purpose ad alte prestazioni con la potenza di calcolo AI. Fornisce anche un’interfaccia di estensione DSA aperta per supportare più requisiti di funzionalità.
Contemporaneamente, la DAMO Academy ha rivelato i suoi piani di sviluppo per nuovi membri della famiglia di processori Xuantie, tra cui C908X, R908A e XL200, continuando a evolversi in direzioni come l’accelerazione AI, le applicazioni automobilistiche e l’interconnessione ad alta velocità. Nello specifico, il C908X è posizionato come il primo processore AI dedicato di Xuantie, che supporta un’estensione vettoriale RVV1.0 con larghezza di bit di dati ultra-lunga di 4096 bit. L’R908A è destinato ai requisiti di alta affidabilità dei chip di livello automobilistico. L’XL200 fornirà un’interconnessione coerente multi-cluster su scala più ampia e con prestazioni più elevate.
Per completare le capacità dei processori Xuantie, la DAMO Academy ha anche lanciato tre SDK Xuantie basati sui tre principali sistemi operativi: Linux, Android e RTOS. Questi SDK integrano in modo completo le capacità software accumulate da Xuantie nel corso degli anni, fornendole al settore in modo più completo, conveniente e stabile. Tra questi, l’SDK Xuantie Linux offre un ricco set di sottosistemi, tra cui l’hypervisor di virtualizzazione, il framework di sicurezza CoVE, il framework Xuantie AI e le librerie di operatori ad alte prestazioni, facilitando lo sviluppo di RISC-V in scenari ad alte prestazioni e AI.
Mentre sviluppa tecnologie hardware e software ad alte prestazioni, Xuantie sta anche promuovendo attivamente l’innovazione collaborativa tra i partner industriali a monte e a valle, accelerando l’implementazione di un ecosistema RISC-V completo ‘high-performance + AI’.
La Dedizione di Alibaba: RISC-V Xuantie Guida la Comunità Internazionale Open-Source
Per coloro che non hanno familiarità con Xuantie, ecco una breve introduzione.
Nel 2018, Alibaba ha fondato il marchio Xuantie, concentrandosi sulla direzione RISC-V. Un anno dopo, è emerso il primo processore, il C910, il processore RISC-V più potente dell’epoca. Da allora, Xuantie è stato un leader nell’ecosistema internazionale RISC-V e uno dei maggiori contributori cinesi alla comunità internazionale open-source. Attualmente detiene posizioni di presidente o vicepresidente nel comitato tecnico della fondazione e in più di 10 sottocomitati tecnici, promuovendo attivamente la standardizzazione delle tecnologie relative all’AI.
Dal 2019, Xuantie ha lanciato 13 processori RISC-V, coprendo vari scenari come alte prestazioni, alta efficienza energetica e basso consumo energetico. Questi includono:
- Serie C (Computing): Principalmente destinata a server di fascia alta, edge computing di fascia alta e IPC di livello industriale/consumer.
- Serie E (Embedded): Utilizzata principalmente in MPU di fascia alta e vari MCU.
- Serie R (Reliability & Realtime): Destinata a SSD di fascia alta, comunicazioni, controllo industriale di fascia alta, automotive e altri scenari.
- XT-Link: Un IP di interconnessione multi-cluster CPU.
Ad oggi, le spedizioni di processori Xuantie hanno superato i 4 miliardi di unità, rendendola una delle serie di prodotti di processori più influenti e leader di mercato nel campo RISC-V nazionale.
Durante il suo sviluppo, Xuantie ha costantemente spinto i limiti delle prestazioni di RISC-V, lottando per prestazioni sempre più elevate. Contemporaneamente, ha abbracciato attivamente l’AI, mirando a stabilire RISC-V come architettura di calcolo AI nativa.
A livello di tecnologia dell’architettura del set di istruzioni, sfruttando la superiore apertura e flessibilità dell’architettura RISC-V, Xuantie ha da tempo personalizzato le estensioni del set di istruzioni per le applicazioni AI. La sua proposta di estensione del set di istruzioni Matrix e l’ottimizzazione dell’operatore core GEMM per i modelli di grandi dimensioni possono accelerare l’inferenza e l’addestramento dell’AI, migliorando l’efficienza energetica dell’AI sui dispositivi edge.
In termini di processori, Xuantie C907 è stato il primo a implementare l’estensione Matrix, ottenendo un’accelerazione di 15 volte rispetto alle soluzioni tradizionali. Il C920 aggiornato supporta le tecnologie Vector 1.0 e Vector Crypto, migliorando le prestazioni GEMM di oltre 7 volte e le prestazioni dell’operatore Transformer di oltre 17 volte. L’ultimo processore di punta, il C930, è dotato di due motori vettoriali e matriciali, posizionandolo come un partner promettente per i grandi modelli AI sui dispositivi edge.
A livello di stack software, Xuantie ha creato una piattaforma software e hardware AI full-stack RISC-V end-to-end. Questa piattaforma fornisce ai produttori di chip un’infrastruttura di calcolo AI general-purpose ed efficiente, formando una progettazione di pipeline orientata alle esigenze aziendali, consentendo veramente un’ottimizzazione conveniente e profonda dalla progettazione hardware sottostante alle toolchain software di livello superiore. Questa piattaforma è stata applicata a prodotti terminali come schede di transcodifica video cloud, box di edge computing AI e laptop RISC-V.
Oltre alla propria tecnologia, il team RISC-V della DAMO Academy ha costantemente coinvolto partner industriali a monte e a valle per migliorare l’ecosistema ‘high-performance + AI’ di RISC-V.
Alla conferenza dello scorso anno, il laptop open-source RISC-V ‘Ruyi BOOK Jia Chen Edition’ ha fatto un’apparizione a sorpresa, dimostrando un funzionamento stabile e fluido di software commerciali di grandi dimensioni. Quest’anno, l’Institute of Software, Chinese Academy of Sciences, ha ulteriormente introdotto ‘Ruyi BOOK Yi Si Edition’, robot intelligenti, PC AI e altre applicazioni RISC-V ad alte prestazioni.
Tra questi, il prototipo di PC AI basato sul C920 ha eseguito con successo modelli open-source come Llama, Qwen e DeepSeek, supportando applicazioni AI come assistenti personali AI, programmazione AI e riconoscimento visivo. Ciò dimostra una completa ‘catena completa AI open-source’ dall’architettura hardware open-source ai sistemi operativi open-source e ai modelli AI open-source, riducendo al contempo il consumo energetico per unità di calcolo del 30%.
Inoltre, Xuantie ha collaborato con i partner per costruire soluzioni pratiche come soluzioni di codec video RISC-V e soluzioni desktop cloud. Per supportare le applicazioni in più settori, Xuantie ha anche implementato la potenza di calcolo RISC-V in PC all-in-one, AI di controllo industriale, robot e altri campi.
L’accademico Ni Guangnan ha affermato che gli investimenti pragmatici e l’innovazione di Xuantie sono forze trainanti cruciali per il sano sviluppo dell’ecosistema RISC-V.
Il Futuro dell’Open Source
Il successo di DeepSeek è una testimonianza della potenza dell’open source. L’architettura di set di istruzioni open-source RISC-V, sin dalla sua nascita oltre un decennio fa, ha tracciato un percorso di sviluppo diverso dal modello chiuso x86 e dal modello con licenza ARM. Ha presentato al settore l’opportunità di innovare le architetture in modo più conciso e aperto, ottenendo un riconoscimento crescente.
Sta emergendo come il miglior candidato per l’architettura nativa dell’era dell’AI. Da un lato, RISC-V, con il suo impegno per l’apertura e l’evoluzione continua, può tenere il passo con i rapidi cambiamenti nell’AI. Dall’altro lato, la forte estensibilità di RISC-V gli consente di essere compatibile con gli ecosistemi architetturali esistenti attraverso il porting e l’adattamento, fungendo anche da architettura nativa per supportare scenari emergenti.
Come ha affermato Guo Songliu, responsabile di RISC-V presso l’Institute of Software, Chinese Academy of Sciences: ‘Lo stack software AI è ancora in rapida evoluzione. Essendo la più flessibile e aperta delle tre principali architetture di set di istruzioni, RISC-V è senza dubbio la più adatta al ritmo dell’innovazione tecnologica nell’era dell’AI’.