AI Rivoluzionaria: DeepSeek su Chip Vimicro

Zhongxing Microelectronics, nota anche come Vimicro, ha recentemente compiuto un passo significativo nel campo dell’intelligenza artificiale presentando il suo ultimo chip AI, lo “Starlight Intelligence No. 5”. Questo chip all’avanguardia è stato svelato all’8° Digital China Construction Summit a Fuzhou il 30 aprile. Ciò che distingue questo chip è la sua capacità di eseguire autonomamente i modelli di grandi dimensioni 7B, 8B e 16B di DeepSeek, senza fare affidamento su potenza di elaborazione esterna. Questo lo rende il primo chip AI embedded completamente autonomo e controllabile in grado di operare simultaneamente sia modelli linguistici generici che modelli visivi di grandi dimensioni su un singolo chip.

Architettura Innovativa e Prestazioni Ottimizzate

Il chip “Starlight Intelligence No. 5” incorpora l’architettura GP-XPU eterogenea multi-core di uso generale proprietaria di Zhongxing Micro. Questa architettura innovativa offre miglioramenti sostanziali rispetto alle tradizionali architetture CPU+GPU in termini di efficienza operativa, prestazioni in tempo reale, rapporto costo-efficacia e sicurezza. L’architettura GP-XPU è specificamente progettata per ottimizzare i carichi di lavoro AI, consentendo al chip di gestire attività complesse con maggiore velocità e precisione.

Vantaggi Chiave dell’Architettura GP-XPU:

  • Efficienza Ottimizzata: L’architettura massimizza l’utilizzo delle risorse di calcolo, portando a tempi di elaborazione più rapidi e prestazioni complessive migliorate.
  • Prestazioni in Tempo Reale: Il chip è in grado di gestire l’elaborazione dei dati in tempo reale, rendendolo adatto per applicazioni che richiedono risposte immediate.
  • Rapporto Costo-Efficacia: Il design del chip riduce la necessità di costosi componenti esterni, risultando in una soluzione più accessibile.
  • Sicurezza: L’architettura incorpora funzionalità di sicurezza che proteggono da accessi non autorizzati e violazioni dei dati.

Prodotto Internamente e Pienamente Controllabile

Il chip “Starlight Intelligence No. 5” è basato su tecnologia di processo prodotta internamente, garantendo completa autonomia e controllo sulla sua produzione e utilizzo. Questo è particolarmente importante per applicazioni in settori strategicamente importanti dove la dipendenza da tecnologia straniera potrebbe rappresentare dei rischi. Utilizzando componenti di provenienza nazionale e processi di produzione, Zhongxing Micro mira a ridurre la dipendenza da fornitori esterni e rafforzare la posizione della Cina nel panorama globale dell’AI.

Applicazioni in Settori Chiave:

  • Importanza Strategica Nazionale: Il chip può essere implementato in infrastrutture critiche e sistemi di difesa, fornendo una soluzione di elaborazione AI sicura e affidabile.
  • Percezione Urbana: Il chip può essere utilizzato in iniziative di smart city per analizzare i dati provenienti da sensori e telecamere, consentendo il monitoraggio e la gestione in tempo reale degli ambienti urbani.
  • Produzione Intelligente: Il chip può migliorare l’automazione e l’efficienza nei processi di produzione, migliorando la qualità del prodotto e riducendo i costi.
  • Agricoltura Intelligente: Il chip può essere utilizzato per analizzare i dati provenienti da sensori agricoli e droni, ottimizzando la resa dei raccolti e l’utilizzo delle risorse.
  • Trasporto Intelligente: Il chip può alimentare sistemi avanzati di assistenza alla guida (ADAS) e veicoli autonomi, migliorando la sicurezza e l’efficienza sulle strade.

Abbattimento della Barriera dell’Edge Computing

Il chip “Starlight Intelligence No. 5” è progettato per superare i limiti dell’edge computing, consentendo l’elaborazione AI direttamente sui dispositivi senza fare affidamento su risorse basate su cloud. Ciò si ottiene attraverso l’architettura avanzata del chip e la sua capacità di eseguire modelli AI di grandi dimensioni su un singolo chip.

Componenti dell’Architettura GP-XPU:

  • CPU RISC-V: Una CPU RISC-V ad alte prestazioni fornisce la potenza di elaborazione di uso generale necessaria per gestire una vasta gamma di attività.
  • GP-GPU: Una GPU di uso generale accelera i carichi di lavoro AI, consentendo un’elaborazione più rapida di algoritmi complessi.
  • NPU: Un’unità di elaborazione neurale (NPU) è specificamente progettata per l’inferenza AI, ottimizzando le prestazioni delle reti neurali.
  • ISP: Un processore di segnale immagine (ISP) migliora la qualità delle immagini acquisite dalle telecamere, migliorando l’accuratezza delle applicazioni AI visive.
  • VPU: Un’unità di elaborazione video (VPU) accelera la codifica e la decodifica video, consentendo lo streaming e l’analisi video efficienti.
  • ECU: Un’unità di crittografia/decrittografia (ECU) fornisce sicurezza basata su hardware per i dati sensibili.

Pool di Calcolo Eterogeneo (HCP)

Il chip utilizza un’unità di pianificazione delle attività del Pool di Calcolo Eterogeneo (HCP) dedicata e un sistema di gestione della memoria sicuro per consentire la pianificazione in tempo reale e la condivisione dinamica delle risorse di calcolo e di archiviazione tra i vari core eterogenei. Ciò migliora significativamente l’efficienza di calcolo e la velocità di trasmissione dei dati, consentendo al chip di implementare ed eseguire modelli di grandi dimensioni di uso generale DeepSeek 1.5B, 7B, 8B e 16B e modelli di grandi dimensioni visivi su un singolo chip.

Capacità di Edge Computing:

  • Analisi Video in Tempo Reale: Il chip può eseguire rilevamento, riconoscimento e tracciamento in tempo reale di oggetti in flussi video.
  • Elaborazione del Linguaggio Naturale: Il chip può elaborare input in linguaggio naturale, abilitando applicazioni come chatbot e assistenti vocali.
  • Pianificazione delle Attività: Il chip può pianificare ed eseguire attività complesse, rendendolo adatto per applicazioni di robotica e automazione.
  • Gestione della Conoscenza: Il chip può archiviare e recuperare informazioni da basi di conoscenza, consentendo un processo decisionale intelligente.
  • Controllo Automatico: Il chip può controllare attuatori e altri dispositivi, consentendo sistemi di controllo a circuito chiuso.

Implementando otto chip “Starlight Intelligence No. 5” in combinazione, è possibile supportare il funzionamento di modelli di grandi dimensioni DeepSeek con parametri 671B “full-blood” e modelli di grandi dimensioni visivi, rompendo completamente il collo di bottiglia della potenza di calcolo all’edge.

Un Chip AI Versatile

Il chip “Starlight Intelligence No. 5” è un chip AI versatile che eccelle in una varietà di applicazioni. I suoi vantaggi chiave includono alta efficienza, basso consumo energetico, basso costo, dimensioni ridotte, forte sicurezza e alta adattabilità.

Vantaggi Chiave in Dettaglio:

  • Alta Efficienza: Il chip utilizza un’architettura MoE a livello di operatore e un meccanismo di pianificazione in tempo reale HCP per migliorare l’efficienza di calcolo di circa il 40% e la velocità di trasmissione dei dati di circa il 50%.
  • Basso Consumo Energetico: Le risorse di calcolo eterogenee del chip vengono allocate su richiesta, riducendo il consumo energetico di almeno il 30%.
  • Basso Costo: L’architettura ‘end-edge closed-loop’ del chip riduce la dipendenza dalle risorse cloud, risultando in un costo di implementazione completo che è circa 1/3 di quello di un’architettura server con le stesse prestazioni.
  • Dimensioni Ridotte: La scheda di elaborazione integrata con il chip richiede uno spazio di solo circa le dimensioni di un biglietto da visita, il che può soddisfare i requisiti di spazio di vari dispositivi intelligenti miniaturizzati.
  • Forte Sicurezza: Il chip utilizza la tecnologia di isolamento della sicurezza della partizione di memoria, supporta calcoli di algoritmi di crittografia domestica ad alte prestazioni, realizza la protezione della password a livello di codice sorgente e ha funzionalità di sicurezza dei dati native.
  • Alta Adattabilità: Il chip supporta ecosistemi aperti e framework AI mainstream, collegandosi senza problemi a vari scenari applicativi in migliaia di settori. In termini di adattabilità all’ambiente di lavoro, il chip “Starlight Intelligence No. 5” elimina la dipendenza delle apparecchiature di calcolo di grandi dimensioni basate su cloud dall’ambiente a temperatura e umidità costanti della sala computer e può completare lavori intelligenti ad alte prestazioni in vari ambienti di produzione e di vita.

Potenziare gli “Agenti Intelligenti Localizzati”

Il chip “Starlight Intelligence No. 5” è progettato per potenziare gli “agenti intelligenti localizzati”, che sono sistemi basati sull’intelligenza artificiale in grado di operare autonomamente sui dispositivi senza fare affidamento su risorse basate su cloud. Questo approccio offre diversi vantaggi, tra cui tempi di risposta migliorati, costi ridotti e maggiore sicurezza.

Vantaggi degli Agenti Intelligenti Localizzati:

  • Tempi di Risposta Migliorati: Elaborando i dati localmente, il chip può rispondere agli eventi in tempo reale, senza il ritardo associato all’elaborazione basata su cloud.
  • Costi Ridotti: Riducendo la dipendenza dalle risorse cloud, il chip può ridurre significativamente il costo delle implementazioni AI.
  • Maggiore Sicurezza: Elaborando i dati localmente, il chip può proteggere le informazioni sensibili da accessi non autorizzati e violazioni dei dati.

Applicazioni degli Agenti Intelligenti Localizzati:

  • Case Intelligenti: Gli agenti intelligenti localizzati possono controllare i dispositivi della casa intelligente, come luci, termostati ed elettrodomestici, fornendo un’esperienza di vita più comoda ed efficiente.
  • Dispositivi Indossabili: Gli agenti intelligenti localizzati possono analizzare i dati provenienti da sensori indossabili, fornendo consigli personalizzati sulla salute e il fitness.
  • Automazione Industriale: Gli agenti intelligenti localizzati possono controllare robot e altre apparecchiature industriali, migliorando l’efficienza e la sicurezza negli ambienti di produzione.

Ricostruire il Paradigma di Implementazione dell’AI

Il chip “Starlight Intelligence No. 5” di Zhongxing Micro è destinato a trasformare il paradigma di implementazione dell’AI abilitando un approccio più distribuito e localizzato. Ciò ridurrà la dipendenza dalle risorse basate su cloud e potenzierà una gamma più ampia di applicazioni.

Vantaggi Chiave del Nuovo Paradigma:

  • Latenza Ridotta: L’elaborazione localizzata elimina la necessità di trasmettere dati al cloud, riducendo la latenza e migliorando i tempi di risposta.
  • Requisiti di Larghezza di Banda Inferiori: L’elaborazione localizzata riduce la quantità di dati che devono essere trasmessi sulla rete, abbassando i requisiti di larghezza di banda e i costi.
  • Maggiore Privacy: L’elaborazione localizzata mantiene i dati sensibili sul dispositivo, proteggendoli da accessi non autorizzati e violazioni dei dati.
  • Maggiore Affidabilità: L’elaborazione localizzata consente ai sistemi AI di continuare a operare anche quando la connessione di rete viene interrotta.

Secondo Zhang Yundong, CEO di Zhongxing Micro Technology, lo “Starlight Intelligence No. 5” promuoverà l’aggiornamento intelligente del lato terminale e del lato edge, ridurrà notevolmente la dipendenza dalle risorse di cloud computing, risparmierà sui costi di costruzione del sistema ed esplorerà un percorso tecnologico di intelligenza artificiale conforme alle condizioni nazionali della Cina.

Il tradizionale processo di ragionamento AI che si basa sul cloud spesso si trova ad affrontare problemi come grandi ritardi nella risposta, costi elevati e restrizioni sull’ambiente di rete. Il chip consente al ragionamento di modelli di grandi dimensioni di essere direttamente a circuito chiuso sul lato edge attraverso la potenza di calcolo localizzata e i meccanismi di sicurezza endogena, il che non solo consente di risparmiare sui costi di trasmissione e archiviazione nel cloud, ma migliora anche notevolmente la velocità di risposta, raggiungendo una risposta a livello di millisecondi e protegge i dati durante il loro ciclo di vita con un meccanismo di password a livello di codice sorgente.

Questa svolta tecnologica fornisce un’ottimizzazione completa di efficienza, consumo energetico, costo, volume, sicurezza e adattabilità per scenari come la percezione urbana, la produzione intelligente e il trasporto intelligente, consentendo veramente a migliaia di settori di creare terminali intelligenti autonomi e controllabili.

Zhang Yundong ha dichiarato: “In risposta alle effettive esigenze di trasformazione digitale nei settori tradizionali cinesi, Zhongxing Micro sta sviluppando una tecnologia di calcolo distribuito di intelligenza artificiale per l’estremità, l’edge e il cloud. Senza fare affidamento sulla tecnologia di processo dei semiconduttori più avanzata, insistiamo sull’innovazione originale e sul controllo indipendente ed esploriamo un percorso tecnologico di intelligenza artificiale conforme alle condizioni nazionali della Cina”.