Nuovi Superchip NVIDIA: Blackwell e Rubin

Blackwell Ultra GB300: Un Balzo in Avanti nelle Prestazioni

Previsto per la spedizione nella seconda metà del 2025, il Blackwell Ultra GB300 rappresenta un notevole progresso rispetto alle precedenti offerte di NVIDIA. Questo nuovo superchip è progettato per fornire una maggiore potenza di calcolo e una maggiore larghezza di banda della memoria, cruciali per soddisfare le crescenti esigenze delle moderne applicazioni di intelligenza artificiale (AI).

Il sistema GB300 è una vera e propria potenza, integrando 72 GPU NVIDIA Blackwell Ultra e 36 CPU NVIDIA Grace basate su Arm. Questa combinazione offre un impressionante 1.400 petaFLOPS di prestazioni FP4 AI. Per metterlo in prospettiva, si tratta di un aumento di 1,5 volte della capacità di calcolo FP4 densa rispetto al suo predecessore, il Blackwell B200.

Uno degli aggiornamenti più significativi nel GB300 è la sua capacità di memoria. Ogni GPU all’interno del sistema è dotata di ben 288 GB di memoria HBM3e. Ciò equivale a un totale di oltre 20 TB di memoria GPU per sistema. Questo sostanziale aumento della memoria consente l’elaborazione di modelli e set di dati AI molto più grandi, consentendo calcoli più complessi e raggiungendo velocità di elaborazione più elevate.

NVIDIA sta posizionando la Blackwell Ultra AI Factory Platform come offerente di guadagni di prestazioni incrementali, piuttosto che rivoluzionari, rispetto ai chip Blackwell standard. Mentre un singolo chip Ultra mantiene gli stessi 20 petaflops di calcolo AI dello standard Blackwell, beneficia in modo significativo di un aumento del 50% della memoria a larghezza di banda elevata (HBM3e), passando da 192 GB a 288 GB.

Esaminando la scala più ampia, un ‘Superpod’ DGX GB300 su vasta scala continua a ospitare 288 CPU e 576 GPU. Questa configurazione offre 11,5 exaflops di calcolo FP4, rispecchiando le prestazioni del Superpod originale basato su Blackwell. Tuttavia, presenta un aumento del 25% della memoria totale, raggiungendo ora l’enorme cifra di 300 TB. Questi miglioramenti della memoria evidenziano l’attenzione di NVIDIA sull’adattamento di modelli più grandi e sul miglioramento dell’efficienza del ragionamento AI, piuttosto che concentrarsi esclusivamente sulla potenza di calcolo grezza.

Invece di confronti diretti tra Blackwell e Blackwell Ultra, NVIDIA sta mostrando come la sua piattaforma più recente si confronta con i suoi chip H100 del 2022, che sono ancora ampiamente utilizzati nei carichi di lavoro AI. L’azienda afferma che Blackwell Ultra offre prestazioni di inferenza FP4 1,5 volte superiori a quelle dell’H100. Tuttavia, il vantaggio più notevole risiede nella sua capacità di accelerare il ragionamento AI.

Ad esempio, un cluster NVL72 che esegue DeepSeek-R1 671B, un modello linguistico eccezionalmente grande, può ora generare risposte in soli dieci secondi. Si tratta di una drastica riduzione rispetto ai 90 secondi richiesti sul sistema H100.

NVIDIA attribuisce questo sostanziale miglioramento a un aumento di dieci volte della velocità di elaborazione dei token. Il Blackwell Ultra può gestire 1.000 token al secondo, un salto significativo rispetto ai 100 token al secondo dell’H100. Queste cifre dimostrano che, sebbene il Blackwell Ultra possa non superare drasticamente il suo immediato predecessore, offre notevoli guadagni di efficienza, soprattutto per le organizzazioni che utilizzano ancora architetture di generazione precedente.

Vera Rubin Superchip: La Prossima Generazione di Elaborazione AI

Guardando oltre il Blackwell Ultra, NVIDIA ha in programma di introdurre il superchip Vera Rubin alla fine del 2026. Chiamato in onore della illustre astronoma Vera Rubin, questo chip incorporerà una CPU (Vera) e una GPU (Rubin) progettate su misura. Questo rappresenta un significativo passo avanti nella ricerca di NVIDIA di capacità di elaborazione AI all’avanguardia.

La CPU Vera, basata sull’architettura Olympus di NVIDIA, è progettata per offrire il doppio delle prestazioni delle attuali CPU Grace. La GPU Rubin, d’altra parte, supporterà fino a un impressionante 288 GB di memoria a larghezza di banda elevata. Questa notevole capacità di memoria migliorerà significativamente le capacità di elaborazione dei dati, in particolare per attività AI complesse.

L’architettura Vera Rubin presenta un design dual-GPU su un singolo die. Questo design innovativo consente un notevole 50 petaFLOPS di prestazioni di inferenza FP4 per chip, favorendo un’elaborazione più efficiente e una latenza ridotta nelle applicazioni AI.

La CPU Vera, successore della CPU Grace, è composta da 88 core Arm personalizzati con multithreading simultaneo. Questa configurazione si traduce in 176 thread per socket. Presenta inoltre un’interfaccia core-to-core NVLink da 1,8 TB/s, migliorando significativamente le velocità di trasferimento dati tra i componenti CPU e GPU.

Il Blackwell Ultra GB300 e il Vera Rubin Superchip rappresentano progressi sostanziali rispetto alle precedenti architetture di chip di NVIDIA. L’aumento di 1,5 volte del calcolo FP4 denso del GB300 rispetto al B200 si traduce direttamente in un’elaborazione più efficiente dei carichi di lavoro AI. Questo, a sua volta, consente tempi di addestramento e inferenza più rapidi, cruciali per accelerare lo sviluppo dell’AI.

Il Vera Rubin, con i suoi 50 petaFLOPS di prestazioni FP4 per chip, segna un notevole balzo in avanti. Questo livello di prestazioni consente l’implementazione di modelli e applicazioni AI ancora più sofisticati, spingendo i confini di ciò che è possibile nel campo dell’intelligenza artificiale.

L’ambiziosa tempistica di sviluppo di NVIDIA, con piani per rilasci annuali di nuove generazioni di chip AI, sottolinea la sua dedizione a mantenere una posizione di leadership nel mercato dell’hardware AI in rapida evoluzione. L’impegno dell’azienda per l’innovazione è evidente nella sua continua ricerca di soluzioni di elaborazione AI più potenti ed efficienti. L’introduzione di questi nuovi superchip non riguarda solo miglioramenti incrementali; si tratta di abilitare una nuova era di capacità AI.

I progressi nella capacità di memoria e nella velocità di elaborazione sono particolarmente degni di nota. La capacità di gestire modelli e set di dati più grandi è fondamentale per lo sviluppo di sistemi AI più sofisticati. Man mano che i modelli AI continuano a crescere in complessità, la necessità di hardware in grado di tenere il passo diventa sempre più importante. L’attenzione di NVIDIA sulla larghezza di banda della memoria e sulla velocità di elaborazione dei token risponde direttamente a questa esigenza.

Il passaggio all’enfatizzazione dei guadagni di efficienza, in particolare per le organizzazioni che passano da architetture più vecchie, è una mossa strategica di NVIDIA. Riconosce che non tutti gli utenti adotteranno immediatamente l’hardware più recente. Dimostrando significativi miglioramenti delle prestazioni rispetto ai chip di generazione precedente, NVIDIA fornisce un argomento convincente per l’aggiornamento.

Il superchip Vera Rubin, con la sua CPU e GPU progettate su misura, rappresenta un significativo progresso architettonico. Il design dual-GPU su un singolo die è un approccio innovativo che promette di offrire notevoli guadagni di prestazioni e latenza ridotta. Questo design riflette l’impegno di NVIDIA a spingere i confini della progettazione dei chip e massimizzare le prestazioni.

La denominazione del chip in onore dell’astronoma Vera Rubin è un giusto tributo al suo lavoro pionieristico. Rafforza anche sottilmente l’impegno di NVIDIA per la scoperta scientifica e l’innovazione. L’attenzione dell’azienda sull’AI si estende oltre le applicazioni commerciali; comprende anche il progresso della ricerca scientifica.

Nel complesso, l’annuncio di NVIDIA dei superchip Blackwell Ultra GB300 e Vera Rubin segna una pietra miliare significativa nell’evoluzione dell’hardware AI. Questi nuovi chip sono pronti ad accelerare lo sviluppo e l’implementazione dell’AI in una vasta gamma di settori. L’impegno dell’azienda per l’innovazione e la sua aggressiva tempistica di sviluppo suggeriscono che possiamo aspettarci progressi ancora più rivoluzionari negli anni a venire. L’attenzione sia alle prestazioni grezze che ai guadagni di efficienza assicura che questi chip saranno rilevanti per un ampio spettro di utenti, da quelli con sistemi all’avanguardia a quelli che utilizzano ancora architetture più vecchie. Il futuro dell’hardware AI sembra luminoso e NVIDIA si sta chiaramente posizionando in prima linea in questo entusiasmante campo. La maggiore memoria, le velocità di elaborazione migliorate e i design innovativi di questi nuovi superchip apriranno senza dubbio la strada a nuove scoperte nell’intelligenza artificiale, influenzando vari settori e guidando ulteriori progressi negli anni a venire.