Blackwell Ultra GB300: Een sprong in prestaties
De Blackwell Ultra GB300, die naar verwachting in de tweede helft van 2025 op de markt komt, vertegenwoordigt een aanzienlijke vooruitgang ten opzichte van NVIDIA’s eerdere aanbod. Deze nieuwe superchip is ontworpen om verbeterde rekenkracht en verhoogde geheugenbandbreedte te bieden, cruciaal voor het voldoen aan de steeds groeiende eisen van moderne AI-toepassingen.
Het GB300-systeem is een krachtpatser, met 72 NVIDIA Blackwell Ultra GPU’s en 36 op Arm gebaseerde NVIDIA Grace CPU’s. Deze combinatie levert een indrukwekkende 1.400 petaFLOPS aan FP4 AI-prestaties. Om het in perspectief te plaatsen, dat is een toename van 1,5 keer in dichte FP4-rekenkracht in vergelijking met zijn voorganger, de Blackwell B200.
Een van de belangrijkste upgrades in de GB300 is de geheugencapaciteit. Elke GPU in het systeem is uitgerust met maar liefst 288 GB HBM3e-geheugen. Dit komt neer op een totaal van meer dan 20 TB aan GPU-geheugen per systeem. Deze aanzienlijke toename van het geheugen maakt het mogelijk om veel grotere AI-modellen en datasets te verwerken, waardoor complexere berekeningen mogelijk worden en hogere verwerkingssnelheden worden bereikt.
NVIDIA positioneert het Blackwell Ultra AI Factory Platform als een platform dat incrementele, in plaats van revolutionaire, prestatieverbeteringen biedt in vergelijking met de standaard Blackwell-chips. Hoewel een enkele Ultra-chip dezelfde 20 petaflops aan AI-rekenkracht behoudt als de standaard Blackwell, profiteert hij aanzienlijk van een boost van 50% in high-bandwidth memory (HBM3e), van 192 GB naar 288 GB.
Als we naar de grotere schaal kijken, blijft een full-scale DGX GB300 ‘Superpod’ 288 CPU’s en 576 GPU’s bevatten. Deze opstelling levert 11,5 exaflops aan FP4-computing, wat overeenkomt met de prestaties van de originele op Blackwell gebaseerde Superpod. Het beschikt echter over een toename van 25% in het totale geheugen, nu tot een enorme 300 TB. Deze geheugenverbeteringen benadrukken NVIDIA’s focus op het accommoderen van grotere modellen en het verbeteren van de efficiëntie van AI-redenering, in plaats van zich uitsluitend te concentreren op ruwe rekenkracht.
In plaats van directe Blackwell-naar-Blackwell Ultra-vergelijkingen, laat NVIDIA zien hoe zijn nieuwste platform zich verhoudt tot zijn H100-chips uit 2022, die nog steeds veel worden gebruikt in AI-workloads. Het bedrijf beweert dat de Blackwell Ultra 1,5 keer de FP4-inferentieprestaties van de H100 biedt. Het meest opmerkelijke voordeel ligt echter in zijn vermogen om AI-redenering te versnellen.
Een NVL72-cluster met DeepSeek-R1 671B, een uitzonderlijk groot taalmodel, kan nu bijvoorbeeld reacties genereren in slechts tien seconden. Dit is een dramatische reductie van de 90 seconden die nodig waren op het H100-systeem.
NVIDIA schrijft deze aanzienlijke verbetering toe aan een vertienvoudiging van de tokenverwerkingssnelheid. De Blackwell Ultra kan 1.000 tokens per seconde verwerken, een aanzienlijke sprong ten opzichte van de 100 tokens per seconde van de H100. Deze cijfers tonen aan dat, hoewel de Blackwell Ultra zijn directe voorganger misschien niet drastisch overtreft, hij overtuigende efficiëntiewinsten biedt, vooral voor organisaties die nog steeds architecturen van de vorige generatie gebruiken.
Vera Rubin Superchip: De volgende generatie AI-verwerking
Naast de Blackwell Ultra heeft NVIDIA plannen om de Vera Rubin-superchip eind 2026 te introduceren. Deze chip, genoemd ter ere van de vooraanstaande astronoom Vera Rubin, zal een op maat ontworpen CPU (Vera) en GPU (Rubin) bevatten. Dit vertegenwoordigt een belangrijke stap voorwaarts in NVIDIA’s streven naar geavanceerde AI-verwerkingsmogelijkheden.
De Vera CPU, gebaseerd op NVIDIA’s Olympus-architectuur, zal naar verwachting het dubbele van de prestaties van de huidige Grace CPU’s leveren. De Rubin GPU daarentegen zal tot een indrukwekkende 288 GB aan high-bandwidth memory ondersteunen. Deze aanzienlijke geheugencapaciteit zal de mogelijkheden voor gegevensverwerking aanzienlijk verbeteren, met name voor complexe AI-taken.
De Vera Rubin-architectuur toont een dual-GPU-ontwerp op een enkele die. Dit innovatieve ontwerp maakt een opmerkelijke 50 petaFLOPS aan FP4-inferentieprestaties per chip mogelijk, wat zorgt voor efficiëntere verwerking en verminderde latentie in AI-toepassingen.
De Vera CPU, de opvolger van de Grace CPU, bestaat uit 88 custom Arm-cores met simultaneous multithreading. Deze configuratie resulteert in 176 threads per socket. Het beschikt ook over een 1,8 TB/s NVLink core-to-core interface, waardoor de gegevensoverdrachtsnelheden tussen de CPU- en GPU-componenten aanzienlijk worden verbeterd.
De Blackwell Ultra GB300 en de Vera Rubin Superchip vertegenwoordigen aanzienlijke verbeteringen ten opzichte van NVIDIA’s eerdere chiparchitecturen. De 1,5 keer hogere dichte FP4-rekenkracht van de GB300 ten opzichte van de B200 vertaalt zich direct in een efficiëntere verwerking van AI-workloads. Dit maakt op zijn beurt snellere training- en inferentietijden mogelijk, cruciaal voor het versnellen van AI-ontwikkeling.
De Vera Rubin, met zijn 50 petaFLOPS aan FP4-prestaties per chip, betekent een aanzienlijke sprong voorwaarts. Dit prestatieniveau maakt de implementatie van nog geavanceerdere AI-modellen en -toepassingen mogelijk, waardoor de grenzen van wat mogelijk is op het gebied van kunstmatige intelligentie worden verlegd.
NVIDIA’s ambitieuze ontwikkelingstijdlijn, met plannen voor jaarlijkse releases van nieuwe AI-chipgeneraties, onderstreept zijn toewijding aan het behouden van een leidende positie in de snel evoluerende AI-hardwaremarkt. De toewijding van het bedrijf aan innovatie blijkt uit zijn voortdurende streven naar krachtigere en efficiëntere AI-verwerkingsoplossingen. De introductie van deze nieuwe superchips gaat niet alleen over incrementele verbeteringen; het gaat om het mogelijk maken van een nieuw tijdperk van AI-mogelijkheden.
De verbeteringen in geheugencapaciteit en verwerkingssnelheid zijn bijzonder opmerkelijk. De mogelijkheid om grotere modellen en datasets te verwerken is cruciaal voor de ontwikkeling van geavanceerdere AI-systemen. Naarmate AI-modellen complexer worden, wordt de behoefte aan hardware die gelijke tred kan houden steeds belangrijker. NVIDIA’s focus op geheugenbandbreedte en tokenverwerkingssnelheid speelt direct in op deze behoefte.
De verschuiving naar het benadrukken van efficiëntiewinsten, met name voor organisaties die overstappen van oudere architecturen, is een strategische zet van NVIDIA. Het erkent dat niet alle gebruikers onmiddellijk de nieuwste hardware zullen adopteren. Door aanzienlijke prestatieverbeteringen te demonstreren ten opzichte van chips van de vorige generatie, biedt NVIDIA een overtuigend argument voor een upgrade.
De Vera Rubin-superchip, met zijn op maat ontworpen CPU en GPU, vertegenwoordigt een aanzienlijke architecturale vooruitgang. Het dual-GPU-ontwerp op een enkele die is een innovatieve aanpak die belooft aanzienlijke prestatiewinsten en verminderde latentie te leveren. Dit ontwerp weerspiegelt NVIDIA’s toewijding aan het verleggen van de grenzen van chipontwerp en het maximaliseren van de prestaties.
De naamgeving van de chip naar astronoom Vera Rubin is een passend eerbetoon aan haar baanbrekende werk. Het versterkt ook subtiel NVIDIA’s toewijding aan wetenschappelijke ontdekking en innovatie. De focus van het bedrijf op AI reikt verder dan commerciële toepassingen; het omvat ook de bevordering van wetenschappelijk onderzoek.
Over het algemeen markeert NVIDIA’s aankondiging van de Blackwell Ultra GB300 en Vera Rubin-superchips een belangrijke mijlpaal in de evolutie van AI-hardware. Deze nieuwe chips zijn klaar om de ontwikkeling en implementatie van AI in een breed scala van industrieën te versnellen. De toewijding van het bedrijf aan innovatie en zijn agressieve ontwikkelingstijdlijn suggereren dat we in de komende jaren nog meer baanbrekende ontwikkelingen kunnen verwachten. De focus op zowel ruwe prestaties als efficiëntiewinsten zorgt ervoor dat deze chips relevant zullen zijn voor een breed spectrum van gebruikers, van degenen met geavanceerde systemen tot degenen die nog steeds oudere architecturen gebruiken. De toekomst van AI-hardware ziet er rooskleurig uit en NVIDIA positioneert zich duidelijk in de voorhoede van dit opwindende veld. Het toegenomen geheugen, de verbeterde verwerkingssnelheden en de innovatieve ontwerpen van deze nieuwe superchips zullen ongetwijfeld de weg vrijmaken voor nieuwe doorbraken in kunstmatige intelligentie, verschillende sectoren beïnvloeden en verdere vooruitgang in de komende jaren stimuleren.