Navigeren door de Inferentie Revolutie
Jensen Huang, CEO van Nvidia, sprak op de jaarlijkse softwareontwikkelaarsconferentie van het bedrijf in San Jose, Californië, en bevestigde Nvidia’s sterke positie te midden van een significante transformatie binnen de kunstmatige intelligentie-industrie. Hij benadrukte de aanhoudende verschuiving van de trainingsfase van AI-modellen naar de inferentiefase, waar bedrijven zich steeds meer richten op het extraheren van gedetailleerde, bruikbare inzichten uit deze modellen.
Inspelen op Zorgen van Investeerders en Marktdynamiek
Huang’s presentatie, gegeven in zijn kenmerkende zwarte leren jas en jeans, diende als een verdediging van Nvidia’s dominante positie in de AI-chipmarkt met hoge inzet. Recente zorgen van investeerders, aangewakkerd door berichten over concurrenten zoals het Chinese DeepSeek die vergelijkbare chatbotprestaties behalen met potentieel minder AI-chips, hebben een schaduw geworpen over Nvidia’s schijnbaar onaantastbare voorsprong.
Ondanks Huang’s zelfverzekerde toespraak reageerde de markt met een zekere mate van scepsis. De aandelen van Nvidia daalden met 3,4%, wat een bredere dip in de chipindex weerspiegelde, die 1,6% lager sloot. Deze reactie suggereert dat de markt mogelijk al veel van het verwachte nieuws heeft ingeprijsd, wat een “afwachtende” benadering van Nvidia’s langetermijnstrategie weerspiegelt.
Misvattingen Wegnemen en Computationele Eisen Benadrukken
Huang confronteerde direct wat hij zag als een wijdverbreid misverstand over de evoluerende computationele vereisten van AI. Hij stelde stoutmoedig: “Bijna de hele wereld had het mis”, en onderstreepte de exponentiële toename van de rekenkracht die nodig is voor geavanceerde AI-toepassingen, met name op het gebied van “agentic AI”.
Agentic AI, gekenmerkt door autonome agenten die routinetaken kunnen uitvoeren met minimale menselijke tussenkomst, vereist aanzienlijk grotere verwerkingscapaciteiten. Huang schatte dat de computationele behoeften voor agentic AI en redeneren “gemakkelijk 100 keer meer zijn dan we vorig jaar dachten nodig te hebben”. Deze dramatische toename onderstreept de aanhoudende, en misschien onderschatte, vraag naar high-performance computing-oplossingen.
De Dichotomie tussen Training en Inferentie
Een belangrijk element van Nvidia’s huidige uitdaging ligt in de evoluerende dynamiek van de AI-markt. De industrie verschuift van een primaire focus op training, waarbij enorme datasets worden gebruikt om AI-modellen zoals chatbots intelligentie bij te brengen, naar inferentie. Inferentie is de fase waarin het getrainde model zijn verworven kennis gebruikt om gebruikers specifieke antwoorden en oplossingen te bieden.
Deze verschuiving vormt een potentiële tegenwind voor Nvidia, aangezien zijn meest lucratieve chips traditioneel zijn geoptimaliseerd voor de rekenintensieve trainingsfase. Hoewel Nvidia de afgelopen tien jaar een sterk ecosysteem van softwaretools en ontwikkelaars-ondersteuning heeft opgebouwd, zijn het de datacenterchips, die prijzen van tienduizenden dollars vragen, die het grootste deel van de omzet hebben gegenereerd, in totaal $130,5 miljard vorig jaar.
Momentum Vasthouden: De Driejarige Stijging en Verder
De aandelen van Nvidia hebben de afgelopen drie jaar een meteorische stijging doorgemaakt, met een meer dan verviervoudiging van de waarde. Deze opmerkelijke groei is aangewakkerd door de cruciale rol van het bedrijf bij het aandrijven van de opkomst van geavanceerde AI-systemen, waaronder ChatGPT, Claude en tal van anderen. De hardware van het bedrijf is synoniem geworden met geavanceerde AI-ontwikkeling.
Het vasthouden van dit momentum vereist echter aanpassing aan de veranderende eisen van de op inferentie gerichte markt. Hoewel de langetermijnvisie van een AI-industrie gebouwd op Nvidia’s chips overtuigend blijft, zijn de kortetermijnverwachtingen van investeerders gevoeliger voor de onmiddellijke uitdagingen en kansen die de inferentierevolutie biedt.
Onthulling van Volgende Generatie Chips: Blackwell Ultra en Verder
Huang gebruikte de conferentie als platform om een reeks nieuwe chipreleases aan te kondigen, ontworpen om Nvidia’s positie in het evoluerende AI-landschap te verstevigen. Een van deze aankondigingen was de onthulling van de Blackwell Ultra GPU-chip, die in de tweede helft van dit jaar op de markt zal komen.
De Blackwell Ultra beschikt over een verbeterde geheugencapaciteit in vergelijking met zijn voorganger, de huidige generatie Blackwell-chip. Dit grotere geheugen stelt het in staat om grotere en complexere AI-modellen te ondersteunen, inspelend op de groeiende eisen van geavanceerde AI-toepassingen.
Dubbele Focus: Reactievermogen en Snelheid
Huang benadrukte dat Nvidia’s chips zijn ontworpen om twee kritieke aspecten van AI-prestaties aan te pakken: reactievermogen en snelheid. De chips moeten AI-systemen in staat stellen intelligente antwoorden te geven op een groot aantal gebruikersvragen, terwijl ze die antwoorden tegelijkertijd met minimale latentie leveren.
Huang betoogde dat Nvidia’s technologie uniek gepositioneerd is om op beide gebieden uit te blinken. Hij trok een parallel met zoeken op het web en zei: “Als het te lang duurt om een vraag te beantwoorden, komt de klant niet meer terug.” Deze analogie benadrukt het belang van snelheid en efficiëntie bij het behouden van gebruikersbetrokkenheid en tevredenheid in AI-gestuurde applicaties.
Roadmap voor de Toekomst: Vera Rubin en Feynman
Vooruitkijkend op Blackwell Ultra, gaf Huang een glimp van Nvidia’s toekomstige chip-roadmap, met details over het aankomende Vera Rubin-systeem. Vera Rubin, gepland voor release in de tweede helft van 2026, is ontworpen om Blackwell op te volgen en biedt nog hogere snelheden en verbeterde mogelijkheden.
Verderop in de tijd kondigde Huang aan dat Rubin-chips zouden worden gevolgd door Feynman-chips, die naar verwachting in 2028 zullen verschijnen. Deze meergeneratie-roadmap toont Nvidia’s toewijding aan continue innovatie en zijn vastberadenheid om een technologische voorsprong te behouden in de snel evoluerende AI-hardwaremarkt.
Aanpakken van Uitdagingen in de Industrie en de Uitrol van Blackwell
De onthulling van deze nieuwe chips komt op een moment dat de marktintroductie van Blackwell trager is verlopen dan aanvankelijk werd verwacht. Een ontwerpfout zou hebben geleid tot productie-uitdagingen, wat heeft bijgedragen aan vertragingen. Deze situatie weerspiegelt bredere worstelingen in de industrie, aangezien de traditionele aanpak van het voeden van steeds groter wordende datasets in enorme datacenters gevuld met Nvidia-chips, afnemende meeropbrengsten begint te vertonen.
Ondanks deze uitdagingen meldde Nvidia vorige maand dat de bestellingen voor Blackwell “verbazingwekkend” waren, wat wijst op een sterke vraag naar de nieuwe chip ondanks de initiële tegenslagen.
Uitbreiding van het Ecosysteem: DGX Workstation en Software-innovaties
Naast de kernchip-aankondigingen introduceerde Huang een krachtige nieuwe personal computer, de DGX Workstation, gebaseerd op Blackwell-chips. Dit werkstation, dat zal worden geproduceerd door toonaangevende bedrijven zoals Dell, Lenovo en HP, vormt een uitdaging voor sommige van Apple’s high-end Mac-aanbiedingen.
Huang toonde trots een moederbord voor een van deze apparaten en verklaarde: “Zo zou een pc eruit moeten zien.” Deze stap geeft aan dat Nvidia de ambitie heeft om zijn aanwezigheid in de high-performance computing-markt uit te breiden, van datacenters naar het domein van professionele werkstations.
Dynamo: Versnelling van Redenering en Samenwerking met General Motors
Op het gebied van software kondigde Huang de release aan van Dynamo, een nieuwe softwaretool die is ontworpen om het redeneerproces in AI-toepassingen te versnellen. Dynamo wordt gratis aangeboden, met als doel een bredere acceptatie te bevorderen en innovatie in het veld te versnellen.
Verder onthulde Huang een belangrijke samenwerking met General Motors, waarbij Nvidia werd geselecteerd om zijn vloot van zelfrijdende auto’s aan te drijven. Deze samenwerking onderstreept Nvidia’s groeiende invloed in de auto-industrie en zijn toewijding aan het bevorderen van autonome rijtechnologie. Dit is een spraakmakende overwinning en het laat zien hoe divers de toepassingen voor Nvidia zijn.
Het Pad Voorwaarts
Nvidia zet groot in op de toekomst van AI, en hun voortdurende innovatie is cruciaal. Ze erkennen de noodzaak om zich aan te passen aan de verschuiving naar inferentie, en ze ontwikkelen al chips die beide kunnen. Met hun geschiedenis van succes en hun toewijding aan onderzoek en ontwikkeling, zal Nvidia waarschijnlijk nog jaren een belangrijke speler in de AI-industrie blijven. De partnerschappen met grote technologie- en autobedrijven zijn een indicatie van waar Nvidia naartoe gaat.