In het rijk van de artificiële intelligentie (AI) is context van het grootste belang. Dit principe weerspiegelt menselijke intelligentie, wat de relevantie ervan voor AI suggereert, gezien onze creatie ervan naar ons eigen beeld.
Momenteel zien we bedrijven zoals NVIDIA AI-fabrieken bepleiten – in wezen supercomputers die petabytes aan data verwerken om intelligente antwoorden te leveren – als een nieuwe manier om significante verschuivingen in de wereldeconomie en culturen te katalyseren.
Maar hoe zijn we op dit punt beland? Het antwoord ligt, zoals altijd, in een reeks incrementele verbeteringen.
Voordat we ingaan op de details van AI-fabrieken en hun implicaties voor de toekomst van het bedrijfsleven en de samenleving, laten we eerst wat fundamentele context vaststellen.
De Neolithische Revolutie: De Zaden van Innovatie Zaaien
Ongeveer 12.000 jaar geleden gingen onze voorouders over van nomadische jager-verzamelaars naar gevestigde landbouwers, die planten verbouwden en dieren fokten voor hun levensonderhoud. Landbouw, of akkerbouw, vertegenwoordigt een rudimentaire voedselfabriek, die afhankelijk is van zonlicht, water en lucht voor de groei van planten en dieren. De term “firma”, die een vaste huurbetaling voor de bewerking van land in de middeleeuwen aanduidde, werd synoniem met landbouw.
Landbouw noodzaakte hiërarchische sociale structuren voor efficiënte landbouwactiviteiten. Het schrift ontstond als een administratief instrument, dat het volgen van inputs en outputs binnen deze voedselfabrieken vergemakkelijkte en maatschappelijke regels vastlegde. Na verloop van tijd breidde het schrift zich uit naar diverse domeinen en blijft het een krachtig middel om complexe informatie over te brengen.
Vanaf het moment dat we bogen en speren verwisselden voor schoffels, harken en ploegen, en de eerste symbolische tekens in klei of steen kerfden, werd de komst van AI, en bijgevolg de AI-fabriek, onvermijdelijk. Het was slechts een kwestie van tijd.
De Industriële Revolutie: Het Pad Banen voor Massaproductie
Duizenden jaren lang perfectioneerde de mensheid haar landbouwvaardigheden, wat leidde tot overschotten die de opkomst van een koopmansklasse bevorderden – individuen die zich bezighielden met het maken van goederen voor anderen, of “fabricage”, afgeleid van het Latijnse “een werk met de hand”. Dit leidde tot de ontwikkeling van geld, een ruilmiddel dat ruilhandel versnelde en omzette in de moderne economie. Globalisering verbond regionale en nationale economieën na het tijdperk van de ontdekkingen.
Latere golven van globalisering hervormden zowel de landbouw als de fabricage. Een cruciale verschuiving in fabrieken, de epicentra van gestandaardiseerde fabricage, omvatte het verdelen van het productieproces in discrete stappen om de snelheid en herhaalbaarheid te verbeteren. Deze Industriële Revolutie viel samen met de Verlichting, gekenmerkt door stijgende geletterdheidscijfers, aangezien fabrieken geschoolde werknemers nodig hadden om de efficiëntie te maximaliseren en afval te minimaliseren. Onderwijs werd een noodzaak, waardoor de erkenning van kiesrecht, particuliere eigendomsrechten, godsdienstvrijheid, veiligheid, meningsuiting en het recht op een spoedig proces werd bevorderd.
Deze principes, die in de 21e eeuw vanzelfsprekend zijn, danken hun ontstaan aan de 18e eeuw.
Fabrieken brachten de fabricage naar binnen, waarbij stoom en elektriciteit werden gebruikt om assemblagelijnen en lean manufacturing-technieken aan te drijven. Dit maakte de productie van goederen tegen betaalbare prijzen mogelijk, waardoor de levensstandaard werd verhoogd en de groei van een middenklasse werd bevorderd, waardoor de economische expansie de mogelijkheden van landbouwsamenlevingen overtrof.
De AI-Revolutie: Data als het Nieuwe Grensgebied
De komst van het internet verbond individuen met elkaar en genereerde een nieuwe bron: data, rijp voor inzichtelijke analyse.
De AI-revolutie hing af van de digitalisering van enorme hoeveelheden tekst, afbeeldingen, video en audio, in combinatie met betaalbare computerkracht voor het verwerken van deze data. Big data, in combinatie met massaal parallelle GPU’s en hoge geheugenbandbreedte, maakt de creatie van neurale netwerken mogelijk die ons begrip van de wereld coderen, waardoor artificiële intelligentie mogelijk wordt.
In wezen levert big data de grondstof voor AI-algoritmen die op GPU-engines draaien om functionele neurale netwerken te construeren.
Deze elementen moeten gelijktijdig samenkomen. In de jaren tachtig beschikten onderzoekers over neurale netwerkalgoritmen, maar ontbrak het hen aan de computationele middelen en data om ze te implementeren. Bijgevolg bleef AI grotendeels theoretisch totdat aan deze drie voorwaarden was voldaan.
AI-Fabrieken: Een Letterlijke Transformatie
De term “AI-fabriek” is geen loutere metafoor, maar een nauwkeurige beschrijving van een moderne AI-supercomputer die in een commerciële omgeving opereert. Het verandert fundamenteel de bedrijfscomputer- en data-analyse – de synthese van data in bruikbare informatie.
De AI-fabriek is net zo onvermijdelijk als de landbouwrevolutie, waar collectieve inspanningen de voedselproductie garandeerden. Maatschappelijke en culturele verschuivingen als gevolg van deze revolutie gaven de mensheid vrije tijd voor contemplatie en innovatie. Nu hebben machines toegang tot en verwerken ze de volledigheid van de menselijke kennis, waardoor conversationele zoekopdrachten en de omgekeerde toepassing van AI-algoritmen mogelijk worden om nieuwe data in verschillende formaten te genereren.
Bedrijven en individuen zullen toegang hebben tot AI-fabrieken, rechtstreeks of via time-sharing-arrangementen. Deze AI-fabrieken zullen nieuwe ideeën, visies genereren en individuele creatieve mogelijkheden versterken.
Het transformerende potentieel van AI-fabrieken is allesomvattend. De chatbots, de ontwikkelaars van parallelle compute-engines voor modeltraining en -inferentie, en modelmakers zoals OpenAI, Anthropic, Google en Mistral zijn het erover eens dat AI elk aspect van ons leven zal hervormen. Ondanks wereldwijde meningsverschillen over verschillende kwesties, wordt de transformerende impact van AI universeel erkend.
Inzicht en Actie Fabriceren
AI-fabrieken dienen twee primaire functies. De eerste is het trainen van basismodellen, wat inzichten oplevert voor zakelijke en persoonlijke verbetering. De tweede, en meer significante, functie omvat het invoeren van nieuwe data en vragen in deze modellen om nieuwe antwoorden af te leiden, nieuwe tokens te genereren en actie te stimuleren.
Veel van de discussie rond AI heeft zich gericht op het trainen van steeds groter wordende basismodellen, met honderden miljarden tot biljoenen parameters en enorme datasets. Tokenaantallen geven de breedte van de kennis aan, terwijl parameters de diepte van het begrip weerspiegelen. Kleinere parameteraantallen in combinatie met grotere tokensets leveren snellere, eenvoudigere antwoorden op. Omgekeerd bieden grotere parameteraantallen en kleinere tokensets meer genuanceerde inzichten in een beperkt domein. Kettingredeneringsmodellen, die multimodaal van aard zijn, combineren gespecialiseerde modellen om outputs te overwegen die andere inputs aansturen en uitgebreide antwoorden genereren.
AI-fabrieken gebruiken alle content die door de mensheid is gecreëerd en synthetische data die door AI-modellen is gegenereerd als grondstof. Inzichten die uit deze data worden afgeleid, worden benut door mensen en AI-agenten om actie te stimuleren. In plaats van in de fabriek te werken, maken individuen er gebruik van en vergroten ze hun vaardigheden met de kennis en snelheid van AI-modellen om meer, betere en snellere resultaten te behalen.
Volgens Jensen Huang, medeoprichter en CEO van NVIDIA, “Wedijvert de wereld om state-of-the-art, grootschalige AI-fabrieken te bouwen.” Het opzetten van een AI-fabriek is een buitengewone technische prestatie, die enorme middelen, mankracht en materiaal vereist.
Het bouwen van een AI-fabriek brengt aanzienlijke kapitaalinvesteringen met zich mee. Een typische configuratie omvat een NVIDIA DGX SuperPOD op basis van meerdere racks met DGX-systemen, met GPU’s, CPU’s, snelle interconnects en opslag.
Met tal van DGX-systemen levert een SuperPOD substantiële prestaties, met een aanzienlijke geheugencapaciteit en bandbreedte. De prestaties kunnen worden geschaald door meer systemen toe te voegen.
Een ander NVIDIA-blueprint voor een AI-fabriek is gecentreerd rond het NVIDIA GB200 NVL72-platform, een rack-scale systeem dat GPU’s, CPU’s, DPU’s, SuperNIC’s, NVLink en NVSwitch, en snelle netwerken integreert. Dit platform biedt een groter gedeeld GPU-geheugendomein voor AI-modellen en een hogere compute-dichtheid, wat vloeistofkoeling vereist.
De GB200 NVL72, die in volledig volume wordt verzonden, vertegenwoordigt een op zichzelf staand systeem dat in staat is om modellen te bouwen en data in verschillende formaten te genereren.
De GB200 NVL72 omvat een MGX-servernode met een NVIDIA Grace CPU in combinatie met Blackwell GPU’s. Twee van deze servernodes vormen een compute-tray binnen het NVL72-rack, met achttien compute-trays die tal van GPU’s en CPU’s bevatten.
Het GB200 NVL72 rack-scale systeem combineert Grace CPU’s met Blackwell GPU’s, die zijn verbonden via snelle NVLink-verbindingen. De NVLink-poorten en NVSwitch-chips verbinden alle GPU’s in een gedeelde geheugenconfiguratie, ideaal voor basistraining van modellen en kettinginferentie.
De NVLink-fabric, gefaciliteerd door negen NVLink-switch trays, maakt toegang tot alle GPU-dies mogelijk als een unified GPU voor AI-applicaties.
GB200 NVL72-systemen beschikken over tal van Arm-cores voor hostverwerking en aanzienlijk drijvende-kommaverwerkingsvermogen. Het GB200 NVL72-systeem beschikt over aanzienlijk HBM3e-geheugen dat is gekoppeld aan de GPU’s, met een hoge geaggregeerde bandbreedte. De Grace CPU’s beschikken over LPDDR5X-geheugen, dat toegankelijk is via NVLink.
De NVIDIA GB200 NVL72 weerspiegelt de transformerende impact van het System/360 op online transactieverwerking, waarbij het belangrijkste verschil de schaalbaarheid van de NVL72 via InfiniBand-interconnects is.
DGX SuperPOD-configuraties op basis van NVL72 rack-scale systemen vereisen aanzienlijk vermogen, maar leveren immense computerkracht en geheugencapaciteit over meerdere compute-racks. De prestaties kunnen worden geschaald door meer racks toe te voegen.
De compute-dichtheid van het NVL72-rack vereist gespecialiseerde vloeistofkoeling en datacenterinfrastructuur, wat een terugkeer vertegenwoordigt naar eerdere praktijken waarbij watergekoelde machines de prestaties maximaliseerden.
AI-fabrieken zullen aanzienlijk meer computerkracht vereisen naarmate inferentie integraal wordt voor diverse applicaties, vooral met de verschuiving naar kettingredeneringsmodellen.
AI-fabrieken omvatten niet alleen hardware, maar ook systemen en ontwikkelingssoftware.
DGX GB200-systemen en DGX SuperPOD AI-supercomputers vereisen beheer en modellering, gefaciliteerd door tools zoals NVIDIA Mission Control, dat AI-workloads orkestreert en taken automatisch herstelt. Mission Control bewaakt de systeemgezondheid en optimaliseert het stroomverbruik.
NVIDIA AI Enterprise, de systeemsoftware suite, omvat bibliotheken, modellen en frameworks die zijn geoptimaliseerd voor NVIDIA GPU’s en netwerken. De AI-fabriek stack beschikt ook over NVIDIA Dynamo, een open-source framework voor het uitvoeren van inferentie over NVLink en DGX SuperPOD-infrastructuur. DGX Expert Service en Support helpt klanten bij het implementeren van deze technologieën, waardoor de tijd tot het eerste token wordt verkort. NVIDIA biedt AI-fabriek blueprints voor zijn Omniverse “digital twin”-omgeving om het datacenterontwerp te simuleren en te optimaliseren.
Een cruciaal aspect van AI-fabrieken is de verschuiving in het denken die ze teweegbrengen, waarbij NVIDIA prioriteit geeft aan hoofdruimte voor systeemgroei.
Volgens Gilad Shainer, senior vice president of networking bij NVIDIA, “Komt het genereren van tokens nu overeen met het genereren van omzet voor veel bedrijven.” Datacenters evolueren van kostenposten naar productieve activa.
En dat is uiteindelijk de essentie van het bouwen van een fabriek.