Microsofts AI-strategie: Een verschuiving in focus

Recente signalen wijzen op een mogelijke vertraging in Microsofts agressieve expansie binnen de AI-sector. Een nadere beschouwing onthult echter een strategische herkalibratie in plaats van een volledige terugtrekking.

Microsoft heeft onlangs aangekondigd dat het zijn datacenterinitiatieven mogelijk ‘strategisch zal afstemmen’. Deze aanpassing volgt op een herziening van de samenwerking met OpenAI en groeiende bezorgdheid over een potentieel overaanbod aan AI-infrastructuur. Deze verschuiving in Microsofts strategie weerspiegelt een bredere trend in de industrie, waarbij de focus verschuift van intensieve AI-training naar meer kosteneffectieve modelimplementatie.

Van razendsnelle expansie naar strategische aanpassing

De race om de AI-infrastructuur te domineren is intens geweest, vooral sinds de opkomst van ChatGPT eind 2022. Grote technologiebedrijven hebben zwaar geïnvesteerd in grond, constructie en rekenkracht om de groeiende generatieve AI-workloads te ondersteunen. Microsoft, gesteund door zijn samenwerking met OpenAI, loopt voorop in deze expansie.

Twee jaar lang was de consensus in de techindustrie onwrikbaar: meer bouwen, sneller bouwen. Dit meedogenloze streven naar meer cloudcapaciteit en Nvidia GPU’s heeft nu een strategische pauze bereikt.

Noelle Walsh, hoofd van Microsoft Cloud Operations, verklaarde onlangs dat het bedrijf zijn plannen mogelijk ‘strategisch zal afstemmen’. Deze aankondiging is significant voor een AI-sector die gewend is aan constante eisen voor meer resources. Walsh lichtte de evoluerende situatie verder toe:

‘De afgelopen jaren is de vraag naar onze cloud- en AI-services sneller gegroeid dan we hadden verwacht. Om deze kans te benutten, zijn we begonnen met het uitvoeren van het grootste en meest ambitieuze infrastructuuruitbreidingsproject in onze geschiedenis,’ schreef ze in een LinkedIn-post. ‘Van nature vereist elke significante nieuwe onderneming van deze omvang flexibiliteit en fijnafstemming naarmate we leren en evolueren met onze klanten. Dit betekent dat we sommige projecten in vroege fasen zullen vertragen of pauzeren.’

Hoewel Walsh geen specifieke details gaf, wees TD-Cowen-analist Michael Elias op verschillende gevallen die duidden op een terugtrekking van Microsoft. De afgelopen zes maanden zou Microsoft zich hebben teruggetrokken uit meer dan 2 gigawatt aan geplande AI-cloudcapaciteit in de VS en Europa, capaciteit die al onder lease was. Bovendien heeft Microsoft bestaande datacenterleases in deze regio’s uitgesteld of geannuleerd, aldus Elias’ recente investeringsnotitie.

Deze vermindering van de leaseactiviteit wordt grotendeels toegeschreven aan Microsofts beslissing om de ondersteuning voor OpenAI’s trainingsworkloads te verminderen. Een recente wijziging in hun partnerschap stelt OpenAI in staat om samen te werken met andere cloudproviders, waardoor de afhankelijkheid van infrastructuur wordt gediversifieerd.

‘We blijven echter van mening dat de annuleringen en uitstellen van leases wijzen op een overaanbod van datacentercapaciteit in verhouding tot de huidige vraagprognoses,’ voegde Elias eraan toe. Deze observatie geeft aanleiding tot bezorgdheid, gezien de biljoenen dollars die zijn geïnvesteerd in de verwachting van een aanhoudende, ongebreidelde groei in generatieve AI. Elke hint datdit traject zou kunnen vertragen, is reden tot bezorgdheid.

Een genuanceerde realiteit: heroriëntatie, geen terugtrekking

De situatie is complexer dan een simpele terugtrekking. Wat we zien, is een strategische heroriëntatie. Barclays-analist Raimo Lenschow gaf waardevolle context door op te merken dat de initiële fase van de industrie-uitgaven sterk gericht was op het veiligstellen van grond en gebouwen om de chips en computertechnologie te huisvesten die nodig zijn om AI-modellen te bouwen en te exploiteren.

Tijdens deze ‘landjepik’ was het gebruikelijk dat grote cloudbedrijven leases veiligstelden die ze later zouden kunnen heronderhandelen of opgeven. Nu Microsoft meer vertrouwd is met de omvang van zijn beveiligde resources, verschuift het bedrijf waarschijnlijk zijn uitgaven naar investeringen in een later stadium, zoals de aanschaf van GPU’s en andere hardware voor zijn nieuwe datacenters.

‘Met andere woorden, Microsoft heeft in de afgelopen kwartalen ‘over-geïnvesteerd’ in grond en gebouwen, maar keert nu terug naar een meer normale cadans,’ schreef Lenschow in een recente investeringsnotitie. Microsoft is nog steeds van plan om 80 miljard dollar te investeren in kapitaaluitgaven voor fiscaal jaar 2025 en verwacht verdere jaar-op-jaar stijgingen. Dit suggereert dat het bedrijf zich niet echt terugtrekt uit AI, maar eerder strategischer investeert, met een scherpere blik op efficiëntie en rendement op investering.

De verschuiving van training naar inference

Een deel van deze strategische verschuiving lijkt een verschuiving te zijn van AI-training naar inference. Pre-training omvat het maken van nieuwe modellen, wat een enorm aantal onderling verbonden GPU’s en state-of-the-art netwerktechnologie vereist – een kostbare onderneming. Inference daarentegen omvat het gebruik van reeds getrainde modellen om diensten zoals AI-agents of copiloten te ondersteunen. Hoewel technisch minder veeleisend, wordt verwacht dat inference de grotere markt zal zijn.

Naarmate inference training steeds meer overtreft, verschuift de focus naar schaalbare, kosteneffectieve infrastructuur die het hoogst mogelijke rendement op kapitaal oplevert. Op een recente AI-conferentie in New York concentreerden de discussies zich meer op efficiëntie dan op het bereiken van Artificial General Intelligence (AGI), het concept van het creëren van machines die menselijke intelligentie overtreffen. Het nastreven van AGI is een uiterst kostbare onderneming.

AI-startup Cohere merkte op dat zijn nieuwe model, ‘Command R’, slechts twee GPU’s nodig heeft om te draaien, aanzienlijk minder dan de meeste modellen van de afgelopen jaren. Mustafa Suleyman, CEO van Microsoft AI, erkende onlangs in een podcast dat de rendementen van grote pre-training runs afnemen. Hij benadrukte echter dat Microsofts compute-gebruik ‘ongelooflijk’ blijft, en simpelweg verschuift naar andere fasen binnen de AI-pipeline.

Suleyman verduidelijkte ook dat sommige van de geannuleerde leases en projecten nooit definitief waren, en exploratieve discussies vertegenwoordigden die gebruikelijk zijn in de planningsprocessen van hyperscale cloudbedrijven. Deze strategische heroriëntatie komt nu OpenAI, een nauwe partner van Microsoft, capaciteit begint af te nemen van andere cloudproviders en zelfs hinten geeft over het ontwikkelen van zijn eigen datacenters. Microsoft behoudt echter een recht van eerste weigering op nieuwe OpenAI-capaciteit, wat duidt op een voortdurende nauwe integratie tussen de twee bedrijven.

Een competitief landschap: flexibiliteit, geen zwakte

Het is belangrijk om te erkennen dat flexibiliteit niet moet worden verward met zwakte. Microsoft past zich waarschijnlijk aan veranderende marktdynamiek aan, en vermindert zijn ambities niet. De hyperscaler-markt blijft uiterst competitief.

Volgens Elias is Google tussenbeide gekomen om capaciteit te absorberen die Microsoft in internationale markten heeft opgegeven. In de VS vult Meta de gaten die Microsoft heeft achtergelaten. ‘Beide hyperscalers bevinden zich midden in een aanzienlijke jaar-op-jaar stijging van de vraag naar datacenters,’ merkte Elias op, verwijzend naar Google en Meta. Microsofts strategische verschuiving is misschien meer een teken van volwassenheid dan van terugtrekking. Naarmate de AI-adoptie de volgende fase ingaat, zullen de winnaars niet noodzakelijkerwijs degenen zijn die het meest uitgeven, maar degenen die het verstandigst investeren.

Kortom, Microsofts evoluerende AI-strategie weerspiegelt een genuanceerd begrip van de markt, een verschuiving in focus van training naar inference en een toewijding aan efficiënte toewijzing van resources. Deze heroriëntatie positioneert Microsoft om een leidende speler te blijven in het AI-landschap, waarbij de nadruk ligt op strategische investeringen in plaats van ongebreidelde expansie. Het aanpassingsvermogen en de flexibiliteit van het bedrijf zullen essentieel zijn om de snel veranderende dynamiek van de AI-sector te navigeren.