In de hoogspanningsarena van de ontwikkeling van kunstmatige intelligentie (AI) bepaalt de toegang tot geavanceerde halfgeleidertechnologie vaak het innovatietempo. Voor Chinese technologiegiganten is deze toegang steeds complexer geworden, gevormd door geopolitieke spanningen en strenge exportcontroles opgelegd door de Verenigde Staten. Te midden van dit uitdagende landschap baant Ant Group, de fintech-krachtpatser gelieerd aan Alibaba, een eigen weg. Het bedrijf zet strategisch een heterogene mix van halfgeleiders in, afkomstig van zowel Amerikaanse als binnenlandse leveranciers, om zijn AI-ambities kracht bij te zetten, met name gericht op het verbeteren van de efficiëntie en kosteneffectiviteit van het trainen van geavanceerde AI-modellen.
Deze berekende aanpak is meer dan alleen een technische noodoplossing; het vertegenwoordigt een fundamentele strategische aanpassing. Door bewust chips van verschillende fabrikanten te integreren, inclusief binnenlandse alternatieven, wil Ant Group de risico’s van verstoringen in de toeleveringsketen beperken en zijn afhankelijkheid van één enkele leverancier verminderen, vooral die welke onderhevig zijn aan internationale handelsbeperkingen. Deze diversificatie is cruciaal voor het waarborgen van de continuïteit en veerkracht van zijn AI-onderzoeks- en ontwikkelingspijplijn. Het kerndoel is tweeledig: het momentum in AI-innovatie behouden en tegelijkertijd de aanzienlijke kosten optimaliseren die doorgaans gepaard gaan met het trainen van grootschalige modellen.
De Kracht van Specialisatie: Omarming van Mixture of Experts (MoE)
Centraal in de hardwarestrategie van Ant Group staat de adoptie van een geavanceerde AI-architectuur die bekend staat als Mixture of Experts (MoE). Deze techniek vertegenwoordigt een significante afwijking van traditionele monolithische AI-modellen, waarbij één enkel, massief neuraal netwerk probeert alle aspecten van een bepaalde taak te leren en af te handelen. De MoE-aanpak daarentegen maakt gebruik van een meer gedistribueerde en gespecialiseerde structuur. Het functioneert veel meer als een commissie van specialisten dan als één enkele generalist.
Stel je een complex probleem voor dat diverse kennis vereist. In plaats van te vertrouwen op één polymath, stel je een team samen: een wiskundige, een taalkundige, een historicus en misschien een natuurkundige. Een ‘gating network’ fungeert als een dispatcher, analyseert binnenkomende taken of datapunten en stuurt ze intelligent door naar het meest geschikte ‘expert’-model binnen het grotere systeem. Elk expertmodel is getraind om uit te blinken in specifieke soorten inputs of deeltaken. Bijvoorbeeld, in een taalmodel kan één expert gespecialiseerd zijn in het begrijpen van technisch jargon, een ander in creatieve schrijfstijlen, en een derde in conversatiedialoog.
Het belangrijkste voordeel van dit modulaire ontwerp ligt in de computationele efficiëntie. Tijdens training of inferentie (wanneer het model voorspellingen doet), worden alleen de relevante expertmodellen en het gating network geactiveerd voor een gegeven input. Deze selectieve berekening staat in schril contrast met dichte modellen waarbij het hele netwerk, met zijn miljarden of zelfs biljoenen parameters, moet worden ingeschakeld voor elke afzonderlijke berekening. Bijgevolg kunnen MoE-modellen vergelijkbare of zelfs superieure prestaties leveren dan hun dichte tegenhangers, terwijl ze aanzienlijk minder rekenkracht en dus minder energie vereisen.
Ant Group heeft dit architecturale voordeel effectief benut. Intern onderzoek en praktische toepassing hebben aangetoond dat MoE het bedrijf in staat stelt robuuste trainingsresultaten te behalen, zelfs bij gebruik van minder krachtige, gemakkelijker verkrijgbare of goedkopere hardware. Volgens bevindingen die door het bedrijf zijn gedeeld, heeft deze strategische implementatie van MoE een opmerkelijke 20% reductie in computerkosten mogelijk gemaakt die gepaard gaan met het trainen van zijn AI-modellen. Deze kostenoptimalisatie is niet slechts een incrementele besparing; het is een strategische enabler, waardoor Ant ambitieuze AI-projecten kan nastreven zonder noodzakelijkerwijs uitsluitend te vertrouwen op de duurste, top-tier grafische verwerkingseenheden (GPUs) die steeds moeilijker te verkrijgen zijn voor Chinese bedrijven. Deze efficiëntiewinst pakt direct de hardwarebeperkingen aan die door de externe omgeving worden opgelegd.
Een Tapijt van Silicium: Ant’s Hardware Portfolio
De praktische implementatie van de strategie van Ant Group omvat het navigeren door een complex halfgeleiderlandschap. De AI-trainingsinfrastructuur van het bedrijf wordt naar verluidt aangedreven door een diverse reeks chips, wat zijn toewijding aan flexibiliteit en veerkracht weerspiegelt. Dit omvat silicium dat intern is ontworpen door zijn dochteronderneming, Alibaba, waarschijnlijk verwijzend naar de chips ontwikkeld door Alibaba’s T-Head halfgeleidereenheid. Bovendien integreert Ant chips van Huawei, een andere Chinese technologiegigant die zwaar heeft geïnvesteerd in de ontwikkeling van zijn eigen AI-versnellers (zoals de Ascend-serie) als reactie op Amerikaanse sancties.
Hoewel Ant Group historisch gezien hoogwaardige GPUs van Nvidia heeft gebruikt, de onbetwiste leider op de markt voor AI-training, hebben de evoluerende Amerikaanse exportcontroles een verschuiving noodzakelijk gemaakt. Deze regelgeving beperkt specifiek de verkoop van de meest geavanceerde AI-versnellers aan Chinese entiteiten, onder verwijzing naar nationale veiligheidszorgen. Hoewel Nvidia nog steeds chips met lagere specificaties aan de Chinese markt kan leveren, lijkt Ant Group actief zijn leveranciersbestand te verbreden om de beperkte toegang tot top-tier Nvidia-producten te compenseren.
Deze diversificatie omvat prominent chips van Advanced Micro Devices (AMD). AMD is uitgegroeid tot een belangrijke concurrent van Nvidia in de high-performance computing en AI-ruimte, en biedt krachtige GPUs die een levensvatbaar alternatief vormen voor bepaalde workloads. Door AMD-hardware te integreren naast binnenlandse opties van Alibaba en Huawei, construeert Ant een heterogene computeromgeving. Deze mix-and-match benadering, hoewel potentieel complexer in softwareoptimalisatie en workloadbeheer, biedt cruciale flexibiliteit. Het stelt het bedrijf in staat zijn hardwaregebruik af te stemmen op beschikbaarheid, kosten en de specifieke computationele eisen van verschillende AI-modellen en taken, waardoor knelpunten worden omzeild die worden veroorzaakt door afhankelijkheid van één enkele, beperkte bron.
De achtergrond van deze strategie is het ingewikkelde web van Amerikaanse exportcontroles. Deze maatregelen zijn geleidelijk aangescherpt, met als doel de vooruitgang van China in geavanceerde halfgeleiderproductie en AI-ontwikkeling te beteugelen. Hoewel aanvankelijk gericht op de absoluut hoogste-eind chips, zijn de beperkingen geëvolueerd en hebben ze invloed op een breder scala aan hardware en apparatuur voor halfgeleiderproductie. Nvidia moest bijvoorbeeld specifieke, minder krachtige versies van zijn vlaggenschip AI-chips (zoals de A800 en H800, afgeleid van de A100 en H100) creëren voor de Chinese markt om aan deze regelgeving te voldoen. Ant’s strategie om alternatieven van AMD en binnenlandse spelers te omarmen is een directe, pragmatische reactie op deze regelgevende druk, en toont een inspanning om de AI-concurrentiepositie binnen de gegeven beperkingen te behouden.
AI in Actie: Transformatie van Gezondheidszorgdiensten
De vooruitgang van Ant Group op het gebied van AI-efficiëntie zijn niet louter theoretische oefeningen; ze worden actief vertaald naar toepassingen in de echte wereld, met een opmerkelijke focus op de gezondheidszorgsector. Het bedrijf onthulde onlangs significante verbeteringen aan zijn AI-oplossingen op maat voor de gezondheidszorg, wat de praktische impact van zijn onderliggende technologiestrategie onderstreept.
Deze verbeterde AI-capaciteiten worden naar verluidt al gebruikt in verschillende prominente zorginstellingen in grote Chinese steden, waaronder Beijing, Shanghai, Hangzhou (het hoofdkantoor van Ant) en Ningbo. Zeven grote ziekenhuizen en zorgorganisaties maken gebruik van Ant’s AI om verschillende aspecten van hun operaties en patiëntenzorg te verbeteren.
De basis van Ant’s AI-model voor de gezondheidszorg is zelf een voorbeeld van collaboratieve innovatie en het benutten van diverse technologische krachten. Het is gebouwd op een combinatie van krachtige grote taalmodellen (LLMs):
- DeepSeek’s R1 en V3 modellen: DeepSeek is een opmerkelijk Chinees AI-onderzoeksbureau dat bekend staat om het ontwikkelen van capabele open-source modellen, die vaak sterke prestatiebenchmarks behalen.
- Alibaba’s Qwen: Dit is de familie van eigen grote taalmodellen ontwikkeld door Ant’s dochteronderneming, Alibaba, die een reeks groottes en capaciteiten bestrijken.
- Ant’s eigen BaiLing model: Dit duidt op de interne inspanningen van Ant Group bij het ontwikkelen van op maat gemaakte AI-modellen die zijn afgestemd op zijn specifieke behoeften, waarschijnlijk met integratie van financiële en mogelijk gezondheidszorgspecifieke data en expertise.
Deze multi-model basis stelt de AI-oplossing voor de gezondheidszorg in staat om te putten uit een brede basis van kennis en capaciteiten. Volgens Ant Group is het systeem bedreven in het beantwoorden van vragen over een breed scala aan medische onderwerpen, en kan het potentieel dienen als een waardevol hulpmiddel voor zowel zorgprofessionals die snelle informatie zoeken als patiënten die op zoek zijn naar algemene medische kennis (hoewel een zorgvuldige afbakening van zijn rol versus professioneel medisch advies cruciaal is).
Naast het ophalen van informatie stelt het bedrijf dat het AI-model is ontworpen om patiëntendiensten te verbeteren. Hoewel specifieke details nog naar buiten komen, zou dit een reeks toepassingen kunnen omvatten, zoals:
- Intelligente Triage: Assisteren bij het prioriteren van patiëntbehoeften op basis van beschreven symptomen.
- Afspraakplanning en -beheer: Automatiseren en optimaliseren van het boekingsproces.
- Opvolging na Ontslag: Geautomatiseerde herinneringen sturen of de voortgang van het herstel van patiënten controleren.
- Administratieve Ondersteuning: Zorgpersoneel helpen met documentatie, samenvatting of gegevensinvoertaken, waardoor tijd vrijkomt voor directe patiëntenzorg.
De implementatie in grote ziekenhuizen betekent een cruciale stap in het valideren van de bruikbaarheid van de technologie en het navigeren door de complexiteit van het gezondheidszorgdomein, dat strenge eisen stelt aan nauwkeurigheid, betrouwbaarheid en gegevensprivacy.
Een Koers Uitzetten Voorbij Premium GPUs
Vooruitkijkend lijkt de strategie van Ant Group in lijn te zijn met een bredere ambitie binnen de Chinese tech-industrie: het bereiken van geavanceerde AI-prestaties zonder uitsluitend afhankelijk te zijn van de meest geavanceerde, vaak beperkte, GPUs. Het bedrijf is naar verluidt van plan het pad te volgen dat organisaties zoals DeepSeek hebben ingeslagen, gericht op methoden om hoog presterende AI-modellen te schalen ‘zonder premium GPUs’.
Deze ambitie signaleert een geloof dat architecturale innovaties (zoals MoE), softwareoptimalisaties en het slimme gebruik van diverse, potentieel minder krachtige hardware gezamenlijk de prestatiekloof kunnen overbruggen die is ontstaan door beperkte toegang tot top-tier silicium. Het is een strategie die deels uit noodzaak is geboren vanwege exportcontroles, maar het weerspiegelt ook een potentieel duurzaam pad naar kosteneffectievere en gedemocratiseerde AI-ontwikkeling.
Het bereiken van dit doel omvat het verkennen van verschillende wegen naast alleen MoE:
- Algoritmische Efficiëntie: Het ontwikkelen van nieuwe AI-algoritmen die minder rekenkracht vereisen voor training en inferentie.
- Modeloptimalisatietechnieken: Het toepassen van methoden zoals kwantisatie (het verminderen van de precisie van getallen die bij berekeningen worden gebruikt) en pruning (het verwijderen van redundante delen van het neurale netwerk) om modellen kleiner en sneller te maken zonder significant prestatieverlies.
- Software Frameworks: Het creëren van geavanceerde software die AI-workloads efficiënt kan beheren en verdelen over heterogene hardware-omgevingen, waardoor het gebruik van beschikbare computerbronnen wordt gemaximaliseerd.
- Gespecialiseerde Binnenlandse Hardware: Voortdurende investering in en gebruik van AI-versnellers ontwikkeld door Chinese bedrijven zoals Huawei (Ascend), Alibaba (T-Head), en mogelijk anderen, specifiek ontworpen voor AI-taken.
Het streven van Ant Group naar dit pad, naast anderen in het Chinese tech-ecosysteem, zou significante implicaties kunnen hebben. Indien succesvol, zou het kunnen aantonen dat leiderschap in AI niet uitsluitend afhankelijk is van toegang tot de absoluut snelste chips, maar ook afhangt van innovatie in software, architectuur en optimalisatie op systeemniveau. Het vertegenwoordigt een vastberaden inspanning om een veerkrachtige en zelfvoorzienende AI-capaciteit op te bouwen, navigerend door de complexiteit van het huidige wereldwijde technologielandschap door middel van strategische diversificatie en onophoudelijke innovatie. De integratie van Amerikaanse en Chinese halfgeleiders, geoptimaliseerd door technieken zoals MoE en toegepast op kritieke sectoren zoals de gezondheidszorg, toont een pragmatische en adaptieve benadering om AI-vooruitgang onder druk te handhaven.