Chinese startup DeepSeek daagt Amerikaans AI-leiderschap uit

De AI-race: Een David tegen Goliath verhaal

In de wereld van kunstmatige intelligentie (AI) ontvouwt zich een verhaal van David tegen Goliath. De Verenigde Staten, met hun ambitieuze “Stargate”-project en een investering van maar liefst 500 miljard dollar, streven ernaar hun positie als wereldleider in AI te verstevigen. Dit enorme project, gesteund door techgiganten, is gericht op het opzetten van een netwerk van geavanceerde datacenters in het hele land. Echter, een behendige Chinese startup, die opereert met wat sommigen een “lachertje van een budget” zouden noemen, is opgedoken als een geduchte uitdager, die een schaduw werpt over de ambities van de VS.

DeepSeek: Een onverwachte uitdager

DeepSeek, een bedrijf gevestigd in Hangzhou, heeft onlangs een reeks open-source AI-modellen onthuld die niet alleen de prestaties van OpenAI’s modellen evenaren, maar in sommige gevallen zelfs overtreffen. Bovendien hebben ze dit bereikt met opmerkelijke efficiëntie en tegen een fractie van de kosten. Deze ontwikkeling heeft schokgolven door de AI-gemeenschap gestuurd en vragen opgeroepen over de effectiviteit van de Amerikaanse strategie en de toekomst van AI-dominantie.

De huidige AI-markt

De AI-markt wordt momenteel gedomineerd door een paar grote spelers, voornamelijk gevestigd in de VS. Deze bedrijven, met overvloedige financiering en middelen, lopen voorop in AI-innovatie en ontwikkelen krachtige modellen die ten grondslag liggen aan een breed scala aan toepassingen. De opkomst van DeepSeek signaleert echter een potentiële verschuiving in deze dynamiek, en laat zien dat baanbrekende AI kan worden ontwikkeld met aanzienlijk minder middelen.

DeepSeek’s R1 model: Een gamechanger

Het R1-model van DeepSeek, dat eerder deze week werd uitgebracht, is een goed voorbeeld van deze verstoring. Volgens het bedrijf evenaart dit model de prestaties van OpenAI’s o1-model, dat vorig jaar werd uitgebracht en ontworpen was om complexe redeneer- en wiskundige problemen aan te pakken, en overtreft het zelfs. Het feit dat het model van DeepSeek open-source is en direct beschikbaar is voor het publiek, versterkt de impact ervan nog verder, waardoor onderzoekers en ontwikkelaars wereldwijd de mogelijkheden ervan kunnen benutten. Recensenten hebben het R1-model geprezen om zijn vermogen om taken zoals coderen en redeneren uit te voeren, waardoor het direct concurreert met de meest geavanceerde modellen op de markt.

Kosten versus prestaties

Deze prestatie is des te opmerkelijker gezien de middelen waarover DeepSeek beschikt. Het V3 large-language model van het bedrijf, dat in december werd aangekondigd, zou zijn getraind met slechts 5,6 miljoen dollar aan rekenkracht. Dit staat in schril contrast met de meer dan 100 miljoen dollar die naar verluidt is gebruikt om OpenAI’s GPT-4 te trainen. Het V3-model van DeepSeek is vergeleken met modellen van OpenAI en Anthropic, waarbij DeepSeek beweert gelijkwaardige prestaties te leveren. Andrej Karpathy, een vooraanstaand AI-onderzoeker die eerder bij Tesla en OpenAI werkte, heeft het vermogen van DeepSeek om zijn geavanceerde AI te trainen met een “lachertje van een budget” als zeer indrukwekkend omschreven.

De opkomst van DeepSeek in China

De opkomst van DeepSeek in de competitieve Chinese AI-sector is geen toeval. De 40-jarige oprichter van het bedrijf, Liang Wenfeng, had onlangs een ontmoeting met de Chinese premier Li Qiang, wat het belang van de prestaties van DeepSeek binnen het land onderstreept. Deze bijeenkomst, bijgewoond door andere vooraanstaande experts uit de industrie, benadrukt de toewijding van China aan het bevorderen van technologische innovatie en zijn ambities op het gebied van AI. Het succes van DeepSeek is een bewijs van de vindingrijkheid en het aanpassingsvermogen van de Chinese technologiesector, en laat zien dat het in staat is om op het wereldtoneel te concurreren ondanks beperkingen op de toegang tot bepaalde technologieën.

De oorsprong van DeepSeek

De oorsprong van DeepSeek gaat terug tot HighFlyer, een Chinees kwantitatief hedgefonds dat in 2019 ongeveer 1,4 miljard dollar aan activa beheerde. HighFlyer splitste DeepSeek in 2023 af en richtte het op als een speciale AI-startup gericht op modelontwikkeling en het creëren van AI-producten. Liang Wenfeng, die een achtergrond in AI heeft van de Zhejiang University, was medeoprichter van HighFlyer en gebruikte de financiële middelen om duizenden Nvidia AI-chips te verwerven vóór de invoering van Amerikaanse beperkingen in 2022. Deze strategische zet gaf DeepSeek een aanzienlijk voordeel ten opzichte van andere AI-startups, waardoor het zijn onderzoek en ontwikkeling kon voortzetten terwijl anderen moeite hadden om rekenkracht te verkrijgen.

DeepSeek’s prestaties en unieke aanpak

Hoewel experts verschillende meningen hebben over de prestaties van DeepSeek in vergelijking met ChatGPT van OpenAI en Claude van Anthropic, is de algemene consensus dat de modellen van DeepSeek uitzonderlijk goed presteren onder specifieke hardwareconfiguraties. Ze kunnen echter problemen ondervinden in andere scenario’s. De focus van DeepSeek ligt op het verbeteren van de efficiëntie en het verlagen van de kosten, wat duidelijk blijkt uit het innovatieve “mixture of experts”-model. Dit model gebruikt verschillende delen van de AI om specifieke vragen te beantwoorden, waardoor de prestaties en het gebruik van middelen worden geoptimaliseerd.

Een ander belangrijk onderscheidend kenmerk van de modellen van DeepSeek is hun open-source karakter, waardoor ze op verschillende hardwareplatforms kunnen worden gebruikt. Belangrijker nog, de modellen van DeepSeek bieden transparantie en onthullen hoe ze tot hun antwoorden komen, in tegenstelling tot OpenAI’s o1. Deze transparantie is een belangrijk verkoopargument voor klanten die op zoek zijn naar kosteneffectieve AI-oplossingen, met name degenen die zijn uitgesloten van de markt voor dure, in de VS ontwikkelde modellen en degenen die geen toegang hebben tot Amerikaanse rekenkracht.

Amerikaanse zorgen over Chinese AI-vooruitgang

De bezorgdheid van de VS over de Chinese vooruitgang in AI is niet ongegrond. De Amerikaanse overheid probeert sinds 2022 de Chinese AI-ontwikkeling actief te beteugelen door exportcontroles op geavanceerde AI-chips. Dit heeft Chinese bedrijven effectief verhinderd om de nodige processors te verwerven om geavanceerde AI-modellen te trainen. Ondanks deze beperkingen hebben chipfabrikanten zoals Nvidia en Intel geprobeerd processors te creëren die voldoen aan de Amerikaanse eisen voor de Chinese markt, maar werden ze geconfronteerd met verdere aanscherping van de regels door Washington.

Chinese alternatieve strategieën

Deze beperkingen hebben Chinese AI-bedrijven gedwongen om alternatieve strategieën te onderzoeken. Sommigen vertrouwen op in de VS gemaakte chips die vóór de verboden werden geïmporteerd, terwijl anderen zich wenden tot grijze-markt-smokkelnetwerken die chips vanuit locaties van derden verschepen. Sommigen onderzoeken datacenters buiten China, terwijl anderen vertrouwen op in China gemaakte alternatieven van bedrijven zoals Huawei. Hoewel Huawei beweert dat zijn AI-chips beter presteren dan Nvidia’s A100-processor, heeft het problemen ondervonden bij het betrouwbaar produceren ervan op grote schaal.

De uitdagingen van DeepSeek

Liang Wenfeng heeft verklaard dat “geld nooit het probleem voor ons is geweest; verboden op zendingen van geavanceerde chips zijn het probleem.” Deze uitspraak onderstreept de aanzienlijke hindernissen waarmee Chinese bedrijven worden geconfronteerd in hun streven naar AI-leiderschap. Naast de exportverboden op chips heeft de regering-Biden ook Amerikaanse investeringen in Chinese AI verboden, wat de situatie verder compliceert.

Het bloeiende Chinese AI-ecosysteem

Ondanks deze uitdagingen heeft China een bloeiend AI-ecosysteem ontwikkeld. Grote techbedrijven zoals Baidu, Alibaba en ByteDance ontwikkelen hun eigen fundamentele modellen en bieden AI-gebaseerde diensten aan. Chinese AI-startups zoals MiniMax en Moonshot AI hebben consumentgerichte diensten gelanceerd die zelfs op de Amerikaanse markt succes hebben geboekt.

De prijzenoorlog in de Chinese AI-sector

De intense concurrentie binnen de Chinese AI-sector heeft geleid tot een prijzenoorlog, waarbij bedrijven de prijzen in 2024 drastisch met wel 90% hebben verlaagd om een concurrentievoordeel te behalen. Deze prijzenoorlog benadrukt verder de vindingrijkheid en het aanpassingsvermogen van de Chinese AI-sector.

Amerikaanse bezorgdheid en reactie

De VS maakt zich steeds meer zorgen over de successen van China in AI, omdat dit impliceert dat de maatregelen die zijn genomen om het Amerikaanse leiderschap in AI te beschermen niet werken. Voormalig Google CEO Eric Schmidt heeft zijn verbazing uitgesproken over de Chinese vooruitgang en verklaard dat hij “dacht dat de beperkingen die we op chips hadden gelegd hen zouden tegenhouden.”

OpenAI, de ontwikkelaar van ChatGPT, heeft ook zijn bezorgdheid geuit over de Chinese AI-ontwikkelingen. In een recent beleidsdocument verklaarde OpenAI dat er naar schatting 175 miljard dollar aan wereldwijde fondsen wacht op investering in AI-projecten. Het bedrijf waarschuwde dat “als de VS die fondsen niet aantrekt, ze naar door China gesteunde projecten zullen vloeien, waardoor de wereldwijde invloed van de Chinese Communistische Partij wordt versterkt.”

Het Stargate-project

Als reactie op deze zorgen hebben OpenAI CEO Sam Altman, SoftBank CEO Masayoshi Son en Oracle medeoprichter Larry Ellison het Stargate-project aangekondigd, dat belooft 500 miljard dollar te investeren in AI-infrastructuur in de VS. Dit project is een duidelijke indicatie van de toewijding van de VS om zijn leiderschap op het gebied van AI te behouden.

De complexiteit van AI-dominantie

De opkomst van bedrijven als DeepSeek suggereert echter dat de weg naar AI-dominantie misschien niet zo eenvoudig is als alleen maar enorme sommen geld investeren. Het vermogen om te innoveren, zich aan te passen en doorbraken te bereiken met beperkte middelen is een cruciale factor in het huidige AI-landschap. Terwijl de AI-race zich blijft intensiveren, zal de wereld nauwlettend in de gaten houden hoe de VS en China deze complexe uitdagingen aangaan. De uitkomst zal verstrekkende gevolgen hebben voor de toekomst van technologie en de wereldwijde machtsverhoudingen. Het verhaal van DeepSeek dient als een herinnering dat vindingrijkheid en aanpassingsvermogen krachtige krachten kunnen zijn in de race om AI-suprematie. Hoewel de VS zwaar investeert om zijn voorsprong te behouden, is de uitdaging vanuit China, met name van innovatieve startups zoals DeepSeek, een formidabele. De komende jaren zullen cruciaal zijn bij het bepalen van de uiteindelijke winnaar in deze competitie met hoge inzet. Het AI-landschap is snel aan het evolueren en de dynamiek tussen deze twee wereldmachten zal de toekomst van deze transformerende technologie blijven vormgeven.