DeepSeek, een naam die in korte tijd is opgeklommen van relatieve onbekendheid tot een centraal punt in het wereldwijde AI-gesprek, heeft intense debatten en speculaties veroorzaakt binnen de technologie- en financiële sector. Het Chinese AI-lab achter deze opkomende kracht heeft de gevestigde orde verstoord, wat analisten ertoe aanzet vragen te stellen over de duurzaamheid van de Amerikaanse dominantie in de AI-race en de levensvatbaarheid op lange termijn van de huidige vraag naar AI-chips. Maar wat zijn de belangrijkste factoren die DeepSeek naar zijn huidige prominentie hebben gestuwd?
De Genesis van DeepSeek: Van Hedgefonds tot AI-lab
De oorsprong van DeepSeek is diep verweven met de wereld van kwantitatieve financiering. Het wordt gesteund door High-Flyer Capital Management, een Chinees hedgefonds dat bekend staat om zijn gebruik van AI bij het nemen van datagestuurde handelsbeslissingen.
Liang Wenfeng, een AI-enthousiasteling met een achtergrond in de handel tijdens zijn tijd aan de Zhejiang University, was in 2015 medeoprichter van High-Flyer. In 2019 lanceerde hij High-Flyer Capital Management als een hedgefonds met een specifieke focus op het ontwikkelen en implementeren van AI-algoritmen voor financiële toepassingen.
In 2023 incubeerde High-Flyer DeepSeek als een dedicated AI-onderzoekslab, dat onafhankelijk opereerde van zijn belangrijkste financiële activiteiten. Vervolgens werd het lab, met High-Flyer als een belangrijke investeerder, afgesplitst tot een afzonderlijke entiteit, met behoud van de naam DeepSeek.
Vanaf het begin gaf DeepSeek prioriteit aan het opzetten van eigen datacentrumclusters om modeltraining te faciliteren. Net als andere AI-bedrijven die in China actief zijn, is DeepSeek echter op uitdagingen gestuit als gevolg van Amerikaanse exportbeperkingen op geavanceerde hardware. Om zijn recentere modellen te trainen, moest het bedrijf daarom zijn toevlucht nemen tot het gebruik van Nvidia H800-chips, een minder krachtige variant van de H100-chips die gemakkelijk beschikbaar zijn voor Amerikaanse bedrijven.
Het technische team van DeepSeek staat bekend om zijn jeugdigheid en dynamiek. Het bedrijf werft actief doctorale AI-onderzoekers van toonaangevende Chinese universiteiten. Bovendien heeft DeepSeek mensen met verschillende achtergronden in dienst, zelfs degenen zonder expertise op het gebied van computerwetenschappen, om ervoor te zorgen dat zijn technologie een breed scala aan onderwerpen effectief kan begrijpen en bedienen, zoals gerapporteerd door The New York Times.
De AI-modellen van DeepSeek: De Status Quo Uitdagen
DeepSeek onthulde zijn eerste reeks modellen - DeepSeek Coder, DeepSeek LLM en DeepSeek Chat - in november 2023. Het was echter de release van zijn volgende generatie DeepSeek-V2-modellen in het voorjaar die de aandacht van de AI-industrie echt trok.
DeepSeek-V2, een veelzijdig systeem dat zowel tekst als afbeeldingen kan analyseren, toonde indrukwekkende prestaties over verschillende AI-benchmarks. Met name behaalde het deze prestaties tegen aanzienlijk lagere kosten in vergelijking met concurrerende modellen die op dat moment beschikbaar waren. Dit zette de binnenlandse rivalen van DeepSeek, waaronder ByteDance en Alibaba, ertoe aan de prijzen van sommige van hun modellen te verlagen en andere volledig gratis aan te bieden.
DeepSeek V3 heeft superieure prestaties laten zien in vergelijking met zowel downloadbare, open-source modellen zoals Meta’s Llama en "gesloten" modellen die alleen toegankelijk zijn via API’s, zoals OpenAI’s GPT-4o.
Even opmerkelijk is DeepSeek’s R1 "redeneermodel". DeepSeek, gelanceerd in januari, beweert dat R1 vergelijkbare prestaties levert als OpenAI’s o1-model op belangrijke benchmarks.
Als redeneermodel bevat R1 zelfcontrolesystemen, waardoor enkele van de veelvoorkomende valkuilen worden vermeden die aan standaardmodellen zijn verbonden. Hoewel redeneermodellen iets langere verwerkingstijden nodig hebben om tot oplossingen te komen (variërend van seconden tot minuten), vertonen ze doorgaans een grotere betrouwbaarheid in domeinen zoals natuurkunde, wetenschap en wiskunde.
De modellen van DeepSeek, waaronder R1 en DeepSeek V3, zijn echter onderworpen aan toezicht door de Chinese internetregulator, die ervoor zorgt dat hun reacties overeenkomen met "socialistische kernwaarden". In de chatbot-app van DeepSeek zal R1 bijvoorbeeld geen vragen beantwoorden over het Tiananmenplein of de autonomie van Taiwan.
In maart overschreed het websiteverkeer van DeepSeek 16,5 miljoen bezoeken. Ondanks een daling van 25% in het verkeer in vergelijking met februari, stond DeepSeek op de tweede plaats in termen van dagelijkse bezoeken, aldus David Carr, redacteur bij Similarweb. Dit cijfer valt echter nog steeds in het niet bij ChatGPT, dat in maart de 500 miljoen wekelijkse actieve gebruikers overschreed.
Een Disruptieve Benadering van het AI-landschap
Het bedrijfsmodel van DeepSeek blijft enigszins raadselachtig. Het bedrijf prijst zijn producten en diensten aanzienlijk onder de marktwaarde en biedt er zelfs enkele gratis aan. Bovendien heeft het extern gefinancierd ondanks aanzienlijke interesse van durfkapitaalbedrijven.
DeepSeek schrijft zijn extreme kostenconcurrentievermogen toe aan doorbraken in efficiëntie. Sommige experts hebben echter de nauwkeurigheid van de door het bedrijf verstrekte cijfers in twijfel getrokken.
Desalniettemin hebben ontwikkelaars de modellen van DeepSeek omarmd, die, hoewel niet open source in de traditionele zin, beschikbaar zijn onder permissieve licenties die commercieel gebruik toestaan. Volgens Clem Delangue, CEO van Hugging Face, hebben ontwikkelaars op het platform meer dan 500 afgeleide modellen van R1 gemaakt, die samen 2,5 miljoen downloads hebben verzameld.
Het succes van DeepSeek tegen grotere, meer gevestigde concurrenten is beschreven als zowel "het opschudden van AI" als "overdreven gehypet". De prestaties van het bedrijf waren mede verantwoordelijk voor een daling van 18% in de aandelenkoers van Nvidia in januari en leidden tot een openbare reactie van OpenAI CEO Sam Altman. In maart meldde Reuters dat bureaus van het Amerikaanse ministerie van Handel DeepSeek op overheidsapparaten hadden verboden.
Microsoft heeft DeepSeek geïntegreerd in zijn Azure AI Foundry-service, een platform dat AI-services voor ondernemingen consolideert. Tijdens Meta’s winstoproep over het eerste kwartaal verklaarde CEO Mark Zuckerberg dat investeringen in AI-infrastructuur een "strategisch voordeel" voor het bedrijf zouden blijven, toen hem werd gevraagd naar de potentiële impact van DeepSeek op Meta’s AI-uitgaven. In maart bestempelde OpenAI DeepSeek als "gesubsidieerd door de staat" en "gecontroleerd door de staat" en adviseerde de Amerikaanse regering om de modellen te verbieden.
Tijdens Nvidia’s winstoproep over het vierde kwartaal benadrukte CEO Jensen Huang DeepSeek’s "uitstekende innovatie" en merkte op dat de redeneermodellen aanzienlijk meer rekenkracht vereisen, wat Nvidia ten goede komt.
Omgekeerd hebben sommige bedrijven, landen en overheden, waaronder Zuid-Korea en de staat New York, het gebruik van DeepSeek op overheidsapparaten verboden.
In mei getuigde Microsoft Vice Chairman en President Brad Smith voor de Senaat dat Microsoft-medewerkers geen DeepSeek mogen gebruiken vanwege zorgen over gegevensbeveiliging en potentiële propaganda.
De Onzekere Toekomst van DeepSeek
De toekomstige koers van DeepSeek blijft onzeker. Hoewel verdere modelverbeteringen worden verwacht, lijkt de Amerikaanse regering steeds meer op haar hoede voor vermeende schadelijke buitenlandse invloed. In maart meldde The Wall Street Journal dat de VS DeepSeek waarschijnlijk zal verbieden op overheidsapparaten.
De snelle opkomst van DeepSeek heeft onmiskenbaar de fundamenten van de AI-industrie doen schudden, wat heeft geleid tot een herbeoordeling van de concurrentiedynamiek en het potentieel voor disruptieve innovatie. Of het zijn huidige momentum kan vasthouden in het licht van toenemend toezicht en regelgevende uitdagingen, valt nog te bezien. De komende jaren zullen cruciaal zijn bij het bepalen van de impact van DeepSeek op lange termijn op het mondiale AI-landschap. Zijn vermogen om de complexe wisselwerking van technologische vooruitgang, geopolitieke overwegingen en ethische zorgen te navigeren, zal uiteindelijk zijn nalatenschap bepalen. De AI-wereld zal aandachtig toekijken.
Het DeepSeek-verhaal is een herinnering dat in de snel evoluerende wereld van kunstmatige intelligentie nieuwe spelers snel kunnen opkomen en de gevestigde orde kunnen uitdagen. Het succes van het bedrijf, gedreven door innovatieve technologie en een bereidheid om traditionele bedrijfsmodellen te verstoren, heeft de industrie gedwongen om kennis te nemen. Naarmate DeepSeek zich blijft ontwikkelen en zijn bereik uitbreidt, zal het ongetwijfeld een belangrijke rol spelen bij het vormgeven van de toekomst van AI.