DeepSeek Dag Twee: Een verschuiving naar AI-adoptie door bedrijven
DeepSeek, een opkomende Chinese AI-startup, maakt furore met haar aanzienlijk afgeprijsde basismodellen. Deze stap heeft het potentieel om de adoptie van AI door bedrijven radicaal te veranderen door een van de belangrijkste barrières aan te pakken: de kosten.
De hoge kosten van AI-adoptie
Volgens analisten Brad Sills en Carly Liu van BofA Global Research zijn de kosten die gepaard gaan met AI-toepassingen het belangrijkste obstakel dat hun wijdverspreide implementatie belemmert. Hun rapport, uitgebracht op dinsdag 28 januari, suggereert dat doorbraken in kostenverlaging de prijzen verder zouden kunnen verlagen, wat leidt tot hogere adoptiepercentages.
DeepSeek’s aankondiging op maandag 27 januari veroorzaakte schokgolven door de AI-industrie en veroorzaakte een daling van de aandelen van verschillende AI-bedrijven. Het bedrijf onthulde dat het in staat was om een basismodel te trainen voor slechts $ 5,58 miljoen met behulp van 2.048 Nvidia H800-chips. Dit cijfer staat in schril contrast met de geschatte kosten van OpenAI en Anthropic, die variëren van $ 100 miljoen tot een miljard dollar en het gebruik van duizenden Nvidia’s AI-chips omvatten.
Roy Benesh, CTO bij eSIMple, benadrukte het transformerende potentieel van DeepSeek’s prestatie en verklaarde dat het kleinere bedrijven, individuele ontwikkelaars en zelfs onderzoekers in staat stelt om de kracht van AI te benutten zonder exorbitante kosten te maken. Deze verhoogde toegankelijkheid kan de ontwikkeling van innovatieve ideeën en technologieën bevorderen, wat leidt tot meer concurrentievermogen in het veld. Als gevolg hiervan kunnen klanten profiteren van nieuwe opties, terwijl gevestigde AI-bedrijven waarschijnlijk hun prijzen zullen verlagen en technologische vooruitgang zullen versnellen.
De BofA-analisten gaven voorbeelden van de kosten die gepaard gaan met bestaande AI-toepassingen. Microsoft’s 365 Copilot Chat rekent tussen de 1 cent en 30 cent per prompt, afhankelijk van de complexiteit van het verzoek. Salesforce’s Agentforce voor Service Cloud rekent een vast tarief van $ 2 per conversie.
Hoewel BofA erkende dat het cijfer van $ 5,58 miljoen dat door DeepSeek wordt gepresenteerd enigszins misleidend is vanwege de uitsluiting van kosten met betrekking tot onderzoek, experimenten, architecturen, algoritmen en data, benadrukten de analisten de betekenis van de innovaties van de startup bij het aantonen van de haalbaarheid van minder kostbare trainingsmethoden.
Pre-training versus inferentie: De kosten begrijpen
Foundation AI-modellen, zoals OpenAI’s GPT-4o en Google’s Gemini, ondergaan een proces dat pre-training wordt genoemd, waarbij ze worden blootgesteld aan enorme hoeveelheden data, zoals het hele internet, om algemene kennis te ontwikkelen. Om deze modellen relevanter en nuttiger te maken voor specifieke bedrijven en industrieën, moeten bedrijven ze echter verder trainen of finetunen met behulp van hun eigen data.
Zodra het AI-model is gefinetuned, kan het gebruikersprompts verwerken en relevante antwoorden genereren. Het proces van het prompten van het model en het verkrijgen van een antwoord brengt echter inferentiekosten met zich mee, dit zijn kosten die verbonden zijn aan het inzetten van het model met nieuwe data om te begrijpen en te analyseren.
Het is belangrijk op te merken dat de meeste bedrijven niet de kosten dragen van het trainen van basismodellen. Deze verantwoordelijkheid ligt bij de ontwikkelaars van deze modellen, waaronder OpenAI, Google, Meta, Amazon, Microsoft, Anthropic, Cohere, Hugging Face, Mistral AI, Stability AI, xAI, IBM, Nvidia, bepaalde onderzoekslaboratoria en Chinese techreuzen zoals Baidu en Alibaba.
Bedrijven maken voornamelijk inferentiekosten voor het verwerken van AI-workloads, wat het grootste deel van de AI-gerelateerde kosten vormt.
De China-connectie: DeepSeek’s inferentiekosten en privacyproblemen
DeepSeek biedt zijn eigen inferentieservices aan tegen aanzienlijk lagere kosten in vergelijking met Silicon Valley-bedrijven. Er zijn echter bepaalde overwegingen om in gedachten te houden bij het gebruik van deze services.
Volgens het privacybeleid van DeepSeek wordt gebruikersinformatie opgeslagen op servers in China. Het bedrijf stelt ook dat het zal voldoen aan wettelijke verplichtingen en taken zal uitvoeren in het algemeen belang of om de vitale belangen van zijn gebruikers en andere mensen te beschermen.
De Chinese nationale inlichtingenwet, met name artikel 7, bepaalt dat alle organisaties en burgers de nationale inlichtingeninspanningen ondersteunen, helpen en ermee samenwerken in overeenstemming met de wet en de geheimen van het nationale inlichtingenwerk beschermen waarvan ze op de hoogte zijn.
Kevin Surace, CEO van Appvance, uitte zijn bezorgdheid over de privacy en verklaarde dat het verzamelen van data van gebruikers een algemene praktijk is in China. Hij adviseerde gebruikers om voorzichtig te zijn.
In een experiment uitgevoerd door PYMNTS werd DeepSeek’s chatbot gevraagd om uit te leggen hoe de protesten op het Tiananmenplein in 1989 de Chinese politiek hebben beïnvloed. De chatbot antwoordde: ‘Sorry, ik weet nog niet zeker hoe ik dit soort vragen moet aanpakken.’
Tim Enneking, CEO van Presearch, wees erop dat DeepSeek een 100% Chinees bedrijf is dat in China is gevestigd. Hij merkte op dat het onvermogen van de chatbot om informatie te verstrekken over het Tiananmenplein of hoge Chinese regeringsfunctionarissen wijst op beperkingen in de objectiviteit van de technologie. Hoewel Enneking het opwindende potentieel van de technologie erkende, uitte hij zijn bezorgdheid over de controle ervan.
Enneking benadrukte echter ook de open-source aard van DeepSeek’s modellen, die revisies mogelijk maakt om overheids- en bedrijfscontroles te verwijderen. Hij gelooft dat de technische creativiteit van het bedrijf kansen creëert voor kleinere bedrijven en landen om deel te nemen aan en te slagen in het generatieve AI-landschap.
DeepSeek’s potentieel om de inferentiekosten voor iedereen te verlagen
DeepSeek’s innovatieve benadering van het trainen van basismodellen tegen lagere kosten heeft positieve gevolgen voor bedrijven zoals Microsoft, die de kosten van AI-computing kunnen blijven verlagen en schaalvoordelen kunnen behalen. Volgens Sills en Liu kunnen lagere computerkosten leiden tot verbeterde marges op AI-gestuurde aanbiedingen.
In een afzonderlijke notitie suggereerden BofA-analisten Alkesh Shah, Andrew Moss en Brad Sills dat lagere AI-computerkosten bredere AI-services in verschillende sectoren mogelijk zouden kunnen maken, van auto’s tot smartphones.
Hoewel het onwaarschijnlijk is dat ontwikkelaars van basismodellen zoals OpenAI onmiddellijk trainingskosten zullen bereiken die zo laag zijn als die van DeepSeek, zijn de analisten van mening dat DeepSeek’s innovatieve training- en post-trainingstechnieken zullen worden overgenomen door concurrerende frontier-modelontwikkelaars om de efficiëntie te verbeteren. Ze benadrukken echter dat de huidige modellen nog steeds aanzienlijke investeringen vereisen, omdat ze de basis vormen voor AI-agents.
Op de lange termijn verwachten de analisten een versnelde adoptie van AI door bedrijven naarmate chatbots, copilots en agents zowel slimmer als goedkoper worden, een fenomeen dat bekend staat als de paradox van Jevons.
Microsoft CEO Satya Nadella herhaalde dit sentiment op X en verklaarde dat de paradox van Jevons in het spel is naarmate AI efficiënter en toegankelijker wordt. Hij gelooft dat dit zal leiden tot een toename van het AI-gebruik, waardoor het een grondstof wordt waar we niet genoeg van kunnen krijgen.
Een diepere duik in basismodellen en hun impact
Basismodellen, de ruggengraat van moderne AI, zorgen voor een revolutie in de manier waarop bedrijven werken en omgaan met technologie. Deze modellen, getraind op enorme datasets, hebben de mogelijkheid om een breed scala aan taken uit te voeren, van natuurlijke taalverwerking tot beeldherkenning. De ontwikkeling en implementatie van deze modellen omvat echter een complex samenspel van factoren, waaronder trainingskosten, inferentiekosten, dataprivacy en ethische overwegingen.
Inzicht in basismodellen
In de kern zijn basismodellen grote neurale netwerken die zijn getraind op massale datasets. Dit trainingsproces stelt hen in staat om patronen en relaties binnen de data te leren, waardoor ze een verscheidenheid aan taken met opmerkelijke nauwkeurigheid kunnen uitvoeren. Enkele voorbeelden van basismodellen zijn:
- GPT-4o: Een krachtig taalmodel ontwikkeld door OpenAI, dat in staat is om tekst van menselijke kwaliteit te genereren, talen te vertalen en vragen op een uitgebreide manier te beantwoorden.
- Google’s Gemini: Een multimodaal AI-model dat verschillende soorten data kan verwerken en begrijpen, waaronder tekst, afbeeldingen en audio.
Deze modellen zijn niet beperkt tot specifieke taken, maar kunnen worden aangepast aan een breed scala aan toepassingen, waardoor ze veelzijdige tools zijn voor bedrijven.
De rol van pre-training en finetuning
De ontwikkeling van een basismodel omvat doorgaans twee belangrijke fasen: pre-training en finetuning.
- Pre-training: In deze fase wordt het model getraind op een enorme dataset, zoals het hele internet, om algemene kennis en taalvaardigheden te leren. Dit proces rust het model uit met het vermogen om tekst te begrijpen en te genereren, talen te vertalen en andere basistaken uit te voeren.
- Finetuning: In deze fase wordt het pre-getrainde model verder getraind op een kleinere, meer specifieke dataset met betrekking tot een bepaalde taak of industrie. Dit proces stelt het model in staat om zijn kennis en vaardigheden aan te passen aan de specifieke behoeften van de toepassing.
Een pre-getraind taalmodel zou bijvoorbeeld kunnen worden gefinetuned op een dataset van klantenservice-interacties om een chatbot te creëren die effectief kan reageren op vragen van klanten.
De kosten van training en inferentie
De kosten die verbonden zijn aan basismodellen kunnen worden onderverdeeld in twee hoofdcategorieën: trainingskosten en inferentiekosten.
- Trainingskosten: Deze kosten omvatten de computerbronnen, data en expertise die nodig zijn om het basismodel te trainen. Het trainen van een groot basismodel kan extreem duur zijn en vereist vaak miljoenen dollars aan investeringen.
- Inferentiekosten: Deze kosten omvatten de computerbronnen die nodig zijn om het getrainde model te gebruiken om voorspellingen te doen of outputs te genereren. Inferentiekosten kunnen variëren afhankelijk van de grootte en complexiteit van het model, de hoeveelheid data die wordt verwerkt en de infrastructuur die wordt gebruikt.
DeepSeek’s innovatie ligt in zijn vermogen om de trainingskosten die verbonden zijn aan basismodellen aanzienlijk te verlagen, waardoor ze toegankelijker worden voor een breder scala aan bedrijven en organisaties.
Het aanpakken van privacy- en ethische bezwaren
Het gebruik van basismodellen roept belangrijke vragen op over dataprivacy en ethische overwegingen. Basismodellen worden getraind op massale datasets, die gevoelige of persoonlijke informatie kunnen bevatten. Het is cruciaal om ervoor te zorgen dat deze modellen op een verantwoorde en ethische manier worden gebruikt, met respect voor de privacy van gebruikers en het vermijden van bias.
Enkele strategieën voor het aanpakken van deze bezwaren zijn:
- Data-anonimisering: Het verwijderen of maskeren van persoonlijke informatie uit de trainingsdata om de privacy van gebruikers te beschermen.
- Biasdetectie en -mitigatie: Het identificeren en aanpakken van bias in de trainingsdata om ervoor te zorgen dat het model geen schadelijke stereotypen of discriminerende praktijken bestendigt.
- Transparantie en verantwoording: Het verstrekken van duidelijke informatie over hoe het model werkt en hoe het wordt gebruikt, en het vaststellen van mechanismen voor verantwoording in geval van fouten of onbedoelde gevolgen.
Naarmate basismodellen vaker voorkomen, is het essentieel om deze privacy- en ethische bezwaren proactief aan te pakken om ervoor te zorgen dat ze worden gebruikt ten behoeve van de samenleving.
De toekomst van basismodellen
Basismodellen evolueren snel en hun potentiële impact op de samenleving is immens. In de toekomst kunnen we verwachten dat:
- Krachtigere en veelzijdigere modellen: Naarmate onderzoekers nieuwe architecturen en trainingstechnieken blijven ontwikkelen, zullen basismodellen nog krachtiger en veelzijdiger worden, in staat om een breder scala aan taken uit te voeren met grotere nauwkeurigheid.
- Verhoogde toegankelijkheid: Naarmate de trainingskosten dalen en cloudgebaseerde AI-platforms vaker voorkomen, zullen basismodellen toegankelijker worden voor bedrijven van alle groottes.
- Nieuwe toepassingen en use cases: Basismodellen zullen blijven worden toegepast op nieuwe en innovatieve use cases in verschillende industrieën, van de gezondheidszorg tot de financiële wereld tot het onderwijs.
De opkomst van basismodellen vertegenwoordigt een paradigmaverschuiving in het vakgebied van de kunstmatige intelligentie. Door hun mogelijkheden, kosten en ethische overwegingen te begrijpen, kunnen we hun kracht benutten om een betere toekomst te creëren.
DeepSeek’s bijdrage aan het democratiseren van AI
DeepSeek’s prestatie bij het aanzienlijk verlagen van de kosten van het trainen van basismodellen markeert een cruciaal moment in de democratisering van AI. Door de drempel te verlagen, stelt DeepSeek een breder scala aan organisaties en individuen in staat om deel te nemen aan de AI-revolutie.
De impact op kleinere bedrijven
Kleinere bedrijven missen vaak de middelen en expertise om hun eigen AI-modellen te ontwikkelen en in te zetten. DeepSeek’s kosteneffectieve basismodellen bieden deze bedrijven toegang tot geavanceerde AI-technologie die voorheen buiten bereik lag. Dit kan het speelveld gelijk maken, waardoor kleinere bedrijven effectiever kunnen concurreren met grotere, meer gevestigde bedrijven.
Een klein e-commercebedrijf zou bijvoorbeeld DeepSeek’s modellen kunnen gebruiken om productaanbevelingen voor zijn klanten te personaliseren, zijn klantenservice te verbeteren of zijn marketingcampagnes te automatiseren.
De empowerment van individuele ontwikkelaars
DeepSeek’s modellen stellen ook individuele ontwikkelaars en onderzoekers in staat om nieuwe AI-toepassingen en innovaties te verkennen. Met toegang tot betaalbare basismodellen kunnen ontwikkelaars experimenteren met verschillende ideeën, nieuwe AI-aangedreven tools ontwikkelen en bijdragen aan de vooruitgang van AI-technologie.
Dit kan leiden tot een toename van innovatie, omdat meer mensen de kans krijgen om deel te nemen aan de ontwikkeling van AI.
Het potentieel voor open-source samenwerking
DeepSeek’s open-source benadering bevordert verdere samenwerking en innovatie in de AI-gemeenschap. Door zijn modellen openbaar te maken, moedigt DeepSeek ontwikkelaars aan om bij te dragen aan hun verbetering, bugs te identificeren en op te lossen en nieuwe functies te ontwikkelen.
Deze collaboratieve benadering kan de ontwikkeling van AI-technologie versnellen en ervoor zorgen dat deze wordt gebruikt ten behoeve van iedereen.
De versnelling van AI-adoptie
Door de kosten van AI te verlagen, versnelt DeepSeek de adoptie van AI in verschillende industrieën. Naarmate AI betaalbaarder en toegankelijker wordt, zullen meer bedrijven het in hun activiteiten kunnen integreren, wat leidt tot verhoogde productiviteit, efficiëntie en innovatie.
Dit kan een diepgaande invloed hebben op de wereldeconomie, groei stimuleren en nieuwe kansen creëren.
Een inclusiever AI-ecosysteem
DeepSeek’s inspanningen om AI te democratiseren dragen bij aan een inclusiever AI-ecosysteem, waar meer mensen de kans krijgen om deel te nemen aan de ontwikkeling en het gebruik van AI. Dit kan helpen ervoor te zorgen dat AI wordt gebruikt op een manier die alle leden van de samenleving ten goede komt, in plaats van slechts een selecte groep.
Door kleinere bedrijven, individuele ontwikkelaars en onderzoekers in staat te stellen, bevordert DeepSeek een diverser en innovatiever AI-landschap.