AI-tools staan steeds meer in de schijnwerpers vanwege hun koolstofuitstoot, en de bewering van DeepSeek AI dat hun modellen efficiënter zijn dan andere, heeft de industrie opgeschud. Een recent onderzoek van Greenly, een Frans softwarebedrijf gespecialiseerd in duurzaamheid, heeft deze bewering onderzocht.
Het onderzoek van Greenly toonde aan dat de DeepSeek-modellen minder tijd nodig hebben om te trainen en minder Nvidia-chips gebruiken. Bij het trainen van de DeepSeek V3-modellen en de Meta Llama 3.1-modellen in hetzelfde scenario, gebruikte DeepSeek 2,78 miljoen GPU-uren (graphics processing unit), terwijl het model van Meta 30,8 miljoen GPU-uren gebruikte. Aangezien training meestal de meest koolstofintensieve fase van de werking van een AI-model is, draagt de snellere training van DeepSeek ongetwijfeld bij aan de efficiëntie. Bovendien gebruikte DeepSeek 2000 Nvidia-chips, terwijl het Meta-model er meer dan 16.000 gebruikte, en ChatGPT maar liefst meer dan 25.000. Bovendien zijn de chips die DeepSeek gebruikt minder "energie-intensief" dan de chips die ChatGPT gebruikt.
Het Greenly-onderzoek wees er verder op: "De sancties die de VS heeft ingevoerd, beperken de toegang van DeepSeek tot de meest geavanceerde AI-chips van Nvidia. Dit dwingt het bedrijf om innovatieve technologieën te ontwikkelen. Deze beperking heeft DeepSeek gedwongen modellen te ontwerpen die de efficiëntie maximaliseren, in plaats van te vertrouwen op enorme rekenkracht."
Technische innovatie van DeepSeek: Mixture-of-Experts-model
Het DeepSeek-ontwerpmodel omvat een mixture-of-experts-ontwerp, waardoor de tool gebruikerstaken kan delegeren aan submodellen, waarbij "alleen de rekenkracht wordt geactiveerd die nodig is voor een bepaald verzoek." Deze methode is vergelijkbaar met een groot team waarin elk lid een expert is op een specifiek gebied. Wanneer zich een nieuw probleem voordoet, wijst de teamleider dit toe aan de expert die het probleem het beste kan oplossen, in plaats van het hele team erbij te betrekken.
In het mixture-of-expertsmodel van DeepSeek wordt het grote AI-model opgedeeld in kleinere, gespecialiseerde submodellen. Elk submodel is getraind om uit te blinken in een bepaald type taak. Een submodel kan bijvoorbeeld goed zijn in het verwerken van taken op het gebied van natuurlijke taalverwerking, terwijl een ander submodel beter is in beeldherkenning.
Wanneer een gebruiker een verzoek indient bij DeepSeek AI, analyseert het systeem het verzoek en bepaalt welk submodel het meest geschikt is om het verzoek te verwerken. Vervolgens stuurt het systeem het verzoek door naar het juiste submodel, dat het verzoek verwerkt en het resultaat retourneert.
Deze methode heeft verschillende voordelen:
- Hogere efficiëntie: Door alleen de rekenkracht te activeren die nodig is voor een bepaald verzoek, kan het mixture-of-expertsmodel de efficiëntie aanzienlijk verhogen. Dit kan aanzienlijke besparingen opleveren in computermiddelen in vergelijking met traditionele AI-modellen waarbij het gehele model geactiveerd moet worden.
- Hogere nauwkeurigheid: Door taken te delegeren aan het submodel dat het meest geschikt is voor het verwerken van de taak, kan het mixture-of-expertsmodel de nauwkeurigheid verhogen. Elk submodel is specifiek getraind om uit te blinken in zijn specifieke domein en heeft daardoor een grotere kans om nauwkeurige resultaten te produceren.
- Verbeterde schaalbaarheid: Mixture-of-experts-modellen zijn gemakkelijker te schalen, omdat er indien nodig nieuwe submodellen kunnen worden toegevoegd om nieuwe taken uit te voeren. Hierdoor kan het systeem zich aanpassen aan veranderende behoeften.
De relatie tussen DeepSeek en datacenters: een cruciale factor voor duurzaamheid
Het Greenly-onderzoek wees er tevens op dat de relatie (of het potentiële gebrek daaraan) van DeepSeek met datacenters ook bijdraagt aan de duurzaamheid. Aangezien DeepSeek een open-weight-model is, ofwel publiekelijk beschikbaar, merkte Greenly op dat het op fysieke apparaten kan worden uitgevoerd, in plaats van alleen in de cloud of via datacenters. Door de behoefte aan datacenters te verminderen, kan DeepSeek op zijn beurt het energieverbruik van de faciliteiten verminderen, waarvan wordt verwacht dat het energieverbruik binnen vijf jaar zal verdubbelen.
Datacenters zijn grote gebouwen met een groot aantal computerservers en andere apparatuur. Deze servers worden gebruikt voor het opslaan, verwerken en distribueren van gegevens. Datacenters hebben veel energie nodig om te functioneren, omdat de servers veel warmte genereren die moet worden afgevoerd door middel van koelsystemen.
Door de behoefte aan datacenters te verminderen, kan DeepSeek helpen het wereldwijde energieverbruik en de koolstofuitstoot te verminderen. Dit is van cruciaal belang om klimaatverandering tegen te gaan.
De paradox van Jevons: potentiële risico’s van efficiëntieverbetering
Desalniettemin waarschuwde het Greenly-onderzoek dat "deze voordelen gemakkelijk van korte duur kunnen zijn", wat wordt toegeschreven aan de paradox van Jevons, namelijk dat iets, hoe efficiënter iets is, des te meer het zal worden gebruikt, waardoor er meer emissies ontstaan.
De paradox van Jevons werd in de 19e eeuw geïntroduceerd door de Britse econoom William Stanley Jevons. Jevons constateerde dat toen de efficiëntie van kolenverbranding toenam, het gebruik van kolen niet afnam, maar toenam. Hij voerde aan dat dit kwam doordat de toegenomen efficiëntie de prijs van kolen verlaagde, wat de vraag stimuleerde.
In de context van AI betekent de paradox van Jevons dat zelfs als de efficiëntie van AI-modellen zoals DeepSeek toeneemt, de totale koolstofuitstoot nog steeds kan toenemen als gevolg van de brede toepassing van AI. Als AI bijvoorbeeld efficiënter wordt, kunnen bedrijven meer geneigd zijn om AI te gebruiken om meer taken te automatiseren, wat leidt tot een exponentiële toename van het AI-gebruik. Deze groei kan de voordelen van de efficiëntieverbetering tenietdoen en zelfs leiden tot een toename van de koolstofuitstoot.
Verantwoorde AI-implementatie: de sleutel tot het waarborgen van duurzaamheid
Om de paradox van Jevons te vermijden, benadrukt het Greenly-onderzoek het belang van "verantwoorde implementatie". Dit betekent dat bedrijven en individuen maatregelen moeten nemen om hun ecologische voetafdruk te verkleinen bij het gebruik van AI. Hier zijn enkele maatregelen die kunnen worden genomen:
- Gebruik van efficiënte AI-modellen: Door te kiezen voor efficiënte AI-modellen zoals DeepSeek kan het energieverbruik en de koolstofuitstoot worden verminderd.
- Optimaliseren van het gebruik van AI-modellen: Zorg ervoor dat AI-modellen alleen worden uitgevoerd wanneer dat nodig is en vermijd overmatig gebruik.
- Gebruik van hernieuwbare energie: Door hernieuwbare energie te gebruiken voor het aandrijven van datacenters en fysieke apparaten kan de koolstofuitstoot worden verminderd.
- Ondersteuning van duurzame AI-ontwikkeling: Ondersteun bedrijven en organisaties die zich inzetten voor de ontwikkeling en implementatie van duurzame AI-technologieën.
Door deze maatregelen te nemen, kunnen we ervoor zorgen dat de voordelen van AI niet ten koste gaan van het milieu.
De open-source strategie van DeepSeek AI: versnelling van innovatie en duurzame ontwikkeling
De keuze van DeepSeek AI om een deel van hun modellen open source te maken, versnelt niet alleen de innovatie van AI-technologie, maar bevordert ook tot op zekere hoogte de duurzame ontwikkeling van AI. Open source betekent dat iedereen toegang heeft tot de modelcode van DeepSeek AI, deze kan gebruiken, wijzigen en distribueren. Deze openheid brengt de volgende voordelen met zich mee:
- Innovatie versnellen: Door open source te zijn, kan DeepSeek AI meer ontwikkelaars aantrekken om deel te nemen aan de verbetering en optimalisatie van de modellen. Ontwikkelaars van over de hele wereld kunnen samenwerken om fouten in de modellen te vinden en nieuwe oplossingen voor te stellen. Dit open, collaboratieve model kan de innovatie van AI-technologie versnellen en de toepassing van AI op verschillende gebieden stimuleren.
- Verlagen van ontwikkelingskosten: Voor andere bedrijven en onderzoeksinstellingen kan het gebruik van de open-source modellen van DeepSeek AI de kosten van AI-ontwikkeling aanzienlijk verlagen. Ze hoeven hun eigen modellen niet helemaal opnieuw op te bouwen, maar kunnen de modellen van DeepSeek AI direct wijzigen en aanpassen, waardoor ze veel tijd en middelen besparen.
- Verbeteren van de toegankelijkheid van modellen: Open source maakt het voor meer mensen mogelijk om de modellen van DeepSeek AI te openen en te gebruiken. Dit helpt de popularisering van AI-technologie te bevorderen, zodat meer mensen ervan kunnen profiteren.
- Bevorderen van duurzame ontwikkeling: Door open source te zijn, kunnen meer ontwikkelaars meer te weten komen over de inspanningen van DeepSeek AI om de modelefficiëntie te verbeteren. Dit helpt duurzame AI-ontwikkelingsideeën te promoten, moedigt meer ontwikkelaars aan om aandacht te besteden aan de milieu-impact van AI en efficiëntere en milieuvriendelijkere AI-modellen te ontwikkelen.
Open source brengt echter ook enkele uitdagingen met zich mee. De veiligheid van open-source modellen is bijvoorbeeld een belangrijk probleem. Als er kwetsbaarheden in het model zitten, kunnen deze worden misbruikt door kwaadwillende aanvallers. Bovendien is de bescherming van intellectuele eigendomsrechten van open modellen een probleem dat aandacht behoeft.
Ondanks enkele uitdagingen is de open-source strategie van DeepSeek AI over het algemeen gunstig. Het versnelt de innovatie van AI-technologie, verlaagt de kosten van AI-ontwikkeling, verbetert de toegankelijkheid van modellen en bevordert de duurzame ontwikkeling van AI.
Het potentieel van DeepSeek AI in verschillende industrieën
De efficiëntie en duurzaamheid van DeepSeek AI maken het geschikt voor een breed scala aan toepassingen in verschillende industrieën. Hier zijn enkele gebieden waar DeepSeek AI een belangrijke rol kan spelen:
- Natuurlijke taalverwerking (NLP): DeepSeek AI kan worden gebruikt om efficiëntere en nauwkeurigere NLP-modellen te bouwen, waardoor toepassingen zoals machinevertaling, tekstsamenvatting, sentimentanalyse, enz. worden verbeterd.
- Computer Vision: DeepSeek AI kan worden gebruikt om efficiëntere en nauwkeurigere computervisiemodellen te bouwen, waardoor toepassingen zoals beeldherkenning, objectdetectie, videoanalyse, enz. worden verbeterd.
- Aanbevelingssystemen: DeepSeek AI kan worden gebruikt om efficiëntere en meer gepersonaliseerde aanbevelingssystemen te bouwen, waardoor de gebruikerservaring en de commerciële voordelen worden verbeterd.
- Gezondheidszorg: DeepSeek AI kan worden gebruikt om diagnoses te stellen, medicijnen te ontwikkelen, behandelingen te personaliseren, enz., waardoor de gezondheidszorg efficiënter en de prognoses van patiënten verbeterd worden.
- Financiële diensten: DeepSeek AI kan worden gebruikt voor risicobeoordeling, fraudedetectie, kwantitatieve handel, enz., waardoor de efficiëntie en veiligheid van financiële diensten worden verbeterd.
- Productie: DeepSeek AI kan worden gebruikt voor het optimaliseren van productieprocessen, kwaliteitscontrole, foutvoorspelling, enz., waardoor de productie-efficiëntie wordt verbeterd en de productiekosten worden verlaagd.
De toekomst van AI-ontwikkeling: Efficiëntie, duurzaamheid en verantwoorde implementatie
Het voorbeeld van DeepSeek AI laat zien dat de toekomst van AI-ontwikkeling steeds meer de nadruk zal leggen op efficiëntie, duurzaamheid en verantwoorde implementatie. Naarmate de AI-technologie zich blijft ontwikkelen, moeten we meer aandacht besteden aan de impact van AI op het milieu en de samenleving, en maatregelen nemen om ervoor te zorgen dat de voordelen van AI volledig worden benut, terwijl de negatieve impact ervan wordt geminimaliseerd.
Hier zijn enkele trends in de toekomstige AI-ontwikkeling:
- Modelcompressie en -optimalisatie: Onderzoekers zullen nieuwe manieren blijven onderzoeken om AI-modellen te comprimeren en te optimaliseren, waardoor de computerbehoeften en het energieverbruik van de modellen worden verminderd.
- Edge Computing: Het implementeren van AI-modellen op edge-apparaten (bijvoorbeeld smartphones, sensoren, enz.) kan de afhankelijkheid van datacenters verminderen, waardoor het energieverbruik en de latentie worden verlaagd.
- Groene AI: Steeds meer onderzoekers zullen zich richten op de ontwikkeling van groene AI, dat wil zeggen het ontwikkelen van milieuvriendelijkere en duurzamere AI-technologieën.
- AI-ethiek en -beveiliging: Er zal steeds meer aandacht worden besteed aan de ethische en veiligheidsaspecten van AI. We moeten het juiste beleid en de juiste normen ontwikkelen om de veiligheid, betrouwbaarheid en eerlijkheid van AI te waarborgen.
De verkenningen van DeepSeek AI bieden ons een goed voorbeeld van hoe we de efficiëntie van AI kunnen verbeteren en tegelijkertijd aandacht kunnen besteden aan de duurzame ontwikkeling van AI. In de toekomst kijken we ernaar uit om meer innovatieve bedrijven zoals DeepSeek AI te zien bijdragen aan het bouwen van een groener en duurzamer AI-ecosysteem.