De Convergentie van Chinese Open Source
Begin februari, toen het Chinese open-source grote model DeepSeek de downloadlijsten van applicatiemarkten in 140 landen en regio’s wereldwijd aanvoerde, beschuldigde OpenAI DeepSeek er publiekelijk van gedistilleerde data van ChatGPT zonder toestemming te gebruiken.
In plaats van de reputatie van OpenAI te redden, werd deze beschuldiging met wijdverspreide spot van onderzoekers wereldwijd begroet.
Nu is er een andere kandidaat opgestaan, die de ‘distillatie’-buff volledig omarmt.
Op 13 april lanceerde Kunlun Wanwei de Skywork-OR1 (Open Reasoner 1) series modellen, die beter presteerden dan Alibaba’s Qwen-32B op dezelfde schaal en in lijn zijn met DeepSeek-R1.
Hoe kan Kunlun Wanwei, een bedrijf met beperkte financiële middelen, een SOTA-level groot model creëren? De officiële uitleg is dat hun modellen zijn gebaseerd op DeepSeek-R1-Distill-Qwen-7B en DeepSeek-R1-Distill-Qwen-32B.
Zoals de namen suggereren, hebben de modellen van DeepSeek de Qwen-serie modellen van Alibaba gedistilleerd.
Terwijl Kunlun Wanwei profiteert van uitstekende open-source modellen, draagt het ook bij aan de open-source community. In tegenstelling tot DeepSeek, dat alleen modelgewichten open-sourced, heeft Kunlun Wanwei ook zijn datasets en trainingscode open-sourced, wat nauwer aansluit bij het concept van ‘echte open source’. Dit betekent dat elke gebruiker kan proberen hun modeltrainingsproces te repliceren.
De prestatie van Kunlun Wanwei demonstreert het belangrijkste aspect van open source: het biedt gebruikers niet alleen een gratis en direct beschikbaar product, maar stelt ook meer ontwikkelaars in staat om op de schouders van voorgangers te staan, waardoor technologie snel en kosteneffectief kan worden bevorderd.
Te midden van de discussies in de industrie van vorig jaar over de bottleneck in het voortrainen van grote modellen, is het tempo van de iteratie van Chinese grote modellen dit jaar versneld, waarbij steeds meer bedrijven investeren in open source.
Alibaba Cloud’s Tongyi Qianwen open-sourced zijn nieuwe visuele model Qwen2.5-VL op Chinees Nieuwjaar en bracht begin maart zijn nieuwe redeneermodel QwQ-32B uit en open-sourced het, waarmee het op de dag dat het open-sourced werd de trending lijst van de wereldwijde mainstream AI open-source community Hugging Face aanvoerde.
Stepwise open-sourced vervolgens in ongeveer een maand drie multimodale grote modellen, waarvan de nieuwste het image-to-video model Step-Video-TI2V is, dat de generatie van video’s met controleerbare bewegingsamplitude en lensbeweging ondersteunt, en ook wordt geleverd met bepaalde mogelijkheden voor het genereren van speciale effecten.
Zhipu kondigde in april aan dat het de 32B/9B-serie GLM-modellen zou open-sourcen, die base-, redeneer- en contemplatieve modellen omvatten, allemaal onder de MIT-licentieovereenkomst.
Zelfs Baidu, dat ooit closed source was, kondigde aan dat het het Wenxin grote model op 30 juni volledig open source zou maken.
Vergeleken met de groeiende welvaart van het binnenlandse open-source ecosysteem, richten Amerikaanse grote modelbedrijven zich nog steeds voornamelijk op closed source, wat Chinese grote modellen een zeldzame kans heeft gegeven om naar het buitenland te gaan. DeepSeek heeft het Indonesische onderwijsbedrijf Ruangguru in staat gesteld om zijn lesmodel tegen lage kosten te optimaliseren; het Singaporese B2B-reis technologiebedrijf Atlas heeft Qwen geïntegreerd in zijn intelligente klantenservicesysteem om 24/7 meertalige ondersteuning te realiseren.
Waarom Closed Source in de VS, Open Source in China?
De neiging tot closed source in de Amerikaanse AI-industrie en de toenemende openheid van Chinese AI zijn de onvermijdelijke resultaten van de verschillende AI-ontwikkelingsomgevingen in de twee landen.
De Amerikaanse AI-industrie wordt voornamelijk geleid door techreuzen en VC’s (venture capitalists), die enorme verwachtingen hebben van kapitaalrendementen van AI. Daarom hebben Amerikaanse AI-modelbedrijven over het algemeen een sterk geloof in technologie, dat wil zeggen, het nastreven van technologisch leiderschap, het bereiken van een zekere mate van mark monopolie en vervolgens het creëren van enorme winsten, en hun ecosysteem is van nature geneigd tot closed source.
Neem de ontwikkelingsgeschiedenis van OpenAI als voorbeeld, het begon als een non-profitorganisatie tijdens de oprichting, maar is sindsdien steeds meer afgesloten geraakt. GPT-1 was volledig open source, GPT-2 was gedeeltelijk open source en stuitte op verzet voordat het volledig open source werd, GPT-3 ging officieel closed source en vervolgens versterkte GPT-4 de closed-source strategie verder, met modelarchitectuur en trainingsgegevens volledig vertrouwelijk, en zelfs het beperken van de API-aanroep frequentie van zakelijke gebruikers.
Hoewel OpenAI zei dat het sluiten van de bron is gebaseerd op compliance en het beheersen van het misbruik van technologie, gelooft de markt over het algemeen dat de mijlpaal gebeurtenis van OpenAI’s verschuiving naar closed source het bereiken was van een honderd miljard dollar samenwerking met Microsoft, waarbij GPT-3 werd ingebed in Azure cloudservices om een ‘technologie-kapitaal’ closed loop te vormen.
Toen Microsoft voor het eerst zijn investering in OpenAI onthulde in zijn financiële rapport in oktober vorig jaar, zei het: ‘We hebben geïnvesteerd in OpenAIGlobal, LLC, met een totale investeringsverplichting van $ 13 miljard, en de investering wordt verantwoord volgens de equity methode.’
De zogenaamde equity methode kan ook worden begrepen als dat Microsoft’s investering in OpenAI gericht is op het verkrijgen van rendement in plaats van puur liefdadigheidsonderzoek. Het is duidelijk dat OpenAI’s verkoop van dure API’s via een closed-source ecosysteem de huidige grootste bron van inkomsten is, en de grootste belemmering is geworden voor OpenAI’s onwil om open source te zijn.
Anthropic, dat is opgericht vanuit OpenAI’s ‘split’, is vastbesloten om vanaf het begin de closed-source route te nemen, en zijn grote modelproduct Claude heeft het closed-source model volledig overgenomen.
Zelfs META’s Llama, de enige open-source leider in de Verenigde Staten, heeft twee anti-vriend clausules toegevoegd bij het open-sourcen:
- Open-source modellen mogen niet worden gebruikt voor producten en diensten met meer dan 700 miljoen maandelijkse actieve gebruikers voordat META ze goedkeurt.
- De output content van Llama modellen mag niet worden gebruikt om andere grote taalmodellen te trainen en te verbeteren.
Het is te zien dat zelfs voor open-source modellen het belangrijkste doel van Meta nog steeds is om zijn eigen AI-ecosysteem op te bouwen in plaats van technische inclusiviteit.
De Verenigde Staten heeft een AI-strategie gekozen op basis van closed source met open source als aanvulling op kapitaal niveau, wat kan worden gezegd dat het puur commerciële overwegingen zijn. In tegenstelling hiermee heeft China’s top-down top level ontwerp van begin af aan belang gehecht aan open source, wat een industry-first pad weerspiegelt onder het concept van onafhankelijke controle.
Al in 2017 bracht de Chinese regering het ‘New Generation Artificial Intelligence Development Plan’ uit, dat duidelijk voorstelde om de diepe integratie van AI met de economie en de samenleving te versnellen en de eerste beweger voordeel van AI-ontwikkeling in te zetten. In 2021 werd open-source-gerelateerde content expliciet opgenomen in China’s ‘14e vijfjarenplan’, wat actieve promotie van technologische innovatie door lokale overheden veroorzaakte.
Mei Hong, een academicus van de Chinese Academie van Wetenschappen, zei ooit dat de toekomstige ontwikkeling van taalmodellen moet vertrouwen op open-source platforms. Alleen in een open omgeving kan de veiligheid en betrouwbaarheid van data uploads en business integratie voor gebruikers in verschillende industrieën worden gewaarborgd.
Het ‘Special Action Plan for Digital Empowerment of Small and Medium-sized Enterprises (2025-2027)’, uitgegeven door het Ministerie van Industrie en Informatietechnologie en andere vier departementen in december vorig jaar, ondersteunt duidelijk de Open Atom Open Source Foundation bij het opzetten van een ‘Small and Medium-sized Enterprise AI Open Source Special Project’ om reproduceerbare en gemakkelijk te promoten trainings frameworks, test tools en andere resources te bieden om de technische drempel voor bedrijven te verlagen.
Een meer realistisch probleem is dat China, als gevolg van de potentiële technologische blokkade door de Verenigde Staten, niet zomaar een volger kan zijn op het gebied van AI, maar een onafhankelijk binnenlands ecosysteem moet opbouwen. Het bouwen van een ander closed-source ecosysteem onder het ecosysteem dat de Verenigde Staten al hebben opgebouwd met closed source als belangrijkste focus, staat gelijk aan het bouwen van een auto achter gesloten deuren. Alleen een open-source ecosysteem kan de ontwikkeling van de AI-industrie snel helpen.
Naast top level ondersteuning hebben verschillende lokale overheden ook echt geld geïnvesteerd in het open-source ecosysteem.
Het Z Fund, gezamenlijk opgericht door Zhipu en Beijing State-owned Assets, dat zich richt op grote model ecosysteem investeringen, kondigde aan dat het 300 miljoen yuan zou investeren om de ontwikkeling van de AI open-source community wereldwijd te ondersteunen. Elk startup project gebaseerd op open-source modellen (niet beperkt tot Zhipu open-source modellen) kan zich aanmelden.
De divergentie tussen China en de Verenigde Staten in hun open-source en closed-source strategieën voor de AI-industrie is in wezen een fundamenteel verschil in ontwikkelingslogica. De Verenigde Staten worden aangedreven door kapitaal, en de winstzoekende eisen van techreuzen en VC’s hebben een closed-source ecosysteem voortgebracht van ‘technologie monopoly-high-priced realization.’ Zelfs als Meta probeert open source te zijn, is het moeilijk om te ontsnappen aan de ketenen van commerciële barrières. China vertrouwt op top level ontwerp, met ‘technologie equity + industrial collaboration’ als kernconcept, en bouwt een open ecosysteem op door middel van beleids empowerment, waardoor open source een basisinfrastructuur wordt voor het verlagen van technische drempels en het bevorderen van de integratie van de reële economie. Deze strategische keuze vormt niet alleen de verschillende paden van de AI-industrieën in de twee landen, maar kondigt ook de versnelling aan van het wereldwijde AI-ecosysteem van ‘monopoly competition’ naar ‘open and win-win.’
Goed Genoeg is Goed Genoeg
China’s AI open-source ecosysteem versnelt niet alleen de AI industrialisatie ontwikkeling in China en de wereld, maar plaatst ook de Amerikaanse overtuiging in technologie op de eerste plaats in een lastige val.
Geconfronteerd met de toenemende druk die wordt veroorzaakt door het DeepSeek effect, bracht Meta Llama4 uit op 5 april, en beweerde dat het het sterkste multimodale grote model in de geschiedenis is.
Na daadwerkelijke tests is dit echter een model dat teleurstellend is. De context lengte van 10m tokens gaat vaak fout, de initiële ball test is moeilijk te voltooien en de 9.11 > 9.9 vergelijking grootte fout treedt op. Binnen een paar dagen na de lancering van het model werden schandalen zoals ontslagen van leidinggevenden en test cheating ook bevestigd door interne medewerkers.
Meer nieuws bewijst dat Llama4 kan worden gezegd dat het een product is dat Zuckerberg haastig in de schappen heeft gezet. Dus de vraag is, waarom moest Zuckerberg het in april lanceren?
Zoals eerder vermeld, heeft de Amerikaanse AI-industrie een verwarrende overtuiging in technologie, en gelooft dat hun producten de sterkste en meest geavanceerde moeten zijn, dus zijn ze een wapenwedloop begonnen. Het afnemende marginale effect van het trainen van AI heeft er echter voor gezorgd dat grote fabrikanten enorme hoeveelheden kosten verbruiken, en niet alleen is de technische drempel niet opgebouwd, maar zijn ze in de moeras van computing power bottlenecks gevallen.
Nadat OpenAI de image generatie functie van GPT-4o had vrijgegeven, twitterde Altman een paar dagen later dat hun GPU’s ‘opbranden’. Minder dan een week nadat Gemini2.5 was uitgebracht, zei het hoofd van GoogleAIStudio dat ze nog steeds geplaagd werden door ‘rate limits’, en ontwikkelaars konden slechts 20 verzoeken per minuut verzenden. Het lijkt erop dat geen enkel bedrijf de inference behoeften van supergrote modellen aankan.
In feite valt de Verenigde Staten in een misverstand. De verantwoordelijke van het Zhiyuan Research Institute zei: ‘Als een nieuw model 100 keer de kosten gebruikt om een benchmark score van 10 punten te verhogen, dan is dit nieuwe model zinloos voor meer dan 80% van de toepassingsscenario’s, omdat er geen kostenefficiëntie is.’
Chinese grote modelbedrijven versnellen het open-source ecosysteem. Ze lijken niet langer te strijden om de toppositie, maar hebben in plaats daarvan meer klanten gewonnen, vooral industriële klanten, met hun ‘goed genoeg’ aanpak.
Vergeleken met de tientallen miljoenen budgetten voor overheid en bedrijfsklanten, hebben veel bedrijven en instellingen dringende AI-behoeften, maar hebben ze niet zoveel bestaande oplossingen. Het gebruik van open-source modellen om hun eigen oplossingen te ontwikkelen is bijna hun enige keuze geworden:
- Baosteel gebruikt het ‘grote model + kleine model’ voor belangrijke metallurgische engineering processen voor intelligente vroege waarschuwing van productieapparatuur.
- De ‘Coal Science Guardian Large Model ChinamjGPT’ van China Coal Science and Industry Group vermindert de downtime van apparatuur en de onderhoudskosten met respectievelijk 30% en 20%.
- Shanghai Mengbo Intelligent Internet of Things Technology heeft een edge-cutting detectie en continue annealing oven procesoptimalisatie applicatie platform gecreëerd op basis van een lichtgewicht groot model.
- Mifei Technology heeft intelligente voorspelling, onderhoud en beheer van geautomatiseerde materiaal handling systemen in semiconductor wafer fabs gerealiseerd op basis van grote modeltechnologie.
Dit zijn allemaal representatieve voorbeelden van open-source modellen die worden geïmplementeerd in industriële scenario’s.
Naast industrieel gebruik kan het open-source ecosysteem ook meer openbare welzijnsactiviteiten helpen.
Het Shanshui Nature Conservation Center zet zich in voor de bescherming van sneeuwluipaarden en plateau ecosystemen. De infraroodcamera’s die het opstelt, maken elk kwartaal een groot aantal foto’s of video’s. Het is uiterst inefficiënt en tijdrovend om te vertrouwen op handmatige identificatie van sneeuwluipaard sporen. Huawei Ascend werkt samen met het Shanshui Nature Conservation Center om sneeuwluipaard sporen te identificeren. Huawei heeft de relevante modellen en tools voor infrarood beeld species recognition in Sanjiangyuan open-sourced, waardoor de drempel voor deelname aan AI-ontwikkeling wordt verlaagd en meer onderzoeks- en beschermingsinstellingen die het model gebruiken, kunnen profiteren. Mensen kunnen samenwerken om het model te optimaliseren in termen van datasets, dataverwerking en datareiniging.
Het “Bazaar” Effect van Open Source
Eric Raymond,de vaandeldrager van de open-source software beweging, stelde een metafoor voor in zijn boek “The Cathedral and the Bazaar” uit 1999: Het traditionele, closed-source software ontwikkelingsmodel is als het bouwen van een kathedraal. De software wordt zorgvuldig ontworpen en gebouwd door een paar experts (architecten) in een geïsoleerde omgeving en wordt pas aan gebruikers vrijgegeven nadat deze eindelijk is voltooid; Het open-source ontwikkelingsmodel is als een bruisende, schijnbaar chaotische maar levendige bazaar. Software ontwikkeling is open, gedecentraliseerd en evolutionair.
Het boek is van mening dat voor veel soorten software projecten, met name complexe software op systeemniveau (zoals operating system kernels), het open, collaboratieve en gedecentraliseerde ‘bazaar’ ontwikkelingsmodel, hoewel het misschien chaotisch lijkt, eigenlijk efficiënter is, software van hogere kwaliteit produceert en robuuster is dan het traditionele, gesloten en gecentraliseerde ‘kathedraal’ model. Het kan fouten sneller ontdekken en verhelpen en beter feedback van gebruikers en community bijdragen absorberen via mechanismen zoals ‘release early, release often’ en het benutten van grootschalige peer review (‘enough eyeballs’), waardoor de snelle iteratie en innovatie van software wordt bevorderd.
Het enorme succes van open-source projecten zoals Linux heeft Raymond’s punt geverifieerd.
De open-source beweging heeft de Verenigde Staten en de wereld een enorme waarde gebracht die veel groter is dan de eigen investering. Een onderzoeksrapport uit 2024 van Harvard University verklaarde: ‘Open-source investeerde $ 4,15 miljard en creëerde $ 8,8 biljoen aan waarde voor bedrijven (dat wil zeggen, elke geïnvesteerde $ 1 creëert $ 2.000 aan waarde). Zonder open source zouden de bedrijfsuitgaven aan software 3,5 keer zo hoog zijn als nu.’
Vandaag hebben Chinese bedrijven dit geleerd. Amerikaanse AI-bedrijven lijken het vergeten te zijn.
In feite is het voor Chinese grote modelbedrijven, zelfs als ze geen rekening houden met maatschappelijke voordelen, niet onrendabel voor de bedrijven zelf om ervoor te kiezen het open-source ecosysteem te omarmen.
Veel grote modelbedrijven hebben aan Observer.com verteld dat open source niet betekent dat je de commercialisering opgeeft. Open source heeft nog steeds de winstlogica van open source. Vergeleken met de vraag of het open source is of niet, is het de belangrijkste vraag hoe je klanten technisch beter kunt bedienen.
Neem Zhipu AI als voorbeeld, het beweert het enige bedrijf in China te zijn dat volledig benchmarkt met OpenAI, maar vergeleken met OpenAI’s closed-source strategie is het een van de meest vastberaden beoefenaars van de open-source strategie in de industrie.
Zhipu nam het voortouw in het open-sourcen van China’s eerste Chat grote model ChatGLM-6B in 2023. Sinds de oprichting bijna zes jaar geleden heeft Zhipu meer dan 55 modellen open-sourced, met een cumulatief download volume van bijna 40 miljoen keer in de internationale open-source community.
Zhipu vertelde Observer.com dat Zhipu hoopt dat zijn open-source strategie zal bijdragen aan het opbouwen van Beijing tot een ‘wereldwijde open-source hoofdstad’ voor kunstmatige intelligentie.
Concreet heeft Zhipu op commercieel niveau ervoor gekozen om een ontwikkelaars ecosysteem aan te trekken via open source en betaalde aangepaste oplossingen te bieden aan B-end en G-end klanten.
Naast het verkopen van oplossingen is het verkopen van API’s ook een belangrijke winst schakel.
Neem DeepSeek als voorbeeld, de eerste business van het open-source model is de verkoop van high-performance API’s. Hoewel basisdiensten gratis zijn, kunnen bedrijven high-performance API-diensten leveren en kosten in rekening brengen op basis van gebruik. De API-prijzen voor DeepSeek-R1 zijn 1 yuan per miljoen input tokens en 16 yuan per miljoen output tokens. Als het gratis token quota is opgebruikt of de basis-API niet aan de behoeften kan voldoen, hebben gebruikers de neiging om de betaalde versie te gebruiken om de stabiliteit van bedrijfsprocessen te behouden.
Vergeleken met bedrijven die alleen modeldiensten hebben, heeft Alibaba een ander open-source monetization model gekozen: ecosysteem bundling.
Alibaba’s Qwen-serie, als een open-source pionier, trekt ontwikkelaars aan om cloud computing en andere infrastructuur te gebruiken door middel van full-modal open source, waardoor een closed-loop scenario wordt gevormd. Hun model is slechts een introductie in de vroege fase, en de goederen met gemarkeerde prijzen zijn eigenlijk clouddiensten.
De globalisering toepassing van Chinese open-source grote modellen is verschoven van ‘technology following’ naar ‘ecosysteem dominance.’ Wanneer de Verenigde Staten verstrikt raken in het dilemma van ‘closed-source monopoly’ en ‘open-source out of control’, reconstrueert China de onderliggende logica van het wereldwijde AI open-source ecosysteem door middel van ‘agreement innovation + scenario cultivation.’ Het uiteindelijke slagveld van dit spel is niet in de concurrentie van parameter schaal, maar in de biljoenen dollar markt van diepe integratie van AI-technologie en de reële economie.