Chinas Open-Source-KI: Mehr als DeepSeek

Die Konvergenz der chinesischen Open Source

Anfang Februar, als das chinesische Open-Source-Großmodell DeepSeek die Download-Charts der Anwendungs-Märkte in 140 Ländern und Regionen weltweit anführte, beschuldigte OpenAI DeepSeek öffentlich, destillierte Daten von ChatGPT ohne Erlaubnis verwendet zu haben.

Anstatt den Ruf von OpenAI zu retten, wurde diese Anschuldigung weltweit mit Spott von Forschern aufgenommen.

Nun ist ein weiterer Anwärter aufgetaucht, der den “Destillations”-Buff voll und ganz annimmt.

Am 13. April brachte Kunlun Wanwei die Modelle der Skywork-OR1 (Open Reasoner 1) Serie auf den Markt, die Alibabas Qwen-32B in derselben Größenordnung übertrafen und mit DeepSeek-R1 übereinstimmten.

Wie kann Kunlun Wanwei, ein Unternehmen mit begrenzten finanziellen Ressourcen, ein SOTA-Level-Großmodell erstellen? Die offizielle Erklärung ist, dass ihre Modelle auf DeepSeek-R1-Distill-Qwen-7B und DeepSeek-R1-Distill-Qwen-32B basieren.

Wie die Namen schon vermuten lassen, destillierten DeepSeek’s Modelle Alibabas Qwen-Serie von Modellen.

Während Kunlun Wanwei exzellente Open-Source-Modelle nutzt, trägt es auch zur Open-Source-Community bei. Im Gegensatz zu DeepSeek, das nur Modellgewichte als Open Source zur Verfügung stellte, hat Kunlun Wanwei auch seine Datensätze und den Trainingscode als Open Source zur Verfügung gestellt, was dem Konzept von “echtem Open Source” näher kommt. Das bedeutet, dass jeder Benutzer versuchen kann, ihren Modelltrainingsprozess zu replizieren.

Kunlun Wanweis Leistung demonstriert den wichtigsten Aspekt von Open Source: Es bietet den Benutzern nicht nur ein kostenloses und leicht verfügbares Produkt, sondern ermöglicht es auch mehr Entwicklern, auf den Schultern von Vorgängern zu stehen und die Technologie schnell und kostengünstig voranzutreiben.

In der Tat hat sich inmitten der Diskussionen der Branche über den Engpass im Vortraining großer Modelle im vergangenen Jahr das Tempo der Iteration chinesischer großer Modelle in diesem Jahr beschleunigt, wobei immer mehr Unternehmen in Open Source investieren.

Alibaba Cloud’s Tongyi Qianwen hat sein neues visuelles Modell Qwen2.5-VL am chinesischen Silvesterabend als Open Source zur Verfügung gestellt und Anfang März sein neues Reasoning-Modell Qwen-32B veröffentlicht und als Open Source zur Verfügung gestellt, das am Tag der Open-Source-Veröffentlichung die Trending-Liste der globalen Mainstream-KI-Open-Source-Community Hugging Face anführte.

Stepwise hat dann in etwa einem Monat drei multimodale große Modelle als Open Source zur Verfügung gestellt, von denen das neueste das Image-to-Video-Modell Step-Video-TI2V ist, das die Generierung von Videos mit steuerbarer Bewegungsamplitude und Linsenbewegung unterstützt und auch bestimmte Spezialeffekt-Generierungsfunktionen bietet.

Zhipu gab im April bekannt, dass es die GLM-Modelle der 32B/9B-Serie als Open Source zur Verfügung stellen wird, die Basis-, Reasoning- und Contemplative-Modelle unter der MIT-Lizenzvereinbarung abdecken.

Sogar Baidu, das einst Closed Source war, kündigte an, das Wenxin-Großmodell am 30. Juni vollständig als Open Source zur Verfügung zu stellen.

Im Vergleich zur wachsenden Prosperität des heimischen Open-Source-Ökosystems konzentrieren sich amerikanische große Modellunternehmen immer noch hauptsächlich auf Closed Source, was chinesischen großen Modellen eine seltene Gelegenheit gegeben hat, ins Ausland zu gehen. DeepSeek hat es dem indonesischen Bildungsunternehmen Ruangguru ermöglicht, sein Lehrmodell kostengünstig zu optimieren; das in Singapur ansässige B2B-Reisetechnologieunternehmen Atlas hat Qwen in sein intelligentes Kundendienstsystem integriert, um einen mehrsprachigen Support rund um die Uhr zu erreichen.

Warum Closed Source in den USA, Open Source in China?

Die Tendenz zur Closed Source in der US-amerikanischen KI-Industrie und die zunehmende Offenheit der chinesischen KI sind die unvermeidlichen Ergebnisse der unterschiedlichen KI-Entwicklungsumgebungen in den beiden Ländern.

Die US-amerikanische KI-Industrie wird hauptsächlich von Technologiegiganten und VCs (Venture Capitalists) angeführt, die große Erwartungen an die Kapitalrenditen aus KI haben. Daher haben US-amerikanische KI-Modellunternehmen im Allgemeinen einen starken Glauben an die Technologie, das heißt, sie streben nach technologischer Führung, erreichen ein gewisses Maß an Marktmonopol und erzielen dann riesige Gewinne, und ihr Ökosystem neigt natürlich zu Closed Source.

Nehmen wir die Entwicklungsgeschichte von OpenAI als Beispiel: Es begann als gemeinnützige Einrichtung während seiner Gründung, ist aber seitdem immer geschlossener geworden. GPT-1 war vollständig Open Source, GPT-2 war teilweise Open Source und stieß auf Widerstand, bevor es vollständig Open Source wurde, GPT-3 ging offiziell zu Closed Source über, und dann verstärkte GPT-4 die Closed-Source-Strategie weiter, wobei Modellarchitektur und Trainingsdaten vollständig vertraulich waren und sogar die API-Aufruffrequenz von Unternehmenskunden eingeschränkt wurde.

Obwohl OpenAI sagte, dass die Schließung der Quelle auf Compliance basiert und den Missbrauch von Technologie kontrolliert, glaubt der Markt im Allgemeinen, dass das bahnbrechende Ereignis von OpenAIs Wechsel zu Closed Source seine Hundert-Milliarden-Dollar-Kooperation mit Microsoft war, die GPT-3 in Azure-Cloud-Dienste einbettete, um einen “Technologie-Kapital”-geschlossenen Kreislauf zu bilden.

Als Microsoft seine Investition in OpenAI erstmals in seinem Finanzbericht im Oktober letzten Jahres bekannt gab, sagte es: “Wir haben in OpenAIGlobal, LLC, mit einer Gesamtinvestitionszusage von 13 Milliarden Dollar investiert, und die Investition wird nach der Equity-Methode bilanziert.”

Die sogenannte Equity-Methode kann auch so verstanden werden, dass Microsofts Investition in OpenAI darauf abzielt, Renditen zu erzielen, anstatt reine wohltätige Forschung zu betreiben. Offensichtlich ist OpenAIs Verkauf von hochpreisigen APIs über ein Closed-Source-Ökosystem seine derzeit größte Einnahmequelle und ist zum größten Hindernis für OpenAIs mangelnde Bereitschaft geworden, Open Source zu verwenden.

Anthropic, das aus OpenAIs “Aufspaltung” hervorgegangen ist, war von Anfang an entschlossen, den Closed-Source-Weg zu gehen, und sein großes Modellprodukt Claude hat das Closed-Source-Modell vollständig übernommen.

Sogar META’s Llama, der einzige Open-Source-Führer in den Vereinigten Staaten, fügte zwei Anti-Freund-Klauseln hinzu, als er Open Source zur Verfügung stellte:

  1. Open-Source-Modelle dürfen nicht für Produkte und Dienstleistungen mit mehr als 700 Millionen monatlich aktiven Benutzern verwendet werden, bevor META sie genehmigt.
  2. Die Ausgab Inhalte von Llama-Modellen dürfen nicht zum Trainieren und Verbessern anderer großer Sprachmodelle verwendet werden.

Es ist ersichtlich, dass selbst für Open-Source-Modelle das Hauptziel von Meta immer noch darin besteht, sein eigenes KI-Ökosystem aufzubauen und nicht die technische Inklusivität.

Die Vereinigten Staaten haben auf Kapital Ebene eine KI-Strategie gewählt, die auf Closed Source mit Open Source als Ergänzung basiert, was man als rein kommerzielle Überlegungen bezeichnen kann. Im Gegensatz dazu hat Chinas Top-Down-Top-Level-Design von Anfang an Wert auf Open Source gelegt, was einen branchenersten Weg unter dem Konzept der unabhängigen Kontrolle widerspiegelt.

Bereits 2017 veröffentlichte die chinesische Regierung den “New Generation Artificial Intelligence Development Plan”, der eindeutig vorschlug, die tiefe Integration von KI in Wirtschaft und Gesellschaft zu beschleunigen und den First-Mover-Vorteil der KI-Entwicklung zu nutzen. Im Jahr 2021 wurden Open-Source-bezogene Inhalte explizit in Chinas “14. Fünfjahresplan” aufgenommen, was eine aktive Förderung der technologischen Innovation durch lokale Regierungen auslöste.

Mei Hong, ein Akademiker der Chinesischen Akademie der Wissenschaften, sagte einmal, dass die zukünftige Entwicklung von Sprachmodellen auf Open-Source-Plattformen beruhen muss. Nur in einer offenen Umgebung kann die Sicherheit und Vertrauenswürdigkeit von Daten-Uploads und Geschäftsintegration für Benutzer in verschiedenen Branchen gewährleistet werden.

Der “Special Action Plan for Digital Empowerment of Small and Medium-sized Enterprises (2025-2027)”, der vom Ministerium für Industrie und Informationstechnologie und anderen vier Abteilungen im Dezember letzten Jahres herausgegeben wurde, unterstützt eindeutig die Open Atom Open Source Foundation bei der Einrichtung eines “Small and Medium-sized Enterprise AI Open Source Special Project”, um reproduzierbare und leicht zu fördernde Trainings-Frameworks, Test-Tools und andere Ressourcen bereitzustellen, um die technische Schwelle für Unternehmen zu senken.

Ein realistischeres Problem ist, dass China aufgrund der potenziellen technologischen Blockade durch die Vereinigten Staaten nicht einfach ein Nachfolger im KI-Bereich sein kann, sondern ein unabhängiges inländisches Ökosystem aufbauen muss. Ein weiteres Closed-Source-Ökosystem unter dem Ökosystem aufzubauen, das die Vereinigten Staaten bereits mit Closed Source als Hauptschwerpunkt aufgebaut haben, ist gleichbedeutend mit dem Bau eines Autos hinter verschlossenen Türen. Nur ein Open-Source-Ökosystem kann die Entwicklung der KI-Industrie schnell unterstützen.

Zusätzlich zur Unterstützung auf höchster Ebene haben verschiedene lokale Regierungen auch echtes Geld in das Open-Source-Ökosystem investiert.

Der Z Fund, der gemeinsam von Zhipu und Beijing State-owned Assets gegründet wurde und sich auf große Modell-Ökosystem-Investitionen konzentriert, kündigte an, 300 Millionen Yuan zu investieren, um die Entwicklung der KI-Open-Source-Community weltweit zu unterstützen. Jedes Startup-Projekt, das auf Open-Source-Modellen basiert (nicht beschränkt auf Zhipu-Open-Source-Modelle), kann sich bewerben.

Die Divergenz zwischen China und den Vereinigten Staaten in ihren Open-Source- und Closed-Source-Strategien für die KI-Industrie ist im Wesentlichen ein grundlegender Unterschied in der Entwicklungslogik. Die Vereinigten Staaten werden vom Kapital angetrieben, und die gewinnorientierten Forderungen von Technologiegiganten und VCs haben ein Closed-Source-Ökosystem aus “Technologiemonopol - hochpreisige Realisierung” hervorgebracht. Selbst wenn Meta versucht, Open Source zu verwenden, ist es schwierig, den Fesseln kommerzieller Barrieren zu entkommen. China verlässt sich auf das Top-Level-Design, mit “Technologie-Equity + industrielle Zusammenarbeit” als Kernkonzept, und baut ein offenes Ökosystem durch Policy Empowerment auf, wodurch Open Source zu einer grundlegenden Infrastruktur wird, um technische Schwellen zu senken und die Integration der Realwirtschaft zu fördern. Diese strategische Wahl prägt nicht nur die unterschiedlichen Wege der KI-Industrien in den beiden Ländern, sondern läutet auch die Beschleunigung des globalen KI-Ökosystems vom “Monopolwettbewerb” zum “Open und Win-Win” ein.

Gut genug ist gut genug

Chinas KI-Open-Source-Ökosystem beschleunigt nicht nur die KI-Industrialisierungsentwicklung in China und der Welt, sondern bringt auch den Glauben der Vereinigten Staaten an die Technologie an erster Stelle in eine unangenehme Falle.

Angesichts des zunehmenden Drucks durch den DeepSeek-Effekt veröffentlichte Meta am 5. April Llama4 und behauptete, es sei das stärkste multimodale große Modell der Geschichte.

Nach dem eigentlichen Test ist dies jedoch ein Modell, das enttäuschend ist. Die Kontextlänge von 10 Millionen Tokens geht oft schief, der erste Balltest ist schwer zu absolvieren, und der Größenfehler 9,11 > 9,9 tritt auf. Innerhalb weniger Tage nach dem Start des Modells wurden auch Skandale wie der Rücktritt von Führungskräften und Testbetrug von internen Mitarbeitern bestätigt.

Weitere Nachrichten beweisen, dass Llama4 als ein Produkt bezeichnet werden kann, das Zuckerberg eilig in die Regale gestellt hat. Die Frage ist also, warum musste Zuckerberg es im April auf den Markt bringen?

Wie bereits erwähnt, hat die US-amerikanische KI-Industrie einen verwirrenden Glauben an die Technologie und glaubt, dass ihre Produkte die stärksten und fortschrittlichsten sein müssen, daher haben sie ein Wettrüsten begonnen. Der abnehmende Grenznutzen des KI-Trainings hat jedoch dazu geführt, dass große Hersteller enorme Kosten verbrauchen, und nicht nur wurde die technische Schwelle nicht gebaut, sondern sie sind in den Sumpf von Rechenleistungsengpässen geraten.

Nachdem OpenAI die Bildgenerierungsfunktion von GPT-4o veröffentlicht hatte, twitterte Altman einige Tage später, dass ihre GPUs “ausbrennen”. Weniger als eine Woche nach der Veröffentlichung von Gemini2.5 sagte der Leiter von GoogleAIStudio, dass sie immer noch von “Rate Limits” geplagt werden und Entwickler nur 20 Anfragen pro Minute senden können. Es scheint, dass kein Unternehmen die Inferenzanforderungen von supergroßen Modellen bewältigen kann.

Tatsächlich geraten die Vereinigten Staaten in ein Missverständnis. Der Verantwortliche des Zhiyuan Research Institute sagte: “Wenn ein neues Modell das Hundertfache der Kosten verwendet, um eine Erhöhung des Benchmark-Scores um 10 Punkte zu erzielen, dann ist dieses neue Modell für mehr als 80 % der Anwendungsszenarien bedeutungslos, da es keine Kosteneffizienz gibt.”

Chinesische große Modellunternehmen beschleunigen das Open-Source-Ökosystem. Es scheint, dass sie nicht mehr um den ersten Platz konkurrieren, sondern stattdessen mit ihrem “Gut genug”-Ansatz mehr Kunden gewonnen haben, insbesondere Industriekunden.

Im Vergleich zu den zig Millionen Budgets für Regierungs- und Unternehmenskunden haben viele Unternehmen und Institutionen dringende KI-Bedürfnisse, aber nicht so viele bestehende Lösungen. Die Verwendung von Open-Source-Modellen zur Entwicklung eigener Lösungen ist fast zu ihrer einzigen Wahl geworden:

  • Baosteel verwendet das “große Modell + kleine Modell” für wichtige metallurgische Engineering-Prozesse zur intelligenten Frühwarnung von Produktionsanlagen.
  • Das “Coal Science Guardian Large Model ChinamjGPT” der China Coal Science and Industry Group reduziert Geräteausfallzeiten und Wartungskosten um 30 % bzw. 20 %.
  • Shanghai Mengbo Intelligent Internet of Things Technology hat eine Edge-Cutting-Erkennungs- und Continuous-Annealing-Furnace-Process-Optimierungs-Anwendungsplattform auf der Grundlage eines leichten großen Modells erstellt.
  • Mifei Technology hat die intelligente Vorhersage, Wartung und Verwaltung von automatisierten Materialhandhabungssystemen in Halbleiter-Wafer-Fabs auf der Grundlage der großen Modelltechnologie realisiert.

Dies sind alles repräsentative Fälle von Open-Source-Modellen, die in industriellen Szenarien implementiert werden.

Neben industriellen Anwendungen kann das Open-Source-Ökosystem auch mehr gemeinnützige Unternehmungen unterstützen.

Das Shanshui Nature Conservation Center setzt sich für den Schutz von Schneeleoparden und Plateau-Ökosystemen ein. Die von ihm aufgestellten Infrarotkameras machen jedes Quartal eine große Anzahl von Fotos oder Videos. Es ist äußerst ineffizient und zeitaufwendig, sich auf die manuelle Identifizierung von Schneeleopard-Spuren zu verlassen. Huawei Ascend kooperiert mit dem Shanshui Nature Conservation Center, um Schneeleopard-Spuren zu identifizieren. Huawei hat die entsprechenden Modelle und Tools für die Infrarotbild-Spezieserkennung in Sanjiangyuan als Open Source zur Verfügung gestellt, wodurch die Schwelle für die Teilnahme an der KI-Entwicklung gesenkt und mehr Forschungs- und Schutzinstitutionen, die das Modell verwenden, davon profitieren können. Die Menschen können zusammenarbeiten, um das Modell in Bezug auf Datensätze, Datenverarbeitung und Datenbereinigung zu optimieren.

Der “Basar”-Effekt von Open Source

Eric Raymond, der Fahnenträger der Open-Source-Softwarebewegung, schlug in seinem Buch “The Cathedral and the Bazaar” von 1999 eine Metapher vor: Das traditionelle, Closed-Source-Softwareentwicklungsmodell ist wie der Bau einer Kathedrale. Die Software wird sorgfältig von einigen Experten (Architekten) in einer isolierten Umgebung entworfen und gebaut und erst nach ihrer endgültigen Fertigstellung an die Benutzer freigegeben; Das Open-Source-Entwicklungsmodell ist wie ein geschäftiger, scheinbar chaotischer, aber lebendiger Basar. Die Softwareentwicklung ist offen, dezentralisiert und evolutionär.

Das Buch glaubt, dass für viele Arten von Softwareprojekten, insbesondere komplexe Software auf Systemebene (wie Betriebssystemkerne), das offene, kollaborative und dezentrale “Basar”-Entwicklungsmodell, obwohl es chaotisch erscheinen mag, tatsächlich effizienter ist, qualitativ hochwertigere und robustere Software produziert als das traditionelle, geschlossene und zentralisierte “Kathedralen”-Modell. Es kann Fehler schneller entdecken und beheben und Benutzerfeedback und Community-Beiträge besser durch Mechanismen wie “Release Early, Release Often” und die Nutzung groß angelegter Peer Reviews (“Enough Eyeballs”) aufnehmen und so die schnelle Iteration und Innovation von Software fördern.

Der große Erfolg von Open-Source-Projekten wie Linux hat Raymonds Standpunkt bestätigt.

Die Open-Source-Bewegung hat den Vereinigten Staaten und der Welt einen enormen Wert gebracht, der ihre eigenen Investitionen bei weitem übersteigt. Ein Forschungsbericht der Harvard University aus dem Jahr 2024 besagt: “Open Source investierte 4,15 Milliarden Dollar und schuf einen Wert von 8,8 Billionen Dollar für Unternehmen (d. h. jeder investierte Dollar schafft einen Wert von 2.000 Dollar). Ohne Open Source wären die Unternehmenskosten für Software 3,5-mal so hoch wie jetzt.”

Heute haben chinesische Unternehmen das gelernt. Amerikanische KI-Unternehmen scheinen es vergessen zu haben.

Tatsächlich ist die Entscheidung für chinesische große Modellunternehmen, das Open-Source-Ökosystem anzunehmen, auch wenn sie soziale Vorteile nicht berücksichtigen, für die Unternehmen selbst nicht unrentabel.

Viele große Modellunternehmen haben Observer.com mitgeteilt, dass Open Source nicht bedeutet, auf die Kommerzialisierung zu verzichten. Open Source hat immer noch die Gewinnlogik von Open Source. Im Vergleich dazu, ob es Open Source ist oder nicht, ist die Frage, wie Kunden technisch besser bedient werden können, der springende Punkt.

Nehmen wir Zhipu AI als Beispiel, das behauptet, das einzige Unternehmen in China zu sein, das OpenAI vollständig benchmarkt, aber im Vergleich zu OpenAIs Closed-Source-Strategie ist es einer der entschlossensten Praktiker der Open-Source-Strategie in der Branche.

Zhipu hat 2023 die Führung bei der Open-Source-Veröffentlichung von Chinas erstem Chat-Großmodell ChatGLM-6B übernommen. Seit seiner Gründung vor fast sechs Jahren hat Zhipu mehr als 55 Modelle als Open Source zur Verfügung gestellt, mit einem kumulativen Download-Volumen von fast 40 Millionen Mal in der internationalen Open-Source-Community.

Zhipu teilte Observer.com mit, dass Zhipu hofft, dass seine Open-Source-Strategie dazu beitragen wird, Peking zu einer “globalen Open-Source-Hauptstadt” für künstliche Intelligenz zu machen.

Konkret hat sich Zhipu auf kommerzieller Ebene dafür entschieden, ein Entwickler-Ökosystem durch Open Source anzuziehen und B-End- und G-End-Kunden kostenpflichtige kundenspezifische Lösungen anzubieten.

Neben dem Verkauf von Lösungen ist auch der Verkauf von APIs ein wichtiges Glied in der Gewinnkette.

Nehmen wir DeepSeek als Beispiel, das erste Geschäft des Open-Source-Modells ist der Verkauf von Hochleistungs-APIs. Obwohl grundlegende Dienste kostenlos sind, können Unternehmen Hochleistungs-API-Dienste anbieten und diese nutzungsabhängig abrechnen. Die API-Preise für DeepSeek-R1 betragen 1 Yuan pro Million Eingabe-Token und 16 Yuan pro Million Ausgabe-Token. Wenn das kostenlose Token-Kontingent aufgebraucht ist oder die grundlegende API die Anforderungen nicht erfüllen kann, neigen Benutzer dazu, die kostenpflichtige Version zu verwenden, um die Stabilität der Geschäftsprozesse aufrechtzuerhalten.

Im Vergleich zu Unternehmen, die nur Modelldienste anbieten, hat Alibaba ein anderes Open-Source-Monetarisierungsmodell gewählt: Ökosystem-Bündelung.

Alibabas Qwen-Serie zieht als Open-Source-Pionier Entwickler dazu an, Cloud Computing und andere Infrastrukturen durch Full-Modal-Open Source zu nutzen und so ein Closed-Loop-Szenario zu bilden. Ihr Modell ist nur eine Einführung in der frühen Phase, und die Waren mit ausgewiesenen Preisen sind eigentlich Cloud-Dienste.

Die Globalisierungsanwendung chinesischer Open-Source-Großmodelle hat sich von “Technologie-Following” zu “Ökosystem-Dominanz” verlagert. Während die Vereinigten Staaten in dem Dilemma von “Closed-Source-Monopol” und “Open-Source-Kontrolle” gefangen sind, rekonstruiert China die zugrunde liegende Logik des globalen KI-Open-Source-Ökosystems durch “Agreement Innovation + Scenario Cultivation”. Das ultimative Schlachtfeld dieses Spiels ist nicht im Wettbewerb der Parameterskala, sondern im Billionen-Dollar-Markt der tiefen Integration von KI-Technologie und der Realwirtschaft.