DeepSeek: Aufstieg eines chinesischen KI-Kraftwerks | de

DeepSeek, ein Name, der in der globalen KI-Diskussion rasch von relativer Unbekanntheit zu einem Dreh- und Angelpunkt aufgestiegen ist, hat in der Technologie- und Finanzbranche heftige Debatten und Spekulationen ausgelöst. Das chinesische KI-Labor hinter dieser aufstrebenden Kraft hat die etablierte Ordnung durcheinandergebracht und Analysten veranlasst, die Nachhaltigkeit der US-Dominanz im KI-Wettrennen und die langfristige Tragfähigkeit der aktuellen KI-Chip-Nachfrage in Frage zu stellen. Aber was sind die Schlüsselfaktoren, die DeepSeek zu seiner gegenwärtigen Bedeutung verholfen haben?

Die Entstehung von DeepSeek: Vom Hedgefonds zum KI-Labor

Die Ursprünge von DeepSeek sind eng mit der Welt der quantitativen Finanzierung verbunden. Es wird von High-Flyer Capital Management unterstützt, einem chinesischen Hedgefonds, der für seinen Einsatz von KI bei datengesteuerten Handelsentscheidungen bekannt ist.

Liang Wenfeng, ein KI-Enthusiast mit einem Hintergrund im Handel während seiner Zeit an der Zhejiang-Universität, gründete High-Flyer im Jahr 2015 mit. Im Jahr 2019 lancierte er High-Flyer Capital Management als Hedgefonds mit einem besonderen Fokus auf die Entwicklung und Implementierung von KI-Algorithmen für Finanzanwendungen.

Im Jahr 2023 inkubierte High-Flyer DeepSeek als ein dediziertes KI-Forschungslabor, das unabhängig von seinem Kerngeschäft im Finanzbereich operiert. In der Folge wurde das Labor mit High-Flyer als Hauptinvestor in eine separate Einheit ausgegliedert, wobei der Name DeepSeek beibehalten wurde.

Von Anfang an priorisierte DeepSeek die Einrichtung eigener Rechenzentrumscluster, um das Modelltraining zu erleichtern. Ähnlich wie andere in China tätige KI-Unternehmen ist DeepSeek jedoch aufgrund von US-Exportbeschränkungen für fortschrittliche Hardware auf Herausforderungen gestossen. Um seine neueren Modelle zu trainieren, musste das Unternehmen daher auf Nvidia H800-Chips zurückgreifen, eine weniger leistungsstarke Variante der H100-Chips, die US-Unternehmen leicht zur Verfügung stehen.

Das technische Team von DeepSeek ist bekannt für seine Jugendlichkeit und Dynamik. Das Unternehmen rekrutiert aktiv promovierte KI-Forscher von führenden chinesischen Universitäten. Darüber hinaus beschäftigt DeepSeek Personen mit unterschiedlichem Hintergrund, auch solche ohne Informatikkenntnisse, um sicherzustellen, dass seine Technologie eine breite Palette von Themen effektiv verstehen und bedienen kann, wie die New York Times berichtete.

DeepSeeks KI-Modelle: Den Status Quo in Frage stellen

DeepSeek enthüllte seine erste Suite von Modellen – DeepSeek Coder, DeepSeek LLM und DeepSeek Chat – im November 2023. Es war jedoch die Veröffentlichung seiner DeepSeek-V2-Modellfamilie der nächsten Generation im Frühjahr, die die Aufmerksamkeit der KI-Industrie wirklich auf sich zog.

DeepSeek-V2, ein vielseitiges System, das sowohl Text als auch Bilder analysieren kann, zeigte eine beeindruckende Leistung in verschiedenen KI-Benchmarks. Bemerkenswert ist, dass es diese Leistung zu deutlich geringeren Kosten im Vergleich zu konkurrierenden Modellen erzielte, die zu dieser Zeit verfügbar waren. Dies veranlasste die inländischen Rivalen von DeepSeek, darunter ByteDance und Alibaba, die Preise einiger ihrer Modelle zu senken und andere völlig kostenlos anzubieten.

DeepSeek V3 hat eine überlegene Leistung im Vergleich zu sowohl herunterladbaren Open-Source-Modellen wie Metas Llama als auch zu "geschlossenen" Modellen gezeigt, die nur über APIs zugänglich sind, wie z. B. OpenAIs GPT-4o.

Ebenso bemerkenswert ist DeepSeeks R1 "Reasoning"-Modell. DeepSeek behauptet, dass R1, das im Januar auf den Markt kam, eine vergleichbare Leistung wie OpenAIs o1-Modell bei wichtigen Benchmarks erzielt.

Als Reasoning-Modell enthält R1 Selbstprüfungsmechanismen, die einige der mit Standardmodellen verbundenen häufigen Fallstricke mildern. Während Reasoning-Modelle möglicherweise etwas längere Verarbeitungszeiten benötigen, um zu Lösungen zu gelangen (von Sekunden bis zu Minuten), weisen sie in Bereichen wie Physik, Wissenschaft und Mathematik tendenziell eine höhere Zuverlässigkeit auf.

Die Modelle von DeepSeek, einschliesslich R1 und DeepSeek V3, unterliegen jedoch der Aufsicht der chinesischen Internetaufsichtsbehörde, die sicherstellt, dass ihre Antworten mit den "sozialistischen Kernwerten" übereinstimmen. In DeepSeeks Chatbot-App wird R1 beispielsweise keine Fragen zum Tiananmen-Platz oder zur Autonomie Taiwans beantworten.

Im März überstieg der Website-Traffic von DeepSeek 16,5 Millionen Besuche. Trotz eines Rückgangs des Traffics um 25 % im Vergleich zum Februar belegte DeepSeek laut David Carr, Redakteur bei Similarweb, den zweiten Platz in Bezug auf die täglichen Besuche. Diese Zahl verblasst jedoch im Vergleich zu ChatGPT, das im März 500 Millionen wöchentlich aktive Nutzer überschritt.

Ein disruptiver Ansatz für die KI-Landschaft

Das Geschäftsmodell von DeepSeek bleibt etwas rätselhaft. Das Unternehmen bepreist seine Produkte und Dienstleistungen deutlich unter dem Marktwert und bietet sogar einige kostenlos an. Darüber hinaus hat es sich trotz des grossen Interesses von Risikokapitalfirmen externen Finanzierungen widersetzt.

DeepSeek führt seine extreme Wettbewerbsfähigkeit bei den Kosten auf Durchbrüche in der Effizienz zurück. Einige Experten haben jedoch die Richtigkeit der vom Unternehmen vorgelegten Zahlen in Frage gestellt.

Ungeachtet dessen haben Entwickler die Modelle von DeepSeek angenommen, die zwar nicht im traditionellen Sinne Open Source sind, aber unter permissiven Lizenzen verfügbar sind, die die kommerzielle Nutzung ermöglichen. Laut Clem Delangue, CEO von Hugging Face, haben Entwickler auf der Plattform über 500 abgeleitete Modelle von R1 erstellt, die insgesamt 2,5 Millionen Downloads angesammelt haben.

Der Erfolg von DeepSeek gegenüber grösseren, etablierteren Wettbewerbern wurde sowohl als "Umkrempelung der KI" als auch als "überbewertet" beschrieben. Die Erfolge des Unternehmens waren teilweise für einen Rückgang des Nvidia-Aktienkurses um 18 % im Januar verantwortlich und veranlassten eine öffentliche Reaktion von OpenAI-CEO Sam Altman. Im März verboten Büros des US-Handelsministeriums DeepSeek Berichten zufolge auf Regierungsgeräten, wie Reuters berichtete.

Microsoft hat DeepSeek in seinen Azure AI Foundry Service integriert, eine Plattform, die KI-Dienste für Unternehmen konsolidiert. Während der Telefonkonferenz von Meta zu den Ergebnissen des ersten Quartals erklärte CEO Mark Zuckerberg, dass Investitionen in die KI-Infrastruktur weiterhin ein "strategischer Vorteil" für das Unternehmen sein würden, als er nach den potenziellen Auswirkungen von DeepSeek auf Metas KI-Ausgaben gefragt wurde. Im März bezeichnete OpenAI DeepSeek als "staatlich subventioniert" und "staatlich kontrolliert" und empfahl der US-Regierung, ein Verbot seiner Modelle in Erwägung zu ziehen.

Während der Telefonkonferenz von Nvidia zu den Ergebnissen des vierten Quartals hob CEO Jensen Huang DeepSeeks "ausgezeichnete Innovation" hervor und stellte fest, dass seine Reasoning-Modelle deutlich mehr Rechenleistung benötigen, was Nvidia zugute kommt.

Umgekehrt haben einige Unternehmen, Länder und Regierungen, darunter Südkorea und der US-Bundesstaat New York, die Verwendung von DeepSeek auf Regierungsgeräten verboten.

Im Mai sagte Microsoft Vice Chairman und President Brad Smith vor dem Senat aus, dass Microsoft-Mitarbeitern die Verwendung von DeepSeek aufgrund von Bedenken hinsichtlich der Datensicherheit und potenzieller Propaganda untersagt ist.

Die ungewisse Zukunft von DeepSeek

Die zukünftige Entwicklung von DeepSeek bleibt ungewiss. Während weitere Modellverbesserungen erwartet werden, scheint die US-Regierung zunehmend besorgt über vermeintlich schädliche ausländische Einflüsse zu sein. Im März berichtete das Wall Street Journal, dass die USA DeepSeek wahrscheinlich auf Regierungsgeräten verbieten werden.

DeepSeeks rasanter Aufstieg hat unbestreitbar die Grundlagen der KI-Industrie erschüttert und zu einer Neubewertung der Wettbewerbsdynamik und des Potenzials für disruptive Innovationen geführt. Ob es seine gegenwärtige Dynamik angesichts zunehmender Kontrolle und regulatorischer Herausforderungen aufrechterhalten kann, bleibt abzuwarten. Die kommenden Jahre werden entscheidend sein, um DeepSeeks langfristige Auswirkungen auf die globale KI-Landschaft zu bestimmen. Seine Fähigkeit, das komplexe Zusammenspiel von technologischem Fortschritt, geopolitischen Erwägungen und ethischen Bedenken zu meistern, wird letztendlich sein Vermächtnis bestimmen. Die KI-Welt wird genau zusehen.

Die DeepSeek-Geschichte erinnert daran, dass in der sich schnell entwickelnden Welt der künstlichen Intelligenz neue Akteure schnell auftauchen und die etablierte Ordnung in Frage stellen können. Der Erfolg des Unternehmens, der auf innovativer Technologie und der Bereitschaft basiert, traditionelle Geschäftsmodelle aufzubrechen, hat die Branche gezwungen, Notiz zu nehmen. Da DeepSeek seine Reichweite weiterentwickelt und ausbaut, wird es zweifellos eine bedeutende Rolle bei der Gestaltung der Zukunft der KI spielen.

aktualisiert am 2025-05-10

# LLM # AIGC # DeepSeek