KI am Scheideweg: Chinas 'Kleine Tiger'

Vom großen Plan zur strategischen Neuausrichtung

Ein interner Brief des CEO von Baichuan Intelligent, einem der chinesischen ‘KI-Kleinen Tiger’, markierte das zweijährige Firmenjubiläum und hob eine strategische Neuausrichtung hervor. Der Fokus würde sich verengen und medizinischen Anwendungen Vorrang einräumen. Dies stand in krassem Gegensatz zu ihrer ursprünglichen Mission, ein bahnbrechendes Basismodell ähnlich OpenAI zu schaffen, komplett mit innovativen Anwendungen.

In ähnlicher Weise kündigte Li Kaifu, Gründer eines weiteren ‘Kleinen Tigers’, 01.AI, im Januar an, dass sein Unternehmen einen ‘kleinen, aber feinen’ Ansatz verfolgen würde. Dies war eine bemerkenswerte Abkehr von der großen Vision, eine KI 2.0-Plattform zu bauen, um die Ankunft von AGI zu beschleunigen.

Diese strategischen Rückzüge haben Spekulationen angeheizt, wobei einige Beobachter andeuten, dass diese ‘Kleinen Tiger’ eher zu ‘kranken Katzen’ werden. Wie können diese Unternehmen in einem Umfeld ständigen Wandels ihre Zukunft sichern?

Um diese Frage zu beantworten, suchte das Redaktionsteam von Zhiwei nach Einblicken von verschiedenen Experten, darunter Spezialisten für große Modelltechnologien, KI-Experten in den Bereichen Finanzen und Gesundheitswesen sowie KI-Technologieexperten von führenden Unternehmen.

Der DeepSeek-Effekt und sich verändernde Strategien

Die KI-Landschaft veränderte sich dramatisch nach der explosionsartigen Popularität von DeepSeek, einem Modell, das den Markt erschütterte. Wie ein gewaltiger Krieger störte DeepSeek die Landschaft und zwang viele KI-Unternehmen, ihre Positionen neu zu bewerten und andere Wege einzuschlagen.

Diese Transformation begann jedoch schon früher, als viele erkannten. Laut Wang Wenguang, einem Experten für große Modelltechnologien, begannen einige chinesische KI-Unternehmen bereits vor der Veröffentlichung von DeepSeek V3 und R1 mit der Aufgabe des Trainings großer Modelle. Die Kosten waren einfach zu hoch, und diese Unternehmen waren der Ansicht, dass sie nicht mit frei verfügbaren und Open-Source-Alternativen wie DeepSeek V2.5 und Alibabas Qwen 70B konkurrieren konnten.

Liang He, ein Experte eines KI-Technologiedienstleistungsunternehmens, fügte hinzu, dass, während die meisten der ‘Kleinen Tiger’ Mitte 2024 noch große Modelle trainierten, ihre Investitionen bereits deutlich gesunken waren. Bis Januar 2025, mit der Veröffentlichung von DeepSeek R1, erkannten viele kleinere Unternehmen, dass sie nicht mithalten konnten.

Diese abrupte Verlagerung verursachte eine große Richtungsänderung für die ‘Kleinen Tiger’, die sich von der AGI-Entwicklung hin zu spezialisierteren Ansätzen bewegten.

Baichuan und 01.AI haben das Vortraining großer Modelle aufgegeben und konzentrieren sich stattdessen auf medizinische KI bzw. industrielle Anwendungen. MiniMax reduziert seine B2B-Aktivitäten und konzentriert sich auf ausländische Märkte mit C-End-Videogenerierung und anderen Anwendungen. Zhipu, Moonshot AI und StepUp sind weiterhin in der Open-Source-Community aktiv, haben aber keine neuen Modelle hervorgebracht, die DeepSeek R1 übertreffen. Zhipu hat sich beträchtliche Mittel und Partnerschaften mit Regierungsunternehmen gesichert, was sein Überleben sichert. Das Hauptprodukt von Moonshot AI, Kimi, sieht seine Position durch Yuanbao bedroht, was seine Positionierung zunehmend unangenehm macht.

Insgesamt nähern sich die ‘Kleinen Tiger’ zunehmend dem B2B-SaaS-Markt an, der von einigen als ‘fantasielos’ angesehen wird.

Der Reiz und die Grenzen des B2B-Marktes

01.AI hat kürzlich seine Absicht angekündigt, DeepSeek vollständig zu integrieren, um eine One-Stop-Enterprise-Large-Model-Plattform für verschiedene Branchen zu schaffen. Dieser Schritt wurde jedoch mit Skepsis aufgenommen.

Jiang Shao, ein Finanz-KI-Experte, glaubt, dass die Zukunft von 01.AI aufgrund seines breiten Fokus, seiner mangelnden technologischer Wettbewerbsfähigkeit nach dem Aufkommen von DeepSeek und seiner begrenzten Kommerzialisierungsfähigkeiten ungewiss ist.

Wang Wenguang bekräftigte diese Einschätzung und merkte an, dass die technische Eintrittsbarriere für eine One-Stop-Large-Model-Plattform relativ niedrig ist.

Wang teilte seine Erfahrung mit der unabhängigen Entwicklung einer solchen Plattform in etwa sechs Monaten und dem Verkauf über persönliche Kanäle. Er argumentierte, dass es zwar schwierig sei, mit diesem Produkt als Unternehmen Gewinne zu erzielen, es aber als Solo-Venture profitabel sein könne.

Wang arbeitet mit mehreren B2B-Unternehmen zusammen, die große Modelldienste anbieten, denen es jedoch an einer technischen Plattform mangelt. Er bietet seine Plattform zu einem niedrigen Preis an, etwa 40.000 bis 50.000 Yuan pro Lizenz, was größere Unternehmen deutlich unterbietet.

Seine Plattform, KAF (Knowledge-based Agent Factory), verwendet Wissensgraphen, Vektordatenbanken und Suchmaschinen, um große Modell- und Agent-Anwendungen bereitzustellen. Sie ermöglicht es Benutzern, benutzerdefinierte Wissensassistenten oder Agenten ohne Programmierung durch Prompt- und Modellmanagement zu erstellen. Wang wies auf die Verbreitung ähnlicher Plattformen auf dem Markt hin, was die Nachahmung erleichtert.

Laut Wang kann ein Unternehmen, das eine B2B-Large-Model-Anwendung entwickeln möchte, schnell ein Produkt erstellen, indem es ein kleines Team von Fachkräften einstellt oder mit einem externen KI-Unternehmen zusammenarbeitet. Dieser Ansatz ist deutlich günstiger als das Trainieren eines großen Modells.

Zusätzlich zum Plattformmodell bieten integrierte Lösungen Hardware, Software und Ausführungsumgebungen und bieten sofort einsatzbereite Funktionalität. Zhang Sensen, Leiter der Technologieplattformgruppe bei Ping An Insurance, glaubt, dass integrierte Lösungen einen tragfähigen Markt haben, insbesondere bei Regierungs- und Bildungseinrichtungen mit begrenzten technischen Bereitstellungsmöglichkeiten. Diese Lösungen legen Wert auf Benutzerfreundlichkeit und technische Autonomie und bieten Vorteile wie Datensicherheit, Datenschutzkonformität und Hardware-Software-Optimierung. Sie können auch im Inland hergestellte Chips verwenden, wodurch Einschränkungen umgangen und die Effizienz verbessert wird. Unternehmen, die kostenbewusst und ROI-orientiert sind, finden integrierte Lösungen aufgrund ihrer längeren Lebenszyklen möglicherweise attraktiv.

Der heimische SaaS-Markt stand in der Vergangenheit vor Herausforderungen wie hohen Anpassungsanforderungen, generischen und homogenisierten Produkten, intensivem Wettbewerb, niedrigen Preisstrategien und einem Fokus auf kurzfristige Monetarisierung. Kunden in diesem Markt haben oft ein geringes Digitalisierungsniveau und eine begrenzte Zahlungsbereitschaft.

Im Gegensatz dazu betont der internationale SaaS-Markt die Spezialisierung, wobei sich Unternehmen auf bestimmte Bereiche konzentrieren und großen und mittelständischen Kunden mit einer höheren Zahlungsbereitschaft fundierte Dienstleistungen anbieten.

Das Feld der großen Modelle spiegelt diese Trends wider. Jüngste Ereignisse auf dem internationalen SaaS-Markt zeigen dies:

  • Im Februar 2025 erwarb MongoDB Voyage AI, ein 17 Monate altes KI-Startup mit Fokus auf Embedding- und Re-Ranking-Modelle, für 220 Millionen Dollar.
  • Im Jahr 2024 kündigte Amazon eine Technologie-Lizenzvereinbarung mit Adept an, einem zwei Jahre alten KI-Agent-Startup, wobei einige Adept-Mitglieder dem AGI-Team von Amazon beitraten.

Diese Startups erzielten Erfolge, indem sie sich auf eine bestimmte Nische innerhalb der Large-Model-Technologie konzentrierten. Solche Beispiele sind in China selten. Viele kleine und mittlere Unternehmen müssen sich ständig davor schützen, dass größere Unternehmen in ihren Bereich eindringen.

Wang Wenguang beschrieb aus seiner umfangreichen Erfahrung im B2B-Markt dessen harte Realität. Er stellte fest, dass es zwar einen großen Markt für One-Stop-Plattformen gibt, dieser jedoch fragmentiert ist. Kleinere Unternehmen mit geringeren Betriebskosten können wettbewerbsfähige Preise anbieten und größere Unternehmen unterbieten. Dies drückt den Preis für Anwendungsdienste. Selbst große Unternehmen sind dem Wettbewerb durch andere Startups und traditionelle Integratoren ausgesetzt. Große Unternehmen haben möglicherweise ihre eigenen großen Modelle und Markenvorteile, stehen aber vor ähnlichen B2B-Geschäftsstrategien.

Wie Wang sagte: ‘Ich verwende auch DeepSeek, und viele andere Unternehmen verwenden DeepSeek, es gibt also keine Differenzierung. Es gibt so viele Cloud-Anbieter in China, also wird es mindestens so viele Wettbewerber geben. Der heimische B2B-Markt war schon immer so; um zu überleben, muss man entweder starke Verbindungen, guten Service oder niedrige Preise haben.’

Liang He bot eine prägnante Einschätzung der aktuellen Entscheidungen und Zukunftsaussichten von 01.AI:

  • Die Entscheidung von Li Kaifu, das Geschäft von 01.AI vollständig auf B2B-Anwendungen zu verlagern und eine One-Stop-Enterprise-Large-Model-Plattform zu fördern, ist kommerziell sinnvoll, wird aber zu einem intensiven Wettbewerb führen.
  • Die Notwendigkeit von 01.AI, kostengünstigere Large-Model-Produkte anzubieten als größere Unternehmen, ist das Ergebnis des Mangels an einzigartigen Vorteilen auf der Anwendungsebene.
  • Der Schritt von 01.AI zu B2B signalisiert einen Verlust an Fantasie und weniger ‘sexy’ Projekte. Dies ähnelt dem Schicksal vieler Computer-Vision-Unternehmen aus der vorherigen Welle der KI im Jahr 2017.
  • 01.AI kann Möglichkeiten haben, wenn es ausländische Märkte erkundet.

Verglichen mit 01.AI sind die Meinungen über die Zukunft von Baichuan weniger pessimistisch.

Allerdings mangelt es dem Einstieg von Baichuan in den medizinischen Bereich an einzigartigen Vorteilen, insbesondere bei den Daten.

Jiang Shao sagte, dass der Wechsel von Baichuan in den medizinischen Bereich einfach ein Weg ist, um zu überleben. Im Vergleich zu 01.AI versucht Baichuan jedoch zumindest, in einen Nischenmarkt einzutreten.

Zhang Sensen erklärte, dass sie optimistischer gegenüber Unternehmen mit medizinischen Daten ist, die medizinische Large Models entwickeln, als gegenüber Technologieunternehmen. Dies gilt für jedes Unternehmen, das ein branchenspezifisches Large Model erstellen möchte. Die größte Herausforderung bei der Erstellung medizinischer Large Models liegt in den Daten, nicht im Modell selbst. Es gibt viele ausgezeichnete Krankenhäuser in China, die ein Large Model mit DeepSeek für den eigenen Gebrauch feinabstimmen können.

Wie können medizinische Daten effektiv beschafft werden? Jiang Shao sagte, dass KI-Technologie-Startups keine Vorteile bei den Daten haben. Um medizinische Large Models zu erstellen, müssen sie möglicherweise mit Unternehmen zusammenarbeiten, die bereits IT-Dienstleistungen für Krankenhäuser anbieten.

Berichten zufolge hat eines der ‘Kleinen Tiger’ eine exklusive Partnerschaft mit einem großen heimischen Ärzteaustauschforum geschlossen, um Modelle anhand der riesigen Anzahl von Fällen zu trainieren, die aus dem Ärzteaustausch generiert werden.

Neben einer optimistischeren Sicht auf Nischenmärkte haben Branchenexperten Hoffnungen in den Gründer von Baichuan, Wang Xiaochuan.

Liang He glaubt, dass der Erfolg von Wang Xiaochuan bei der Spezialisierung auf Medizin davon abhängt, ob er ein Ideal verfolgen oder Geld verdienen möchte. Er glaubt, dass Wang eher dazu neigt, ein Ideal zu verfolgen und bahnbrechende medizinische KI-Forschungsergebnisse zu erzielen.

Wang Wenguang betonte die veraltete Natur dieses Marktes. Er erklärte, dass der medizinische Bereich, wenn das Ziel eine kurzfristige Kommerzialisierung ist, ebenfalls hart umkämpft ist, ähnlich wie der gesamte B2B-Markt. Viele Unternehmen können Wissensgraphen, Vektorsuchen und große Modelle für medizinische Anwendungen verwenden.

Laut Zhiweis Gesprächen mit medizinischen KI-Experten weist die medizinische Forschung selbst erhebliche Wissenslücken auf, und neues Wissen wächst rasant. Daher besteht ein erhebliches Potenzial für die Verwendung großer Modelle zur Durchführung medizinischer Grundlagenforschung. Beispielsweise wurde das AlphaFold-Modell zur Vorhersage der Proteinstruktur von über 1,8 Millionen Wissenschaftlern weltweit verwendet, um die Forschung zu beschleunigen, einschließlich der Entwicklung von bioerneuerbaren Materialien und der Förderung der Genforschung, so Meis Medical.

Neben der Verfolgung eines Ideals oder dem Geldverdienen steht das medizinische KI-Startup auch vor der Frage, ob ein allgemeines medizinisches Large Model erstellt werden soll oder nicht.

Zhang Sensen erklärte, dass es auf dem heimischen Markt keinen Durchbruch bei allgemeinen medizinischen Large Models gegeben habe, hauptsächlich aufgrund der Abhängigkeit von leistungsstarken medizinischen Geräten für die großflächige Datenerfassung und -anwendung. Viele medizinische Einrichtungen in China sind noch nicht weit verbreitet, was es der KI erschwert, genaue Diagnosen zu stellen. Einige starke Krankenhäuser, wie die Mayo Clinic, haben jedoch begonnen, die Einführung eigener Large Models zu untersuchen. Obwohl kurzfristig nur schwer Gewinnmöglichkeiten zu erkennen sind, können diese Arten von Large Models langfristig einen tiefgreifenden Einfluss auf die medizinische Industrie haben.

Die medizinische Industrie steht auch vor der Herausforderung einer vollautomatischen Diagnose, insbesondere auf dem heimischen Markt, wo die Ausrüstung unzureichend ist und die KI herkömmliche Diagnosemethoden nicht vollständig ersetzen kann. Das Fehlen weit verbreiteter medizinischer Geräte, insbesondere in abgelegenen Gebieten, erschwert die vollständige Abdeckung der Medizintechnik, sodass die vollautomatische Diagnose eine erhebliche Herausforderung bleibt.

Die medizinische Industrie unterliegt strengen Lizenzierungs- und Compliance-Anforderungen, und Large Models müssen Compliance-Probleme angehen, wenn sie in den medizinischen Bereich eintreten. Zukünftige C-End-medizinische Dienstleistungen können die Techniken von Ärzten und KI kombinieren, um die Effizienz von Diagnose und Behandlung zu verbessern, insbesondere für jüngere Generationen.

Schließlich ist es selbst unter Missachtung der Eigenschaften des heimischen B2B-Marktes aufgrund des Wettbewerbs bei Large-Model-Anwendungen schwierig, im To B-Markt zu überleben. Wang Wenguang erklärte, dass die Designmodelle für Large-Model-To-B-Produkte zwar noch erforscht werden, sie sich aber irgendwann annähern werden. Dies gilt nicht nur in China, sondern auch in Technologieunternehmen im Silicon Valley wie OpenAI, Anthropic und Google. Solange es keinen wesentlichen Unterschied in der Leistung der Modelle selbst gibt, ist es unmöglich, in diesem Markt Geld zu verdienen, und schließlich werden alle auf dem gleichen Niveau sein.

Aus diesem Grund hat DeepSeek R1 seine größten Auswirkungen nicht in China, sondern im Ausland, insbesondere auf Technologieunternehmen im Silicon Valley. Der US-Aktienmarkt erlebte nach der Veröffentlichung von R1 hohe Volatilität und dann einen Rückgang. Die Kernlogik ist einfach: Die Large Models des Silicon Valley wurden von China eingeholt. Obwohl sie diese nicht übertreffen, hat die Unfähigkeit, die Kluft zu vergrößern, es unmöglich gemacht, solch hohe Bewertungen zu unterstützen, was zu einem Rückgang der Aktienkurse führte.

Natürlich gibt es einen weiteren Weg für den To B-Markt, Kunden anzuziehen: Open Source. Zu den primären Gewinnmodellen für Open Source gehören die Bereitstellung von kostenpflichtigen Funktionen, Cloud-Hosting und Mehrwertdiensten wie z. B. Enterprise-Level-Beratung und Schulung auf Basis von Open-Source-Technologie.

Der direkteste Effekt von Open-Source-Large-Models ist die Förderung der Popularisierung von Technologie. Zhang Sensen erklärte, dass DeepSeeks Open Source die Anwendung von Large Models durch Unternehmen erheblich beschleunigt hat. Das Top-Management unterstützt die Anwendung von Large Models sehr. Da Large Models in praktischen Anwendungen gut abschneiden, insbesondere bei der Reduzierung menschlicher Eingriffe und der Steigerung der Effizienz, wird die Unterstützung weiter zunehmen.

Die Finanzindustrie, als die Branche mit der besten Datenqualität, verfügt seit jeher über eine reiche technische Akkumulation im Bereich KI und kann schnell mithalten. Unabhängig von DeepSeek wird Finance KI-Technologie implementieren. Mit DeepSeek wird KI jedoch nicht nur die Kerngeschäfte der Finanzindustrie ermöglichen, sondern auch in täglichen Büroaufgaben und Operationen eingesetzt, die bisher nur schwer durchzuführen waren.

Operationen waren früher sehr kostspielig. Beispielsweise erforderte die Ursachenanalyse zuvor herkömmliche Betriebsüberwachung und AIOps sowie das Trainieren kleiner Modelle. Jetzt kann DeepSeek in Verbindung mit Wissensdatenbanken verwendet werden, um Anwendungspläne zu erstellen, um Überwachung, Alarme, Self-Service-Analyse und Rückverfolgbarkeit, automatisierte Verarbeitung und Stabilitätsverbesserung zu handhaben, was flexibler ist als AIOps.

Darüber hinaus hat die KI eine breitere Abdeckung von Operationen erreicht, wobei Interaktivität und Initiative stärker berücksichtigt werden. Initiative bedeutet, dass KI Operationen proaktiv ausführen kann. Durch die Abkehr von der Abhängigkeit von Regeln, Menschen oder sogar persönlicher Erfahrung, wobei das Maß an menschlicher Erfahrung das Maß an Betriebsfähigkeiten bestimmte, können jetzt leichtere KI-Modelle verwendet werden, um dies direkt zu erreichen.

Obwohl die Halluzinationsrate von DeepSeek immer noch hoch ist, selbst wenn sie sich nicht wesentlich von anderen ähnlichen Modellen unterscheidet, können seine Argumentations- und praktischen Anwendungsfähigkeiten die negativen Auswirkungen von Halluzinationen ausgleichen. Dieses Problem wird durch Feinabstimmung und Optimierung mit RAG und anderen verwandten Technologien schrittweise verbessert.

Der Experte für Large-Model-Technologie von Alibaba, Gao Peng, glaubt, dass die Auswirkungen von DeepSeek für große und kleine Unternehmen unterschiedlich sind:

Die intern von Alibaba verwendeten Large Models waren schon immer die fortschrittlichsten der Branche, daher hat das Aufkommen von DeepSeek keine wesentlichen Auswirkungen gehabt. Alibaba verwendet DeepSeek zur Leistungsbewertung und zum Vergleich und bietet mehr technische Inspiration. Die Implementierung von DeepSeek im Bereich Reasoning ist relativ schnell, und die technischen Details sind häufiger. DeepSeek wurde auch von Qianwen beeinflusst.

Im Gegensatz dazu hat DeepSeek größere Auswirkungen auf kleine und mittlere Unternehmen, da es zuvor kein Modell gab, das die Wirkung von DeepSeek erzielen und gleichzeitig eine kostengünstige, private Bereitstellung ermöglichen konnte. Nach der Veröffentlichung von DeepSeek sind viele Unternehmen entstanden, die DeepSeek-integrierte Maschinen verkaufen. DeepSeek ist jedoch im Vergleich zu vielen Open-Source-Modell-integrierten Maschinen nicht das billigste, abhängig von den jeweiligen Standards.

In jedem Fall floriert das heimische Open-Source-Large-Model jetzt und kann global konkurrieren. Basierend auf der Implementierung von Large Models durch Ping An Insurance glaubt Zhang Sensen jedoch, dass Open-Source-Large-Models immer noch unüberwindbare Einschränkungen aufweisen:

Für uns hat DeepSeek in erster Linie einen enormen Kostenvorteil. In Bezug auf die Fähigkeiten ist es in Operationsszenarien möglicherweise besser als andere Modelle in Bezug auf Argumentation, Verallgemeinerungsfähigkeit und kontextuelles Verständnis. DeepSeek schneidet jedoch in komplexeren Szenarien wie der finanziellen Risikokontrolle nicht gut ab. Dies liegt daran, dass eine detailliertere Feinabstimmung oder sogar Optimierung in Verbindung mit anderen Modellen erforderlich ist. Daher ist eine gezielte Feinabstimmung basierend auf bestimmten Anwendungsszenarien erforderlich, um die Modellleistung weiter zu verbessern.

Die selbstentwickelten Large Models von Ping An sind in zwei Schichten unterteilt: das zugrunde liegende Foundation Large Model und die Domain Models, die für Bank-, Versicherungs- und andere Geschäfte zuständig sind. Die intern verwendeten Large Models schneiden im Bereich des Fachwissens besser ab als DeepSeek, insbesondere in bestimmten Bereichen wie Finanzen und Medizin, wo die Modelle genauer sind. DeepSeek hat jedoch immer noch einen starken Vorteil in der Argumentationsfähigkeit. In einigen Szenarien möchten wir DeepSeek für einen kleinen Versuch verwenden, um zu sehen, ob er durchlaufen werden kann.

Es gibt keinen wesentlichen Unterschied zwischen Alibaba Qianwen, Baidu Wenxin und Zhipu ChatGLM und DeepSeek in dieser Hinsicht. Die Beurteilung basiert auf der Tatsache, dass diese Modelle keinen wesentlichen Unterschied zu DeepSeek in Bezug auf Argumentationsfähigkeit und Wissensbasisstruktur aufweisen.

Insgesamt sind die Auswirkungen von Open-Source-Large-Models derzeit begrenzt, und das Tempo des Wettbewerbs zwischen ihnen ist hoch.

Die Gefahren des To C-Marktes

Während der Wettbewerb im To B-Markt hart ist, bedeutet dies nicht, dass der To C-Weg mehr Hoffnung bietet.

Der Wettbewerb im To C-Markt für Large Models ist ebenfalls sehr hart, unterscheidet sich aber stark vom To B-Markt.

Die Marktlandschaft verändert sich ständig.

Die Monetarisierung von To C ist schwierig.

Die beliebtesten Anwendungen generieren nicht unbedingt den meisten Umsatz. Beispielsweise hat ChatGPT den höchsten Umsatz, aber OpenAI verliert immer noch 5 Milliarden Dollar pro Jahr, während viele ‘Nachahmer’-Anwendungen von ChatGPT wahrscheinlich eine schnelle Rentabilität erzielt haben; nachdem DeepSeek populär wurde, kamen Nachahmer und Fälscher in Scharen.

Die Beobachtung der Situation der ‘Kleinen Tiger’ vom C-End-Markt aus ist ebenfalls nicht optimistisch. Zhiweis Kommunikation mit Branchenexperten ist allgemein der Ansicht, dass große Hersteller großen Überlebensdruck ausüben werden.

Jiang Shao erklärte, dass der leistungsstärkste der ‘Kleinen Tiger’ auf dem Konsumentenmarkt Kimis Moonshot AI ist. Aber jetzt steht Tencents Yuanbao an erster Stelle, DeepSeek an zweiter Stelle und Doubao an dritter Stelle. Die Top-Drei-Unternehmen nehmen fast den größten Teil des Marktanteils ein. Tencents Yuanbao hat mit Hilfe des WeChat-Ökosystems eine große Anzahl von Kundenverkehr gewonnen, während DeepSeek sich durch seine technologische Innovation und seine hervorragende Leistung in mehreren Szenarien hervorgetan hat.

Liang He erklärte, dass die Large-Model-Technologie von Kimi sich nicht sehr von ihren Wettbewerbern unterscheidet, sodass sie nur kostenlos sein kann, was es Moonshot sehr schwer macht, sich zu kommerzialisieren. Als To C-Anwendung ist nicht klar, wo sie sich von Yuanbao und Doubao unterscheidet. Darüber hinaus kann Doubao durch Byets andere Geschäfte unterstützt werden, und Yuanbao kann durch Tencents andere Geschäfte unterstützt werden. Sie können 100 Milliarden investieren, um diese Anwendungen zu unterstützen.

Jiang Shao fügte hinzu, dass C-End-Benutzer mehr Wert auf die Benutzerfreundlichkeit des Produkts legen, worin Tencent und Byte besser sind. Natürlich hat Alibaba auch Chancen. Alibaba inkubiert eine Anwendung namens ‘AI Listening’, die KI für Chat und Interaktion verwendet und darauf abzielt, Douyin auf der Kurzvideo-Plattform zu ersetzen. Obwohl Douyin eine große Anzahl von Erstellern anzieht, um qualitativ hochwertige Inhalte zu generieren, haben KI-Chat-Anwendungen das Potenzial, Benutzergruppen anzuziehen, indem sie personalisiertere und interaktive Erfahrungen bieten. Der Unterschied zwischen den beiden liegt in der Inhaltserstellung und Interaktion. Wenn Alibaba dies durchbrechen kann, hat es auch eine Chance, das Blatt zu wenden, aber es ist schwer zu sagen, ob Tencent nachzieht.

Bezüglich MiniMax gehen die Meinungen der Branche etwas auseinander.

Liang He glaubt, dass MiniMaxs Conch AI derzeit einen guten Gewinn erzielt. Es hat seinen eigenen Weg gefunden, aber es ist noch nicht bekannt, ob dieser Weg es MiniMax ermöglichen wird, seine Bewertung ausreichend zu steigern. Aufgrund seiner Anwendungsorientierung ist MiniMax nach dem Erscheinen von DeepSeek entspannter. Wenn sie DeepSeeks Modelle verwenden, spart dies die Forschungs- und Entwicklungskosten des Modells, und seine Anwendungen können weiterhin Geld verdienen, sogar mehr.

Jiang Shao glaubt, dass MiniMax eine Chance hat, wenn es später eine beliebte APP erstellen kann, aber Alibaba kann es übertreffen und zuerst eine beliebte APP erstellen, sodass selbst wenn MiniMax eine Chance hat, die Wahrscheinlichkeit nicht hoch ist.

Letztendlich ist die Produktdifferenzierung immer noch der Durchbruchspunkt für C-End-Anwendungen.

Laut a16zs aktuellem Bericht ‘Top 100 Gen AI Consumer Apps’ erzielen viele Anwendungen mit geringer Nutzung tatsächlich bessere Umsätze. Einige Produkte mit schlechter Vielseitigkeit, wie z. B. Pflanzenidentifizierung und Ernährung, ziehen zahlende Nutzer stärker an als allgemeine Produkte.

Es ist schwierig, allgemeine KI-Produkte zu differenzieren. Benutzer haben eine geringe Zahlungsbereitschaft, der Gewinnzyklus ist lang, sodass sie große Unternehmen nicht überleben können.

Und wenn die Differenzierung nicht tief genug vertikal ist, ist es auch leicht, durch Kapazitätserweiterungen vom Basis-Large-Model internalisiert zu werden. Beispielsweise haben die jüngsten Bildgenerierungsfunktionen von GPT-4o einen Dimensionsreduktionsschlag gegen Text-zu-Bild-Startups wie Midjourney gebracht. Diese Abdeckungsfähigkeit ist oft zufällig und unvorhersehbar, wie das Sprichwort sagt: ‘Dich zu zerstören hat nichts mit dir zu tun.’

Die pixelgenaue Nachahmung von Wettbewerbern und die schnelle Aufrüstung von Basis-Large-Models sorgen dafür, dass die Landschaft der C-End-KI-Startups fast immer nur für kurze Zeit erhalten bleibt.

Was die Frage betrifft, wie man die extrem geringe Wahrscheinlichkeit ergreift, ein Hit zu werden, sind sich Branchenexperten einig, dass ‘es im Grunde keine Erfahrung gibt, der man folgen kann’.

Die ‘Kleinen Tiger’ sind in die heutige Zwangslage geraten, vor allem weil sie zu viel in das Basis-Large-Model investiert und die Arbeitskräfte, finanziellen Mittel und materiellen Ressourcen unterschätzt haben, die erforderlich sind, um auf dieser Strecke zu überleben und sich zu übertreffen, was dazu geführt hat, dass es schwierig ist, sich auf der Anwendungsstrecke zu differenzieren.

Jetzt sind die ‘Kleinen Tiger’ immer weniger entschlossen, AGI anzugreifen, und Li Kaifu hat öffentlich erklärt, dass nur DeepSeek, Ali und Byte im heimischen Basis-Large-Model übrig bleiben werden.

In dieser Hinsicht stimmen Branchenexperten, die mit Zhiwei kommunizierten, dieser Ansicht im Wesentlichen zu.

Jiang Shao sagte, dass KI-Startups, die weiterhin hart an der Large-Model-Technologie arbeiten, im Grunde sterben müssen. Das vielversprechendste ist definitiv DeepSeek, das zweite ist Alibaba und das dritte ist ByteDance. Der erste Platz wird voraussichtlich 50%-80% des Traffics erhalten, und die letzten beiden möglicherweise 10% des Traffics. Der Kern liegt darin, wer zuerst AGI macht, und wer der ultimative Gewinner ist.

DeepSeek ist derzeit der wettbewerbsfähigste im Bereich der Large Models, und seine technologische Innovation und Leistung in praktischen Anwendungen sind tadellos. Alibaba und ByteDance haben ebenfalls eine starke Wettbewerbsfähigkeit, insbesondere bei plattformübergreifenden Anwendungen und Datenressourcen. Das Ranking basiert hauptsächlich auf den Innovationsfähigkeiten jedes Unternehmens in Bezug auf Basistechnologie, Rechenleistung, Datenressourcen und praktische Anwendungen.

Die Zhipu- und Kimi-Teams sind fest davon überzeugt, dass die weitere Verbesserung der Fähigkeiten des Basismodells die Zukunft ist. Im Gegensatz dazu glaube ich, dass mit Veränderungen der Marktnachfrage und der Diversifizierung der Anwendungsszenarien der Weg der einfachen Stärkung des Basismodells begrenzt sein kann und flexiblere und anpassungsfähigere Modellentwicklungspfade auf dem Markt wettbewerbsfähiger sein können.

Der Wettbewerb in der Large-Model-Technologie ist extrem hart, und Unternehmen mit enormen Investitionen müssen schließlich eindeutige Durchbrüche in Innovation, Rechenleistung, Daten und Optimierung erzielen, um die Wettbewerbsfähigkeit aufrechtzuerhalten. Andere Unternehmen, die mit dem technologischen Fortschritt nicht mithalten können oder nicht in der Lage sind, die Marktnachfrage zu bewältigen, werden allmählich aussortiert.

Liang He sagte, dass nur DeepSeek, Ali und Byte in Zukunft im heimischen Basis-Large-Model-Unternehmen übrig bleiben werden, basierend auf der Tatsache, dass diese drei die Stärke und Entschlossenheit haben, Superressourcen in Forschung und Entwicklung zu investieren. Für Byte ist es unmöglich, die Gelegenheit für Large Models zu verpassen, da dies ansonsten große Auswirkungen auf sein Gesamtbild haben wird. Und DeepSeeks Technologie wird für Byte nicht zu viele Barrieren haben, aber DeepSeek hat derzeit einen größeren Vorteil in der F&E-Effizienz. Alibabas Qianwen-Open-Source-Modell selbst ist auf einem hohen Niveau. Bevor DeepSeek populär wurde, verfolgten sich Qianwen und Llama im Grunde genommen gegenseitig. Für Alibaba kann das Qianwen-Modell möglicherweise kein Geld verdienen, aber verwandte Cloud-Geschäfte können Geld verdienen, und Byte ist ähnlich und kann weiterhin Large-Model-Technologie verwenden, um die Erfahrung von Douyin und anderen Apps kontinuierlich zu optimieren. Für KI-Startups berührt es die Wurzel des Überlebens, wenn das Modell selbst kein Geld verdient.

Wang Wenguang sagte, dass DeepSeeks Vorteil hauptsächlich im technologischen Idealismus liegt. Innerhalb von zwei oder drei Monaten vor und nach dem Frühlingsfest war der Traffic von DeepSeek enorm. Wenn es sich kommerzialisieren wollte, würde es bald die Spitze der Welt erreichen, und andere Large Models wie Doubao hätten überhaupt keine Chance. Solange DeepSeek die Infrastruktur-bezogenen Optimierungsmethoden in der jüngsten Open-Source-Woche nicht öffnet, kann es sich in Zukunft darauf verlassen, um Geld zu verdienen, sodass andere keine Chance haben. DeepSeek wurde nicht finanziert und muss nicht von Investoren beeinflusst werden. Technologischer Idealismus und Talent sind die größten Barrieren. Verglichen mit OpenAI sind die Ergebnisse, die OpenAI jetzt sehen kann, im Grunde die Forschungsergebnisse vor dem Streit zwischen Altman und Ilya. Zumindest die Innovationspunkte wurden festgelegt. Jetzt, nach dem Ausscheiden des ursprünglichen Teams von Idealisten, hat OpenAI selbst fast keine Innovationen mehr. Derzeit ist OpenAIs Innovation eher auf Anwendungsebene, wie z. B. Deep Research. Es gibt keine Barrieren für Innovation auf Anwendungsebene, daher muss es mit Wettbewerbern konkurrieren.

Wang Mu, ein Large Factory AI-Technologieexperte, sagte Zhiwei, dass es keinen Grund gibt, Mühe in das Vortraining von Large Models zu stecken, es sei denn, es gibt Geld, Talent und Hardware. DeepSeek hatte bereits 2021 einen 10.000-Karten-Cluster und es mangelt nicht an Geld. Im Gegensatz dazu können andere kleine und mittlere Unternehmen diese Bedingung kaum zusammenstellen.

Gao Peng erklärte, dass KI-Startups überleben wollen, sie sich immer noch Anwendungen zuwenden müssen. Das habe ich schon vor ein oder zwei Jahren gedacht, und jetzt ist es vielleicht zu spät, sich zu wenden. Die erste Charge von KI-Unternehmen, die als nächstes aussortiert werden, werden diejenigen sein, die Basis-Large-Models erstellen. Large-Model-Training hat tatsächlich viele komplexe Details und ist sehr abhängig von der Ansammlung von Erfahrung. Die internen Details der Transformer-Architektur sind im Allgemeinen gut verstanden, aber die Papiere von Open-Source- oder Closed-Source-Modellen sagen Ihnen im Grunde nicht, wie die Daten vorbereitet werden, wie die Datendetails aussehen, wie groß die Datengröße ist und wie gut die Datenqualität ist. Es gibt keinen einheitlichen Standard in der Branche.

Open-Source-Open-Half war schon immer eine typische Praxis auf der Large-Model-Strecke. Derzeit gibt es nur sehr wenige Large Models, die den Code, die Gewichte, die Datensätze und den Trainingsprozess vollständig offenlegen. Die bekannteren sind OLMo, BLOOM usw.

Aber selbst wenn man sich Anwendungen zuwendet, kann man überleben? Aus der vorherigen Analyse der To B-Strecke und der To C-Strecke ist es für KI-Startups fast schwierig, ihre eigenen Branchenbarrieren in Anwendungen zu bilden. In dieser Hinsicht erklärte Gao Peng, dass der Schlüssel zur Bildung Ihrer eigenen Branchenbarrieren darin liegt, welche Daten Sie haben. Modelle können von jedem verwendet werden. Daten sind in zwei Aspekte unterteilt: Einer ist die Felderfahrung des Unternehmers und der andere sind die vorhandenen Daten.

Aus Sicht der Unternehmenskultur glaubt Gao Peng, dass Forschung und Entwicklung von Basis-Large-Models einen Geist experimenteller und ingenieurtechnischer harter Arbeit erfordern. ‘Für lange Zeit zuvor waren viele heimische KI-Startups zu hochkarätig. Wenn man Technologie betreibt, sollte man sie zuerst auf unauffällige Weise betreiben und sie dann auf auffällige Weise fördern. Einige Teams bestehen stärker aus der Wissenschaft, aber Menschen in der Wissenschaft studieren Technologie manchmal zu theoretisch. In Bezug auf Talent oder Team hängt der Erfolg eines Large-Model-Teams hauptsächlich davon ab, ob der Chef Large Models versteht. Wenn der Chef Large-Model-Technologie nicht versteht oder nicht den Glauben hat, durchzuhalten, weil es kein Geld verdient, wird es überhaupt nicht funktionieren. DeepSeeks Erfolg beruht eher auf einem Top-Down-Organisationsmodus. Der Chef versteht die technischen Details sehr gut und führt alle dazu, es gemeinsam zu tun. Es gibt zu wenige heimische Modelle, die diesem Modell entsprechen.’

Bezüglich der hitzigen Diskussion der Branche über die endgültige Gewinnerprognose des heimischen Basis-Large-Models glaubt Gao Peng, dass diese Beurteilung zu früh ist. ‘Es wird nicht viel Unterschied in den technischen Routen der Spieler geben, die am Wettbewerb teilnehmen können. Folgen Sie einfach der Transformer-Architektur und optimieren Sie detailliert. Mamba und RWKV haben ebenfalls Hoffnung. Der Schlüssel liegt darin, Dinge stetig zu tun, und die Zeit wird alles beweisen. Der endgültige Gewinner und die Top Drei sind nicht leicht zu sagen. Der Large-Model-Technologiestack ist eine sehr komplizierte Sache, und wer weiß, ob es viele Leute gibt, die stillschweigend eine Sache tun, aber die Zeit ist noch nicht gekommen.’

In der aktuellen Situation, in der es schwierig ist, den Modellgewinner zu beurteilen, sind Daten zur wichtigsten Barriere geworden. Konstantine Buhler, ein Partner bei Sequoia Capital, sagte einmal, dass ein Fehler, den OpenAI bei ChatGPT gemacht habe, darin bestand, das Bearbeiten von Antworten nicht zuzulassen, was qualitativ hochwertigere Daten im Feedback-Loop hätte liefern und eine tiefere Barriere hätte aufbauen können.

Ob Daten es einer bestimmten Branche ermöglichen können, sich mit Hilfe von KI weiterzuentwickeln oder neue Geschäftsmöglichkeiten in der Gegenwart zu bringen, ist ebenfalls sehr wichtig. Zhang Sensen sagte, dass die Reife von KI-Landungen näher an der Finanz- und Internetindustrie liegt. Ich bin optimistischer in Bezug auf KI-Büro, KI-Regierungsgeschäfte und KI-E-Commerce. Dies basiert hauptsächlich auf ihrem hohen Digitalisierungsgrad und der hohen Sicherheit der Leistung.

‘Obwohl E-Commerce relativ ausgereift ist, wird KI die Effizienz des E-Commerce weiter verbessern, insbesondere in den Bereichen Warenempfehlung, Kundenservice und Logistikoptimierung. KI kann die Effizienz von E-Commerce-Plattformen durch genauere Marktanalysen und Entscheidungsfindungsoptimierung verbessern. Diese Effizienzverbesserung wird nicht nur die Fortsetzung des Offline-Einzelhandels sein, sondern neue Formen des E-Commerce bringen, insbesondere im Bereich des grenzüberschreitenden E-Commerce, wird KI sein explosives Wachstum unterstützen.’

‘Im Gegensatz dazu erlebte die Finanzindustrie 2024 eine Leistungsexplosion, und es gibt 2025 noch viel