De snelle evolutie van AI-technologie in China heeft zowel opwinding als onzekerheid gebracht voor veel startups. Sommige bedrijven, die ooit vol ambitieuze doelen zaten, zijn nu hun strategieën aan het herijken, geconfronteerd met de harde realiteit van een competitieve en resource-intensieve markt.
Van Grootse Visies naar Strategische Pivots
Een recente interne brief van de CEO van een van China’s ‘AI Kleine Tijgers’, Baichuan Intelligent, markeerde het tweede jubileum van het bedrijf en benadrukte een strategische verschuiving. De focus zou worden vernauwd, waarbij medische toepassingen prioriteit zouden krijgen. Dit contrasteerde scherp met de oorspronkelijke missie om een baanbrekend basismodel te creëren, vergelijkbaar met OpenAI, compleet met innovatieve toepassingen.
Evenzo kondigde Li Kaifu, oprichter van een andere ‘Kleine Tijger’, 01.AI, in januari aan dat zijn bedrijf een ‘kleine maar mooie’ aanpak zou omarmen. Dit was een opmerkelijk vertrek van de grootse visie om een AI 2.0-platform te bouwen om de komst van AGI te versnellen.
Deze strategische terugtrekkingen hebben speculatie aangewakkerd, waarbij sommige waarnemers suggereren dat deze ‘Kleine Tijgers’ meer op ‘zieke katten’ beginnen te lijken. Hoe kunnen deze bedrijven, in een omgeving die wordt gekenmerkt door constante verandering, hun toekomst veiligstellen?
Om deze vraag te beantwoorden, zocht het redactieteam van Zhiwei inzichten van verschillende experts, waaronder specialisten in grote modeltechnologie, AI-experts in de financiële wereld en de gezondheidszorg, en AI-tech experts van toonaangevende bedrijven.
Het DeepSeek Effect en Veranderende Strategieën
Het AI-landschap veranderde dramatisch na de explosieve populariteit van DeepSeek, een model dat de markt deed schudden. Als een formidabele krijger verstoorde DeepSeek het landschap, waardoor veel AI-bedrijven hun posities moesten heroverwegen en andere wegen moesten inslaan.
Deze transformatie begon echter nog eerder dan velen zich realiseerden. Volgens Wang Wenguang, een expert in grote modeltechnologie, begonnen sommige Chinese AI-bedrijven al met het opgeven van het nastreven van grootschalige modeltraining, nog voor de release van DeepSeek V3 en R1. De kosten waren simpelweg te hoog en deze bedrijven voelden zich niet in staat om te concurreren met vrij beschikbare en open-source alternatieven zoals DeepSeek V2.5 en Alibaba’s Qwen 70B.
Liang He, een expert van een AI-technologie servicebedrijf, voegde eraan toe dat hoewel de meeste ‘Kleine Tijgers’ medio 2024 nog steeds grote modellen trainden, hun investeringen al aanzienlijk waren gedaald. In januari 2025, met de release van DeepSeek R1, realiseerden veel kleinere bedrijven zich dat ze het niet konden bijbenen.
Deze abrupte verschuiving veroorzaakte een grote verandering in de richting voor de ‘Kleine Tijgers’, waarbij ze afstapten van AGI-ontwikkeling en overgingen naar meer gespecialiseerde benaderingen.
Baichuan en 01.AI hebben het pre-trainen van grote modellen opgegeven en richten zich respectievelijk op medische AI en industriële toepassingen. MiniMax vermindert zijn B2B-activiteiten en richt zich op overzeese markten met C-end videogeneratie en andere toepassingen. Zhipu, Moonshot AI en StepUp zijn nog steeds actief in de open-source community, maar hebben geen nieuwe modellen geproduceerd die beter presteren dan DeepSeek R1. Zhipu heeft aanzienlijke financiering en partnerschappen met de overheid en bedrijven veiliggesteld, waardoor zijn overleving is verzekerd. Moonshot AI’s belangrijkste product, Kimi, heeft zijn positie bedreigd gezien door Yuanbao, waardoor zijn positionering steeds ongemakkelijker wordt.
Over het algemeen convergeren de ‘Kleine Tijgers’ steeds meer met de B2B SaaS-markt, die sommigen als ‘fantasieloos’ beschouwen.
De Aantrekkingskracht en Beperkingen van de B2B Markt
01.AI heeft onlangs zijn intentie aangekondigd om DeepSeek volledig te integreren om een one-stop enterprise large model platform te creëren voor verschillende industrieën. Deze stap is echter met scepsis ontvangen.
Jiang Shao, een financiële AI-expert, gelooft dat de toekomst van 01.AI onzeker is vanwege de brede focus, het gebrek aan technologische concurrentiekracht na de opkomst van DeepSeek en de beperkte commercialiseringsmogelijkheden.
Wang Wenguang herhaalde dit sentiment en merkte op dat de technische drempel om een one-stop large model platform te betreden relatief laag is.
Wang deelde zijn ervaring met het zelfstandig ontwikkelen van een dergelijk platform in ongeveer zes maanden, en het verkopen via persoonlijke kanalen. Hij stelde dat hoewel het moeilijk is om winst te maken met dit product als bedrijf, het als solo-onderneming winstgevend kan zijn.
Wang werkt samen met verschillende B2B-bedrijven die grote modeldiensten aanbieden, maar geen technisch platform hebben. Hij levert zijn platform tegen lage kosten, ongeveer 40.000 tot 50.000 yuan per licentie, wat aanzienlijk lager is dan bij grotere bedrijven.
Zijn platform, KAF (Knowledge-based Agent Factory), maakt gebruik van knowledge graphs, vector databases en zoekmachines om grote model- en Agent-toepassingen te leveren. Het stelt gebruikers in staat om custom knowledge assistants of Agents te creëren zonder te coderen via prompt- en modelbeheer. Wang merkte de prevalentie van vergelijkbare platforms in de markt op, waardoor het gemakkelijk te repliceren is.
Volgens Wang kan een bedrijf dat een B2B large model-toepassing wil ontwikkelen, snel een product creëren door een klein team van geschoolde personen in te huren of samen te werken met een extern AI-bedrijf. Deze aanpak is aanzienlijk goedkoper dan het trainen van een groot model.
Naast het platformmodel bieden geïntegreerde oplossingen hardware, software en uitvoeringsomgevingen, die kant-en-klare functionaliteit bieden. Zhang Sensen, hoofd van de technologieplatformgroep bij Ping An Insurance, gelooft dat geïntegreerde oplossingen een levensvatbare markt hebben, met name bij overheids- en onderwijsinstellingen met beperkte technische implementatiemogelijkheden. Deze oplossingen geven prioriteit aan gebruiksgemak en technische autonomie en bieden voordelen zoals databeveiliging, privacycompliance en hardware-software-optimalisatie. Ze kunnen ook gebruik maken van in eigen land geproduceerde chips, waardoor beperkingen worden omzeild en de efficiëntie wordt verbeterd. Bedrijven die kostenbesparend en ROI-gericht zijn, kunnen geïntegreerde oplossingen aantrekkelijk vinden vanwege hun langere levenscycli.
De binnenlandse SaaS-markt heeft in het verleden te maken gehad met uitdagingen zoals hoge aanpassingsvereisten, generieke en gehomogeniseerde producten, intense concurrentie, lage prijsstrategieën en een focus op korte termijn winstgenerering. Klanten in deze markt hebben vaak een lage digitaliseringsgraad en een beperkte bereidheid om te betalen.
Daarentegen benadrukt de internationale SaaS-markt specialisatie, waarbij bedrijven zich concentreren op specifieke gebieden en diepgaande diensten verlenen aan grote en middelgrote klanten met een grotere bereidheid om te betalen.
Het grote modelveld weerspiegelt deze trends. Recente gebeurtenissen in de internationale SaaS-markt laten dit zien:
- In februari 2025 nam MongoDB Voyage AI over, een 17 maanden oude AI-startup gericht op embedding- en re-ranking modellen, voor $220 miljoen.
- In 2024 kondigde Amazon een technologie licentieovereenkomst aan met Adept, een twee jaar oude AI Agent-startup, waarbij enkele Adept-leden zich aansloten bij Amazon’s AGI-team.
Deze startups behaalden succes door zich te richten op een specifieke niche binnen de grote modeltechnologie. Dergelijke voorbeelden zijn zeldzaam in China. Veel kleine en middelgrote ondernemingen moeten zich voortdurend beschermen tegen het betreden van grotere bedrijven in hun ruimte.
Wang Wenguang, puttend uit zijn uitgebreide ervaring in de B2B-markt, beschreef de harde realiteit ervan. Hij merkte op dat hoewel er een grote markt is voor one-stop platforms, deze gefragmenteerd is. Kleinere bedrijven met lagere operationele kosten kunnen concurrerende prijzen aanbieden, waardoor grotere bedrijven worden onderboden. Dit drijft de prijs van applicatiediensten omlaag. Zelfs grote bedrijven worden geconfronteerd met concurrentie van andere startups en traditionele integrators. Grote bedrijven hebben wellicht hun eigen grote modellen en merkvoordelen, maar ze worden geconfronteerd met vergelijkbare B2B-bedrijfsstrategieën.
Zoals Wang verklaarde: “Ik gebruik ook DeepSeek, en veel andere bedrijven gebruiken DeepSeek, dus er is geen differentiatie. Er zijn zoveel cloudleveranciers in China, dus er zullen minstens zoveel concurrenten zijn. De binnenlandse B2B-markt is altijd al zo geweest; om te overleven, moet je sterke connecties, goede service of lage prijzen hebben.”
Liang He bood een beknopte beoordeling van de huidige keuzes en toekomstige vooruitzichten van 01.AI:
- Li Kaifu’s beslissing om 01.AI’s business volledig te verschuiven naar B2B-toepassingen en een one-stop enterprise large model platform te promoten, is commercieel gezien verstandig, maar zal leiden tot intense concurrentie.
- De noodzaak van 01.AI om lager geprijsde large model-producten aan te bieden dan grotere bedrijven is een gevolg van het gebrek aan unieke voordelen op de applicatielaag.
- 01.AI’s overstap naar B2B signaleert een verlies van verbeeldingskracht en minder ‘sexy’ projecten. Dit is vergelijkbaar met het lot van veel computer vision-bedrijven uit de vorige golf van AI in 2017.
- 01.AI kan kansen hebben als het overzeese markten verkent.
In vergelijking met 01.AI zijn de meningen over de toekomst van Baichuan minder pessimistisch.
De toetreding van Baichuan tot het medische veld mist echter unieke voordelen, vooral op het gebied van data.
Jiang Shao zei dat Baichuans verschuiving naar medische toepassingen simpelweg een manier is om te overleven. In vergelijking met 01.AI probeert Baichuan echter ten minste een nichemarkt te betreden.
Zhang Sensen verklaarde dat ze optimistischer is over bedrijven met medische data die medische large models ontwikkelen dan technologiebedrijven. Dit geldt voor elk bedrijf dat een branchespecifiek large model wil creëren. De belangrijkste uitdaging bij het creëren van medische large models ligt in data, niet in het model zelf. Er zijn veel uitstekende ziekenhuizen in China die een large model kunnen finetunen met behulp van DeepSeek voor eigen gebruik.
Hoe kunnen medische data effectief worden verkregen? Jiang Shao zei dat AI-technologie startups geen voordelen hebben op het gebied van data. Om medische large models te creëren, moeten ze mogelijk samenwerken met bedrijven die al IT-diensten aan ziekenhuizen leveren.
Naar verluidt heeft een van de ‘Kleine Tijgers’ een exclusieve samenwerking gesloten met een groot binnenlands dokter uitwisselingsforum om modellen te trainen met behulp van het grote aantal cases dat voortkomt uit dokter uitwisselingen.
Naast een meer optimistische kijk op nichemarkten, hebben experts in de industrie hoop voor Baichuans oprichter, Wang Xiaochuan.
Liang He gelooft dat of Wang Xiaochuan erin slaagt zich te specialiseren in de geneeskunde afhangt van of hij een ideaal wil nastreven of geld wil verdienen. Hij gelooft dat Wang meer geneigd is om een ideaal na te streven en baanbrekende medische AI-onderzoeksresultaten te creëren.
Wang Wenguang benadrukte het verouderde karakter van deze markt. Hij stelde dat als het doel korte termijn commercialisering is, het medische veld ook zeer competitief is, vergelijkbaar met de algehele B2B-markt. Veel bedrijven kunnen knowledge graphs, vector searches en large models gebruiken voor medische toepassingen.
Volgens Zhiwei’s discussies met medische AI-experts heeft medisch onderzoek zelf aanzienlijke kennishiaten, en groeit nieuwe kennis snel. Daarom is er een aanzienlijk potentieel voor het gebruik van large models om medisch basisonderzoek uit te voeren. Het AlphaFold model voor voorspelling van eiwitstructuren is bijvoorbeeld gebruikt door meer dan 1,8 miljoen wetenschappers wereldwijd om onderzoek te versnellen, waaronder het ontwikkelen van bio-hernieuwbare materialen en het bevorderen van genetisch onderzoek, aldus Meis Medical.
Naast het nastreven van een ideaal of het verdienen van geld, staat de medische AI-startup ook voor de vraag of ze wel of geen algemeen medisch large model moet creëren.
Zhang Sensen verklaarde dat er geen doorbraak is geweest in algemene medische large models in de binnenlandse markt, voornamelijk vanwege de afhankelijkheid van krachtige medische apparatuur voor grootschalige dataverzameling en -toepassing. Veel medische faciliteiten in China zijn niet breed gepopulariseerd, waardoor het voor AI moeilijk is om nauwkeurige diagnoses te stellen. Sommige sterke ziekenhuizen, zoals de Mayo Clinic, zijn echter begonnen met het verkennen van het lanceren van hun eigen large models. Hoewel het moeilijk is om op korte termijn winstkansen te zien, kunnen deze soorten large models een diepgaande impact hebben op de medische industrie op de lange termijn.
De medische industrie wordt ook geconfronteerd met de uitdaging van volledig geautomatiseerde diagnose, vooral in de binnenlandse markt, waar apparatuur ontoereikend is en AI traditionele diagnosemethoden niet volledig kan vervangen. Het gebrek aan wijdverspreide medische apparatuur, vooral in afgelegen gebieden, maakt het moeilijk om de medische technologie volledig te dekken, dus volledig geautomatiseerde diagnose blijft een aanzienlijke uitdaging.
De medische industrie heeft strikte licentie- en compliance-vereisten, en large models moeten compliance-kwesties aanpakken bij het betreden van het medische veld. Toekomstige C-end medische diensten kunnen de technieken van artsen en AI combineren om de efficiëntie van diagnose en behandeling te verbeteren, vooral voor jongere generaties.
Ten slotte, zelfs als de kenmerken van de binnenlandse B2B-markt worden genegeerd, maakt de concurrentie in large model-toepassingen het moeilijk om te overleven in de To B-markt. Wang Wenguang verklaarde dat hoewel de ontwerpmodellen voor large model To B-producten nog worden onderzocht, ze uiteindelijk zullen convergeren. Dit geldt niet alleen in China, maar ook in Silicon Valley-technologiebedrijven zoals OpenAI, Anthropic en Google. Zolang er geen significant verschil is in de prestaties van de modellen zelf, is het onmogelijk om geld te verdienen in deze markt, en uiteindelijk zal iedereen op hetzelfde niveau zitten.
Dit is de reden waarom DeepSeek R1 zijn grootste impact niet in China heeft gehad, maar in het buitenland, vooral op Silicon Valley-technologiebedrijven. De Amerikaanse aandelenmarkt begon na de release van R1 een hoge volatiliteit te ervaren en daalde vervolgens. De kernlogica is eenvoudig: Silicon Valley’s large models zijn ingehaald door China. Hoewel ze hen niet overtreffen, heeft het onvermogen om de kloof te vergroten het onmogelijk gemaakt om dergelijke hoge waarderingen te ondersteunen, wat leidde tot een daling van de aandelenkoersen.
Er is natuurlijk nog een manier voor de To B-markt om klanten aan te trekken: open source. De primaire winstmodellen voor open source omvatten het aanbieden van betaalde functies, cloudhosting en diensten met toegevoegde waarde, zoals enterprise-level consulting en training op basis van open-source technologie.
Het meest directe effect van open-source large models is het bevorderen van de popularisering van technologie. Zhang Sensen verklaarde dat DeepSeek’s open source de toepassing van large models door bedrijven aanzienlijk heeft versneld. Het senior management staat zeer achter de toepassing van large models. Omdat large models goed presteren in praktische toepassingen, vooral bij het verminderen van menselijke interventie en het verhogen van de efficiëntie, zal de steun blijven toenemen.
De financiële industrie, als de industrie met de beste datakwaliteit, heeft altijd al een rijke technische accumulatie in AI gehad en kan snel bijblijven. Ongeacht DeepSeek zal de financiële wereld AI-technologie implementeren. Met DeepSeek zal AI echter niet alleen de kernactiviteiten van de financiële industrie mogelijk maken, maar ook worden gebruikt in dagelijkse kantoortaken en -operaties die voorheen moeilijk uit te voeren waren.
Operaties waren vroeger erg kostbaar. Root cause analyse vereiste bijvoorbeeld traditionele operations monitoring en AIOps, evenals het trainen van kleine modellen. Nu kan DeepSeek worden gebruikt in combinatie met knowledge bases om toepassingsplannen te genereren voor het afhandelen van monitoring, alarmen, self-service analyse en traceerbaarheid, geautomatiseerde verwerking en verbetering van de stabiliteit, wat flexibeler is dan AIOps.
Daarnaast is de dekking van AI op operaties breder geworden, met meer aandacht voor interactiviteit en initiatief. Initiatief betekent dat AI proactief operaties kan uitvoeren. Door over te stappen van het vertrouwen op regels, mensen of zelfs persoonlijke ervaring, waarbij het niveau van menselijke ervaring het niveau van operatie mogelijkheden bepaalde, kunnen lichtere AI-modellen nu worden gebruikt om dit direct te bereiken.
Hoewel DeepSeek’s hallucinatiegraad nog steeds hoog is, zelfs niet significant verschillend van andere vergelijkbare modellen, kunnen de redenerings- en praktische toepassingsmogelijkheden de negatieve effecten van hallucinaties compenseren. Dit probleem zal geleidelijk worden verbeterd door finetuning en optimalisatie met behulp van RAG en aanverwante technologieën.
Alibaba’s large model-technologie expert Gao Peng gelooft dat DeepSeek’s impact verschilt voor grote en kleine bedrijven:
De large models die intern door Alibaba worden gebruikt, zijn altijd de meest geavanceerde in de industrie geweest, dus de opkomst van DeepSeek heeft geen significante impact gehad. Alibaba gebruikt DeepSeek voor prestatie-evaluatie en vergelijking, wat meer een technische inspiratie biedt. DeepSeek’s implementatie in Reasoning is relatief snel en de technische details zijn meer algemeen. DeepSeek is ook beïnvloed door Qianwen.
Daarentegen heeft DeepSeek een grotere impact op kleine en middelgrote bedrijven, omdat er voorheen geen model was dat DeepSeek’s effect kon bereiken en tegelijkertijd goedkope, private deployment kon bieden. Na DeepSeek’s release zijn er veel bedrijven ontstaan die DeepSeek geïntegreerde machines verkopen. DeepSeek is echter niet de goedkoopste in vergelijking met veel open-source model geïntegreerde machines, afhankelijk van de specifieke normen.
In ieder geval bloeit het binnenlandse open-source large model nu en kan het wereldwijd concurreren. Op basis van Ping An Insurance’s implementatie van large models, gelooft Zhang Sensen echter dat open-source large models nog steeds onoverkomelijke beperkingen hebben:
Voor ons heeft DeepSeek vooral een enorm kostenvoordeel. Qua mogelijkheden is het misschien beter dan andere modellen in operatie scenario’s in termen van redeneren, generalisatievermogen en contextueel begrip. DeepSeek presteert echter niet goed in complexere scenario’s, zoals financiële risicocontrole. Dit komt omdat meer gedetailleerde finetuning of zelfs optimalisatie in combinatie met andere modellen vereist is. Daarom is gerichte finetuning op basis van specifieke toepassingsscenario’s nodig om de prestaties van het model verder te verbeteren.
Ping An’s zelf ontwikkelde large models zijn verdeeld in twee lagen: het onderliggende foundation large model en de domeinmodellen die verantwoordelijk zijn voor bankieren, verzekeringen en andere bedrijven. De large models die intern worden gebruikt, presteren beter dan DeepSeek op het gebied van professionele kennis, vooral in specifieke gebieden zoals financiën en geneeskunde, waar de modellen nauwkeuriger zijn. DeepSeek heeft echter nog steeds een sterk voordeel in redeneervermogen. In sommige scenario’s willen we DeepSeek gebruiken voor een kleinschalige poging om te zien of het kan worden uitgevoerd.
Er is geen significant verschil tussen Alibaba Qianwen, Baidu Wenxin en Zhipu ChatGLM en DeepSeek in dit opzicht. Het oordeel is gebaseerd op het feit dat deze modellen geen significant verschil vertonen met DeepSeek in redeneervermogen en knowledge base structuur.
Over het algemeen is de impact van open-source large models momenteel beperkt en is het tempo van de concurrentie tussen hen intens.
De Gevaren van de To C Markt
Hoewel de concurrentie hevig is in de To B-markt, betekent dit niet dat de To C-route meer hoop biedt.
De concurrentie in de To C-markt voor large models is ook erg hevig, maar het is heel anders dan de To B-markt.
Het marktlandschap is voortdurend in verandering.
De winstgenerering van To C is moeilijk.
De meest populaire toepassingen genereren niet noodzakelijk de meeste inkomsten. ChatGPT heeft bijvoorbeeld de hoogste omzet, maar OpenAI verliest nog steeds $5 miljard per jaar, terwijl veel “copycat” toepassingen van ChatGPT waarschijnlijk snel winst hebben gemaakt; nadat DeepSeek populair werd, kwamen imitators en vervalsers in groten getale.
Het observeren van de situatie van de ‘Kleine Tijgers’ vanuit de C-end markt is ook niet optimistisch. Zhiwei’s communicatie met experts in de industrie gelooft over het algemeen dat grote fabrikanten een grote overlevingsdruk zullen brengen.
Jiang Shao verklaarde dat de best presterende van de ‘Kleine Tijgers’ in de consumentenmarkt Moonshot AI’s Kimi is. Maar nu staat Tencent’s Yuanbao op de eerste plaats, DeepSeek op de tweede en Doubao op de derde plaats. De top drie bedrijven bezetten bijna het grootste deel van het marktaandeel. Tencent’s Yuanbao heeft een groot aantal klantverkeer verworven met behulp van het WeChat-ecosysteem, terwijl DeepSeek zich heeft onderscheiden met zijn technologische innovatie en uitstekende prestaties in meerdere scenario’s.
Liang He verklaarde dat Kimi’s large model-technologie niet veel verschilt van zijn concurrenten, dus het kan alleen gratis zijn, wat het erg moeilijk maakt voor Moonshot om te commercialiseren. Als To C-toepassing is het niet duidelijk waarin het verschilt van Yuanbao en Doubao. Bovendien kan Doubao worden ondersteund door Byte’s andere bedrijven en Yuanbao kan worden ondersteund door Tencent’s andere bedrijven. Ze kunnen 100 miljard investeren om deze toepassingen te ondersteunen.
Jiang Shao voegde eraan toe dat C-end gebruikers meer bezorgd zijn over het gebruiksgemak van producten, waar Tencent en Byte beter in zijn. Alibaba heeft natuurlijk ook kansen. Alibaba is een toepassing aan het incuberen genaamd “AI Listening”, die AI gebruikt voor chat en interactie, met als doel Douyin te vervangen in het korte videoplatform. Hoewel Douyin een groot aantal creators aantrekt om hoogwaardige content te genereren, hebben AI-chat toepassingen het potentieel om gebruikersgroepen aan te trekken door meer gepersonaliseerde en interactieve ervaringen te bieden. Het verschil tussen de twee ligt in contentcreatie en interactie. Als Alibaba hier doorheen kan breken, heeft het ook een kans om het tij te keren, maar het is moeilijk te zeggen of Tencent dit zal volgen.
Met betrekking tot MiniMax zijn de meningen in de industrie iets anders.
Liang He gelooft dat MiniMax’s Conch AI momenteel een goede winst maakt. Het heeft zijn eigen manier gevonden, maar het is nog niet bekend of dit pad MiniMax in staat zal stellen zijn waardering voldoende te verhogen. Vanwege zijn toepassingsoriëntatie is MiniMax meer ontspannen nadat DeepSeek uitkwam. Als ze DeepSeek’s modellen gebruiken, bespaarthet de onderzoeks- en ontwikkelingskosten van het model, en kunnen de toepassingen ervan geld blijven verdienen, zelfs meer.
Jiang Shao gelooft dat MiniMax een kans heeft als het later een populaire APP kan creëren, maar Alibaba kan het overtreffen en eerst een populaire APP maken, dus zelfs als MiniMax een kans heeft, is de kans niet groot.
Uiteindelijk is productdifferentiatie nog steeds het doorbraakpunt voor C-end toepassingen.
Volgens a16z’s nieuwste rapport “Top 100 Gen AI Consumer Apps” behalen veel toepassingen met een laag gebruik eigenlijk betere inkomsten. Sommige producten met een slechte veelzijdigheid, zoals plantidentificatie en voeding, trekken meer betalende gebruikers aan dan algemene producten.
Het is moeilijk om algemene AI-producten te differentiëren. Gebruikers hebben een lage bereidheid om te betalen, de winstcyclus is lang, dus ze kunnen grote bedrijven niet overleven.
En als de differentiatie niet diep genoeg verticaal is, is het ook gemakkelijk om te worden geïnternaliseerd door het base large model door capaciteitsupgrades. De recente GPT-4o’s image generation capabilities hebben bijvoorbeeld een dimensionality reduction blow gebracht aan text-to-image start-ups zoals Midjourney. Dit coveragevermogen is vaak willekeurig en onvoorspelbaar, zoals het spreekwoord zegt: “Het vernietigen van jou heeft niets met jou te maken.”
De pixel-level imitatie van concurrenten en de snelle upgrading van base large models zorgen ervoor dat het landschap van C-end AI start-ups bijna altijd maar korte tijd wordt gehandhaafd.
Wat betreft het grijpen van de extreem lage kans om een hit te worden, zijn experts in de industrie het er unaniem over eens dat “er eigenlijk geen ervaring is om te volgen”.
De ‘Kleine Tijgers’ zijn in de huidige benarde situatie terechtgekomen, grotendeels omdat ze te veel hebben geïnvesteerd in het base large model en de mankracht, financiële middelen en materiële middelen die nodig zijn om te overleven en uit te blinken in dit track hebben onderschat, wat resulteert in het moeilijk te differentiëren op de applicatie track.
Nu zijn de ‘Kleine Tijgers’ steeds minder vastbesloten om AGI aan te vallen, en Li Kaifu heeft publiekelijk verklaard dat alleen DeepSeek, Ali en Byte zullen overblijven in het binnenlandse base large model.
In dit opzicht zijn experts in de industrie die met Zhiwei communiceerden het over het algemeen eens met deze mening.
Jiang Shao zei dat AI-start-ups die nog steeds hard blijven werken aan large model-technologie, in feite moeten sterven. De meest veelbelovende is zeker DeepSeek, de tweede is Alibaba en de derde is ByteDance. De eerste plaats zal naar verwachting 50%-80% van het verkeer krijgen en de laatste twee kunnen 10% van het verkeer krijgen. De kern ligt in wie AGI het eerst maakt en wie de uiteindelijke winnaar is.
DeepSeek is momenteel het meest competitief op het gebied van large models, en zijn technologische innovatie en prestaties in praktische toepassingen zijn onberispelijk. Alibaba en ByteDance hebben ook een sterke concurrentiekracht, vooral in cross-platform toepassingen en data resources. De rangschikking is voornamelijk gebaseerd op de innovatie mogelijkheden van elk bedrijf in basistechnologie, computing power, data resources en praktische toepassingen.
De Zhipu- en Kimi-teams geloven stellig dat het blijven verbeteren van de mogelijkheden van het base model de toekomst is. Daarentegen geloof ik dat met veranderingen in de marktvraag en de diversificatie van toepassingsscenario’s, de route van het simpelweg versterken van het base model beperkt kan zijn, en meer flexibele en aanpasbare model ontwikkelingspaden competitiever kunnen zijn in de markt.
De concurrentie in large model-technologie is extreem hevig en bedrijven met enorme investeringen moeten uiteindelijk duidelijke doorbraken hebben in innovatie, computing power, data en optimalisatie om hun concurrentiepositie te behouden. Andere bedrijven die de technologische vooruitgang niet kunnen bijbenen of niet in staat zijn om aan de marktvraag te voldoen, zullen geleidelijk worden geëlimineerd.
Liang He zei dat alleen DeepSeek, Ali en Byte in de toekomst zullen overblijven in het binnenlandse base large model-bedrijf, op basis van het feit dat deze drie de kracht en vastberadenheid hebben om super resources te investeren in onderzoek en ontwikkeling. Voor Byte is het onmogelijk om de kans voor large models te missen, anders zal dit een grote impact hebben op het geheel. En DeepSeek’s technologie zal niet al te veel barrières vormen voor Byte, maar DeepSeek heeft momenteel een groter voordeel in R&D-efficiëntie. Alibaba’s Qianwen open-source model is zelf van een hoog niveau. Voordat DeepSeek populair werd, jaagden Qianwen en Llama elkaar in feite achterna. Voor Alibaba maakt het Qianwen-model misschien geen geld, maar gerelateerde cloudbedrijven kunnen geld verdienen, en Byte is vergelijkbaar en kan large model-technologie blijven gebruiken om de ervaring van Douyin en andere apps continu te optimaliseren. Voor AI-start-ups, als het model zelf geen geld oplevert, raakt het de kern van het overleven.
Wang Wenguang zei dat DeepSeek’s voordeel vooral ligt in technologisch idealisme. Binnen twee of drie maanden voor en na het Spring Festival was DeepSeek’s verkeer enorm. Als het wilde commercialiseren, zou het al snel de top in de wereld bereiken, en andere large models zoals Doubao zouden helemaal geen kans hebben. Zolang DeepSeek de infrastructure-gerelateerde optimalisatiemethoden niet open source maakt in de recente open-source week, kan het hier in de toekomst op vertrouwen om geld te verdienen, zodat anderen geen kans hebben. DeepSeek is niet gefinancierd en hoeft niet te worden beïnvloed door investeerders. Technologisch idealisme en talent zijn de grootste barrières. Vergeleken met OpenAI zijn de resultaten die OpenAI nu kan zien in feite de onderzoeksresultaten van voor het geschil tussen Altman en Ilya. Er zijn in ieder geval innovatie punten vastgesteld. Nu, na het vertrek van het oorspronkelijke team van idealisten, heeft OpenAI zelf bijna geen innovatie. Momenteel bevindt OpenAI’s innovatie zich meer op het applicatieniveau, zoals Deep Research. Er zijn geen barrières voor innovatie op het applicatieniveau, dus het moet concurreren met concurrenten.
Wang Mu, een large factory AI-technologie expert, vertelde Zhiwei dat tenzij er geld, talent en hardware is, er geen reden is om moeite te verspillen aan het pre-trainen van large models. DeepSeek had al in 2021 een 10.000-card cluster en heeft geen geld tekort. Andere kleine en middelgrote bedrijven kunnen daarentegen deze voorwaarde nauwelijks samenstellen.
Gao Peng verklaarde dat AI-start-ups willen overleven, ze nog steeds naar toepassingen moeten overschakelen. Ik dacht er een of twee jaar geleden zo over, en nu is het misschien te laat om over te schakelen. De eerste batch AI-bedrijven die vervolgens worden geëlimineerd, zijn degenen die base large models maken. Large model training heeft eigenlijk veel complexe details en is sterk afhankelijk van de accumulatie van ervaring. De interne details van de Transformer-architectuur worden over het algemeen goed begrepen, maar de papers van open-source of closed-source modellen vertellen je in feite niet hoe de data is voorbereid, wat de datadetails zijn, hoe groot de datascale is en hoe goed de datakwaliteit is. Er is geen uniforme standaard in de industrie.
Open-source open-half is altijd al een typische praktijk geweest in de large model track. Momenteel zijn er maar heel weinig large models die de code, gewichten, datasets en het trainingproces volledig zullen onthullen. De meer bekende zijn OLMo, BLOOM, etc.
Maar zelfs als het overschakelen naar toepassingen kan overleven? Vanuit de vorige analyse van de To B track en de To C track is het bijna moeilijk voor AI-start-ups om hun eigen industrie barrières in toepassingen te vormen. In dit opzicht verklaarde Gao Peng dat de sleutel tot het vormen van uw eigen industrie barrières ligt in welke data u heeft. Modellen kunnen door iedereen worden gebruikt. Data is verdeeld in twee aspecten: de ene is de veldervaring van de ondernemer en de andere is de data in de hand.
Vanuit het perspectief van bedrijfscultuur gelooft Gao Peng dat onderzoek en ontwikkeling van base large models een geest van experimenteel en engineering hard werken vereist. “Gedurende lange tijd waren veel binnenlandse AI-start-ups te high-profile. Wanneer u technologie doet, moet u het eerst low-key doen en het vervolgens high-profile promoten. Sommige teams zijn zwaarder samengesteld uit de academische wereld, maar mensen in de academische wereld bestuderen technologie soms te theoretisch. In termen van talent of team hangt het succes van een large model-team vooral af van of de baas large models begrijpt. Als de baas large model-technologie niet begrijpt of niet het geloof heeft om vol te houden, omdat het geen geld oplevert, zal het helemaal niet werken. DeepSeek’s succes is meer afhankelijk van een top-down organisatie modus. De baas begrijpt de technische details zeer goed en leidt iedereen om het samen te doen. Er zijn te weinig binnenlandse modellen die aan dit model voldoen.”
Met betrekking tot de verhitte discussie in de industrie over de definitieve winnaar voorspelling van het binnenlandse base large model, gelooft Gao Peng dat dit oordeel te vroeg is. “Er zal niet veel verschil zijn in de technische routes van de spelers die kunnen deelnemen aan de competitie. Volg gewoon de Transformer-architectuur en voer gedetailleerde optimalisatie uit. Mamba en RWKV hebben ook hoop. De sleutel is om de zaken gestaag te doen en de tijd zal alles bewijzen. De definitieve winnaar en de top drie zijn niet gemakkelijk te