Punkt Zwrotny AI: Ewolucja Krajobrazu Chińskich “Małych Tygrysów”
Gwałtowny rozwój technologii AI w Chinach przyniósł zarówno ekscytację, jak i niepewność dla wielu startupów. Niegdyś pełne ambitnych celów, niektóre firmy obecnie rekalibrują swoje strategie, stawiając czoła surowej rzeczywistości konkurencyjnego i zasobochłonnego rynku.
Od Wielkich Wizji do Strategicznych Punktów Zwrotnych
Niedawny list wewnętrzny od CEO jednej z chińskich “AI Little Tigers,” Baichuan Intelligent, z okazji drugiej rocznicy firmy, podkreślił strategiczną zmianę. Skupienie miałoby się zawęzić, priorytetowo traktując zastosowania medyczne. To ostro kontrastowało z pierwotną misją stworzenia przełomowego modelu bazowego, podobnego do OpenAI, wraz z innowacyjnymi aplikacjami.
Podobnie, Li Kaifu, założyciel kolejnego “Little Tiger,” 01.AI, ogłosił w styczniu, że jego firma przyjmie podejście “małe, ale piękne.” Było to znaczące odejście od wielkiej wizji budowy platformy AI 2.0, aby przyspieszyć nadejście AGI.
Te strategiczne wycofania podsycają spekulacje, a niektórzy obserwatorzy sugerują, że te “Little Tigers” stają się bardziej jak “chore koty.” W środowisku naznaczonym ciągłymi zmianami, jak te firmy mogą zabezpieczyć swoją przyszłość?
Aby odpowiedzieć na to pytanie, zespół redakcyjny Zhiwei zasięgnął opinii różnych ekspertów, w tym specjalistów od technologii dużych modeli, ekspertów AI w finansach i opiece zdrowotnej oraz ekspertów AI tech z wiodących firm.
Efekt DeepSeek i Zmieniające się Strategie
Krajobraz AI dramatycznie się zmienił po wybuchowej popularności DeepSeek, modelu, który wstrząsnął rynkiem. Jak potężny wojownik, DeepSeek zakłócił krajobraz, zmuszając wiele firm AI do ponownej oceny swoich pozycji i poszukiwania różnych ścieżek.
Jednak ta transformacja rozpoczęła się nawet wcześniej, niż wielu zdawało sobie sprawę. Według Wang Wenguang, eksperta od technologii dużych modeli, niektóre chińskie firmy AI zaczęły porzucać dążenie do trenowania dużych modeli jeszcze przed wydaniem DeepSeek V3 i R1. Koszty były po prostu zbyt wysokie, a firmy te czuły się niezdolne do konkurowania z swobodnie dostępnymi i open-source’owymi alternatywami, takimi jak DeepSeek V2.5 i Alibaba’s Qwen 70B.
Liang He, ekspert z przedsiębiorstwa świadczącego usługi technologii AI, dodał, że chociaż większość “Little Tigers” nadal trenowała duże modele w połowie 2024 roku, ich inwestycje już znacznie spadły. Do stycznia 2025 roku, wraz z wydaniem DeepSeek R1, wiele mniejszych firm zdało sobie sprawę, że nie mogą nadążyć.
To nagłe przesunięcie spowodowało poważną zmianę kierunku dla “Little Tigers,” odchodząc od rozwoju AGI w kierunku bardziej wyspecjalizowanych podejść.
Baichuan i 01.AI porzuciły wstępne trenowanie dużych modeli, koncentrując się odpowiednio na medycznej AI i zastosowaniach przemysłowych. MiniMax redukuje swoje operacje B2B i koncentruje się na rynkach zagranicznych z generowaniem wideo C-end i innymi aplikacjami. Zhipu, Moonshot AI i StepUp nadal działają w społeczności open-source, ale nie wyprodukowały żadnych nowych modeli, które przewyższają DeepSeek R1. Zhipu zabezpieczył znaczne finansowanie i partnerstwa rządowo-przedsiębiorcze, zapewniając swoje przetrwanie. Podstawowy produkt Moonshot AI, Kimi, zobaczył, że jego pozycja jest zagrożona przez Yuanbao, co sprawia, że jego pozycjonowanie staje się coraz bardziej niezręczne.
Ogólnie rzecz biorąc, “Little Tigers” coraz bardziej zbliżają się do rynku B2B SaaS, który niektórzy uważają za “pozbawiony wyobraźni.”
Urok i Ograniczenia Rynku B2B
01.AI niedawno ogłosił zamiar pełnej integracji DeepSeek, aby stworzyć kompleksową platformę dużych modeli dla przedsiębiorstw dla różnych branż. Jednak ten ruch spotkał się ze sceptycyzmem.
Jiang Shao, ekspert finansowy AI, uważa, że przyszłość 01.AI jest niepewna ze względu na jego szerokie skupienie, brak konkurencyjności technologicznej po pojawieniu się DeepSeek i ograniczone możliwości komercjalizacji.
Wang Wenguang powtórzył to zdanie, zauważając, że bariera techniczna wejścia dla kompleksowej platformy dużych modeli jest stosunkowo niska.
Wang podzielił się swoim doświadczeniem w samodzielnym opracowaniu takiej platformy w około sześć miesięcy, sprzedając ją za pośrednictwem osobistych kanałów. Argumentował, że chociaż trudno jest czerpać zyski z tego produktu jako firma, może to być opłacalne jako samodzielne przedsięwzięcie.
Wang współpracuje z kilkoma firmami B2B, które oferują usługi dużych modeli, ale brakuje im platformy technicznej. Dostarcza swoją platformę po niskich kosztach, około 40 000 do 50 000 juanów za licencję, znacznie obniżając ceny większych firm.
Jego platforma, KAF (Knowledge-based Agent Factory), wykorzystuje grafy wiedzy, bazy danych wektorowych i wyszukiwarki do dostarczania dużych modeli i aplikacji Agent. Umożliwia użytkownikom tworzenie niestandardowych asystentów wiedzy lub Agentów bez kodowania poprzez zarządzanie podpowiedziami i modelami. Wang zauważył powszechność podobnych platform na rynku, co ułatwia ich replikację.
Według Wanga, firma chcąca opracować aplikację B2B dużego modelu może szybko stworzyć produkt, zatrudniając mały zespół wykwalifikowanych osób lub współpracując z zewnętrzną firmą AI. To podejście jest znacznie tańsze niż trenowanie dużego modelu.
Oprócz modelu platformy, zintegrowane rozwiązania zapewniają sprzęt, oprogramowanie i środowiska wykonawcze, oferując funkcjonalność od razu po wyjęciu z pudełka. Zhang Sensen, szef grupy platform technologicznych w Ping An Insurance, uważa, że zintegrowane rozwiązania mają realny rynek, szczególnie wśród instytucji rządowych i edukacyjnych o ograniczonych możliwościach wdrożeniowych. Te rozwiązania priorytetowo traktują łatwość użycia i autonomię techniczną, oferując korzyści, takie jak bezpieczeństwo danych, zgodność z prywatnością i optymalizacja sprzętu i oprogramowania. Mogą również używać produkowanych w kraju chipów, omijając ograniczenia i poprawiając wydajność. Firmy wrażliwe na koszty i skupione na ROI mogą uznać zintegrowane rozwiązania za atrakcyjne ze względu na ich dłuższe cykle życia.
Krajowy rynek SaaS historycznie napotykał wyzwania, takie jak wysokie wymagania dotyczące dostosowywania, ogólne i zhomogenizowane produkty, intensywna konkurencja, strategie niskich cen i nacisk na krótkoterminową monetyzację. Klienci na tym rynku często mają niski poziom digitalizacji i ograniczoną chęć do płacenia.
W przeciwieństwie do tego, międzynarodowy rynek SaaS kładzie nacisk na specjalizację, a firmy koncentrują się na określonych obszarach i zapewniają dogłębne usługi dla dużych i średnich klientów z większą chęcią do płacenia.
Pole dużych modeli odzwierciedla te trendy. Niedawne wydarzenia na międzynarodowym rynku SaaS to potwierdzają:
- W lutym 2025 roku MongoDB przejął Voyage AI, 17-miesięczny startup AI skupiony na modelach osadzania i ponownego rankingu, za 220 milionów dolarów.
- W 2024 roku Amazon ogłosił umowę licencyjną na technologię z Adept, dwuletnim startupem AI Agent, a niektórzy członkowie Adept dołączyli do zespołu AGI Amazona.
Te startupy osiągnęły sukces, koncentrując się na określonej niszy w technologii dużych modeli. Takie przykłady są rzadkie w Chinach. Wiele małych i średnich przedsiębiorstw musi stale chronić się przed większymi firmami wchodzącymi w ich przestrzeń.
Wang Wenguang, czerpiąc z bogatego doświadczenia na rynku B2B, opisał jego surową rzeczywistość. Zauważył, że chociaż istnieje duży rynek dla kompleksowych platform, jest on rozdrobniony. Mniejsze firmy z niższymi kosztami operacyjnymi mogą oferować konkurencyjne ceny, obniżając ceny większych firm. To obniża cenę usług aplikacyjnych. Nawet duże firmy stają w obliczu konkurencji ze strony innych startupów i tradycyjnych integratorów. Duże firmy mogą mieć własne duże modele i przewagę marki, ale stoją przed podobnymi strategiami biznesowymi B2B.
Jak stwierdził Wang, “Ja również używam DeepSeek, a wiele innych firm używa DeepSeek, więc nie ma różnicowania. W Chinach jest tak wiele dostawców chmury, więc będzie co najmniej tylu konkurentów. Krajowy rynek B2B zawsze taki był; aby przetrwać, albo musisz mieć silne powiązania, dobrą obsługę, albo niskie ceny.”
Liang He zaoferował zwięzłą ocenę obecnych wyborów i przyszłych perspektyw 01.AI:
- Decyzja Li Kaifu o pełnym przeniesieniu działalności 01.AI do aplikacji B2B i promowaniu kompleksowej platformy dużych modeli dla przedsiębiorstw jest komercyjnie uzasadniona, ale doprowadzi do intensywnej konkurencji.
- Potrzeba 01.AI, aby oferować tańsze produkty dużych modeli niż większe firmy, jest wynikiem braku unikalnych zalet na warstwie aplikacji.
- Przejście 01.AI do B2B sygnalizuje utratę wyobraźni i mniej “sexy” projekty. Jest to podobne do losu wielu firm zajmujących się widzeniem komputerowym z poprzedniej fali AI w 2017 roku.
- 01.AI może mieć możliwości, jeśli zbada rynki zagraniczne.
W porównaniu do 01.AI, opinie na tematprzyszłości Baichuan są mniej pesymistyczne.
Jednak wejście Baichuan w dziedzinę medycyny nie ma unikalnych zalet, zwłaszcza w danych.
Jiang Shao powiedział, że przejście Baichuan do medycyny to po prostu sposób na przetrwanie. Jednak w porównaniu do 01.AI, Baichuan przynajmniej próbuje wejść na rynek niszowy.
Zhang Sensen stwierdziła, że jest bardziej optymistyczna co do firm z danymi medycznymi opracowujących medyczne duże modele niż firmy technologiczne. Dotyczy to każdej firmy chcącej stworzyć duży model specyficzny dla danej branży. Kluczowym wyzwaniem w tworzeniu medycznych dużych modeli są dane, a nie sam model. W Chinach jest wiele doskonałych szpitali, które mogą dostroić duży model za pomocą DeepSeek do własnego użytku.
Jak skutecznie pozyskiwać dane medyczne? Jiang Shao powiedział, że startupy technologiczne AI nie mają zalet w danych. Aby tworzyć medyczne duże modele, mogą potrzebować współpracy z firmami, które już świadczą usługi IT dla szpitali.
Podobno jeden z “Little Tigers” nawiązał wyłączną współpracę z dużym krajowym forum wymiany lekarzy, aby trenować modele, wykorzystując ogromną liczbę przypadków generowanych z wymiany lekarzy.
Oprócz bardziej optymistycznego spojrzenia na rynki niszowe, eksperci branżowi mają nadzieję na założyciela Baichuan, Wang Xiaochuan.
Liang He uważa, że czy Wang Xiaochuan odniesie sukces w specjalizacji w medycynie, zależy od tego, czy chce dążyć do ideału, czy zarabiać pieniądze. Uważa, że Wang jest bardziej skłonny do dążenia do ideału, tworząc przełomowe wyniki badań medycznej AI.
Wang Wenguang podkreślił przestarzały charakter tego rynku. Stwierdził, że jeśli celem jest krótkoterminowa komercjalizacja, dziedzina medyczna jest również bardzo konkurencyjna, podobnie jak cały rynek B2B. Wiele firm może używać grafów wiedzy, wyszukiwań wektorowych i dużych modeli do zastosowań medycznych.
Zgodnie z dyskusjami Zhiwei z ekspertami medycznej AI, same badania medyczne mają znaczące luki w wiedzy, a nowa wiedza rozwija się szybko. Dlatego istnieje znaczny potencjał wykorzystania dużych modeli do prowadzenia medycznych badań podstawowych. Na przykład model AlphaFold do przewidywania struktury białek został wykorzystany przez ponad 1,8 miliona naukowców na całym świecie do przyspieszenia badań, w tym do opracowywania bioodnawialnych materiałów i postępu w badaniach genetycznych, według Meis Medical.
Oprócz dążenia do ideału lub zarabiania pieniędzy, medyczny startup AI stoi również przed pytaniem, czy stworzyć ogólny medyczny duży model, czy nie.
Zhang Sensen stwierdziła, że nie nastąpił przełom w ogólnych medycznych dużych modelach na rynku krajowym, głównie ze względu na poleganie na potężnym sprzęcie medycznym do gromadzenia i stosowania danych na dużą skalę. Wiele placówek medycznych w Chinach nie zostało powszechnie spopularyzowanych, co utrudnia AI dokładne diagnozowanie. Jednak niektóre silne szpitale, takie jak Mayo Clinic, zaczęły badać możliwość uruchomienia własnych dużych modeli. Chociaż trudno jest dostrzec możliwości zysku w krótkim okresie, tego typu duże modele mogą mieć głęboki wpływ na branżę medyczną w dłuższej perspektywie.
Branża medyczna stoi również przed wyzwaniem w pełni zautomatyzowanej diagnostyki, zwłaszcza na rynku krajowym, gdzie sprzęt jest niewystarczający, a AI nie może całkowicie zastąpić tradycyjnych metod diagnostycznych. Brak powszechnego sprzętu medycznego, zwłaszcza na obszarach oddalonych, utrudnia pełne pokrycie technologią medyczną, więc w pełni zautomatyzowana diagnostyka pozostaje znaczącym wyzwaniem.
Branża medyczna ma surowe wymagania dotyczące licencjonowania i zgodności, a duże modele muszą rozwiązywać kwestie zgodności, wchodząc w dziedzinę medyczną. Przyszłe usługi medyczne C-end mogą łączyć techniki lekarzy i AI, aby poprawić efektywność diagnozy i leczenia, zwłaszcza dla młodszych pokoleń.
Wreszcie, nawet pomijając cechy krajowego rynku B2B, konkurencja w zastosowaniach dużych modeli utrudnia przetrwanie na rynku To B. Wang Wenguang stwierdził, że chociaż modele projektowe dla dużych produktów modelowych To B są nadal badane, ostatecznie zbiegną się. Dotyczy to nie tylko Chin, ale także firm technologicznych z Doliny Krzemowej, takich jak OpenAI, Anthropic i Google. Dopóki nie ma znaczących różnic w wydajności samych modeli, nie można zarabiać na tym rynku, a ostatecznie wszyscy będą na tym samym poziomie.
Dlatego DeepSeek R1 miał największy wpływ nie w Chinach, ale za granicą, zwłaszcza na firmy technologiczne z Doliny Krzemowej. Amerykański rynek akcji zaczął doświadczać wysokiej zmienności, a następnie spadku po wydaniu R1. Podstawowa logika jest prosta: duże modele Doliny Krzemowej zostały dogonione przez Chiny. Chociaż ich nie przewyższają, brak możliwości poszerzenia luki uniemożliwił wsparcie tak wysokich wycen, co doprowadziło do spadku cen akcji.
Oczywiście, istnieje inny sposób na przyciągnięcie klientów przez rynek To B: open source. Podstawowe modele zysku dla open-source obejmują zapewnienie płatnych funkcji, hosting w chmurze i usługi o wartości dodanej, takie jak doradztwo na poziomie korporacyjnym i szkolenia oparte na technologii open-source.
Najbardziej bezpośrednim efektem dużych modeli open-source jest promowanie popularyzacji technologii. Zhang Sensen stwierdziła, że open source DeepSeek znacznie przyspieszył zastosowanie dużych modeli przez firmy. Kadra kierownicza wyższego szczebla bardzo wspiera stosowanie dużych modeli. Ponieważ duże modele dobrze sprawdzają się w praktycznych zastosowaniach, zwłaszcza w zmniejszaniu interwencji człowieka i zwiększaniu efektywności, wsparcie będzie nadal rosło.
Branża finansowa, jako branża o najlepszej jakości danych, zawsze miała bogate nagromadzenie techniczne w AI i może szybko nadążyć. Niezależnie od DeepSeek, finanse wdrożą technologię AI. Jednak dzięki DeepSeek AI umożliwi nie tylko podstawową działalność branży finansowej, ale także będzie wykorzystywana w codziennych zadaniach biurowych i operacjach, które wcześniej były trudne do wykonania.
Operacje były kiedyś bardzo kosztowne. Na przykład analiza pierwotnej przyczyny wymagała wcześniej tradycyjnego monitorowania operacji i AIOps, a także trenowania małych modeli. Teraz DeepSeek można używać w połączeniu z bazami wiedzy do generowania planów aplikacji do obsługi monitoringu, alarmów, samoobsługowej analizy i identyfikowalności, zautomatyzowanego przetwarzania i poprawy stabilności, co jest bardziej elastyczne niż AIOps.
Ponadto zasięg AI w operacjach stał się szerszy, z większym uwzględnieniem interaktywności i inicjatywy. Inicjatywa oznacza umożliwienie AI proaktywnego wykonywania operacji. Odchodząc od polegania na zasadach, ludziach, a nawet osobistym doświadczeniu, gdzie poziom ludzkiego doświadczenia determinował poziom możliwości operacyjnych, lżejsze modele AI mogą być teraz używane do bezpośredniego osiągnięcia tego.
Chociaż współczynnik halucynacji DeepSeek jest nadal wysoki, nawet nie różni się znacząco od innych podobnych modeli, jego rozumowanie i praktyczne możliwości zastosowania mogą zrównoważyć negatywne skutki halucynacji. Problem ten będzie stopniowo poprawiany poprzez dostrajanie i optymalizację przy użyciu RAG i innych powiązanych technologii.
Ekspert ds. technologii dużych modeli Alibaba, Gao Peng, uważa, że wpływ DeepSeek różni się w przypadku dużych i małych firm:
Duże modele używane wewnętrznie przez Alibabę zawsze były najbardziej zaawansowane w branży, więc pojawienie się DeepSeek nie miało znaczącego wpływu. Alibaba używa DeepSeek do oceny i porównywania wydajności, zapewniając więcej inspiracji technicznej. Wdrożenie DeepSeek w rozumowaniu jest stosunkowo szybkie, a szczegóły techniczne są bardziej powszechne. DeepSeek również był pod wpływem Qianwen.
W przeciwieństwie do tego, DeepSeek ma większy wpływ na małe i średnie firmy, ponieważ wcześniej nie było modelu, który mógłby osiągnąć efekt DeepSeek, zapewniając jednocześnie niski koszt, prywatne wdrożenie. Po wydaniu DeepSeek pojawiło się wiele firm sprzedających zintegrowane maszyny DeepSeek. Jednak DeepSeek nie jest najtańszy w porównaniu z wieloma zintegrowanymi maszynami modelowymi open-source, w zależności od konkretnych standardów.
W każdym razie, krajowy open-source duży model kwitnie teraz i może konkurować globalnie. Jednak w oparciu o wdrożenie dużych modeli przez Ping An Insurance, Zhang Sensen uważa, że duże modele open-source nadal mają nieprzekraczalne ograniczenia:
Dla nas DeepSeek ma przede wszystkim ogromną przewagę kosztową. Pod względem możliwości może być lepszy niż inne modele w scenariuszach operacyjnych pod względem rozumowania, zdolności uogólniania i rozumienia kontekstowego. Jednak DeepSeek nie radzi sobie dobrze w bardziej złożonych scenariuszach, takich jak kontrola ryzyka finansowego. Wynika to z faktu, że wymagane jest bardziej szczegółowe dostrajanie, a nawet optymalizacja w połączeniu z innymi modelami. Dlatego ukierunkowane dostrajanie w oparciu o konkretne scenariusze aplikacji jest potrzebne do dalszej poprawy wydajności modelu.
Samodzielnie opracowane przez Ping An duże modele są podzielone na dwie warstwy: podstawowy duży model bazowy i modele domenowe odpowiedzialne za bankowość, ubezpieczenia i inne działalności. Duże modele używane wewnętrznie działają lepiej niż DeepSeek w dziedzinie wiedzy specjalistycznej, zwłaszcza w określonych dziedzinach, takich jak finanse i medycyna, gdzie modele są dokładniejsze. Jednak DeepSeek nadal ma silną przewagę w zdolności rozumowania. W niektórych scenariuszach chcemy użyć DeepSeek do próby na małą skalę, aby sprawdzić, czy można go uruchomić.
Nie ma znaczącej różnicy między Alibaba Qianwen, Baidu Wenxin i Zhipu ChatGLM a DeepSeek pod tym względem. Ocena opiera się na fakcie, że modele te nie różnią się znacząco od DeepSeek pod względem zdolności rozumowania i struktury bazy wiedzy.
Ogólnie rzecz biorąc, wpływ dużych modeli open-source jest obecnie ograniczony, a tempo konkurencji między nimi jest intensywne.
Zagrożenia Rynku To C
Chociaż konkurencja jest zacięta na rynku To B, nie oznacza to, że trasa To C oferuje więcej nadziei.
Konkurencja na rynku To C dla dużych modeli jest również bardzo zacięta, ale bardzo różni się od rynku To B.
Krajobraz rynkowy stale się zmienia.
Monetyzacja To C jest trudna.
Najpopularniejsze aplikacje niekoniecznie generują największe przychody. Na przykład ChatGPT ma najwyższe przychody, ale OpenAI nadal traci 5 miliardów dolarów rocznie, podczas gdy wiele “podrabianych” aplikacji ChatGPT prawdopodobnie osiągnęło szybką rentowność; po tym, jak DeepSeek stał się popularny, imitatorzy i fałszerze pojawili się tłumnie.
Obserwowanie sytuacji “Little Tigers” z rynku C-end również nie jest optymistyczne. Komunikacja Zhiwei z ekspertami branżowymi generalnie uważa, że duzi producenci przyniosą wielką presję na przetrwanie.
Jiang Shao stwierdził, że najlepiej radzącym sobie z “Little Tigers” na rynku konsumenckim jest Kimi od Moonshot AI. Ale teraz Yuanbao Tencent zajmuje pierwsze miejsce, DeepSeek zajmuje drugie miejsce, a Doubao zajmuje trzecie miejsce. Trzy najlepsze firmy prawie zajmują większość udziału w rynku. Yuanbao Tencent zyskał dużą liczbę ruchu klientów dzięki ekosystemowi WeChat, podczas gdy DeepSeek wyróżnił się innowacjami technologicznymi i doskonałą wydajnością w wielu scenariuszach.
Liang He stwierdził, że technologia dużych modeli Kimi nie różni się zbytnio od konkurentów, więc może być tylko darmowa, co bardzo utrudnia Moonshot komercjalizację. Jako aplikacja To C nie jest jasne, czym różni się od Yuanbao i Doubao. Ponadto Doubao może być wspierane przez inne działalności Byte, a Yuanbao może być wspierane przez inne działalności Tencent. Mogą zainwestować 100 miliardów, aby wesprzeć te aplikacje.
Jiang Shao dodał, że użytkownicy C-end bardziej dbają o łatwość użytkowania produktu, w czym Tencent i Byte są lepsi. Oczywiście Alibaba również ma możliwości. Alibaba inkubuje aplikację o nazwie “AI Listening”, która wykorzystuje AI do czatu i interakcji, mając na celu zastąpienie Douyin na platformie krótkich filmów. Chociaż Douyin przyciąga dużą liczbę twórców do generowania wysokiej jakości treści, aplikacje czatowe AI mają potencjał przyciągnięcia grup użytkowników, zapewniając bardziej spersonalizowane i interaktywne doświadczenia. Różnica między nimi polega na tworzeniu treści i interakcji. Jeśli Alibaba może to przebić, również ma szansę odwrócić losy, ale trudno powiedzieć, czy Tencent pójdzie w ich ślady.
Jeśli chodzi o MiniMax, opinie branżowe są nieco inne.
Liang He uważa, że Conch AI MiniMax obecnie osiąga dobre zyski. Znalazł własną drogę, ale nie wiadomo jeszcze, czy ta ścieżka pozwoli MiniMax wystarczająco zwiększyć swoją wycenę. Ze względu na swoją orientację aplikacyjną, MiniMax jest bardziej zrelaksowany po pojawieniu się DeepSeek. Jeśli użyją modeli DeepSeek, zaoszczędzi to koszty badań i rozwoju modelu, a jego aplikacje mogą nadal zarabiać, nawet więcej.
Jiang Shao uważa, że MiniMax ma szansę, jeśli później stworzy popularną aplikację, ale Alibaba może ją przekroczyć i stworzyć popularną aplikację jako pierwsza, więc nawet jeśli MiniMax ma szansę, prawdopodobieństwo nie jest wysokie.
Ostatecznie, różnicowanie produktów jest nadal punktem przełomowym dla aplikacji C-end.
Według najnowszego raportu a16z “Top 100 Gen AI Consumer Apps”, wiele aplikacji o niskim zużyciu faktycznie osiąga lepsze przychody. Niektóre produkty o słabej wszechstronności, takie jak identyfikacja roślin i odżywianie, przyciągają płacących użytkowników bardziej niż produkty ogólne.
Trudno jest różnicować ogólne produkty AI. Użytkownicy mają niską chęć do płacenia, cykl zysku jest długi, więc nie mogą przetrwać dużych firm.
A jeśli różnicowanie nie jest wystarczająco głębokie w pionie, łatwo jest je zinternalizować przez bazowy duży model poprzez aktualizacje pojemności. Na przykład niedawne możliwości generowania obrazów przez GPT-4o przyniosły cios redukcyjny dla startupów tekst-obraz, takich jak Midjourney. Ta zdolność pokrycia jest często losowa i nieprzewidywalna, jak to się mówi, “Zniszczenie ciebie nie ma z tobą nic wspólnego.”
Imitacja konkurentów na poziomie pikseli i szybka aktualizacja bazowych dużych modeli sprawiają, że sceneria startupów AI C-end jest prawie zawsze utrzymywana tylko przez krótki czas.
Jeśli chodzi o to, jak wykorzystać niezwykle niskie prawdopodobieństwo stania się hitem, eksperci branżowi jednogłośnie uważają, że “zasadniczo nie ma doświadczenia, którym można by się kierować.”
“Little Tigers” weszły w dzisiejszy kłopot, w dużej mierze dlatego, że zainwestowały zbyt dużo w bazowy duży model i nie doceniły siły roboczej, zasobów finansowych i zasobów materialnych wymaganych do przetrwania i wyróżnienia się na tej ścieżce, co utrudnia różnicowanie na ścieżce aplikacji.
Teraz “Little Tigers” są coraz mniej zdeterminowane do atakowania AGI, a Li Kaifu publicznie stwierdził, że tylko DeepSeek, Ali i Byte pozostaną w krajowym bazowym dużym modelu.
W tym względzie eksperci branżowi, którzy komunikowali się z Zhiwei, zasadniczo zgadzają się z tym poglądem.
Jiang Shao powiedział, że startupy AI, które nadal ciężko pracują nad technologią dużych modeli, zasadniczo muszą umrzeć. Najbardziej obiecujący jest zdecydowanie DeepSeek, drugi to Alibaba, a trzeci to ByteDance. Oczekuje się, że pierwsze miejsce uzyska 50%-80% ruchu, a dwa ostatnie mogą uzyskać 10% ruchu. Sedno leży w tym, kto pierwszy stworzy AGI i kto jest ostatecznym zwycięzcą.
DeepSeek jest obecnie najbardziej konkurencyjny w dziedzinie dużych modeli, a jego innowacje technologiczne i wydajność w praktycznych zastosowaniach są bez zarzutu. Alibaba i ByteDance również mają silną konkurencyjność, zwłaszcza w aplikacjach wieloplatformowych i zasobach danych. Ranking opiera się głównie na możliwościach innowacyjnych każdej firmy w zakresie technologii podstawowych, mocy obliczeniowej, zasobów danych i praktycznych zastosowań.
Zespoły Zhipu i Kimi mocno wierzą, że dalsze wzmacnianie możliwości modelu bazowego to przyszłość. W przeciwieństwie do tego, wierzę, że wraz ze zmianami w popycie rynkowym i dywersyfikacją scenariuszy zastosowań, ścieżka prostego wzmacniania modelu bazowego może być ograniczona, a bardziej elastyczne i adaptacyjne ścieżki rozwoju modelu mogą być bardziej konkurencyjne na rynku.
Konkurencja w technologii dużych modeli jest niezwykle zacięta, a firmy z ogromnymi inwestycjami muszą ostatecznie mieć jasne przełomy w innowacjach, mocy obliczeniowej, danych i optymalizacji, aby utrzymać konkurencyjność. Inne firmy, którym nie uda się nadążyć za postępem technologicznym lub nie będą w stanie sprostać popytowi rynkowemu, będą stopniowo eliminowane.
Liang He powiedział, że tylko DeepSeek, Ali i Byte pozostaną w krajowej firmie bazowej dużego modelu w przyszłości, w oparciu o fakt, że te trzy mają siłę i determinację, aby inwestować super zasoby w badania i rozwój. W przypadku Byte niemożliwe jest przegapienie okazji na duże modele, w przeciwnym razie będzie to miało duży wpływ na całość. Technologia DeepSeek nie będzie miała zbyt wielu barier dla Byte, ale DeepSeek ma obecnie większą przewagę w wydajności badawczo-rozwojowej. Otwarty model Qianwen Alibaba jest na wysokim poziomie. Zanim DeepSeek stał się popularny, Qianwen i Llama zasadniczo ścigały się nawzajem. Dla Alibaba model Qianwen może nie zarabiać, ale powiązane działalności chmurowe mogą zarabiać, a Byte jest podobny i może nadal wykorzystywać technologię dużych modeli do ciągłej optymalizacji doświadczeń Douyin i innych aplikacji. Dla startupów AI, jeśli sam model nie zarabia, dotyka to korzeni przetrwania.
Wang Wenguang powiedział, że przewaga DeepSeek polega głównie na idealizmie technologicznym. W ciągu dwóch lub trzech miesięcy przed i po Święcie Wiosny ruch DeepSeek był ogromny. Gdyby chciał komercjalizować, wkrótce osiągnąłby szczyt na świecie, a inne duże modele, takie jak Doubao, nie miałyby żadnych szans. Dopóki DeepSeek nie udostępni metod optymalizacji związanych z infrastrukturą w nadchodzącym tygodniu otwartego oprogramowania, może na tym polegać, aby zarabiać pieniądze w przyszłości, aby inni nie mieli szans. DeepSeek nie został sfinansowany i nie musi podlegać wpływowi inwestorów. Idealizm technologiczny i talent to największe bariery. W porównaniu z OpenAI, wyniki, które OpenAI może teraz zobaczyć, to zasadniczo wyniki badań przed sporem między Altmanem i Ilyą. Przynajmniej punkty innowacyjne zostały określone. Teraz, po odejściu oryginalnego zespołu idealistów, OpenAI samo w sobie prawie nie ma innowacji. Obecnie innowacje OpenAI znajdują się bardziej na poziomie aplikacji, takim jak Deep Research. Nie ma barier dla innowacji na poziomie aplikacji, więc musi konkurować z konkurentami.
Wang Mu, ekspert ds. technologii AI w dużej fabryce, powiedział Zhiwei, że o ile nie ma pieniędzy, talentu i sprzętu, nie ma potrzeby marnowania wysiłku na wstępne trenowanie dużych modeli. DeepSeek miał klaster 10 000 kart już w 2021 roku i nie brakuje mu pieniędzy. W przeciwieństwie do tego, inne małe i średnie firmy z trudem mogą zebrać ten warunek.
Gao Peng stwierdził, że startupy AI chcą przetrwać, nadal muszą zwrócić się do aplikacji. Tak myślałem rok lub dwa lata temu, a teraz może być za późno, aby się zwrócić. Pierwszą partią firm AI, które zostaną wyeliminowane w następnej kolejności, będą te, które tworzą bazowe duże modele. Trenowanie dużych modeli ma w rzeczywistości wiele złożonych szczegółów i jest bardzo zależne od akumulacji doświadczeń. Wewnętrzne szczegóły architektury Transformat