L’evoluzione rapida della tecnologia IA in Cina ha portato sia entusiasmo che incertezza per molte startup. Un tempo piene di obiettivi ambiziosi, alcune aziende stanno ora ricalibrando le loro strategie, affrontando le dure realtà di un mercato competitivo e ad alta intensità di risorse.
Da Grandi Visioni a Pivot Strategici
Una recente lettera interna dell’Amministratore Delegato di una delle “Piccole Tigri dell’IA” cinese, Baichuan Intelligent, ha segnato il secondo anniversario dell’azienda e ha evidenziato un cambiamento strategico. L’attenzione si concentrerà, privilegiando le applicazioni mediche. Ciò contrastava nettamente con la sua missione iniziale di creare un modello di base rivoluzionario simile a OpenAI, completo di applicazioni innovative.
Allo stesso modo, Li Kaifu, fondatore di un’altra “Piccola Tigre”, 01.AI, ha annunciato a gennaio che la sua azienda avrebbe abbracciato un approccio “piccolo ma bello”. Questa è stata una notevole deviazione dalla grande visione di costruire una piattaforma AI 2.0 per accelerare l’arrivo dell’AGI.
Questi ritiri strategici hanno alimentato la speculazione, con alcuni osservatori che suggeriscono che queste “Piccole Tigri” stiano diventando più simili a “gatti malati”. In un ambiente caratterizzato da un cambiamento costante, come possono queste aziende garantire il loro futuro?
Per rispondere a questa domanda, il team editoriale di Zhiwei ha cercato approfondimenti da vari esperti, tra cui specialisti di tecnologia di modelli di grandi dimensioni, esperti di IA in finanza e sanità ed esperti di tecnologia IA di aziende leader.
L’Effetto DeepSeek e le Strategie in Evoluzione
Il panorama dell’IA è cambiato radicalmente dopo l’esplosiva popolarità di DeepSeek, un modello che ha scosso il mercato. Come un formidabile guerriero, DeepSeek ha sconvolto il panorama, costringendo molte aziende di IA a rivalutare le loro posizioni e a perseguire percorsi diversi.
Tuttavia, questa trasformazione è iniziata anche prima di quanto molti si rendessero conto. Secondo Wang Wenguang, un esperto di tecnologia di modelli di grandi dimensioni, alcune aziende cinesi di IA hanno iniziato ad abbandonare la ricerca della formazione di modelli di grandi dimensioni anche prima del rilascio di DeepSeek V3 e R1. I costi erano semplicemente troppo alti e queste aziende si sentivano incapaci di competere con alternative liberamente disponibili e open source come DeepSeek V2.5 e Qwen 70B di Alibaba.
Liang He, un esperto di un’azienda di servizi di tecnologia IA, ha aggiunto che mentre la maggior parte delle “Piccole Tigri” stava ancora addestrando modelli di grandi dimensioni a metà del 2024, il loro investimento era già diminuito in modo significativo. Entro gennaio 2025, con il rilascio di DeepSeek R1, molte aziende più piccole si sono rese conto che non potevano tenere il passo.
Questo brusco cambiamento ha causato un importante cambio di direzione per le “Piccole Tigri”, allontanandosi dallo sviluppo dell’AGI verso approcci più specializzati.
Baichuan e 01.AI hanno abbandonato il pre-addestramento di modelli di grandi dimensioni, concentrandosi rispettivamente sull’IA medica e sull’applicazione industriale. MiniMax sta riducendo le sue operazioni B2B e si sta concentrando sui mercati esteri con la generazione di video C-end e altre applicazioni. Zhipu, Moonshot AI e StepUp sono ancora attivi nella comunità open source, ma non hanno prodotto nuovi modelli che superino DeepSeek R1. Zhipu si è assicurata notevoli finanziamenti e partnership governative-aziendali, garantendo la sua sopravvivenza. Il prodotto principale di Moonshot AI, Kimi, ha visto la sua posizione minacciata da Yuanbao, rendendo il suo posizionamento sempre più imbarazzante.
Nel complesso, le “Piccole Tigri” stanno convergendo sempre più con il mercato SaaS B2B, che alcuni considerano “senza immaginazione”.
Il Fascino e i Limiti del Mercato B2B
01.AI ha recentemente annunciato la sua intenzione di integrare completamente DeepSeek per creare una piattaforma aziendale one-stop di modelli di grandi dimensioni per vari settori. Tuttavia, questa mossa è stata accolta con scetticismo.
Jiang Shao, un esperto di IA finanziaria, ritiene che il futuro di 01.AI sia incerto a causa della sua ampia attenzione, della mancanza di competitività tecnologica in seguito all’emergere di DeepSeek e delle limitate capacità di commercializzazione.
Wang Wenguang ha fatto eco a questo sentimento, osservando che la barriera tecnica all’ingresso per una piattaforma one-stop di modelli di grandi dimensioni è relativamente bassa.
Wang ha condiviso la sua esperienza nello sviluppo di una tale piattaforma in modo indipendente in circa sei mesi, vendendola attraverso canali personali. Ha sostenuto che, sebbene sia difficile trarre profitto da questo prodotto come azienda, può essere redditizio come impresa individuale.
Wang collabora con diverse aziende B2B che offrono servizi di modelli di grandi dimensioni ma non dispongono di una piattaforma tecnica. Fornisce la sua piattaforma a un basso costo, circa 40.000-50.000 yuan per licenza, sottraendo significativamente le aziende più grandi.
La sua piattaforma, KAF (Knowledge-based Agent Factory), utilizza grafi di conoscenza, database vettoriali e motori di ricerca per fornire modelli di grandi dimensioni e applicazioni Agent. Consente agli utenti di creare assistenti di conoscenza o Agenti personalizzati senza codifica attraverso la gestione di prompt e modelli. Wang ha notato la prevalenza di piattaforme simili sul mercato, rendendola facile da replicare.
Secondo Wang, un’azienda che cerca di sviluppare un’applicazione B2B di modelli di grandi dimensioni può creare rapidamente un prodotto assumendo un piccolo team di persone qualificate o collaborando con un’azienda di IA esterna. Questo approccio è significativamente più economico dell’addestramento di un modello di grandi dimensioni.
Oltre al modello di piattaforma, le soluzioni integrate forniscono hardware, software e ambienti di esecuzione, offrendo funzionalità pronte all’uso. Zhang Sensen, responsabile del gruppo della piattaforma tecnologica presso Ping An Insurance, ritiene che le soluzioni integrate abbiano un mercato praticabile, in particolare tra le istituzioni governative ed educative con limitate capacità di implementazione tecnica. Queste soluzioni danno la priorità alla facilità d’uso e all’autonomia tecnica, offrendo vantaggi come la sicurezza dei dati, la conformità alla privacy e l’ottimizzazione hardware-software. Possono anche utilizzare chip prodotti internamente, bypassando le restrizioni e migliorando l’efficienza. Le aziende sensibili ai costi e focalizzate sul ROI possono trovare le soluzioni integrate interessanti a causa dei loro cicli di vita più lunghi.
Il mercato SaaS nazionale ha storicamente affrontato sfide come elevati requisiti di personalizzazione, prodotti generici e omogeneizzati, intensa concorrenza, strategie di prezzi bassi e un focus sulla monetizzazione a breve termine. I clienti in questo mercato hanno spesso bassi livelli di digitalizzazione e una limitata volontà di pagare.
Al contrario, il mercato SaaS internazionale enfatizza la specializzazione, con aziende che si concentrano su aree specifiche e forniscono servizi approfonditi a clienti di grandi e medie dimensioni con una maggiore volontà di pagare.
Il campo dei modelli di grandi dimensioni riflette queste tendenze. Eventi recenti nel mercato SaaS internazionale lo dimostrano:
- Nel febbraio 2025, MongoDB ha acquisito Voyage AI, una startup di IA di 17 mesi focalizzata sull’incorporamento e il ri-ranking di modelli, per 220 milioni di dollari.
- Nel 2024, Amazon ha annunciato un accordo di licenza tecnologica con Adept, una startup di AI Agent di due anni, con alcuni membri di Adept che si sono uniti al team AGI di Amazon.
Queste startup hanno ottenuto successo concentrandosi su una nicchia specifica all’interno della tecnologia di modelli di grandi dimensioni. Tali esempi sono rari in Cina. Molte piccole e medie imprese devono costantemente proteggersi dall’ingresso di aziende più grandi nel loro spazio.
Wang Wenguang, attingendo alla sua vasta esperienza nel mercato B2B, ha descritto le sue dure realtà. Ha osservato che, sebbene esista un grande mercato per le piattaforme one-stop, è frammentato. Le aziende più piccole con costi operativi inferiori possono offrire prezzi competitivi, sottraendo le aziende più grandi. Questo riduce il prezzo dei servizi applicativi. Anche le grandi aziende affrontano la concorrenza di altre startup e integratori tradizionali. Le grandi aziende possono avere i propri modelli di grandi dimensioni e vantaggi di marchio, ma affrontano simili strategie aziendali B2B.
Come ha affermato Wang: “Sto anche usando DeepSeek e molte altre aziende stanno usando DeepSeek, quindi non c’è differenziazione. Ci sono così tanti fornitori di cloud in Cina, quindi ci saranno almeno così tanti concorrenti. Il mercato B2B nazionale è sempre stato così; per sopravvivere, devi avere forti connessioni, un buon servizio o prezzi bassi”.
Liang He ha offerto una concisa valutazione delle scelte attuali e delle prospettive future di 01.AI:
- La decisione di Li Kaifu di spostare completamente l’attività di 01.AI verso applicazioni B2B e promuovere una piattaforma aziendale one-stop di modelli di grandi dimensioni è commercialmente valida ma porterà a un’intensa concorrenza.
- La necessità di 01.AI di offrire prodotti di modelli di grandi dimensioni a prezzi inferiori rispetto alle aziende più grandi è il risultato della sua mancanza di vantaggi unici a livello di applicazione.
- La mossa di 01.AI verso il B2B segnala una perdita di immaginazione e progetti meno “sexy”. Questo è simile al destino di molte aziende di computer vision della precedente ondata di IA nel 2017.
- 01.AI potrebbe avere opportunità se esplora i mercati esteri.
Rispetto a 01.AI, le opinioni sul futuro di Baichuan sono meno pessimistiche.
Tuttavia, l’ingresso di Baichuan nel campo medico manca di vantaggi unici, specialmente nei dati.
Jiang Shao ha affermato che il passaggio di Baichuan alla medicina è semplicemente un modo per sopravvivere. Tuttavia, rispetto a 01.AI, Baichuan sta almeno tentando di entrare in un mercato di nicchia.
Zhang Sensen ha affermato di essere più ottimista riguardo alle aziende con dati medici che sviluppano modelli medici di grandi dimensioni rispetto alle aziende tecnologiche. Ciò vale per qualsiasi azienda che cerca di creare un modello di grandi dimensioni specifico per il settore. La sfida principale nella creazione di modelli medici di grandi dimensioni risiede nei dati, non nel modello stesso. Ci sono molti ottimi ospedali in Cina che possono affinare un modello di grandi dimensioni utilizzando DeepSeek per il proprio uso.
Come si possono ottenere efficacemente i dati medici? Jiang Shao ha affermato che le startup tecnologiche di IA mancano di vantaggi nei dati. Per creare modelli medici di grandi dimensioni, potrebbero aver bisogno di collaborare con aziende che già forniscono servizi IT agli ospedali.
Secondo quanto riferito, una delle “Piccole Tigri” ha collaborato esclusivamente con un grande forum nazionale di scambio di medici per addestrare modelli utilizzando il vasto numero di casi generati dagli scambi di medici.
Oltre a una prospettiva più ottimistica sui mercati di nicchia, gli esperti del settore hanno speranze per il fondatore di Baichuan, Wang Xiaochuan.
Liang He ritiene che il successo di Wang Xiaochuan nello specializzarsi in medicina dipenda dal fatto che voglia perseguire un ideale o fare soldi. Crede che Wang sia più incline a perseguire un ideale, creando risultati di ricerca di IA medica rivoluzionari.
Wang Wenguang ha sottolineato la natura obsoleta di questo mercato. Ha affermato che, se l’obiettivo è la commercializzazione a breve termine, anche il campo medico è altamente competitivo, simile al mercato B2B complessivo. Molte aziende possono utilizzare grafi di conoscenza, ricerche vettoriali e modelli di grandi dimensioni per applicazioni mediche.
Secondo le discussioni di Zhiwei con esperti di IA medica, la ricerca medica stessa presenta significative lacune di conoscenza e nuove conoscenze crescono rapidamente. Pertanto, c’è un significativo potenziale per l’utilizzo di modelli di grandi dimensioni per condurre ricerche mediche di base. Ad esempio, il modello AlphaFold per la previsione della struttura delle proteine è stato utilizzato da oltre 1,8 milioni di scienziati in tutto il mondo per accelerare la ricerca, compreso lo sviluppo di materiali bio-rinnovabili e l’avanzamento della ricerca genetica, secondo Meis Medical.
Oltre a perseguire un ideale o fare soldi, la startup di IA medica deve anche affrontare la questione se creare o meno un modello medico generale di grandi dimensioni.
Zhang Sensen ha affermato che non c’è stata una svolta nei modelli medici generali di grandi dimensioni nel mercato nazionale, principalmente a causa della dipendenza da potenti attrezzature mediche per la raccolta e l’applicazione di dati su larga scala. Molte strutture mediche in Cina non sono state ampiamente popolarizzate, rendendo difficile per l’IA eseguire diagnosi accurate. Tuttavia, alcuni ospedali forti, come la Mayo Clinic, hanno iniziato a esplorare il lancio dei propri modelli di grandi dimensioni. Sebbene sia difficile vedere opportunità di profitto a breve termine, questi tipi di modelli di grandi dimensioni possono avere un profondo impatto sull’industria medica a lungo termine.
L’industria medica deve anche affrontare la sfida della diagnosi completamente automatizzata, specialmente nel mercato nazionale, dove le attrezzature sono inadeguate e l’IA non può sostituire completamente i metodi diagnostici tradizionali. La mancanza di attrezzature mediche diffuse, specialmente nelle aree remote, rende difficile coprire completamente la tecnologia medica, quindi la diagnosi completamente automatizzata rimane una sfida significativa.
L’industria medica ha rigidi requisiti di licenza e conformità e i modelli di grandi dimensioni devono affrontare problemi di conformità quando entrano nel campo medico. I futuri servizi medici C-end possono combinare le tecniche dei medici e l’IA per migliorare l’efficienza della diagnosi e del trattamento, specialmente per le generazioni più giovani.
Infine, anche trascurando le caratteristiche del mercato B2B nazionale, la concorrenza nelle applicazioni di modelli di grandi dimensioni rende difficile sopravvivere nel mercato To B. Wang Wenguang ha affermato che, sebbene i modelli di progettazione per i prodotti To B di modelli di grandi dimensioni siano ancora in fase di esplorazione, alla fine convergeranno. Questo è vero non solo in Cina ma anche nelle aziende tecnologiche della Silicon Valley come OpenAI, Anthropic e Google. Finché non c’è una differenza significativa nelle prestazioni dei modelli stessi, è impossibile fare soldi in questo mercato e alla fine tutti saranno allo stesso livello.
Questo è il motivo per cui DeepSeek R1 ha avuto il suo impatto maggiore non in Cina ma all’estero, specialmente sulle aziende tecnologiche della Silicon Valley. Il mercato azionario statunitense ha iniziato a sperimentare un’elevata volatilità e quindi un calo dopo il rilascio di R1. La logica di base è semplice: i modelli di grandi dimensioni della Silicon Valley sono stati raggiunti dalla Cina. Pur non superandoli, l’incapacità di ampliare il divario ha reso impossibile supportare valutazioni così elevate, portando a un calo dei prezzi delle azioni.
Naturalmente, c’è un altro modo per il mercato To B di attirare clienti: l’open source. I principali modelli di profitto per l’open source includono la fornitura di funzioni a pagamento, l’hosting cloud e servizi a valore aggiunto come la consulenza a livello aziendale e la formazione basata sulla tecnologia open source.
L’effetto più diretto dei modelli di grandi dimensioni open source è promuovere la popolarizzazione della tecnologia. Zhang Sensen ha affermato che l’open source di DeepSeek ha accelerato in modo significativo l’applicazione dei modelli di grandi dimensioni da parte delle aziende. L’alta dirigenza supporta molto l’applicazione dei modelli di grandi dimensioni. Poiché i modelli di grandi dimensioni si comportano bene nelle applicazioni pratiche, specialmente nel ridurre l’intervento umano e aumentare l’efficienza, il supporto continuerà ad aumentare.
Il settore finanziario, come il settore con la migliore qualità dei dati, ha sempre avuto un ricco accumulo tecnico nell’IA e può tenere il passo rapidamente. Indipendentemente da DeepSeek, la finanza implementerà la tecnologia IA. Tuttavia, con DeepSeek, l’IA non solo abiliterà le attività principali del settore finanziario, ma sarà utilizzata anche nelle attività e operazioni di ufficio quotidiane che in precedenza erano difficili da svolgere.
Le operazioni erano molto costose. Ad esempio, l’analisi della causa principale in precedenza richiedeva il monitoraggio operativo tradizionale e AIOps, nonché la formazione di piccoli modelli. Ora, DeepSeek può essere utilizzato in combinazione con le basi di conoscenza per generare piani di applicazione per gestire il monitoraggio, gli allarmi, l’analisi self-service e la tracciabilità, l’elaborazione automatizzata e il miglioramento della stabilità, che è più flessibile di AIOps.
Inoltre, la copertura dell’IA delle operazioni è diventata più ampia, con una maggiore considerazione per l’interattività e l’iniziativa. Iniziativa significa consentire all’IA di eseguire proattivamente le operazioni. Passando dall’affidarsi a regole, esseri umani o anche esperienza personale, dove il livello di esperienza umana determinava il livello delle capacità operative, modelli di IA più leggeri possono ora essere utilizzati per raggiungere direttamente questo obiettivo.
Sebbene il tasso di allucinazioni di DeepSeek sia ancora alto, anche non significativamente diverso da altri modelli simili, le sue capacità di ragionamento e applicazione pratica possono compensare gli effetti negativi delle allucinazioni. Questo problema sarà gradualmente migliorato attraverso l’affinamento e l’ottimizzazione utilizzando RAG e altre tecnologie correlate.
L’esperto di tecnologia di modelli di grandi dimensioni di Alibaba, Gao Peng, ritiene che l’impatto di DeepSeek vari per le aziende grandi e piccole:
I modelli di grandi dimensioni utilizzati internamente da Alibaba sono sempre stati i più avanzati del settore, quindi l’emergere di DeepSeek non ha avuto un impatto significativo. Alibaba utilizza DeepSeek per la valutazione delle prestazioni e il confronto, fornendo più di un’ispirazione tecnica. L’implementazione di DeepSeek in Reasoning è relativamente veloce e i dettagli tecnici sono più comuni. DeepSeek è stato anche influenzato da Qianwen.
Al contrario, DeepSeek ha un impatto maggiore sulle piccole e medie imprese, poiché in precedenza non c’era un modello che potesse raggiungere l’effetto di DeepSeek fornendo al contempo implementazione privata a basso costo. Dopo il rilascio di DeepSeek, sono emerse molte aziende che vendono macchine integrate DeepSeek. Tuttavia, DeepSeek non è il più economico rispetto a molte macchine integrate con modelli open source, a seconda degli standard specifici.
In ogni caso, il modello di grandi dimensioni open source nazionale è ora fiorente e può competere a livello globale. Tuttavia, sulla base dell’implementazione di modelli di grandi dimensioni da parte di Ping An Insurance, Zhang Sensen ritiene che i modelli di grandi dimensioni open source abbiano ancora limiti insormontabili:
Per noi, DeepSeek ha principalmente un enorme vantaggio in termini di costi. In termini di capacità, potrebbe essere migliore di altri modelli in scenari operativi in termini di ragionamento, capacità di generalizzazione e comprensione contestuale. Tuttavia, DeepSeek non si comporta bene in scenari più complessi come il controllo del rischio finanziario. Questo perché è necessario un affinamento o persino un’ottimizzazione più dettagliati in combinazione con altri modelli. Pertanto, è necessario un affinamento mirato basato su scenari applicativi specifici per migliorare ulteriormente le prestazioni del modello.
I modelli di grandi dimensioni sviluppati autonomamente da Ping An sono divisi in due livelli: il modello di grandi dimensioni di base sottostante e i modelli di dominio responsabili di banche, assicurazioni e altre attività. I modelli di grandi dimensioni utilizzati internamente si comportano meglio di DeepSeek nel campo della conoscenza professionale, specialmente in campi specifici come la finanza e la medicina, dove i modelli sono più accurati. Tuttavia, DeepSeek ha ancora un forte vantaggio nella capacità di ragionamento. In alcuni scenari, vogliamo usare DeepSeek per un tentativo su piccola scala per vedere se può essere eseguito.
Non c’è una differenza significativa tra Alibaba Qianwen, Baidu Wenxin e Zhipu ChatGLM e DeepSeek a questo riguardo. Il giudizio si basa sul fatto che questi modelli non hanno una differenza significativa rispetto a DeepSeek nella capacità di ragionamento e nella struttura della base di conoscenza.
Nel complesso, l’impatto dei modelli di grandi dimensioni open source è attualmente limitato e il ritmo della concorrenza tra loro è intenso.
I Pericoli del Mercato To C
Mentre la concorrenza è feroce nel mercato To B, ciò non significa che la rotta To C offra più speranza.
La concorrenza nel mercato To C per i modelli di grandi dimensioni è anche molto feroce, ma è molto diversa dal mercato To B.
Il panorama del mercato è in continua evoluzione.
La monetizzazione di To C è difficile.
Le applicazioni più popolari non generano necessariamente le entrate maggiori. Ad esempio, ChatGPT ha le entrate più alte, ma OpenAI perde ancora 5 miliardi di dollari all’anno, mentre molte applicazioni “copia” di ChatGPT probabilmente hanno raggiunto una rapida redditività; dopo che DeepSeek è diventato popolare, imitatori e contraffattori sono arrivati in massa.
Osservare la situazione delle “Piccole Tigri” dal mercato C-end non è ottimista. La comunicazione di Zhiwei con gli esperti del settore ritiene generalmente che i grandi produttori porteranno una grande pressione di sopravvivenza.
Jiang Shao ha affermato che il più performante delle “Piccole Tigri” nel mercato dei consumatori è Kimi di Moonshot AI. Ma ora, Yuanbao di Tencent è al primo posto, DeepSeek è al secondo posto e Doubao è al terzo posto. Le prime tre aziende occupano quasi la maggior parte della quota di mercato. Yuanbao di Tencent ha guadagnato un gran numero di traffico clienti con l’aiuto dell’ecosistema WeChat, mentre DeepSeek si è distinto per la sua innovazione tecnologica e le eccellenti prestazioni in più scenari.
Liang He ha affermato che la tecnologia di modelli di grandi dimensioni di Kimi non è molto diversa dai suoi concorrenti, quindi può essere solo gratuita, il che rende molto difficile la commercializzazione per Moonshot. Come applicazione To C, non è chiaro in cosa differisca da Yuanbao e Doubao. Inoltre, Doubao può essere supportato dalle altre attività di Byte e Yuanbao può essere supportato dalle altre attività di Tencent. Possono investire 100 miliardi per supportare queste applicazioni.
Jiang Shao ha aggiunto che gli utenti C-end sono più preoccupati per la facilità d’uso del prodotto, in cui Tencent e Byte sono migliori. Naturalmente, anche Alibaba ha opportunità. Alibaba sta incubando un’applicazione chiamata “AI Listening”, che utilizza l’IA per la chat e l’interazione, con l’obiettivo di sostituire Douyin nella piattaforma video breve. Sebbene Douyin attragga un gran numero di creatori per generare contenuti di alta qualità, le applicazioni di chat AI hanno il potenziale per attirare gruppi di utenti fornendo esperienze più personalizzate e interattive. La differenza tra i due risiede nella creazione di contenuti e nell’interazione. Se Alibaba può superare questo, ha anche la possibilità di ribaltare la situazione, ma è difficile dire se Tencent seguirà l’esempio.
Per quanto riguarda MiniMax, le opinioni del settore sono leggermente diverse.
Liang He ritiene che Conch AI di MiniMax stia attualmente realizzando un buon profitto. Ha trovato la sua strada, ma non è ancora noto se questo percorso consentirà a MiniMax di aumentare abbastanza la sua valutazione. A causa del suo orientamento all’applicazione, MiniMax è più rilassato dopo l’uscita di DeepSeek. Se utilizzano i modelli di DeepSeek, risparmierà i costi di ricerca e sviluppo del modello e le sue applicazioni possono continuare a fare soldi, anche di più.
Jiang Shao ritiene che MiniMax abbia una possibilità se riesce a creare un’APP popolare in seguito, ma Alibaba potrebbe superarla e creare prima un’APP popolare, quindi anche se MiniMax ha una possibilità, la probabilità non è alta.
In definitiva, la differenziazione del prodotto è ancora il punto di svolta per le applicazioni C-end.
Secondo l’ultimo rapporto di a16z “Top 100 Gen AI Consumer Apps”, molte applicazioni a basso utilizzo raggiungono effettivamente entrate migliori. Alcuni prodotti con scarsa versatilità, come l’identificazione delle piante e la nutrizione, attirano utenti paganti più dei prodotti generali.
È difficile differenziare i prodotti AI generali. Gli utenti hanno una bassa volontà di pagare, il ciclo di profitto è lungo, quindi non possono sopravvivere alle grandi aziende.
E se la differenziazione non è abbastanza profonda verticalmente, è anche facile essere internalizzata dal modello di grandi dimensioni di base attraverso aggiornamenti di capacità. Ad esempio, le recenti capacità di generazione di immagini di GPT-4o hanno portato un colpo di riduzione dimensionale alle start-up da testo a immagine come Midjourney. Questa capacità di copertura è spesso casuale e imprevedibile, come si suol dire, “Distruggerti non ha nulla a che fare con te”.
L’imitazione a livello di pixel dei concorrenti e il rapido aggiornamento dei modelli di grandi dimensioni di base fanno sì che lo scenario delle start-up AI C-end sia quasi sempre mantenuto solo per un breve periodo.
Per quanto riguarda come cogliere la probabilità estremamente bassa di diventare un successo, gli esperti del settore ritengono unanimemente che “non ci sia praticamente alcuna esperienza da seguire”.
Le “Piccole Tigri” sono entrate nella difficile situazione odierna, in gran parte perché hanno investito troppo nel modello di grandi dimensioni di base e hanno sottovalutato la manodopera, le risorse finanziarie e le risorse materiali necessarie per sopravvivere ed eccellere in questa pista, risultando difficile differenziarsi nella pista delle applicazioni.
Ora, le “Piccole Tigri” sono sempre meno determinate ad attaccare AGI e Li Kaifu ha dichiarato pubblicamente che solo DeepSeek, Ali e Byte saranno lasciati nel modello di grandi dimensioni di base nazionale.
A questo proposito, gli esperti del settore che hanno comunicato con Zhiwei concordano sostanzialmente con questo punto di vista.
Jiang Shao ha affermato che le start-up AI che continuano a lavorare sodo sulla tecnologia di modelli di grandi dimensioni devono fondamentalmente morire. La più promettente è sicuramente DeepSeek, la seconda è Alibaba e la terza è ByteDance. Si prevede che il primo posto otterrà il 50%-80% del traffico e gli ultimi due potrebbero ottenere il 10% del traffico. Il fulcro risiede in chi crea prima AGI e chi è il vincitore finale.
DeepSeek è attualmente il più competitivo nel campo dei modelli di grandi dimensioni e la sua innovazione tecnologica e le prestazioni nelle applicazioni pratiche sono impeccabili. Alibaba e ByteDance hanno anche una forte competitività, specialmente nelle applicazioni multipiattaforma e nelle risorse di dati. La classifica si basa principalmente sulle capacità di innovazione di ogni azienda nella tecnologia di base, nella potenza di calcolo, nelle risorse di dati e nelle applicazioni pratiche.
I team di Zhipu e Kimi credono fermamente che continuare a migliorare le capacità del modello di base sia il futuro. Al contrario, credo che con i cambiamenti nella domanda del mercato e la diversificazione degli scenari applicativi, il percorso di semplice rafforzamento del modello di base possa essere limitato e percorsi di sviluppo del modello più flessibili e adattabili potrebbero essere più competitivi sul mercato.
La concorrenza nella tecnologia di modelli di grandi dimensioni è estremamente feroce e le aziende con enormi investimenti devono alla fine avere chiare scoperte nell’innovazione, nella potenza di calcolo, nei dati e nell’ottimizzazione per mantenere la competitività. Altre aziende che non riescono a tenere il passo con il progresso tecnologico o che non sono in grado di far fronte alla domanda del mercato saranno gradualmente eliminate.
Liang He ha affermato che solo DeepSeek, Ali e Byte saranno lasciati nella società nazionale di modelli di grandi dimensioni di base in futuro, sulla base del fatto che questi tre hanno la forza e la determinazione per investire super risorse nella ricerca e sviluppo. Per Byte, è impossibile perdere l’opportunità per i modelli di grandi dimensioni, altrimenti avrà un grande impatto sul suo insieme. E la tecnologia di DeepSeek non avrà troppe barriere per Byte, ma DeepSeek ha attualmente un vantaggio maggiore nell’efficienza della ricerca e sviluppo. Il modello open source Qianwen di Alibaba stesso è ad alto livello. Prima che DeepSeek diventasse popolare, Qianwen e Llama si inseguivano sostanzialmente. Per Alibaba, il modello Qianwen potrebbe non fare soldi, ma le attività cloud correlate possono fare soldi e Byte è simile e può continuare a utilizzare la tecnologia di modelli di grandi dimensioni per ottimizzare continuamente l’esperienza di Douyin e altre APP. Per le start-up AI, se il modello stesso non fa soldi, tocca la radice della sopravvivenza.
Wang Wenguang ha affermato che il vantaggio di DeepSeek risiede principalmente nell’idealismo tecnologico. Entro due o tre mesi prima e dopo la Festa di Primavera, il traffico di DeepSeek era enorme. Se volesse commercializzare, raggiungerebbe presto la vetta nel mondo e altri modelli di grandi dimensioni come Doubao non avrebbero alcuna possibilità. Finché DeepSeek non apre i metodi di ottimizzazione correlati all’infrastruttura nella recente settimana open source, può fare affidamento su questo per fare soldi in futuro, in modo che gli altri non abbiano alcuna possibilità. DeepSeek non è stato finanziato e non ha bisogno di essere influenzato dagli investitori. L’idealismo tecnologico e il talento sono le maggiori barriere. Rispetto a OpenAI, i risultati che OpenAI può vedere ora sono fondamentalmente i risultati della ricerca prima della disputa tra Altman e Ilya. Almeno i punti di innovazione sono stati determinati. Ora, dopo la partenza del team originale di idealisti, OpenAI stesso non ha quasi nessuna innovazione. Attualmente, l’innovazione di OpenAI è più a livello di applicazione, come Deep Research. Non ci sono barriere all’innovazione a livello di applicazione, quindi deve competere con i concorrenti.
Wang Mu, un esperto di tecnologia AI di una grande fabbrica, ha detto a Zhiwei che, a meno che non ci siano soldi, talento e hardware, non è necessario sprecare sforzi nel pre-addestramento di modelli di grandi dimensioni. DeepSeek aveva un cluster di 10.000 schede già nel 2021 e non manca di soldi. Al contrario, altre piccole e medie imprese difficilmente riescono a mettere insieme questa condizione.
Gao Peng ha affermato che le start-up AI vogliono sopravvivere, devono ancora rivolgersi alle applicazioni. Lo pensavo uno o due anni fa e ora potrebbe essere troppo tardi per girare. Il primo lotto di aziende AI da eliminare in seguito saranno quelle che creano modelli di grandi dimensioni di base. La formazione di modelli di grandi dimensioni ha in realtà molti dettagli complessi ed è molto dipendente dall’accumulo di esperienza. I dettagli interni dell’architettura Transformer sono generalmente ben compresi, ma i documenti di modelli open source o closed source fondamentalmente non ti dicono come vengono preparati i dati, quali sono i dettagli dei dati, quanto è grande la scala dei dati e quanto è buona la qualità dei dati. Non esiste uno standard unificato nel settore.
L’open source aperto a metà è sempre stata una pratica tipica nella traccia dei modelli di grandi dimensioni. Attualmente, ci sono pochissimi modelli di grandi dimensioni che divulgheranno completamente il codice, i pesi, i set di dati e il processo di formazione. I più noti sono OLMo, BLOOM, ecc.
Tuttavia, anche se rivolgersi alle applicazioni può sopravvivere? Dalla precedente analisi della traccia To B e della traccia To C, è quasi difficile per le start-up AI formare le proprie barriere industriali nelle applicazioni. A questo proposito, Gao Peng ha affermato che la chiave per formare le proprie barriere industriali risiede nei dati che si hanno. I modelli possono essere utilizzati da chiunque. I dati sono divisi in due aspetti: uno è l’esperienza sul campo dell’imprenditore e l’altro sono i dati in mano.
Dal punto di vista della cultura aziendale, Gao Peng ritiene che la ricerca e lo sviluppo di modelli di grandi dimensioni di base richiedano uno spirito di duro lavoro sperimentale e ingegneristico. “Per molto tempo prima, molte start-up AI nazionali erano troppo in vista. Quando si fa tecnologia, si dovrebbe prima fare in modo discreto e poi promuoverla in modo visibile. Alcuni team sono composti più pesantemente da accademici, ma le persone nel mondo accademico a volte studiano la tecnologia in modo troppo teorico. In termini di talento o team, il successo di un team di modelli di grandi dimensioni dipende principalmente dal fatto che il capo comprenda i modelli di grandi dimensioni. Se il capo non comprende la tecnologia dei modelli di grandi dimensioni o non ha la fede per persistere, perché non fa soldi, non funzionerà affatto. Il successo di DeepSeek si basa maggiormente su una modalità organizzativa dall’alto verso il basso. Il capo comprende molto bene i dettagli tecnici e guida tutti a farlo insieme. Ci sono troppo pochi modelli nazionali che soddisfano questo modello.”
Per quanto riguarda l’accesa discussione del settore sulla previsione del vincitore finale del modello di grandi dimensioni di base nazionale, Gao Peng ritiene che questo giudizio sia troppo precoce. “Non ci saranno molte differenze nei percorsi tecnici dei giocatori che possono partecipare alla competizione. Basta seguire l’architettura Transformer e fare un’ottimizzazione dettagliata. Anche Mamba e RWKV hanno speranza. La chiave è fare le cose con calma e il tempo dimostrerà tutto. Il vincitore finale e i primi tre non sono facili da dire. Lo stack tecnologico del modello di grandi dimensioni è una cosa molto complicata e chissà se ci sono molte persone che stanno silenziosamente facendo una cosa, ma il momento non è ancora arrivato.”
Nella situazione attuale in cui è difficile giudicare il vincitore del modello, i dati sono diventati il fossato più importante. Konstantine Buhler, partner di Sequoia Capital, ha detto una volta che un errore che OpenAI ha fatto su ChatGPT è stato quello di non consentire la modifica delle risposte, il che avrebbe potuto fornire dati di qualità superiore nel ciclo di feedback e costruire un fossato più profondo.
Che i dati possano consentire a un determinato settore di svilupparsi ulteriormente con l’aiuto dell’IA o di portare nuove opportunità commerciali nel presente è anche molto importante. Zhang Sensen ha affermato che la maturità dell’atterraggio dell’IA è più vicina ai settori finanziari e Internet. Sono più ottimista riguardo all’ufficio AI, agli affari governativi AI e all’e-commerce AI. Si basa principalmente sul suo alto grado di digitalizzazione e sull’alta certezza delle prestazioni.
“Sebbene l’e-commerce sia relativamente maturo, l’IA continuerà a migliorare l’efficienza dell’e-commerce, specialmente nella raccomandazione di merci, nel servizio clienti e nell’ottimizzazione della logistica. L’IA può migliorare l’efficienza delle piattaforme di e-commerce attraverso un’analisi di mercato più accurata e l’ottimizzazione del processo decisionale. Questo miglioramento dell’efficienza non sarà solo la continuazione del commercio al dettaglio offline, ma porterà nuove forme di e-commerce, specialmente nel campo dell’e-commerce transfrontaliero, l’IA aiuterà la sua crescita esplosiva.”
“Al contrario, il settore finanziario ha sperimentato un’esplosione di prestazioni nel 2024 e c’è ancora molto spazio per la crescita nel 2025 man mano che l’attività AI si approfondisce.”
“Guardando a quei settori