L'IA Chinoise : Les 'Petits Tigres' à la croisée des chemins

L’évolution rapide de la technologie de l’IA en Chine a suscité à la fois enthousiasme et incertitude pour de nombreuses startups. Autrefois débordantes d’objectifs ambitieux, certaines entreprises recalibrent aujourd’hui leurs stratégies, confrontées aux dures réalités d’un marché concurrentiel et gourmand en ressources.

Des grandes visions aux pivots stratégiques

Une récente lettre interne du PDG de l’un des “Petits Tigres” chinois de l’IA, Baichuan Intelligent, a marqué le deuxième anniversaire de l’entreprise et souligné un changement de stratégie. L’accent serait mis sur les applications médicales. Cela contrastait fortement avec sa mission initiale de créer un modèle de base révolutionnaire semblable à OpenAI, avec des applications innovantes.

De même, Li Kaifu, fondateur d’un autre “Petit Tigre”, 01.AI, a annoncé en janvier que son entreprise adopterait une approche “petite mais belle”. Il s’agissait d’un écart notable par rapport à la grande vision de la construction d’une plateforme AI 2.0 pour accélérer l’arrivée de l’AGI (Intelligence Artificielle Générale).

Ces retraites stratégiques ont alimenté les spéculations, certains observateurs suggérant que ces “Petits Tigres” ressemblent davantage à des “chats malades”. Dans un environnement marqué par un changement constant, comment ces entreprises peuvent-elles assurer leur avenir ?

Pour répondre à cette question, l’équipe éditoriale de Zhiwei a sollicité les points de vue de divers experts, notamment des spécialistes de la technologie des grands modèles, des experts en IA dans les secteurs de la finance et de la santé, et des experts en technologie de l’IA des principales entreprises.

L’effet DeepSeek et les stratégies en mutation

Le paysage de l’IA a radicalement changé à la suite de la popularité explosive de DeepSeek, un modèle qui a ébranlé le marché. Tel un guerrier redoutable, DeepSeek a perturbé le paysage, forçant de nombreuses entreprises d’IA à réévaluer leurs positions et à suivre des voies différentes.

Cependant, cette transformation a commencé encore plus tôt que beaucoup ne l’ont réalisé. Selon Wang Wenguang, un expert en technologie des grands modèles, certaines entreprises chinoises d’IA ont commencé à abandonner la poursuite de la formation de grands modèles avant même la sortie de DeepSeek V3 et R1. Les coûts étaient tout simplement trop élevés, et ces entreprises se sentaient incapables de rivaliser avec les alternatives librement disponibles et open source comme DeepSeek V2.5 et Qwen 70B d’Alibaba.

Liang He, un expert d’une entreprise de services technologiques d’IA, a ajouté que si la plupart des “Petits Tigres” formaient encore de grands modèles à la mi-2024, leur investissement avait déjà considérablement diminué. En janvier 2025, avec la sortie de DeepSeek R1, de nombreuses petites entreprises ont réalisé qu’elles ne pouvaient pas suivre le rythme.

Ce changement brutal a entraîné un changement de direction majeur pour les “Petits Tigres”, passant du développement de l’AGI à des approches plus spécialisées.

Baichuan et 01.AI ont abandonné le pré-entraînement de grands modèles, se concentrant respectivement sur l’IA médicale et l’application industrielle. MiniMax réduit ses opérations B2B et se concentre sur les marchés étrangers avec la génération de vidéos C-end et d’autres applications. Zhipu, Moonshot AI et StepUp sont toujours actifs dans la communauté open source, mais n’ont produit aucun nouveau modèle qui surpasse DeepSeek R1. Zhipu a obtenu un financement considérable et des partenariats gouvernement-entreprise, assurant sa survie. Le principal produit de Moonshot AI, Kimi, a vu sa position menacée par Yuanbao, rendant son positionnement de plus en plus délicat.

Dans l’ensemble, les “Petits Tigres” convergent de plus en plus vers le marché SaaS B2B, que certains considèrent comme “sans imagination”.

L’attrait et les limites du marché B2B

01.AI a récemment annoncé son intention d’intégrer pleinement DeepSeek pour créer une plateforme unique de grands modèles d’entreprise pour diverses industries. Cependant, cette initiative a été accueillie avec scepticisme.

Jiang Shao, un expert en IA financière, estime que l’avenir de 01.AI est incertain en raison de son orientation générale, de son manque de compétitivité technologique après l’émergence de DeepSeek et de ses capacités de commercialisation limitées.

Wang Wenguang a fait écho à ce sentiment, notant que la barrière technique à l’entrée pour une plateforme unique de grands modèles est relativement faible.

Wang a partagé son expérience du développement d’une telle plateforme de manière indépendante en environ six mois, en la vendant par le biais de canaux personnels. Il a fait valoir que s’il est difficile de tirer profit de ce produit en tant qu’entreprise, il peut être rentable en tant qu’entreprise individuelle.

Wang collabore avec plusieurs entreprises B2B qui offrent des services de grands modèles mais qui n’ont pas de plateforme technique. Il fournit sa plateforme à faible coût, environ 40 000 à 50 000 yuans par licence, ce qui est nettement inférieur à celui des grandes entreprises.

Sa plateforme, KAF (Knowledge-based Agent Factory), utilise des graphes de connaissances, des bases de données vectorielles et des moteurs de recherche pour fournir de grandes applications de modèles et d’agents. Elle permet aux utilisateurs de créer des assistants ou des agents de connaissances personnalisés sans codage grâce à la gestion des invites et des modèles. Wang a noté la prévalence de plateformes similaires sur le marché, ce qui la rend facile à reproduire.

Selon Wang, une entreprise qui cherche à développer une application de grands modèles B2B peut rapidement créer un produit en embauchant une petite équipe de personnes qualifiées ou en s’associant à une entreprise d’IA externe. Cette approche est nettement moins chère que la formation d’un grand modèle.

En plus du modèle de plateforme, les solutions intégrées fournissent du matériel, des logiciels et des environnements d’exécution, offrant des fonctionnalités prêtes à l’emploi. Zhang Sensen, responsable du groupe de plateforme technologique chez Ping An Insurance, estime que les solutions intégrées ont un marché viable, en particulier parmi les institutions gouvernementales et éducatives qui ont des capacités de déploiement technique limitées. Ces solutions privilégient la facilité d’utilisation et l’autonomie technique, offrant des avantages tels que la sécurité des données, la conformité à la vie privée et l’optimisation matériel-logiciel. Elles peuvent également utiliser des puces produites localement, contournant ainsi les restrictions et améliorant l’efficacité. Les entreprises soucieuses des coûts et axées sur le retour sur investissement peuvent trouver les solutions intégrées attrayantes en raison de leur cycle de vie plus long.

Le marché SaaS national a toujours été confronté à des défis tels que des exigences de personnalisation élevées, des produits génériques et homogénéisés, une concurrence intense, des stratégies de prix bas et une concentration sur la monétisation à court terme. Les clients de ce marché ont souvent de faibles niveaux de numérisation et une volonté limitée de payer.

En revanche, le marché SaaS international met l’accent sur la spécialisation, les entreprises se concentrant sur des domaines spécifiques et fournissant des services approfondis à des clients de grande et moyenne taille ayant une plus grande volonté de payer.

Le domaine des grands modèles reflète ces tendances. Les événements récents sur le marché SaaS international le démontrent :

  • En février 2025, MongoDB a acquis Voyage AI, une startup d’IA de 17 mois axée sur l’intégration et le reclassement de modèles, pour 220 millions de dollars.
  • En 2024, Amazon a annoncé un accord de licence de technologie avec Adept, une startup d’agents d’IA de deux ans, et certains membres d’Adept ont rejoint l’équipe AGI d’Amazon.

Ces startups ont réussi en se concentrant sur un créneau spécifique dans la technologie des grands modèles. De tels exemples sont rares en Chine. De nombreuses petites et moyennes entreprises doivent constamment se prémunir contre l’entrée de grandes entreprises dans leur espace.

Wang Wenguang, s’appuyant sur sa vaste expérience du marché B2B, a décrit ses dures réalités. Il a noté que s’il existe un grand marché pour les plateformes uniques, il est fragmenté. Les petites entreprises ayant des coûts d’exploitation inférieurs peuvent offrir des prix compétitifs, ce qui réduit ceux des grandes entreprises. Cela fait baisser le prix des services d’application. Même les grandes entreprises sont confrontées à la concurrence d’autres startups et d’intégrateurs traditionnels. Les grandes entreprises peuvent avoir leurs propres grands modèles et des avantages en termes de marque, mais elles sont confrontées à des stratégies commerciales B2B similaires.

Comme l’a déclaré Wang : “J’utilise également DeepSeek, et beaucoup d’autres entreprises utilisent DeepSeek, il n’y a donc pas de différenciation. Il y a tellement de fournisseurs de cloud en Chine, il y aura donc au moins autant de concurrents. Le marché B2B national a toujours été comme ça ; pour survivre, il faut avoir des relations solides, un bon service ou des prix bas.”

Liang He a offert une évaluation concise des choix actuels et des perspectives d’avenir de 01.AI :

  • La décision de Li Kaifu de transférer entièrement l’activité de 01.AI vers les applications B2B et de promouvoir une plateforme unique de grands modèles d’entreprise est commercialement judicieuse, mais entraînera une concurrence intense.
  • La nécessité pour 01.AI d’offrir des produits de grands modèles à des prix inférieurs à ceux des grandes entreprises est le résultat de son manque d’avantages uniques au niveau de l’application.
  • Le passage de 01.AI au B2B signale une perte d’imagination et des projets moins “sexy”. Cela ressemble au sort de nombreuses entreprises de vision par ordinateur de la vague précédente d’IA en 2017.
  • 01.AI peut avoir des opportunités si elle explore les marchés étrangers.

Comparées à 01.AI, les opinions sur l’avenir de Baichuan sont moins pessimistes.

Cependant, l’entrée de Baichuan dans le domaine médical manque d’avantages uniques, en particulier en matière de données.

Jiang Shao a déclaré que le passage de Baichuan au médical est simplement un moyen de survivre. Cependant, comparé à 01.AI, Baichuan tente au moins d’entrer dans un marché de niche.

Zhang Sensen a déclaré qu’elle est plus optimiste quant aux entreprises disposant de données médicales qui développent de grands modèles médicaux que les entreprises technologiques. Cela s’applique à toute entreprise qui cherche à créer un grand modèle spécifique à un secteur. Le principal défi dans la création de grands modèles médicaux réside dans les données, pas dans le modèle lui-même. Il existe de nombreux excellents hôpitaux en Chine qui peuvent affiner un grand modèle en utilisant DeepSeek pour leur propre usage.

Comment obtenir efficacement des données médicales ? Jiang Shao a déclaré que les startups technologiques d’IA manquent d’avantages en matière de données. Pour créer de grands modèles médicaux, elles pourraient avoir besoin de collaborer avec des entreprises qui fournissent déjà des services informatiques aux hôpitaux.

Selon certaines informations, l’un des “Petits Tigres” s’est associé exclusivement à un grand forum d’échange de médecins nationaux pour former des modèles en utilisant le grand nombre de cas générés par les échanges de médecins.

Outre une perspective plus optimiste sur les marchés de niche, les experts du secteur ont des espoirs pour le fondateur de Baichuan, Wang Xiaochuan.

Liang He estime que le succès de Wang Xiaochuan dans la spécialisation en médecine dépend de sa volonté de poursuivre un idéal ou de gagner de l’argent. Il pense que Wang est plus enclin à poursuivre un idéal, en créant des résultats de recherche révolutionnaires en IA médicale.

Wang Wenguang a souligné la nature dépassée de ce marché. Il a déclaré que si l’objectif est la commercialisation à court terme, le domaine médical est également très concurrentiel, semblable au marché B2B global. De nombreuses entreprises peuvent utiliser des graphes de connaissances, des recherches vectorielles et de grands modèles pour des applications médicales.

Selon les discussions de Zhiwei avec des experts en IA médicale, la recherche médicale elle-même présente d’importantes lacunes en matière de connaissances, et de nouvelles connaissances se développent rapidement. Par conséquent, il existe un potentiel important pour l’utilisation de grands modèles pour mener des recherches fondamentales en médecine. Par exemple, le modèle AlphaFold pour la prédiction de la structure des protéines a été utilisé par plus de 1,8 million de scientifiques dans le monde pour accélérer la recherche, notamment le développement de matériaux bio-renouvelables et l’avancement de la recherche génétique, selon Meis Medical.

Outre la poursuite d’un idéal ou le fait de gagner de l’argent, la startup d’IA médicale est également confrontée à la question de savoir s’il faut ou non créer un grand modèle médical général.

Zhang Sensen a déclaré qu’il n’y a pas eu de percée dans les grands modèles médicaux généraux sur le marché national, principalement en raison de la dépendance à l’égard d’équipements médicaux puissants pour la collecte et l’application de données à grande échelle. De nombreux établissements médicaux en Chine n’ont pas été largement popularisés, ce qui rend difficile pour l’IA de poser des diagnostics précis. Cependant, certains hôpitaux solides, tels que la Mayo Clinic, ont commencé à explorer le lancement de leurs propres grands modèles. Bien qu’il soit difficile de voir des opportunités de profit à court terme, ces types de grands modèles peuvent avoir un impact profond sur l’industrie médicale à long terme.

L’industrie médicale est également confrontée au défi du diagnostic entièrement automatisé, en particulier sur le marché national, où l’équipement est inadéquat et où l’IA ne peut pas remplacer complètement les méthodes de diagnostic traditionnelles. Le manque d’équipements médicaux répandus, en particulier dans les zones reculées, rend difficile la couverture complète de la technologie médicale, de sorte que le diagnostic entièrement automatisé reste un défi important.

L’industrie médicale est soumise à des exigences strictes en matière de licences et de conformité, et les grands modèles doivent tenir compte des problèmes de conformité lorsqu’ils entrent dans le domaine médical. Les futurs services médicaux C-end peuvent combiner les techniques des médecins et l’IA pour améliorer l’efficacité du diagnostic et du traitement, en particulier pour les jeunes générations.

Enfin, même en ne tenant pas compte des caractéristiques du marché B2B national, la concurrence dans les applications de grands modèles rend difficile la survie sur le marché To B. Wang Wenguang a déclaré que si les modèles de conception des grands modèles de produits To B sont encore en cours d’exploration, ils finiront par converger. Cela est vrai non seulement en Chine, mais aussi dans les entreprises technologiques de la Silicon Valley telles qu’OpenAI, Anthropic et Google. Tant qu’il n’y a pas de différence significative dans les performances des modèles eux-mêmes, il est impossible de gagner de l’argent sur ce marché, et finalement, tout le monde sera au même niveau.

C’est pourquoi DeepSeek R1 a eu son plus grand impact non pas en Chine mais à l’étranger, en particulier sur les entreprises technologiques de la Silicon Valley. Le marché boursier américain a commencé à connaître une forte volatilité, puis un déclin après la sortie de R1. La logique de base est simple : les grands modèles de la Silicon Valley ont été rattrapés par la Chine. Bien qu’ils ne les aient pas dépassés, l’incapacité à creuser l’écart a rendu impossible le maintien de valorisations aussi élevées, ce qui a entraîné une baisse des cours boursiers.

Bien sûr, il existe un autre moyen pour le marché To B d’attirer les clients : l’open source. Les principaux modèles de profit pour l’open source comprennent la fourniture de fonctions payantes, l’hébergement dans le cloud et les services à valeur ajoutée tels que le conseil et la formation au niveau de l’entreprise basés sur la technologie open source.

L’effet le plus direct des grands modèles open source est de promouvoir la popularisation de la technologie. Zhang Sensen a déclaré que l’open source de DeepSeek a considérablement accéléré l’application des grands modèles par les entreprises. La haute direction soutient fortement l’application des grands modèles. Comme les grands modèles fonctionnent bien dans les applications pratiques, en particulier en réduisant l’intervention humaine et en augmentant l’efficacité, le soutien continuera d’augmenter.

Le secteur financier, en tant que secteur ayant la meilleure qualité de données, a toujours eu une riche accumulation technique en IA et peut rapidement suivre le rythme. Indépendamment de DeepSeek, la finance mettra en œuvre la technologie de l’IA. Cependant, avec DeepSeek, l’IA permettra non seulement les activités principales du secteur financier, mais sera également utilisée dans les tâches et opérations bureautiques quotidiennes qui étaient auparavant difficiles à réaliser.

Les opérations étaient auparavant très coûteuses. Par exemple, l’analyse des causes profondes nécessitait auparavant une surveillance opérationnelle traditionnelle et AIOps, ainsi que la formation de petits modèles. Maintenant, DeepSeek peut être utilisé conjointement avec des bases de connaissances pour générer des plans d’application afin de gérer la surveillance, les alarmes, l’analyse en libre-service et la traçabilité, le traitement automatisé et l’amélioration de la stabilité, ce qui est plus flexible qu’AIOps.

En outre, la couverture de l’IA des opérations est devenue plus large, avec une plus grande prise en compte de l’interactivité et de l’initiative. L’initiative signifie permettre à l’IA d’effectuer des opérations de manière proactive. En passant de la dépendance à l’égard des règles, des humains ou même de l’expérience personnelle, où le niveau d’expérience humaine déterminait le niveau des capacités opérationnelles, des modèles d’IA plus légers peuvent maintenant être utilisés pour y parvenir directement.

Bien que le taux d’hallucination de DeepSeek soit encore élevé, même s’il n’est pas significativement différent des autres modèles similaires, ses capacités de raisonnement et d’application pratique peuvent compenser les effets négatifs des hallucinations. Ce problème sera progressivement amélioré grâce à l’affinage et à l’optimisation en utilisant RAG et d’autres technologies connexes.

Gao Peng, expert en technologie des grands modèles chez Alibaba, estime que l’impact de DeepSeek varie pour les grandes et les petites entreprises :

Les grands modèles utilisés en interne par Alibaba ont toujours été les plus avancés du secteur, de sorte que l’émergence de DeepSeek n’a pas eu d’impact significatif. Alibaba utilise DeepSeek pour l’évaluation des performances et la comparaison, fournissant davantage une inspiration technique. La mise en œuvre de DeepSeek dans le raisonnement est relativement rapide, et les détails techniques sont plus courants. DeepSeek a également été influencé par Qianwen.

En revanche, DeepSeek a un impact plus important sur les petites et moyennes entreprises, car il n’y avait auparavant aucun modèle qui pouvait obtenir l’effet de DeepSeek tout en offrant un déploiement privé à faible coût. Après la sortie de DeepSeek, de nombreuses entreprises vendant des machines intégrées DeepSeek ont émergé. Cependant, DeepSeek n’est pas le moins cher par rapport à de nombreuses machines intégrées de modèles open source, selon les normes spécifiques.

En tout cas, le grand modèle open source national est maintenant en plein essor et peut rivaliser à l’échelle mondiale. Cependant, sur la base de la mise en œuvre des grands modèles par Ping An Insurance, Zhang Sensen estime que les grands modèles open source ont encore des limites insurmontables :

Pour nous, DeepSeek a principalement un énorme avantage en termes de coûts. En termes de capacités, il peut être meilleur que les autres modèles dans les scénarios opérationnels en termes de raisonnement, de capacité de généralisation et de compréhension contextuelle. Cependant, DeepSeek ne fonctionne pas bien dans les scénarios plus complexes tels que le contrôle des risques financiers. En effet, un affinage plus détaillé, voire une optimisation en conjonction avec d’autres modèles, est nécessaire. Par conséquent, un affinage ciblé basé sur des scénarios d’application spécifiques est nécessaire pour améliorer davantage les performances du modèle.

Les grands modèles auto-développés de Ping An sont divisés en deux couches : le grand modèle de base sous-jacent et les modèles de domaine responsables de la banque, de l’assurance et d’autres activités. Les grands modèles utilisés en interne fonctionnent mieux que DeepSeek dans le domaine des connaissances professionnelles, en particulier dans des domaines spécifiques tels que la finance et la médecine, où les modèles sont plus précis. Cependant, DeepSeek a toujours un fort avantage en termes de capacité de raisonnement. Dans certains scénarios, nous voulons utiliser DeepSeek pour une tentative à petite échelle afin de voir si elle peut être exécutée.

Il n’y a pas de différence significative entre Alibaba Qianwen, Baidu Wenxin et Zhipu ChatGLM et DeepSeek à cet égard. Le jugement est basé sur le fait que ces modèles n’ont pas de différence significative par rapport à DeepSeek en termes de capacité de raisonnement et de structure de base de connaissances.

Dans l’ensemble, l’impact des grands modèles open source est actuellement limité, et le rythme de la concurrence entre eux est intense.

Les dangers du marché To C

Bien que la concurrence soit féroce sur le marché To B, cela ne signifie pas que la voie To C offre plus d’espoir.

La concurrence sur le marché To C pour les grands modèles est également très féroce, mais elle est très différente du marché To B.

Le paysage du marché est en constante évolution.

La monétisation du To C est difficile.

Les applications les plus populaires ne génèrent pas nécessairement le plus de revenus. Par exemple, ChatGPT a le revenu le plus élevé, mais OpenAI perd encore 5 milliards de dollars par an, tandis que de nombreuses applications “copiées” de ChatGPT ont probablement atteint une rentabilité rapide ; après que DeepSeek est devenu populaire, les imitateurs et les contrefacteurs sont arrivés en masse.

Observer la situation des “Petits Tigres” du marché C-end n’est pas non plus optimiste. La communication de Zhiwei avec les experts du secteur estime généralement que les grands fabricants apporteront une grande pression de survie.

Jiang Shao a déclaré que le plus performant des “Petits Tigres” sur le marché de la consommation est Kimi de Moonshot AI. Mais maintenant, Yuanbao de Tencent se classe premier, DeepSeek se classe deuxième et Doubao se classe troisième. Les trois premières entreprises occupent presque la plus grande part de marché. Yuanbao de Tencent a gagné un grand nombre de trafic client grâce à l’écosystème WeChat, tandis que DeepSeek s’est distingué par son innovation technologique et ses excellentes performances dans de multiples scénarios.

Liang He a déclaré que la grande technologie de modèle de Kimi n’est pas très différente de ses concurrents, elle ne peut donc être que gratuite, ce qui rend très difficile la commercialisation de Moonshot. En tant qu’application To C, il n’est pas clair en quoi elle diffère de Yuanbao et Doubao. De plus, Doubao peut être soutenu par les autres activités de Byte, et Yuanbao peut être soutenu par les autres activités de Tencent. Ils peuvent investir 100 milliards pour soutenir ces applications.

Jiang Shao a ajouté que les utilisateurs C-end sont plus préoccupés par la facilité d’utilisation du produit, ce que Tencent et Byte font mieux. Bien sûr, Alibaba a également des opportunités. Alibaba incube une application appelée “AI Listening”, qui utilise l’IA pour le chat et l’interaction, dans le but de remplacer Douyin sur la plate-forme de courtes vidéos. Bien que Douyin attire un grand nombre de créateurs pour générer du contenu de haute qualité, les applications de chat AI ont le potentiel d’attirer des groupes d’utilisateurs en offrant des expériences plus personnalisées et interactives. La différence entre les deux réside dans la création de contenu et l’interaction. Si Alibaba peut percer cela, elle a également une chance de renverser la situation, mais il est difficile de dire si Tencent emboîte le pas.

Concernant MiniMax, les opinions du secteur sont légèrement différentes.

Liang He estime que Conch AI de MiniMax réalise actuellement de bons bénéfices. Il a trouvé sa propre voie, mais on ne sait pas encore si cette voie permettra à MiniMax d’augmenter suffisamment sa valorisation. En raison de son orientation applicative, MiniMax est plus détendu après la sortie de DeepSeek. S’ils utilisent les modèles de DeepSeek, cela permettra d’économiser les coûts de recherche et développement du modèle, et ses applications peuvent continuer à rapporter de l’argent, encore plus.

Jiang Shao estime que MiniMax a une chance s’il peut créer une application populaire plus tard, mais Alibaba peut le dépasser et créer une application populaire en premier, donc même si MiniMax a une chance, la probabilité n’est pas élevée.

En fin de compte, la différenciation des produits est toujours le point de rupture pour les applications C-end.

Selon le dernier rapport d’a16z “Top 100 Gen AI Consumer Apps”, de nombreuses applications à faible utilisation atteignent en fait de meilleurs revenus. Certains produits avec une mauvaise polyvalence, tels que l’identification des plantes et la nutrition, attirent davantage les utilisateurs payants que les produits généraux.

Il est difficile de différencier les produits d’IA généraux. Les utilisateurs ont une faible volonté de payer, le cycle de profit est long, ils ne peuvent donc pas survivre aux grandes entreprises.

Et si la différenciation n’est pas assez profonde verticalement, il est également facile d’être internalisée par le grand modèle de base grâce à des mises à niveau de capacité. Par exemple, les récentes capacités de génération d’images de GPT-4o ont porté un coup de réduction dimensionnelle aux start-ups de texte à image telles que Midjourney. Cette capacité de couverture est souvent aléatoire et imprévisible, comme le dit le dicton, “Vous détruire n’a rien à voir avecvous.”

L’imitation au niveau du pixel des concurrents et la mise à niveau rapide des grands modèles de base font que le paysage des start-ups d’IA C-end est presque toujours maintenu pendant une courte période.

Quant à la façon de saisir la probabilité extrêmement faible de devenir un succès, les experts du secteur estiment à l’unanimité qu’”il n’y a pratiquement aucune expérience à suivre.”

Les “Petits Tigres” sont entrés dans la situation difficile d’aujourd’hui, en grande partie parce qu’ils ont trop investi dans le grand modèle de base et ont sous-estimé la main-d’œuvre, les ressources financières et les ressources matérielles nécessaires pour survivre et exceller dans cette voie, ce qui rend difficile ladifférenciation sur la voie de l’application.

Aujourd’hui, les “Petits Tigres” sont de moins en moins déterminés à attaquer l’AGI, et Li Kaifu a déclaré publiquement que seuls DeepSeek, Ali et Byte seront laissés dans le grand modèle de base national.

À cet égard, les experts du secteur qui ont communiqué avec Zhiwei sont fondamentalement d’accord avec ce point de vue.

Jiang Shao a déclaré que les start-ups d’IA qui continuent de travailler dur sur la grande technologie de modèle doivent fondamentalement mourir. Le plus prometteur est certainement DeepSeek, le deuxième est Alibaba et le troisième est ByteDance. La première place devrait obtenir 50 à 80 % du trafic, et les deux suivantes pourraient obtenir 10 % du trafic. L’essentiel est de savoir qui fait l’AGI en premier, et qui est le vainqueur final.

DeepSeek est actuellement le plus compétitif dans le domaine des grands modèles, et son innovation technologique et ses performances dans les applications pratiques sont irréprochables. Alibaba et ByteDance ont également une forte compétitivité, en particulier dans les applications multiplateformes et les ressources de données. Le classement est principalement basé sur les capacités d’innovation de chaque entreprise en matière de technologie de base, de puissance de calcul, de ressources de données et d’applications pratiques.

Les équipes Zhipu et Kimi croient fermement que la poursuite de l’amélioration des capacités du modèle de base est l’avenir. En revanche, je pense qu’avec les changements dans la demande du marché et la diversification des scénarios d’application, la voie consistant à simplement renforcer le modèle de base peut être limitée, et des voies de développement de modèles plus flexibles et adaptables peuvent être plus compétitives sur le marché.

La concurrence dans la grande technologie de modèle est extrêmement féroce, et les entreprises ayant des investissements énormes doivent finalement avoir des percées claires en matière d’innovation, de puissance de calcul, de données et d’optimisation pour maintenir leur compétitivité. Les autres entreprises qui ne parviennent pas à suivre le progrès technologique ou qui sont incapables de faire face à la demande du marché seront progressivement éliminées.

Liang He a déclaré que seuls DeepSeek, Ali et Byte seront laissés dans la grande entreprise de modèle de base nationale à l’avenir, sur la base du fait que ces trois ont la force et la détermination d’investir des super ressources dans la recherche et le développement. Pour Byte, il est impossible de rater l’opportunité des grands modèles, sinon cela aura un grand impact sur son ensemble. Et la technologie de DeepSeek n’aura pas trop d’obstacles pour Byte, mais DeepSeek a actuellement un plus grand avantage en termes d’efficacité de la R&D. Le modèle open source Qianwen d’Alibaba lui-même est à un niveau élevé. Avant que DeepSeek ne devienne populaire, Qianwen et Llama se poursuivaient fondamentalement. Pour Alibaba, le modèle Qianwen peut ne pas rapporter d’argent, mais les activités cloud connexes peuvent rapporter de l’argent, et Byte est similaire, et peut continuer à utiliser la grande technologie de modèle pour optimiser continuellement l’expérience de Douyin et d’autres applications. Pour les start-ups d’IA, si le modèle lui-même ne rapporte pas d’argent, il touche à la racine de la survie.

Wang Wenguang a déclaré que l’avantage de DeepSeek réside principalement dans l’idéalisme technologique. Dans les deux ou trois mois avant et après la Fête du Printemps, le trafic de DeepSeek était énorme. S’il voulait commercialiser, il atteindrait bientôt le sommet dans le monde, et les autres grands modèles tels que Doubao n’auraient aucune chance. Tant que DeepSeek n’ouvre pas les méthodes d’optimisation liées à l’infrastructure dans la récente semaine open source, il peut s’appuyer sur cela pour gagner de l’argent à l’avenir, de sorte que les autres n’aient aucune chance. DeepSeek n’a pas été financé et n’a pas besoin d’être influencé par les investisseurs. L’idéalisme technologique et le talent sont les plus grandes barrières. Comparé à OpenAI, les résultats qu’OpenAI peut voir maintenant sont fondamentalement les résultats de la recherche avant le différend entre Altman et Ilya. Au moins, les points d’innovation ont été déterminés. Aujourd’hui, après le départ de l’équipe originale d’idéalistes, OpenAI lui-même n’a presque aucune innovation. Actuellement, l’innovation d’OpenAI se situe davantage au niveau de l’application, comme Deep Research. Il n’y a pas de barrières à l’innovation au niveau de l’application, il doit donc rivaliser avec ses concurrents.

Wang Mu, un expert en technologie d’IA de grande usine, a déclaré à Zhiwei qu’à moins qu’il n’y ait de l’argent, des talents et du matériel, il n’est pas nécessaire de gaspiller des efforts sur le pré-entraînement de grands modèles. DeepSeek avait un cluster de 10 000 cartes dès 2021 et ne manque pas d’argent. En revanche, les autres petites et moyennes entreprises peuvent difficilement réunir cette condition.

Gao Peng a déclaré que les start-ups d’IA veulent survivre, elles doivent toujours se tourner vers les applications. Je le pensais il y a un an ou deux, et maintenant il est peut-être trop tard pour se retourner. Le premier lot d’entreprises d’IA à être éliminées ensuite sera celui qui fabrique de grands modèles de base. La formation de grands modèles a en fait beaucoup de détails complexes et dépend fortement de l’accumulation d’expérience. Les détails internes de l’architecture Transformer sont généralement bien compris, mais les articles de modèles open source ou fermés ne vous disent fondamentalement pas comment les données sont préparées, quels sont les détails des données, quelle est l’ampleur des données et quelle est la qualité des données. Il n’y a pas de norme unifiée dans l’industrie.

L’open source open-half a toujours été une pratique typique dans la grande voie de modèle. Actuellement, il existe très peu de grands modèles qui divulgueront entièrement le code, les poids, les ensembles de données et le processus de formation. Les plus connus sont OLMo, BLOOM, etc.

Cependant, même si se tourner vers les applications peut survivre ? D’après l’analyse précédente de la voie To B et de la voie To C, il est presque difficile pour les start-ups d’IA de former leurs propres barrières industrielles dans les applications. À cet égard, Gao Peng a déclaré que la clé pour former vos propres barrières industrielles réside dans les données que vous avez. Les modèles peuvent être utilisés par n’importe qui. Les données sont divisées en deux aspects : l’un est l’expérience du domaine de l’entrepreneur, et l’autre est les données en main.

Du point de vue de la culture d’entreprise, Gao Peng estime que la recherche et le développement de grands modèles de base nécessitent un esprit d’expérimentation et de travail acharné en ingénierie. “Pendant longtemps auparavant, de nombreuses start-ups d’IA nationales étaient trop médiatisées. Lorsque vous faites de la technologie, vous devriez d’abord le faire de manière discrète, puis le promouvoir de manière médiatisée. Certaines équipes sont plus fortement composées du monde universitaire, mais les personnes du monde universitaire étudient parfois la technologie de manière trop théorique. En termes de talent ou d’équipe, le succès d’une grande équipe de modèles dépend principalement du fait que le patron comprenne ou non les grands modèles. Si le patron ne comprend pas la grande technologie de modèle ou n’a pas la foi de persister, parce qu’il ne rapporte pas d’argent, cela ne fonctionnera pas du tout. Le succès de DeepSeek repose davantage sur un mode d’organisation descendant. Le patron comprend très bien les détails techniques et amène tout le monde à le faire ensemble. Il y a trop peu de modèles nationaux qui répondent à ce modèle.”

Concernant la discussion animée de l’industrie sur la prédiction du vainqueur final du grand modèle de base national, Gao Peng estime que ce jugement est trop tôt. “Il n’y aura pas beaucoup de différence dans les itinéraires techniques des joueurs qui peuvent participer à la compétition. Il suffit de suivre l’architecture Transformer et de faire une optimisation détaillée. Mamba et RWKV ont également de l’espoir. La clé est de faire les choses de manière stable, et le temps prouvera tout. Le vainqueur final et les trois premiers ne sont pas faciles à dire. La pile technologique de grands modèles est une chose très compliquée, et qui sait s’il y a beaucoup de gens qui font silencieusement une chose, mais le moment n’est pas encore venu.”

Dans la situation actuelle où il est difficile de juger du vainqueur du modèle, les données sont devenues le fossé le plus important. Konstantine Buhler, partenaire chez Sequoia Capital, a dit un jour qu’une erreur commise par OpenAI sur ChatGPT était de ne pas autoriser la modification des réponses, ce qui aurait pu fournir des données de meilleure qualité dans la boucle de rétroaction et construire un fossé plus profond.

La question de savoir si les données peuvent permettre à une certaine industrie de se développer davantage avec l’aide de l’IA ou d’apporter de nouvelles opportunités commerciales dans le présent est également très importante. Zhang S