La Chine IA Open Source : Au-delà de DeepSeek

L’essor du mouvement open source en Chine consolide rapidement une force avec laquelle il faut compter. Avec des modèles fondamentaux comme DeepSeek et Qwen d’Alibaba en tête, établissant de nouvelles références pour les capacités open source chinoises, un nombre croissant de petites et moyennes entreprises (PME) tirent parti de ces avancées pour développer des modèles verticaux plus petits, mais plus puissants. Cette vague d’innovation a accéléré le rythme des mises à jour des grands modèles en Chine, fournissant constamment des développements nouveaux et passionnants. Contrairement à l’approche principalement fermée qui prévaut aux États-Unis, les entreprises chinoises adoptent l’open source, démontrant leur confiance technologique et ouvrant une nouvelle voie vers l’inclusivité technologique et la collaboration mondiale, s’étendant continuellement sur les marchés étrangers et faisant passer le paysage mondial de l’IA d’une ‘hégémonie unipolaire’ à une ‘coexistence multipolaire’.

La Convergence de l’Open Source Chinois

Début février, lorsque le grand modèle open source chinois DeepSeek a dominé les classements de téléchargement de marchés d’applications dans 140 pays et régions du monde, OpenAI a publiquement accusé DeepSeek d’utiliser des données distillées de ChatGPT sans autorisation.

Plutôt que de sauver la réputation d’OpenAI, cette accusation a été accueillie avec un ridicule généralisé de la part des chercheurs du monde entier.

Maintenant, un autre concurrent, embrassant pleinement le buff de ‘distillation’, a émergé.

Le 13 avril, Kunlun Wanwei a lancé les modèles de la série Skywork-OR1 (Open Reasoner 1), surpassant Qwen-32B d’Alibaba à la même échelle et s’alignant sur DeepSeek-R1.

Comment Kunlun Wanwei, une entreprise aux ressources financières limitées, peut-elle créer un grand modèle de niveau SOTA ? L’explication officielle est que leurs modèles sont basés sur DeepSeek-R1-Distill-Qwen-7B et DeepSeek-R1-Distill-Qwen-32B.

Comme leurs noms l’indiquent, les modèles de DeepSeek ont distillé les modèles de la série Qwen d’Alibaba.

Tout en tirant parti d’excellents modèles open source, Kunlun Wanwei contribue également à la communauté open source. Contrairement à DeepSeek, qui n’a ouvert que les poids du modèle, Kunlun Wanwei a également ouvert ses ensembles de données et son code d’entraînement, s’alignant plus étroitement sur le concept de ‘véritable open source’. Cela signifie que tout utilisateur peut tenter de reproduire son processus d’entraînement de modèle.

La réalisation de Kunlun Wanwei démontre l’aspect le plus important de l’open source : elle fournit non seulement aux utilisateurs un produit gratuit et facilement disponible, mais permet également à davantage de développeurs de se tenir sur les épaules de leurs prédécesseurs, faisant progresser rapidement et à moindre coût la technologie.

En fait, au milieu des discussions de l’industrie de l’année dernière sur le goulot d’étranglement du pré-entraînement des grands modèles, le rythme d’itération des grands modèles chinois s’est accéléré cette année, avec de plus en plus d’entreprises investissant dans l’open source.

Tongyi Qianwen d’Alibaba Cloud a ouvert son nouveau modèle visuel Qwen2.5-VL la veille du Nouvel An chinois et a publié et ouvert son nouveau modèle de raisonnement QwQ-32B début mars, en tête de la liste des tendances de la communauté mondiale grand public d’IA open source Hugging Face le jour de son ouverture.

Stepwise a ensuite ouvert trois grands modèles multimodaux en environ un mois, dont le dernier est le modèle image-vidéo Step-Video-TI2V, qui prend en charge la génération de vidéos avec une amplitude de mouvement et un mouvement d’objectif contrôlables, et est également livré avec certaines capacités de génération d’effets spéciaux.

Zhipu a annoncé en avril qu’il ouvrirait les modèles GLM de la série 32B/9B, couvrant les modèles de base, de raisonnement et contemplatifs, tous sous l’accord de licence MIT.

Même Baidu, qui était autrefois fermé, a annoncé qu’il ouvrirait entièrement le grand modèle Wenxin le 30 juin.

Par rapport à la prospérité croissante de l’écosystème national open source, les grandes entreprises américaines de modèles se concentrent encore principalement sur le closed source, ce qui a donné aux grands modèles chinois une rare opportunité d’aller à l’étranger. DeepSeek a permis à la société indonésienne d’éducation Ruangguru d’optimiser son modèle d’enseignement à faible coût ; la société singapourienne de technologie de voyage B2B Atlas a intégré Qwen dans son système de service client intelligent pour assurer un support multilingue 24h/24 et 7j/7.

Pourquoi le Closed Source aux États-Unis, l’Open Source en Chine ?

La tendance au closed source dans l’industrie américaine de l’IA et l’ouverture croissante de l’IA chinoise sont les résultats inévitables des différents environnements de développement de l’IA dans les deux pays.

L’industrie américaine de l’IA est principalement dirigée par des géants de la technologie et des VC (capital-risqueurs), qui ont d’énormes attentes quant aux retours sur investissement de l’IA. Par conséquent, les entreprises américaines de modèles d’IA ont généralement une forte croyance dans la technologie, c’est-à-dire qu’elles cherchent à obtenir un leadership technologique, à réaliser un certain degré de monopole du marché, puis à créer d’énormes profits, et leur écosystème est naturellement enclin au closed source.

Prenons l’exemple de l’histoire du développement d’OpenAI, qui a commencé comme une entité à but non lucratif lors de sa création, mais qui est devenue de plus en plus fermée. GPT-1 était entièrement open source, GPT-2 était partiellement open source et a rencontré de l’opposition avant d’être entièrement open source, GPT-3 est officiellement passé en closed source, puis GPT-4 a encore renforcé la stratégie de closed source, avec l’architecture du modèle et les données d’entraînement totalement confidentielles, et même en restreignant la fréquence d’appel API des utilisateurs corporatifs.

Bien qu’OpenAI ait déclaré que la fermeture de la source est basée sur la conformité et le contrôle de l’abus de technologie, le marché estime généralement que l’événement marquant du passage d’OpenAI au closed source a été sa coopération de cent milliards de dollars avec Microsoft, intégrant GPT-3 dans les services cloud Azure pour former une boucle fermée ‘technologie-capital’.

Lorsque Microsoft a divulgué pour la première fois son investissement dans OpenAI dans son rapport financier en octobre dernier, il a déclaré : ‘Nous avons investi dans OpenAIGlobal, LLC, avec un engagement d’investissement total de 13 milliards de dollars, et l’investissement est comptabilisé selon la méthode de la mise en équivalence.’

La méthode de la mise en équivalence peut également être comprise comme le fait que l’investissement de Microsoft dans OpenAI vise à obtenir des rendements plutôt qu’une pure recherche caritative. De toute évidence, la vente d’API à prix élevé par OpenAI via un écosystème closed source est sa source de revenus la plus importante actuellement et est devenue le principal obstacle à la réticence d’OpenAI à ouvrir la source.

Anthropic, qui a été fondée à partir de la ‘scission’ d’OpenAI, a été déterminée à adopter la voie du closed source dès le début, et son grand modèle de produit Claude a pleinement adopté le modèle closed source.

Même Llama de META, le seul leader open source aux États-Unis, a ajouté deux clauses anti-amis lors de l’ouverture de la source :

  1. Les modèles open source ne peuvent pas être utilisés pour des produits et services comptant plus de 700 millions d’utilisateurs actifs mensuels avant que META ne les approuve.
  2. Le contenu de sortie des modèles Llama ne peut pas être utilisé pour entraîner et améliorer d’autres grands modèles linguistiques.

On peut constater que même pour les modèles open source, l’objectif principal de Meta est toujours de construire son propre écosystème d’IA plutôt que l’inclusivité technique.

Les États-Unis ont choisi une stratégie d’IA basée sur le closed source avec l’open source en complément au niveau du capital, ce qui peut être considéré comme des considérations purement commerciales. En revanche, la conception de haut niveau de la Chine a attaché de l’importance à l’open source dès le début, reflétant une voie axée sur l’industrie sous le concept de contrôle indépendant.

Dès 2017, le gouvernement chinois a publié le ‘Plan de développement de l’intelligence artificielle de nouvelle génération’, qui proposait clairement d’accélérer l’intégration profonde de l’IA à l’économie et à la société, et de déployer pour construire l’avantage de premier arrivé du développement de l’IA. En 2021, le contenu lié à l’open source a été explicitement inclus dans le ‘14e plan quinquennal’ de la Chine, ce qui a déclenché une promotion active de l’innovation technologique par les gouvernements locaux.

Mei Hong, académicien de l’Académie chinoise des sciences, a déclaré un jour que le développement futur des modèles linguistiques doit s’appuyer sur des plateformes open source. Ce n’est que dans un environnement ouvert que la sécurité et la fiabilité des téléchargements de données et de l’intégration des entreprises pour les utilisateurs de divers secteurs peuvent être garanties.

Le ‘Plan d’action spécial pour l’autonomisation numérique des petites et moyennes entreprises (2025-2027)’ publié par le ministère de l’Industrie et des Technologies de l’information et quatre autres départements en décembre dernier soutient clairement la fondation Open Atom Open Source pour établir un ‘Projet spécial open source d’IA pour les petites et moyennes entreprises’ afin de fournir des cadres de formation reproductibles et faciles à promouvoir, des outils de test et d’autres ressources pour abaisser le seuil technique pour les entreprises.

Un problème plus réaliste est qu’en raison du blocus technologique potentiel des États-Unis, la Chine ne peut pas simplement être un suiveur dans le domaine de l’IA, mais doit construire un écosystème national indépendant. Construire un autre écosystème closed source sous l’écosystème que les États-Unis ont déjà construit avec le closed source comme objectif principal revient à construire une voiture à huis clos. Seul un écosystème open source peut aider rapidement au développement de l’industrie de l’IA.

En plus du soutien de haut niveau, divers gouvernements locaux ont également réalisé de réels investissements en argent dans l’écosystème open source.

Le fonds Z, créé conjointement par Zhipu et Beijing State-owned Assets, qui se concentre sur l’investissement dans l’écosystème des grands modèles, a annoncé qu’il investirait 300 millions de yuans pour soutenir le développement de la communauté mondiale open source de l’IA. Tout projet de démarrage basé sur des modèles open source (pas limité aux modèles open source de Zhipu) peut postuler.

La divergence entre la Chine et les États-Unis dans leurs stratégies open source et closed source pour l’industrie de l’IA est essentiellement une différence fondamentale de logique de développement. Les États-Unis sont motivés par le capital, et les demandes de recherche de profit des géants de la technologie et des VC ont engendré un écosystème closed source de ‘monopole technologique - réalisation à prix élevé’. Même si Meta essaie d’ouvrir la source, il est difficile d’échapper aux chaînes des barrières commerciales. La Chine s’appuie sur une conception de haut niveau, avec ‘l’équité technologique + la collaboration industrielle’ comme concept central, et construit un écosystème ouvert grâce à l’autonomisation politique, faisant de l’open source une infrastructure de base pour abaisser les seuils techniques et promouvoir l’intégration de l’économie réelle. Ce choix stratégique façonne non seulement les différentes voies des industries de l’IA dans les deux pays, mais annonce également l’accélération de l’écosystème mondial de l’IA du ‘concours de monopole’ à ‘l’ouverture et au gagnant-gagnant’.

Assez Bien, c’est Assez Bien

L’écosystème open source de l’IA en Chine accélère non seulement le développement de l’industrialisation de l’IA en Chine et dans le monde, mais place également la croyance des États-Unis en la technologie d’abord dans un piège maladroit.

Face à la pression croissante exercée par l’effet DeepSeek, Meta a publié Llama4 le 5 avril, affirmant qu’il s’agissait du plus grand modèle multimodal de l’histoire.

Cependant, après des tests réels, c’est un modèle décevant. La longueur de contexte de 10 millions de jetons se trompe souvent, le test initial de la balle est difficile à terminer et l’erreur de taille de comparaison 9,11 > 9,9 se produit. Quelques jours après le lancement du modèle, des scandales tels que des démissions de dirigeants et des tricheries aux tests ont également été confirmés par des employés internes.

De plus en plus d’informations prouvent que Llama4 peut être considéré comme un produit que Zuckerberg s’est précipité à mettre en rayon. La question est donc de savoir pourquoi Zuckerberg devait le lancer en avril ?

Comme mentionné précédemment, l’industrie américaine de l’IA a une croyance déroutante en la technologie, croyant queleurs produits doivent être les plus puissants et les plus avancés, ils ont donc commencé une course aux armements. Cependant, l’effet marginal décroissant de l’entraînement de l’IA a amené les grands fabricants à consommer d’énormes quantités de coûts, et non seulement le seuil technique n’a pas été construit, mais ils sont tombés dans le bourbier des goulots d’étranglement de la puissance de calcul.

Après qu’OpenAI a publié la fonction de génération d’images de GPT-4o, Altman a tweeté quelques jours plus tard que leurs GPU étaient ‘en train de brûler’. Moins d’une semaine après la sortie de Gemini2.5, le responsable de GoogleAIStudio a déclaré qu’ils étaient toujours en proie à des ‘limites de débit’, et les développeurs ne pouvaient envoyer que 20 requêtes par minute. Il semble qu’aucune entreprise ne puisse faire face aux besoins d’inférence des modèles super-larges.

En fait, les États-Unis tombent dans un malentendu. Le responsable de l’institut de recherche Zhiyuan a déclaré : ‘Si un nouveau modèle utilise 100 fois le coût pour atteindre une augmentation de score de référence de 10 points, alors ce nouveau modèle n’a aucun sens pour plus de 80 % des scénarios d’application car il n’y a pas de rentabilité.’

Les entreprises chinoises de grands modèles accélèrent l’écosystème open source. Elles ne semblent plus se disputer la première place, mais ont plutôt gagné plus de clients, en particulier des clients industriels, avec leur approche ‘assez bonne’.

Par rapport aux dizaines de millions de budgets pour les clients gouvernementaux et les entreprises, de nombreuses entreprises et institutions ont des besoins urgents en IA, mais n’ont pas autant de solutions existantes. L’utilisation de modèles open source pour développer leurs propres solutions est presque devenue leur seul choix :

  • Baosteel utilise le ‘grand modèle + petit modèle’ pour les processus clés de l’ingénierie métallurgique pour l’alerte précoce intelligente des équipements de production.
  • Le ‘Grand modèle de gardien des sciences et de l’industrie du charbon de Chine ChinamjGPT’ du groupe chinois des sciences et de l’industrie du charbon réduit les temps d’arrêt des équipements et les coûts de maintenance de 30 % et 20 %, respectivement.
  • Shanghai Mengbo Intelligent Internet of Things Technology a créé une plateforme d’application d’optimisation du processus de détection de coupe de bord et de four d’annealing continu basée sur un grand modèle léger.
  • Mifei Technology a réalisé une prédiction, une maintenance et une gestion intelligentes des systèmes de manutention automatisés dans les fabs de wafers de semi-conducteurs basées sur la technologie des grands modèles.

Ce sont tous des cas représentatifs de modèles open source mis en œuvre dans des scénarios industriels.

En plus des utilisations industrielles, l’écosystème open source peut également aider davantage les entreprises d’intérêt public.

Le centre de conservation de la nature Shanshui s’engage à protéger les léopards des neiges et les écosystèmes des hauts plateaux. Les caméras infrarouges qu’il installe prennent un grand nombre de photos ou de vidéos chaque trimestre. Il est extrêmement inefficace et chronophage de s’appuyer sur l’identification manuelle des traces de léopards des neiges. Huawei Ascend coopère avec le centre de conservation de la nature Shanshui pour identifier les traces de léopards des neiges. Huawei a ouvert les modèles et outils pertinents pour la reconnaissance des espèces d’images infrarouges à Sanjiangyuan, abaissant le seuil de participation au développement de l’IA et permettant à davantage d’institutions de recherche et de protection utilisant le modèle d’en bénéficier. Les gens peuvent travailler ensemble pour optimiser le modèle en termes d’ensembles de données, de traitement des données et de nettoyage des données.

L’effet ‘Bazar’ de l’Open Source

Eric Raymond, le porte-drapeau du mouvement logiciel open source, a proposé une métaphore dans son livre de 1999 ‘La cathédrale et le bazar’ : le modèle de développement logiciel traditionnel et closed source est comme la construction d’une cathédrale. Le logiciel est soigneusement conçu et construit par quelques experts (architectes) dans un environnement isolé et n’est publié auprès des utilisateurs qu’une fois qu’il est finalement terminé ; Le modèle de développement open source est comme un bazar animé, apparemment chaotique mais vibrant. Le développement logiciel est ouvert, décentralisé et évolutif.

Le livre estime que pour de nombreux types de projets logiciels, en particulier les logiciels complexes au niveau du système (tels que les noyaux de système d’exploitation), le modèle de développement ‘bazar’ ouvert, collaboratif et décentralisé, bien qu’il puisse sembler chaotique, est en réalité plus efficace, produit des logiciels de meilleure qualité et plus robustes que le modèle traditionnel, fermé et centralisé de ‘cathédrale’. Il peut découvrir et corriger les erreurs plus rapidement et mieux absorber les commentaires des utilisateurs et les contributions de la communauté grâce à des mécanismes tels que ‘publier tôt, publier souvent’ et en tirant parti de l’examen par les pairs à grande échelle (‘assez de globes oculaires’), favorisant ainsi l’itération rapide et l’innovation des logiciels.

L’énorme succès de projets open source tels que Linux a vérifié le point de vue de Raymond.

Le mouvement open source a apporté aux États-Unis et au monde une valeur énorme dépassant de loin son propre investissement. Un rapport de recherche de 2024 de l’université de Harvard a déclaré : ‘L’open source a investi 4,15 milliards de dollars et a créé 8,8 billions de dollars de valeur pour les entreprises (c’est-à-dire que chaque dollar investi crée 2 000 dollars de valeur). Sans l’open source, les dépenses des entreprises en logiciels seraient 3,5 fois ce qu’elles sont actuellement.’

Aujourd’hui, les entreprises chinoises l’ont appris. Les entreprises américaines d’IA semblent l’avoir oublié.

En fait, pour les entreprises chinoises de grands modèles, même si elles ne tiennent pas compte des avantages sociaux, choisir d’embrasser l’écosystème open source n’est pas non plus improductif pour les entreprises elles-mêmes.

De nombreuses entreprises de grands modèles ont déclaré à Observer.com que l’open source ne signifie pas renoncer à la commercialisation. L’open source a toujours la logique de profit de l’open source. Par rapport au fait de savoir s’il est open source ou non, la façon de mieux servir les clients techniquement est la question clé.

Prenons l’exemple de Zhipu AI, qui prétend être la seule entreprise en Chine qui compare entièrement OpenAI, mais par rapport à la stratégie closed source d’OpenAI, elle est l’un des praticiens les plus déterminés de la stratégie open source de l’industrie.

Zhipu a pris l’initiative d’ouvrir le premier grand modèle de chat de Chine ChatGLM-6B en 2023. Depuis sa création il y a près de six ans, Zhipu a ouvert plus de 55 modèles, avec un volume de téléchargement cumulé de près de 40 millions de fois dans la communauté internationale open source.

Zhipu a déclaré à Observer.com que Zhipu espère que sa stratégie open source contribuera à faire de Pékin une ‘capitale mondiale open source’ pour l’intelligence artificielle.

Plus précisément, au niveau commercial, Zhipu a choisi d’attirer un écosystème de développeurs grâce à l’open source et de fournir des solutions personnalisées payantes aux clients B-end et G-end.

En plus de vendre des solutions, la vente d’API est également un lien de profit important.

Prenons l’exemple de DeepSeek, la première activité du modèle open source est la vente d’API haute performance. Bien que les services de base soient gratuits, les entreprises peuvent fournir des services d’API haute performance et facturer en fonction de l’utilisation. Le prix de l’API pour DeepSeek-R1 est de 1 yuan par million de jetons d’entrée et de 16 yuans par million de jetons de sortie. Si le quota de jetons gratuits est épuisé ou si l’API de base ne peut pas répondre aux besoins, les utilisateurs ont tendance à utiliser la version payante pour maintenir la stabilité des processus métier.

Par rapport aux entreprises qui n’ont que des services de modèles, Alibaba a choisi un autre modèle de monétisation open source : le regroupement d’écosystèmes.

La série Qwen d’Alibaba, en tant que pionnier de l’open source, attire les développeurs à utiliser le cloud computing et d’autres infrastructures grâce à l’open source à modalité complète, formant un scénario en boucle fermée. Leur modèle n’est qu’une introduction au début, et les produits avec des prix marqués sont en fait des services cloud.

L’application de la mondialisation des grands modèles open source chinois est passée du ‘suivi technologique’ à la ‘domination de l’écosystème’. Lorsque les États-Unis sont pris dans le dilemme du ‘monopole closed source’ et de ‘l’open source hors de contrôle’, la Chine reconstruit la logique sous-jacente de l’écosystème mondial open source de l’IA grâce à ‘l’innovation d’accord + la culture de scénarios’. Le champ de bataille ultime de ce jeu n’est pas dans la concurrence de l’échelle des paramètres, mais dans le marché de mille milliards de dollars de l’intégration profonde de la technologie de l’IA et de l’économie réelle.