Le modèle Qwen d'Alibaba stimule l'IA chinoise

L’écosystème IA en expansion de la Chine

Le 5 mars, le géant technologique chinois Alibaba a dévoilé son dernier modèle de raisonnement d’intelligence artificielle, un développement qui a fait grimper les actions de la société cotées à Hong Kong de 8 %. Bien que ce nouveau modèle, baptisé QwQ-32B, ne rivalise peut-être pas encore avec les capacités des principaux systèmes d’IA aux États-Unis, il égalerait les performances de son concurrent national, le modèle R1 de DeepSeek. Ce qui distingue QwQ-32B, c’est sa demande considérablement plus faible en puissance de calcul, tant pour son développement que pour son fonctionnement continu. Les concepteurs de QwQ-32B affirment qu’il incarne un “esprit philosophique ancien”, abordant les problèmes avec un sentiment “d’émerveillement et de doute authentiques”.

“Cette publication souligne la compétitivité plus large de l’écosystème IA de pointe de la Chine”, observe Scott Singer, chercheur invité au programme Technologie et Affaires internationales du Carnegie Endowment for International Peace. Cet écosystème est un paysage dynamique peuplé d’acteurs comme DeepSeek avec son modèle R1 et Tencent avec son modèle Hunyuan. Notamment, le cofondateur d’Anthropic, Jack Clark, a reconnu Hunyuan comme étant “de classe mondiale” dans certains aspects. Cependant, il est important de noter que les évaluations du dernier modèle d’Alibaba n’en sont qu’à leurs débuts. La difficulté inhérente à la mesure des capacités du modèle, couplée au fait que QwQ-32B n’a été évalué qu’en interne par Alibaba, signifie que “l’environnement d’information n’est pas très riche pour le moment”, comme le souligne Singer.

Le lancement du modèle R1 de DeepSeek en janvier avait déjà fait des vagues sur le marché boursier mondial, propulsant l’écosystème technologique chinois sous les feux de la rampe internationale. Cette attention est encore amplifiée par la perception croissante aux États-Unis d’une course contre la Chine pour atteindre l’intelligence artificielle générale (AGI). L’AGI représente un niveau hypothétique de sophistication de l’IA où les systèmes possèdent la capacité d’effectuer un large éventail de tâches cognitives, de la conception graphique à la recherche en apprentissage automatique, à un niveau comparable ou supérieur aux capacités humaines.

Les implications stratégiques de l’AGI

Le développement de l’AGI est largement anticipé comme conférant un avantage militaire et stratégique significatif à l’entité – qu’il s’agisse d’une entreprise ou d’un gouvernement – qui l’atteindra en premier. Les applications potentielles d’un tel système sont vastes et transformatrices, allant des capacités de cyberguerre avancées à la création de nouvelles armes de destruction massive.

“Nous sommes convaincus que la combinaison de modèles de base plus solides avec l’apprentissage par renforcement alimenté par des ressources de calcul à grande échelle nous rapprochera de la réalisation de l’AGI”, a déclaré l’équipe responsable du dernier modèle d’Alibaba. Cette quête de l’AGI est un fil conducteur qui traverse la plupart des principaux laboratoires d’IA. L’objectif déclaré de DeepSeek est de “percer le mystère de l’AGI avec curiosité”. De même, la mission d’OpenAI est de “s’assurer que l’intelligence artificielle générale – des systèmes d’IA généralement plus intelligents que les humains – profite à toute l’humanité”. Des PDG de premier plan dans le domaine de l’IA ont exprimé l’espoir que des systèmes de type AGI pourraient émerger au cours du mandat actuel du président Trump.

Le retour de Jack Ma et le paysage technologique chinois

La récente percée d’Alibaba en matière d’IA intervient dans la foulée d’une apparition publique notable du cofondateur de l’entreprise, Jack Ma. Il était assis au premier rang lors d’une réunion entre le président Xi Jinping et les principaux chefs d’entreprise chinois. Cela a marqué un changement significatif pour Ma, qui s’était largement retiré de la scène publique depuis 2020. Ses critiques antérieures à l’égard des régulateurs de l’État et des banques publiques, accusés d’entraver l’innovation et de fonctionner avec une “mentalité de prêteur sur gages”, avaient apparemment conduit à une période de visibilité réduite.

Pendant l’absence de Ma sous les feux de la rampe, le gouvernement chinois a mis en œuvre une série de mesures ciblant l’industrie technologique. Des réglementations plus strictes ont été imposées sur la manière dont les entreprises pouvaient utiliser les données et s’engager dans la concurrence sur le marché. Simultanément, le gouvernement a exercé un plus grand contrôle sur les principales plateformes numériques.

Changement de priorités : de la répression technologique à la relance économique

En 2022, un changement perceptible dans l’orientation du gouvernement a émergé. La menace perçue posée par l’industrie technologique a semblé s’estomper par rapport au défi imminent de la stagnation économique. “Cette histoire de stagnation économique, et la tentative de l’inverser, a vraiment façonné une grande partie de la politique au cours des 18 derniers mois”, explique Singer. La Chine poursuit désormais activement l’adoption de technologies de pointe. Des rapports indiquent qu’au moins 13 gouvernements municipaux et 10 compagnies énergétiques publiques ont déjà intégré les modèles DeepSeek dans leurs systèmes opérationnels.

La tendance à l’efficacité croissante de l’IA

Le modèle d’Alibaba illustre une tendance continue dans le domaine de l’IA : l’amélioration constante des performances du système parallèlement à une réduction des coûts opérationnels. Epoch AI, une organisation de recherche à but non lucratif, estime que la puissance de calcul requise pour l’entraînement des systèmes d’IA a augmenté à un rythme supérieur à 4 fois par an. Cependant, les progrès simultanés dans la conception des algorithmes ont conduit à une augmentation de trois fois de l’efficacité de cette puissance de calcul chaque année. En termes pratiques, cela signifie qu’un système d’IA qui aurait pu nécessiter 10 000 puces informatiques avancées pour l’entraînement l’année dernière pourrait être entraîné avec seulement un tiers de ce nombre cette année.

Le rôle crucial des puces informatiques haut de gamme

Malgré ces gains d’efficacité impressionnants, Singer prévient que les puces informatiques haut de gamme restent indispensables pour le développement avancé de l’IA. Cette réalité souligne le défi permanent posé par les contrôles américains à l’exportation de ces puces pour les entreprises chinoises d’IA comme Alibaba et DeepSeek. Le PDG de DeepSeek a spécifiquement identifié l’accès aux puces, plutôt que les ressources financières ou le talent, comme leur principal goulot d’étranglement.

Un nouveau paradigme : les “modèles de raisonnement”

QwQ représente le dernier ajout à une génération naissante de systèmes d’IA catégorisés comme “modèles de raisonnement”. Certains experts considèrent cela comme un changement de paradigme dans le domaine de l’IA. Auparavant, les systèmes d’IA s’amélioraient grâce à une combinaison d’augmentation de la puissance de calcul utilisée pour l’entraînement et d’amélioration de la quantité et de la qualité des données d’entraînement.

Ce nouveau paradigme met l’accent sur une approche différente. Il s’agit de prendre un modèle qui a déjà subi un entraînement initial – dans ce cas, Qwen 2.5-32B – puis d’augmenter considérablement les ressources de calcul allouées au système lorsqu’il répond à une requête spécifique. Comme l’équipe Qwen l’exprime avec éloquence, “lorsqu’on lui donne le temps de réfléchir, de questionner et de méditer, la compréhension des mathématiques et de la programmation par le modèle s’épanouit comme une fleur qui s’ouvre au soleil”. Cette observation s’aligne sur les tendances observées dans les modèles occidentaux, où les techniques qui permettent un temps de “réflexion” prolongé ont entraîné des améliorations substantielles des performances sur des tâches analytiques complexes.

Publication en “open-weight” et dynamique du marché

Le QwQ d’Alibaba a été publié sous un modèle “open-weight”. Cela signifie que les poids, qui constituent essentiellement le modèle et sont accessibles sous forme de fichier informatique, peuvent être téléchargés et exécutés localement, même sur un ordinateur portable haut de gamme. Il est intéressant de noter qu’un aperçu du modèle publié en novembre de l’année précédente avait suscité beaucoup moins d’attention. Singer note que “le marché boursier est généralement réactif aux publications de modèles et non à la trajectoire de la technologie”, qui devrait continuer à progresser rapidement des deux côtés du Pacifique. Il souligne en outre : “L’écosystème chinois compte un grand nombre d’acteurs, qui proposent tous des modèles très puissants et convaincants, et il n’est pas clair qui émergera, en fin de compte, comme ayant le meilleur modèle.”

Examen détaillé de l’architecture de QwQ-32B

Le modèle QwQ-32B, bien que construit sur la base de Qwen 2.5-32B, intègre plusieurs modifications architecturales clés et améliorations d’entraînement qui contribuent à ses capacités de raisonnement améliorées. Ces améliorations peuvent être globalement classées en :

  • Extension de la fenêtre contextuelle: La fenêtre contextuelle, qui détermine la quantité de texte que le modèle peut prendre en compte en une seule fois, a probablement été considérablement étendue. Cela permet à QwQ-32B de traiter et de comprendre des passages de texte plus longs et plus complexes, ce qui conduit à une meilleure compréhension et à des réponses plus nuancées.

  • Mécanismes d’attention améliorés: Le mécanisme d’attention, un composant essentiel des modèles basés sur les transformateurs comme QwQ-32B, a probablement été affiné. Cela pourrait impliquer des techniques telles que l’attention multi-têtes ou l’attention clairsemée, permettant au modèle de se concentrer plus efficacement sur les informations pertinentes dans le texte d’entrée et de filtrer le bruit.

  • Apprentissage par renforcement à partir de la rétroaction humaine (RLHF): Bien que cela ne soit pas explicitement indiqué, il est fort probable que QwQ-32B ait été affiné à l’aide de RLHF. Cette technique consiste à entraîner le modèle à générer des sorties qui sont préférées par les évaluateurs humains, ce qui conduit à des améliorations dans des domaines tels que la cohérence, l’utilité et l’innocuité.

  • Réglage des instructions: QwQ-32B a peut-être subi un réglage approfondi des instructions, un processus où le modèle est entraîné sur un ensemble diversifié d’instructions et de sorties correspondantes. Cela aide le modèle à mieux se généraliser à de nouvelles tâches et à suivre les instructions plus précisément.

  • Incitation à la chaîne de pensée: Le modèle est explicitement conçu pour tirer parti de l’incitation à la chaîne de pensée, une technique où le modèle est encouragé à générer une série d’étapes de raisonnement intermédiaires avant d’arriver à une réponse finale. Cela favorise un raisonnement plus délibéré et logique.

Implications pour des industries spécifiques

Les avancées incarnées par QwQ-32B et d’autres modèles d’IA chinois ont des implications significatives pour diverses industries, tant en Chine qu’à l’échelle mondiale. Parmi les secteurs clés susceptibles d’être touchés, on peut citer :

  • Commerce électronique: Le cœur de métier d’Alibaba, le commerce électronique, devrait bénéficier considérablement de l’amélioration des capacités de l’IA. Cela inclut des domaines tels que les recommandations personnalisées, les chatbots de service client, la détection des fraudes et l’optimisation de la chaîne d’approvisionnement.

  • Finance: Les modèles d’IA peuvent être utilisés pour des tâches telles que l’évaluation des risques, la détection des fraudes, le trading algorithmique et la gestion de la relation client. Les capacités de raisonnement accrues de modèles comme QwQ-32B pourraient conduire à des prédictions financières plus précises et à une meilleure prise de décision.

  • Soins de santé: L’IA peut aider à la découverte de médicaments, au diagnostic des maladies, à la médecine personnalisée et à la surveillance des patients. Des modèles de raisonnement plus puissants peuvent analyser des données médicales complexes et fournir des informations qui étaient auparavant inaccessibles.

  • Fabrication: L’automatisation basée sur l’IA, le contrôle qualité et la maintenance prédictive peuvent améliorer l’efficacité et réduire les coûts dans les processus de fabrication.

  • Transport: Les véhicules autonomes, les systèmes de gestion du trafic et l’optimisation de la logistique reposent fortement sur l’IA. Les progrès du raisonnement de l’IA peuvent contribuer à des réseaux de transport plus sûrs et plus efficaces.

  • Éducation: Les modèles d’IA sont de plus en plus adoptés pour fournir un meilleur soutien aux étudiants, etmême un tutorat personnalisé.

L’avenir de la concurrence et de la collaboration en matière d’IA

Les progrès rapides des modèles d’IA chinois comme QwQ-32B soulèvent des questions importantes sur l’avenir de la concurrence et de la collaboration en matière d’IA à l’échelle mondiale. Bien qu’une dynamique concurrentielle existe indéniablement, en particulier entre les États-Unis et la Chine, il existe également des avantages potentiels à la collaboration et au partage des connaissances.

  • Open Source vs. Source fermée: La décision d’Alibaba de publier QwQ-32B en tant que modèle open-weight est significative. Elle contraste avec l’approche adoptée par certaines entreprises occidentales d’IA qui maintiennent leurs modèles en tant que systèmes propriétaires à source fermée. Les modèles open source peuvent favoriser une plus grande collaboration et accélérer l’innovation en permettant aux chercheurs et aux développeurs du monde entier de s’appuyer sur les travaux existants.

  • Partage de données et normalisation: Le développement de systèmes d’IA robustes et fiables nécessite de grandes quantités de données. La collaboration internationale sur le partage des données et l’établissement de normes communes pourraient bénéficier à l’ensemble de la communauté de l’IA.

  • Considérations éthiques: À mesure que les systèmes d’IA deviennent plus puissants, les considérations éthiques deviennent de plus en plus importantes. Le dialogue et la coopération à l’échelle mondiale sont essentiels pour garantir que l’IA est développée et déployée de manière responsable, avec des garanties appropriées pour atténuer les risques potentiels.

  • Échange de talents: Le domaine de l’IA bénéficie d’un vivier de talents diversifié et réparti dans le monde entier. Faciliter l’échange de chercheurs et d’ingénieurs entre les pays peut favoriser le transfert de connaissances et accélérer les progrès.

L’émergence de QwQ-32B et d’autres modèles d’IA chinois avancés représente une étape importante dans l’évolution continue de l’intelligence artificielle. Elle met en évidence les capacités croissantes de l’écosystème technologique chinois et souligne les implications mondiales des avancées de l’IA. Les années à venir seront probablement marquées par des progrès rapides et continus, une concurrence intense et des appels croissants à la collaboration internationale pour garantir que l’IA profite à l’humanité dans son ensemble.