Le paysage de l’intelligence artificielle est en constante évolution, avec de nouveaux modèles et des avancées qui émergent à un rythme effréné. Parmi les développements récents, la publication en open source par Alibaba de son modèle Tongyi Qianwen de nouvelle génération, Qwen3, a suscité une attention considérable. Se targuant d’une taille de paramètre plus petite, de coûts réduits et de performances améliorées par rapport à d’autres modèles de premier plan, Qwen3 s’est positionné comme un concurrent de taille dans le domaine de l’IA à l’échelle mondiale.
Qwen3 se distingue comme un modèle de raisonnement hybride novateur en Chine, offrant une combinaison intéressante de performances améliorées et de coûts réduits. Avec un total de 235 milliards de paramètres, il nécessite beaucoup moins de ressources pour être déployé par rapport à d’autres modèles dotés de capacités similaires. Cette rentabilité fait de Qwen3 une option attrayante pour les organisations qui cherchent à exploiter la puissance des grands modèles linguistiques sans se ruiner.
Autonomisation des agents et applications d’IA
L’un des principaux atouts de Qwen3 est son potentiel d’accélération du développement et du déploiement d’agents d’IA et d’applications de grands modèles linguistiques. Lors des évaluations des capacités des agents modèles, Qwen3 a obtenu des scores impressionnants, dépassant d’autres modèles de premier plan. Cela suggère que Qwen3 peut abaisser la barrière à l’entrée pour le développement et le déploiement d’agents d’IA, ce qui pourrait entraîner une augmentation des applications innovantes.
La demande croissante de capacités d’appel d’outils dans les agents d’IA
Les agents d’IA sont de plus en plus utilisés pour automatiser des tâches complexes et interagir avec le monde réel. Les capacités requises d’un agent d’IA dépendent de la complexité et de l’autonomie des tâches qu’il est conçu pour effectuer.
Un système d’agent d’IA robuste nécessite généralement les capacités suivantes du modèle sous-jacent :
Compréhension et génération du langage de base : La capacité d’interpréter avec précision les instructions, de comprendre le contexte et de générer des réponses en langage naturel.
Utilisation et appel d’outils : La capacité de comprendre et d’utiliser des outils externes, y compris des API, pour accomplir des tâches spécifiques.
Raisonnement et planification : La capacité de décomposer des objectifs complexes en sous-tâches plus petites et de les exécuter dans un ordre logique.
Qwen3 répond au besoin critique d’amélioration des capacités d’appel d’outils dans les agents d’IA. Il peut intégrer des outils externes avec précision, tant en mode de pensée qu’en mode non pensée, ce qui en fait un modèle open source de premier plan pour les tâches complexes basées sur des agents.
Lors des évaluations des capacités des agents modèles, Qwen3 a obtenu un score élevé, dépassant d’autres modèles de premier plan. Cela signifie une réduction significative des obstacles à l’entrée pour le développement et le déploiement d’agents d’IA.
Qwen3 prend en charge nativement le protocole MCP et possède de solides capacités d’appel d’outils. Combiné au framework Qwen-Agent, qui encapsule les modèles et les analyseurs d’appels d’outils, il simplifie le processus de développement et permet des opérations d’agent efficaces sur les appareils mobiles et informatiques. Les développeurs peuvent définir les outils disponibles en fonction des fichiers de configuration MCP et les intégrer à l’aide du framework Qwen-Agent ou d’autres outils personnalisés. Cela permet le développement rapide d’agents intelligents dotés de bases de connaissances et de capacités d’utilisation d’outils.
De plus, Qwen3 affiche de solides performances dans la compréhension et la génération du langage de base, ainsi que dans les capacités de raisonnement.
Cela signifie qu’avec des capacités de modèle équivalentes, le coût d’appel des modèles pour les agents et les industries d’applications d’IA est plus faible, et l’appel est plus pratique, ce qui favorisera inévitablement l’émergence de davantage de nouveaux agents et d’applications d’IA.
Un engagement envers l’open source
Alibaba a réaffirmé son engagement envers la communauté open source en proposant une gamme variée de modèles Qwen3. Cela comprend deux modèles Mixture-of-Experts (MoE) avec 30 milliards et 235 milliards de paramètres, ainsi que six modèles denses de tailles variables.
Le modèle MoE de 30 milliards de paramètres offre une amélioration significative des performances, offrant des performances comparables au modèle Qwen2.5-32B de la génération précédente. Les modèles denses démontrent également des performances améliorées, même les modèles plus petits obtenant des résultats impressionnants.
Étant donné que tous les modèles Qwen3 sont des modèles de raisonnement hybrides, les API peuvent être configurées selon les besoins pour définir des ‘budgets de pensée’ (c’est-à-dire le nombre maximum de jetons attendus pour une pensée approfondie) afin d’effectuer différents degrés de pensée et de répondre de manière flexible aux divers besoins des applications d’IA et aux différents scénarios de performance et de coût. Les petites et moyennes entreprises et les développeurs d’IA peuvent choisir de manière flexible les modèles en fonction de leurs besoins, ce qui réduira inévitablement le seuil et le coût d’utilisation de grands modèles. Ces équipes disposant de fonds et de personnel très limités peuvent consacrer plus de ressources et d’énergie au marché et à l’extraction des besoins et des points faibles des utilisateurs afin de pouvoir développer des applications plus innovantes.
Fondation technologique d’Alibaba
Après 16 ans de développement, Alibaba a reconstruit de manière exhaustive un système d’architecture technologique complet, du matériel sous-jacent à l’informatique, au stockage, au réseau, au traitement des données, à la formation de modèles et aux plateformes de raisonnement, ce qui en fait la principale plateforme d’informatique en nuage de la région Asie-Pacifique. Alibaba est également l’une des premières entreprises technologiques au monde à investir dans la recherche sur les grands modèles.
Auparavant, Zhou Jingren a déclaré dans une interview aux médias que le développement de grands modèles est indissociable du soutien du système cloud. Qu’il s’agisse de formation ou de raisonnement, chaque avancée dans les grands modèles est, en surface, l’évolution des capacités du modèle, mais derrière elle se cache la coopération globale et la mise à niveau de l’ensemble de la plateforme d’informatique en nuage, de données et d’ingénierie. La multimodalité est également un moyen important d’atteindre l’AGI.
Reconnaissance internationale
La publication de Qwen3 a suscité l’attention à l’échelle mondiale. Suite à la publication de Qwen 3 d’Alibaba, Elon Musk a déclaré sur la plateforme de médias sociaux X qu’une version bêta précoce de Grok 3.5 serait publiée pour les abonnés SuperGrok la semaine prochaine, affirmant qu’il s’agit de la première IA capable de répondre avec précision aux questions sur les moteurs de fusée ou la technologie électrochimique.
Stimuler l’innovation et l’accessibilité
Sun Maosong, vice-président exécutif de l’Institut d’intelligence artificielle de l’Université Tsinghua et académicien étranger de l’Académie européenne des sciences humaines et naturelles, a déclaré qu’au cours des dernières années, la Chine a apporté de fortes contributions au développement de l’intelligence artificielle, en particulier dans le domaine des grands modèles. L’émergence de DeepSeek et de la série de produits open source de Tongyi Qianwen ont grandement promu la voie open source des grands modèles nationaux, ce qui est sans aucun doute d’une grande importance pour atténuer les monopoles technologiques, promouvoir l’équité technologique et améliorer l’inclusivité de l’intelligence artificielle.
Actuellement, le nombre de modèles dérivés de Qwen dans les communautés open source nationales et étrangères a dépassé 100 000, dépassant la série Llama de modèles dérivés, et Tongyi Qianwen Qwen se classe comme le plus grand groupe de modèles de langage génératif au monde. Selon la dernière liste mondiale de grands modèles open source de Huggingface du 10 février 2025, les dix premiers grands modèles open source sont tous des modèles dérivés basés sur les modèles open source Tongyi Qianwen Qwen.
Sun Maosong estime que cela signifie que la culture chinoise des grands modèles a été reconnue à l’échelle internationale, ce qui constitue un changement culturel. Ceci est très précieux et représente une reconnaissance du développement et de la technologie des grands modèles chinois.