DeepSeek défie le leadership américain en IA

L’ascension de DeepSeek : un défi pour le leadership américain en IA

Dans le domaine de l’intelligence artificielle, une histoire de David contre Goliath se déroule. Les États-Unis, avec leur projet ambitieux “Stargate” et un investissement colossal de 500 milliards de dollars, visent à consolider leur position de leader mondial en IA. Cet effort monumental, soutenu par des géants de la technologie, cherche à établir un réseau de centres de données de pointe à travers le pays. Cependant, une startup chinoise agile, opérant avec ce que certains pourraient appeler un “budget dérisoire”, a émergé comme un challenger redoutable, jetant une ombre sur les aspirations américaines.

DeepSeek, une entreprise basée à Hangzhou, a récemment dévoilé une série de modèles d’IA open-source qui non seulement égalent, mais dans certains cas, surpassent les performances des modèles d’OpenAI. De plus, ils ont réalisé cela avec une efficacité remarquable et à une fraction du coût. Ce développement a envoyé des ondes de choc dans la communauté de l’IA, soulevant des questions sur l’efficacité de la stratégie américaine et l’avenir de la domination de l’IA.

Le paysage actuel de l’IA et l’émergence de DeepSeek

Le paysage de l’IA est actuellement dominé par quelques acteurs majeurs, principalement basés aux États-Unis. Ces entreprises, dotées de financements et de ressources considérables, ont été à l’avant-garde de l’innovation en IA, développant des modèles puissants qui sous-tendent un large éventail d’applications. Cependant, l’émergence de DeepSeek signale un changement potentiel dans cette dynamique, démontrant qu’une IA révolutionnaire peut être développée avec beaucoup moins de ressources.

Le modèle R1 de DeepSeek, publié plus tôt cette semaine, est un excellent exemple de cette perturbation. Selon l’entreprise, ce modèle égale et dépasse même les performances du modèle o1 d’OpenAI, qui a été publié l’année dernière et conçu pour résoudre des problèmes complexes de raisonnement et de mathématiques. Le fait que le modèle de DeepSeek soit open-source et facilement accessible au public amplifie encore son impact, permettant aux chercheurs et aux développeurs du monde entier de tirer parti de ses capacités. Les critiques ont salué la capacité du modèle R1 à gérer des tâches telles que le codage et le raisonnement, le plaçant en concurrence directe avec les modèles les plus avancés du marché.

L’efficacité de DeepSeek : un contraste frappant

Cette réalisation est d’autant plus remarquable si l’on considère les ressources dont dispose DeepSeek. Le grand modèle linguistique V3 de l’entreprise, annoncé en décembre, aurait été entraîné en utilisant seulement 5,6 millions de dollars de puissance de calcul. C’est un contraste frappant avec les plus de 100 millions de dollars qui auraient été utilisés pour entraîner GPT-4 d’OpenAI. Le modèle V3 de DeepSeek a été comparé aux modèles d’OpenAI et d’Anthropic, DeepSeek revendiquant une parité de performance. Andrej Karpathy, un éminent chercheur en IA qui a précédemment travaillé chez Tesla et OpenAI, a décrit la capacité de DeepSeek à entraîner son IA de pointe avec un “budget dérisoire” comme étant très impressionnante.

L’ascension de DeepSeek dans le secteur compétitif de l’IA en Chine n’est pas accidentelle. Le fondateur de l’entreprise, Liang Wenfeng, âgé de 40 ans, a récemment rencontré le Premier ministre chinois Li Qiang, soulignant l’importance des réalisations de DeepSeek au sein de la nation. Cette réunion, à laquelle ont participé d’autres experts de l’industrie, met en évidence l’engagement de la Chine à favoriser l’innovation technologique et ses ambitions dans le domaine de l’IA. Le succès de DeepSeek témoigne de l’ingéniosité et de l’esprit d’initiative du secteur technologique chinois, démontrant sa capacité à rivaliser sur la scène mondiale malgré les restrictions d’accès à certaines technologies.

Les origines et la stratégie de DeepSeek

Les origines de DeepSeek remontent à HighFlyer, un fonds spéculatif quantitatif chinois qui gérait environ 1,4 milliard de dollars d’actifs en 2019. HighFlyer a scindé DeepSeek en 2023, l’établissant comme une startup d’IA dédiée axée sur le développement de modèles et la création de produits d’IA. Liang Wenfeng, qui a une formation en IA de l’université de Zhejiang, a cofondé HighFlyer et a tiré parti de ses ressources financières pour acquérir des milliers de puces d’IA Nvidia avant l’imposition des restrictions américaines en 2022. Cette décision stratégique a donné à DeepSeek un avantage significatif sur d’autres startups d’IA, lui permettant de poursuivre ses recherches et son développement tandis que d’autres avaient du mal à obtenir de la puissance de traitement.

Bien que les experts aient des opinions divergentes sur les performances de DeepSeek par rapport à ChatGPT d’OpenAI et Claude d’Anthropic, le consensus général est que les modèles de DeepSeek fonctionnent exceptionnellement bien dans des configurations matérielles spécifiques. Cependant, ils peuvent rencontrer des difficultés dans d’autres scénarios. L’objectif de DeepSeek est d’améliorer l’efficacité et de réduire les coûts, ce qui est évident dans son modèle innovant de “mélange d’experts”. Ce modèle utilise différentes parties de l’IA pour traiter des questions spécifiques, optimisant ainsi les performances et l’utilisation des ressources.

Les avantages concurrentiels de DeepSeek

Un autre élément clé qui différencie les modèles de DeepSeek est leur nature open-source, permettant une utilisation sur diverses plateformes matérielles. Plus important encore, les modèles de DeepSeek offrent une transparence, révélant comment ils arrivent à leurs réponses, contrairement au modèle o1 d’OpenAI. Cette transparence est un argument de vente clé pour les clients qui recherchent des solutions d’IA rentables, en particulier ceux qui sont exclus du marché des modèles américains à prix élevé et ceux qui sont limités dans leur accès à la puissance de calcul américaine.

Les préoccupations des États-Unis concernant les progrès de la Chine en matière d’IA ne sont pas infondées. Le gouvernement américain s’efforce activement de freiner le développement de l’IA en Chine par le biais de contrôles à l’exportation sur les puces d’IA avancées depuis 2022. Cela a effectivement empêché les entreprises chinoises d’acquérir les processeurs nécessaires pour entraîner des modèles d’IA de pointe. Malgré ces restrictions, les fabricants de puces comme Nvidia et Intel ont tenté de créer des processeurs conformes aux exigences américaines pour le marché chinois, pour se heurter à un durcissement des règles par Washington.

Les stratégies alternatives de la Chine face aux restrictions

Ces restrictions ont contraint les entreprises chinoises d’IA à explorer des stratégies alternatives. Certaines s’appuient sur des puces fabriquées aux États-Unis qui ont été importées avant les interdictions, tandis que d’autres se tournent vers des réseaux de contrebande du marché gris qui expédient des puces depuis des pays tiers. Certaines explorent des centres de données en dehors de la Chine, tandis que d’autres s’appuient sur des alternatives fabriquées en Chine par des entreprises comme Huawei. Bien que Huawei affirme que ses puces d’IA surpassent le processeur A100 de Nvidia, elle a rencontré des difficultés à les produire de manière fiable à grande échelle.

Liang Wenfeng a déclaré que “l’argent n’a jamais été le problème pour nous ; les interdictions d’expédition de puces avancées sont le problème”. Cette déclaration souligne les obstacles importants auxquels les entreprises chinoises sont confrontées dans leur quête du leadership en matière d’IA. Outre les interdictions d’exportation de puces, l’administration Biden a également interdit les investissements américains dans l’IA chinoise, ce qui complique encore la situation.

L’écosystème florissant de l’IA en Chine

Malgré ces défis, la Chine a cultivé un écosystème d’IA florissant. Les grandes entreprises technologiques telles que Baidu, Alibaba et ByteDance développent leurs propres modèles fondamentaux et proposent des services basés sur l’IA. Des startups chinoises d’IA comme MiniMax et Moonshot AI ont lancé des services axés sur le consommateur qui ont connu le succès même sur le marché américain.

La concurrence intense au sein du secteur chinois de l’IA a conduit à une guerre des prix, les entreprises réduisant considérablement leurs prix jusqu’à 90 % tout au long de l’année 2024 afin de gagner un avantage concurrentiel. Cette guerre des prix met encore plus en évidence l’ingéniosité et la capacité d’adaptation du secteur chinois de l’IA.

Les inquiétudes américaines et la réponse du projet Stargate

Les États-Unis sont de plus en plus inquiets des succès de la Chine en matière d’IA, car cela implique que les mesures prises pour protéger le leadership américain en matière d’IA ne fonctionnent pas. L’ancien PDG de Google, Eric Schmidt, a exprimé sa surprise face aux progrès de la Chine, déclarant qu’il “pensait que les restrictions que nous avions imposées aux puces les retarderaient”.

OpenAI, le développeur de ChatGPT, a également exprimé des inquiétudes quant aux avancées de la Chine en matière d’IA. Dans un récent document de politique générale, OpenAI a déclaré qu’il y avait environ 175 milliards de dollars de fonds mondiaux en attente d’investissement dans des projets d’IA. L’entreprise a averti que “si les États-Unis n’attirent pas ces fonds, ils iront vers des projets soutenus par la Chine, renforçant ainsi l’influence mondiale du Parti communiste chinois”.

En réponse à ces préoccupations, le PDG d’OpenAI, Sam Altman, le PDG de SoftBank, Masayoshi Son, et le cofondateur d’Oracle, Larry Ellison, ont annoncé le projet Stargate, qui s’engage à investir 500 milliards de dollars dans l’infrastructure d’IA à travers les États-Unis. Ce projet est une indication claire de l’engagement des États-Unis à maintenir leur leadership dans le domaine de l’IA.

L’importance de l’innovation et de l’adaptabilité

Cependant, l’émergence d’entreprises comme DeepSeek suggère que la voie vers la domination de l’IA pourrait ne pas être aussi simple que d’investir de vastes sommes d’argent. La capacité d’innover, de s’adapter et de réaliser des percées avec des ressources limitées est un facteur essentiel dans le paysage actuel de l’IA. Alors que la course à l’IA continue de s’intensifier, le monde observera attentivement comment les États-Unis et la Chine gèrent ces défis complexes. L’issue aura des implications considérables pour l’avenir de la technologie et de la dynamique du pouvoir mondial. L’histoire de DeepSeek nous rappelle que l’ingéniosité et l’esprit d’initiative peuvent être des forces puissantes dans la course à la suprématie de l’IA. Alors que les États-Unis investissent massivement pour maintenir leur avance, le défi de la Chine, en particulier des startups innovantes comme DeepSeek, est redoutable. Les années à venir seront cruciales pour déterminer le vainqueur ultime de cette compétition à enjeux élevés. Le paysage de l’IA évolue rapidement, et la dynamique entre ces deux puissances mondiales continuera de façonner l’avenir de cette technologie transformatrice.