Adaptation de l’IA pour l’entreprise et au-delà
Lors de la récente GPU Technical Conference (GTC) 2025, le PDG de Nvidia, Jensen Huang, a exposé la stratégie de l’entreprise visant à adapter sa puissance de calcul accéléré à un large éventail d’applications. Alors que les projecteurs étaient braqués sur les GPU ‘Blackwell’ B300 de nouvelle génération de Nvidia et sur la future famille d’accélérateurs ‘Rubin’, Huang a également souligné l’engagement de l’entreprise à répondre aux besoins des entreprises, de l’informatique de périphérie (edge computing) et du domaine de l’IA physique.
Huang a souligné que si les fournisseurs de services cloud sont attirés par la technologie de pointe et l’approche full-stack de Nvidia, l’adoption plus large de l’IA exige une stratégie plus nuancée. Il a déclaré : “Le calcul accéléré ne concerne pas seulement la puce, ni même la puce et les bibliothèques, le modèle de programmation. C’est la puce, le modèle de programmation et tout un tas de logiciels qui viennent s’y ajouter.”
L’évolution de l’IA : du cloud à l’omniprésence
L’élan initial de l’IA a peut-être pris naissance dans le cloud, mais sa trajectoire s’étend clairement bien au-delà. À mesure que l’IA imprègne divers secteurs, elle rencontre diverses configurations système, environnements d’exploitation, bibliothèques spécifiques à un domaine et modèles d’utilisation. Huang a souligné cette expansion, notant les exigences uniques de l’informatique d’entreprise, de la fabrication, de la robotique, des voitures autonomes et même des fournisseurs de cloud GPU émergents.
La nature fondamentale de l’informatique est remodelée par l’IA et l’apprentissage automatique, influençant tout, des processeurs et systèmes d’exploitation aux applications et à leur orchestration. Les flux de travail d’entreprise évoluent, passant de la simple récupération de données à des interactions interactives de questions-réponses avec des systèmes d’IA.
L’essor des agents d’IA et des travailleurs numériques
Huang envisage un avenir où les agents d’IA feront partie intégrante de la main-d’œuvre numérique. Il prédit qu’aux côtés du milliard de travailleurs du savoir dans le monde, il y aura dix milliards de travailleurs numériques, collaborant de manière transparente. Cette présence omniprésente des agents d’IA nécessite une nouvelle génération d’ordinateurs, optimisés pour leurs exigences opérationnelles uniques.
Présentation d’un nouveau matériel pour l’ère de l’IA
Nvidia répond à ce besoin en introduisant deux supercalculateurs personnels d’IA : le DGX Spark et le DGX Station. Ces systèmes de bureau sont conçus pour l’inférence et d’autres tâches, offrant une flexibilité pour un fonctionnement local ou une intégration avec le DGX Cloud de Nvidia et d’autres environnements cloud accélérés.
Le DGX Spark est doté du Superchip GB10 Grace Blackwell, offrant des performances exceptionnelles pour le réglage fin et l’inférence de l’IA. Le DGX Station, un système de bureau plus puissant, est équipé du Superchip de bureau GB300 Grace-Blackwell Ultra, offrant une mémoire cohérente massive de 784 Go, le ConnectX-8 SuperNIC de Nvidia, la plateforme logicielle AI Enterprise et l’accès aux microservices NIM AI.
Au-delà des agents : l’aube du raisonnement de l’IA
Ces nouveaux systèmes fournissent non seulement aux entreprises des outils puissants pour les charges de travail d’IA, mais ouvrent également la voie à la prochaine étape de l’évolution de l’IA : les modèles de raisonnement. Ces modèles représentent un bond en avant significatif par rapport aux agents d’IA de base, capables de s’attaquer à des problèmes complexes et de présenter des capacités de raisonnement dépassant de loin la nature de type question-réponse des chatbots d’IA actuels.
Huang a décrit cette avancée en déclarant : “Nous avons maintenant des IA qui peuvent raisonner, ce qui consiste fondamentalement à décomposer un problème, étape par étape. Nous avons maintenant des IA qui peuvent raisonner étape par étape en utilisant… des technologies appelées chaîne de pensée, meilleur de N, vérification de la cohérence, planification de chemin, une variété de techniques différentes.”
Modèles Nemotron : renforcer le raisonnement de l’IA
S’appuyant sur les bases posées lors du Consumer Electronics Show avec le dévoilement des modèles Llama Nemotron et Cosmos Nemotron, Nvidia a présenté une famille de modèles Llama Nemotron ouverts lors de la GTC. Ces modèles offrent des capacités de raisonnement améliorées pour les tâches multi-étapes en mathématiques, codage, prise de décision et suivi des instructions.
Kari Briski, vice-présidente de Nvidia pour les logiciels d’IA générative pour l’entreprise, a souligné l’engagement de l’entreprise envers le support des développeurs. Nvidia fournit des ensembles de données, comprenant 60 milliards de jetons de données générées synthétiquement, et des techniques pour faciliter l’adoption de ces modèles.
Briski a expliqué : “Tout comme les humains, les agents doivent comprendre le contexte pour décomposer les demandes complexes, comprendre l’intention de l’utilisateur et s’adapter en temps réel.”
Les modèles Nemotron offrent différents niveaux de capacités de raisonnement et sont disponibles en trois tailles : Nano (optimisé pour les PC et les appareils de périphérie), Super (haute précision et débit sur un seul GPU) et Ultra (conçu pour plusieurs GPU).
AI-Q Blueprint : connecter les données aux agents de raisonnement
La plateforme logicielle AI Enterprise de Nvidia est complétée par AI-Q Blueprint, une offre basée sur NIM qui permet aux entreprises de connecter des données propriétaires à des agents d’IA de raisonnement. Ce logiciel ouvert s’intègre à l’outil NeMo Retriever de Nvidia, permettant d’interroger divers types de données (texte, images, vidéos) et facilitant la collaboration entre le calcul accéléré de Nvidia et les plateformes et logiciels de stockage tiers, y compris les modèles Llama Nemotron.
Briski a souligné les avantages pour les équipes de développement, déclarant : “Pour les équipes d’agents connectés, le blueprint fournit une observabilité et une transparence dans l’activité des agents, permettant aux développeurs d’améliorer les agents au fil du temps. Les développeurs peuvent améliorer la précision des agents et réduire le temps d’exécution de ces tâches de plusieurs heures à quelques minutes.”
AI Data Platform : une conception de référence pour l’infrastructure d’entreprise
La AI Data Platform de Nvidia sert de conception de référence pour l’infrastructure d’entreprise, incorporant des agents d’interrogation d’IA construits à l’aide du AI-Q Blueprint.
IA physique : relier les mondes numérique et physique
Huang a également abordé le domaine en plein essor de l’IA physique, qui implique l’intégration de l’IA dans des systèmes physiques pour permettre la perception et l’interaction dans le monde réel. Il a prédit que ce domaine pourrait devenir le plus grand segment du marché de l’IA.
“L’IA qui comprend le monde physique, des choses comme la friction et l’inertie, la cause et l’effet, la permanence des objets, cette capacité à comprendre le monde physique, le monde tridimensionnel. C’est ce qui va permettre une nouvelle ère d’IA physique et cela va permettre la robotique”, a expliqué Huang.
Avancées dans la robotique et les véhicules autonomes
Plusieurs annonces ont souligné l’engagement de Nvidia envers l’IA physique, notamment l’introduction du Nvidia AI Dataset, spécialement conçu pour la robotique et les véhicules autonomes. Cet ensemble de données permet aux développeurs de pré-entraîner, tester, valider et affiner les modèles de fondation, en tirant parti des données réelles et synthétiques utilisées dans la plateforme de développement de modèles du monde Cosmos de Nvidia, le logiciel Drive AV, la plateforme de développement de robots Isaac AI et le framework Metropolis pour les villes intelligentes.
La version initiale de l’ensemble de données est disponible sur Hugging Face, offrant 15 téraoctets de données pour la formation en robotique, avec un support pour le développement de véhicules autonomes prévu dans un avenir proche.
De plus, Nvidia a annoncé Isaac GROOT N1, un modèle de fondation pour les robots humanoïdes. Il est formé sur des données réelles et synthétiques, et représente l’avancement du projet GROOT.
Élargir les horizons de l’IA
Les initiatives stratégiques de Nvidia démontrent une vision claire de l’avenir de l’IA, étendant sa portée bien au-delà des limites du cloud et au cœur de l’entreprise et du monde physique. Grâce à une combinaison de matériel de pointe, de plateformes logicielles innovantes et d’un engagement envers l’autonomisation des développeurs, Nvidia se positionne comme la force motrice de la prochaine vague d’innovation en IA. L’introduction de capacités de raisonnement, associée au développement d’outils et d’ensembles de données pour l’IA physique, marque une étape importante vers un avenir où l’IA s’intègre de manière transparente à notre vie quotidienne, transformant les industries et redéfinissant la façon dont nous interagissons avec la technologie. L’accent mis sur les solutions d’entreprise, l’informatique de périphérie et la robotique souligne la compréhension de Nvidia des besoins divers et évolutifs du paysage de l’IA, consolidant sa position de leader dans cette révolution technologique transformatrice.