NVIDIA et Microsoft intensifient leur collaboration pour faire progresser les applications d’IA agentique, allant des solutions basées sur le cloud aux ordinateurs personnels. Ce partenariat renforcé est sur le point d’accélérer les découvertes scientifiques et de favoriser l’innovation dans divers secteurs.
Amélioration de la recherche scientifique grâce à l’IA
Microsoft Discovery est sur le point d’intégrer le microservice ALCHEMI NIM de NVIDIA. Cette intégration est essentielle pour optimiser l’inférence de l’IA pour les simulations chimiques complexes, accélérant ainsi considérablement la recherche en science des matériaux grâce à une prédiction précise des propriétés et à une recommandation efficace des candidats. Cette amélioration promet de rationaliser l’identification de nouveaux matériaux ayant les caractéristiques souhaitées, réduisant ainsi le temps et les ressources traditionnellement nécessaires.
De plus, Microsoft Discovery intégrera les microservices BioNeMo NIM de NVIDIA. Ces microservices sont conçus pour exploiter les flux de travail d’IA pré-entraînés, accélérant considérablement le processus de développement de modèles d’IA pour la découverte de médicaments. En tirant parti de ces outils, les chercheurs peuvent rapidement développer et affiner des modèles d’IA qui prédisent l’efficacité des médicaments et les effets secondaires potentiels, conduisant à des processus de développement de médicaments plus efficaces et ciblés.
Ces intégrations sont méticuleusement conçues pour donner aux chercheurs des performances accélérées, réduisant ainsi le temps nécessaire aux découvertes scientifiques. Ils garantissent que les chercheurs peuvent gérer de vastes ensembles de données et des simulations complexes avec une rapidité et une précision sans précédent, leur permettant de s’attaquer à certains des problèmes les plus difficiles de la recherche scientifique.
Une application pratique de ces avancées a été démontrée par des chercheurs de Microsoft. Ils ont utilisé avec succès Microsoft Discovery pour identifier un nouveau prototype de liquide de refroidissement présentant des propriétés prometteuses pour le refroidissement par immersion dans les centres de données en moins de 200 heures. Ce calendrier contraste fortement avec les mois, voire les années, généralement requis par les méthodes conventionnelles. Le refroidissement par immersion, qui consiste à immerger des composants électroniques dans un liquide de refroidissement non conducteur, devient de plus en plus vital pour gérer la chaleur générée par les systèmes informatiques à haute performance.
GPU NVIDIA Blackwell dans les centres de données Azure
Pour renforcer les performances et l’efficacité, Microsoft déploie rapidement des centaines de milliers de GPU NVIDIA Blackwell dans les centres de données Azure optimisés pour l’IA dans le monde entier. Ces GPU sont intégrés dans les systèmes rack-scale NVIDIA GB200 NVL72, qui sont conçus pour gérer les charges de travail d’IA les plus exigeantes.
Plusieurs des principaux clients de Microsoft, dont OpenAI, exécutent actuellement des charges de travail de production sur cette infrastructure avancée. L’utilisation des GPU NVIDIA Blackwell permet à ces organisations d’exécuter des tâches complexes d’IA plus efficacement. Ce déploiement souligne l’engagement de Microsoft à fournir des capacités d’IA de pointe à ses clients.
Les machines virtuelles Azure ND GB200 v6 représentent un bond en avant significatif en termes de puissance de calcul. Elles offrent jusqu’à 35 fois plus de débit d’inférence par rapport aux machines virtuelles ND H100 v5 précédentes. Les anciennes machines virtuelles, accélérées par huit GPU NVIDIA H100, font désormais pâle figure par rapport aux performances améliorées offertes par la nouvelle génération, marquant une nouvelle référence pour les charges de travail d’IA. Ce niveau d’amélioration des performances peut réduire considérablement le temps et les coûts associés à l’exécution de modèles d’IA à grande échelle.
Cette échelle impressionnante et ces performances élevées sont prises en charge par des conceptions de serveurs personnalisées, des interconnexions NVIDIA NVLink à haute vitesse et une mise en réseau NVIDIA Quantum InfiniBand. Ces technologies facilitent une mise à l’échelle transparente vers des milliers de GPU Blackwell, ce qui est essentiel pour la gestion des applications d’IA générative et agentique exigeantes. L’interconnectivité sophistiquée assure une communication à faible latence entre les GPU, améliorant ainsi les performances globales du système.
Satya Nadella, président-directeur général de Microsoft, et Jensen Huang, fondateur et PDG de NVIDIA, ont souligné que leur collaboration produisait des gains de performance importants grâce à des optimisations logicielles continues sur toutes les architectures NVIDIA sur Azure. Cette approche est conçue pour maximiser la productivité des développeurs, réduire le coût total de possession et accélérer toutes les charges de travail, y compris le traitement de l’IA et des données. En fin de compte, cela se traduit par une plus grande efficacité par dollar et par watt pour les clients.
Extension des capacités avec l’intégration NIM
S’appuyant sur l’intégration NIM dans Azure AI Foundry, Microsoft et NVIDIA étendent la plateforme avec la famille NVIDIA Llama Nemotron de modèles de raisonnement ouverts et les microservices BioNeMo NIM de NVIDIA. Ceux-ci sont conçus pour fournir une inférence conteneurisée de niveau entreprise pour la prise de décision complexe et les charges de travail d’IA spécifiques au domaine.
Les développeurs peuvent désormais tirer parti des microservices NIM optimisés pour un raisonnement avancé au sein d’Azure AI Foundry. Ceux-ci incluent les modèles NVIDIA Llama Nemotron Super et Nano, qui offrent un raisonnement multi-étapes avancé, des capacités de codage et d’agentique. Ils offrent une précision jusqu’à 20 % supérieure et une inférence cinq fois plus rapide par rapport aux modèles précédents, permettant aux développeurs de créer des applications d’IA plus sophistiquées et efficaces.
Les microservices BioNeMo NIM, spécialement conçus pour les applications de soins de santé, répondent aux besoins critiques en matière de biologie numérique, de découverte de médicaments et d’imagerie médicale. Ils permettent aux chercheurs et aux cliniciens d’accélérer la science des protéines, la modélisation moléculaire et l’analyse génomique, conduisant à une amélioration des soins aux patients et à une innovation scientifique plus rapide. Ces outils permettent aux professionnels de la santé de prendre des décisions plus éclairées et de développer des traitements plus efficaces.
Cette intégration étendue permet aux organisations de déployer rapidement des agents d’IA à haute performance. En se connectant à ces modèles et à d’autres solutions de santé spécialisées, les organisations peuvent obtenir une fiabilité robuste et une mise à l’échelle simplifiée, répondant ainsi aux divers besoins de divers secteurs et applications.
IA générative sur les PC RTX AI
L’IA générative révolutionne les logiciels PC en introduisant des expériences entièrement nouvelles allant des humains numériques aux assistants d’écriture, en passant par les agents intelligents et les outils de création. Les PC NVIDIA RTX AI facilitent l’expérimentation avec l’IA générative et améliorent les performances sur Windows 11, rendant l’IA de pointe accessible à un public plus large.
Lors de la Microsoft Build, NVIDIA et Microsoft ont dévoilé une pile d’inférence d’IA conçue pour simplifier le développement et améliorer les performances d’inférence pour les PC Windows 11. Cet ensemble d’outils est essentiel pour permettre une expérience d’IA transparente sur les ordinateurs personnels, rendant les outils d’IA plus réactifs et efficaces.
NVIDIA TensorRT a été repensé spécifiquement pour les PC RTX AI. Il combine les performances de TensorRT avec la construction du moteur juste à temps sur l’appareil et une taille de package huit fois plus petite pour un déploiement transparent de l’IA sur plus de 100 millions de PC RTX AI. Cette optimisation permet un traitement de l’IA plus rapide et plus efficace sur les PC, ouvrant la voie à de nouvelles applications et capacités.
Annoncé lors de Microsoft Build, TensorRT pour RTX est pris en charge nativement par Windows ML - une nouvelle pile d’inférence qui fournit aux développeurs d’applications une large compatibilité matérielle et des performances de pointe. TensorRT pour RTX est disponible dans l’aperçu Windows ML à partir d’aujourd’hui et sera disponible en tant que kit de développement logiciel autonome de NVIDIA Developer en juin. Ce développement simplifie le processus pour les développeurs qui cherchent à intégrer des capacités d’IA dans leurs applications Windows, garantissant que l’IA est accessible à une large gamme de solutions logicielles.
Essentiellement, la collaboration entre NVIDIA et Microsoft crée un écosystème synergique où les avancées de la technologie d’IA sont rapidement traduites en applications du monde réel, bénéficiant ainsi aux chercheurs, aux développeurs et aux utilisateurs finaux. Ce partenariat est stratégiquement positionné pour maintenir son leadership dans le domaine de l’intelligence artificielle en évolution rapide.
Analyse détaillée des avancées
Technologies de pointe
La collaboration entre NVIDIA et Microsoft exploite plusieurs technologies de pointe pour réaliser des avancées dans l’IA agentique. Nous allons ici approfondir ces éléments clés.
Microservice NVIDIA ALCHEMI NIM: Ce microservice est un outil spécialisé optimisé pour l’inférence de l’IA dans les simulations chimiques. Sa fonction principale est d’accélérer la recherche en science des matériaux grâce à une prédiction précise des propriétés et à une recommandation efficace des candidats. En permettant des simulations plus rapides et plus précises, il permet aux chercheurs d’identifier des matériaux prometteurs beaucoup plus rapidement que ne le permettent les méthodes traditionnelles.
Microservices NVIDIA BioNeMo NIM: Ces microservices fournissent des flux de travail d’IA pré-entraînés pour accélérer le développement de modèles d’IA pour la découverte de médicaments. Les chercheurs peuvent les utiliser pour développer rapidement des modèles qui prédisent l’efficacité des médicaments et les effets secondaires potentiels, accélérant ainsi considérablement le développement de nouveaux médicaments.
GPU NVIDIA Blackwell: Ces GPU offrent des performances et une efficacité améliorées dans les charges de travail d’IA au sein des centres de données Azure. Intégrés dans des systèmes rack-scale, ils aident des clients comme OpenAI à exécuter des tâches complexes de manière fluide et efficace.
Interconnexions NVIDIA NVLink: Ces interconnexions à haute vitesse servent à assurer une communication à faible latence entre les GPU, améliorant considérablement les performances globales du système. Il en résulte un calcul plus rapide et une efficacité améliorée dans diverses opérations d’IA.
Mise en réseau NVIDIA Quantum InfiniBand: Cela prend en charge une mise à l’échelle transparente vers des milliers de GPU Blackwell, ce qui est essentiel pour la gestion des charges de travail d’IA générative et agentique exigeantes. Les capacités de mise en réseau garantissent que les modèles d’IA à grande échelle peuvent être déployés et gérés efficacement.
Modèles NVIDIA Llama Nemotron: Les modèles NVIDIA Llama Nemotron Super et Nano sont conçus pour fournir un raisonnement multi-étapes avancé, des capacités de codage et d’agentique. Une précision améliorée et des vitesses d’inférence plus rapides permettent aux développeurs de créer des applications d’IA plus sophistiquées et efficaces.
Impact sur la recherche scientifique
L’intégration des technologies de NVIDIA dans les plateformes de Microsoft a de profondes implications pour la recherche scientifique dans de multiples disciplines.
Science des matériaux: Le microservice NVIDIA ALCHEMI NIM aide à la prédiction précise des propriétés et à la recommandation des candidats, permettant une identification plus rapide de nouveaux matériaux ayant les caractéristiques souhaitées.
Découverte de médicaments: Les microservices BioNeMo NIM accélèrent le développement de modèles d’IA, permettant aux chercheurs de développer des modèles qui prédisent l’efficacité des médicaments et les effets secondaires potentiels.
Refroidissement des centres de données: Microsoft a utilisé Microsoft Discovery pour détecter un nouveau prototype de liquide de refroidissement idéal pour le refroidissement par immersion dans les centres de données en moins de 200 heures au lieu de mois ou d’années avec les méthodes traditionnelles. Cela met en évidence l’accélération rapide des découvertes scientifiques.
Science des protéines, modélisation moléculaire et analyse génomique: Les microservices BioNeMo NIM permettent l’accélération dans ces domaines. Ils conduisent à une amélioration des soins aux patients et à une innovation scientifique plus rapide.
Infrastructure d’IA Azure
Azure AI Foundry de Microsoft et ses centres de données représentent des investissements importants dans la création d’un environnement optimal pour l’exécution des charges detravail d’IA.
Machines virtuelles ND GB200 v6: Elles offrent jusqu’à 35 fois plus de débit d’inférence par rapport aux machines virtuelles ND H100 v5 précédentes, établissant une nouvelle référence pour les charges de travail d’IA.
Conceptions de serveurs personnalisées: Des conceptions de serveurs personnalisées sont développées pour maximiser les performances et l’efficacité, permettant aux GPU Blackwell de fonctionner à leur plein potentiel.
Optimisations NVIDIA sur Azure: Les optimisations logicielles continues sur toutes les architectures NVIDIA sur Azure maximisent la productivité des développeurs, réduisent le coût total de possession et accélèrent toutes les charges de travail, améliorant ainsi l’efficacité par dollar et par watt pour les clients.
IA générative sur les ordinateurs personnels
Les avancées de la technologie d’IA se fraient également un chemin dans les ordinateurs personnels, ouvrant de nouvelles possibilités pour les applications logicielles et les expériences utilisateur.
PC NVIDIA RTX AI: L’expérimentation simplifiée avec l’IA générative et l’amélioration des performances sur Windows 11 sont facilitées par les PC NVIDIA RTX AI. Ils rendent la technologie d’IA de pointe plus accessible à un public plus large.
NVIDIA TensorRT: Ce kit de développement logiciel (SDK) a été optimisé pour les PC RTX AI. Il combine des performances élevées avec une taille de package huit fois plus petite pour un déploiement transparent de l’IA. Cela permet aux développeurs d’intégrer plus facilement les fonctionnalités d’IA dans l’application.
Prise en charge de Windows ML: La prise en charge native de TensorRT dans Windows ML garantit une large compatibilité matérielle et des performances de pointe. Cela facilite l’intégration transparente de l’IA dans les applications Windows.
Nouvelles expériences utilisateur: Des humains numériques aux assistants d’écriture, en passant par les agents intelligents et les outils de création, l’IA générative remodèle les logiciels PC et introduit des expériences entièrement nouvelles. Les utilisateurs peuvent bénéficier d’applications plus interactives, intelligentes et créatives.
La vision stratégique
La collaboration entre NVIDIA et Microsoft repose sur une vision stratégique, visant à diriger l’avancement de la technologie d’IA dans divers secteurs. Les efforts de collaboration et les technologies sont conçus pour accélérer l’adoption de l’IA dans différents domaines, bénéficiant non seulement aux chercheurs et aux développeurs, mais également aux utilisateurs finaux et aux organisations du monde entier.
Innovation: L’accent continu mis sur l’innovation et la collaboration accélère les progrès technologiques. Cela aide à maintenir le leadership dans un domaine en évolution rapide.
Accessibilité: NVIDIA et Microsoft démocratisent l’IA en la rendant accessible aux développeurs et aux utilisateurs grâce à des outils optimisés, à l’intégration avec des plateformes populaires et à des améliorations de la rentabilité.
Performance et efficacité: L’accent mis sur l’amélioration à la fois des performances et de la rentabilité garantit que les avantages des technologies d’IA sont à la disposition d’un large éventail d’utilisateurs, des chercheurs individuels aux grandes entreprises.
Applications du monde réel: En traduisant les avancées de l’IA en solutions du monde réel, NVIDIA et Microsoft génèrent des avantages tangibles et transforment les industries du monde entier.