Nvidia dévoile NeMo pour Agents IA

La plateforme NeMo de Nvidia est officiellement lancée, une suite complète de microservices conçus pour rationaliser le développement de systèmes d’agents IA avancés. Cette plateforme, annoncée le mercredi 23 avril, prend en charge une variété de grands modèles de langage (LLM) et exploite un mécanisme de ‘Data Flywheel’. Cette approche innovante permet aux agents IA d’apprendre en continu des expériences du monde réel, améliorant ainsi leurs performances et leur adaptabilité.

Composants principaux de la plateforme NeMo

La plateforme NeMo est un écosystème de microservices interconnectés, chacun conçu pour répondre à des aspects spécifiques du développement d’agents IA. Ces composants fonctionnent de concert pour fournir aux développeurs une boîte à outils robuste pour la création de solutions IA sophistiquées.

NeMo Customizer : Accélérer le réglage fin des LLM

NeMo Customizer est un composant clé conçu pour accélérer le réglage fin des grands modèles de langage. Ce microservice simplifie le processus d’adaptation des LLM à des tâches ou des ensembles de données spécifiques, permettant aux développeurs d’obtenir des performances optimales avec un minimum d’efforts. En rationalisant le processus de réglage fin, NeMo Customizer réduit le temps et les ressources nécessaires pour adapter les LLM à diverses applications. Le ‘fine-tuning’, ou réglage fin, est une étape cruciale pour adapter un modèle pré-entraîné à une tâche spécifique, en utilisant un ensemble de données plus petit et ciblé. Ceci permet d’améliorer la précision et l’efficacité du modèle pour l’application visée.

NeMo Evaluator : Simplifier l’évaluation des modèles et des flux de travail d’IA

Le NeMo Evaluator fournit une approche simplifiée pour évaluer les modèles et les flux de travail d’IA sur la base de benchmarks personnalisés et spécifiques à l’industrie. Ce microservice permet aux développeurs d’évaluer rapidement les performances de leurs agents IA, d’identifier les domaines à améliorer et de s’assurer que leurs solutions répondent aux normes requises. Avec seulement cinq appels d’API, les développeurs peuvent obtenir des informations précieuses sur l’efficacité de leurs modèles d’IA. L’évaluation est un processus essentiel pour garantir que les modèles d’IA fonctionnent comme prévu et répondent aux exigences de qualité et de performance.

NeMo Guardrails : Améliorer la conformité et la protection

NeMo Guardrails est conçu pour améliorer la conformité et la protection des systèmes d’IA sans impact significatif sur les performances. Ce microservice garantit que les agents d’IA adhèrent aux directives éthiques et aux exigences réglementaires, réduisant ainsi le risque de conséquences imprévues. En ajoutant seulement une demi-seconde de latence, NeMo Guardrails peut améliorer la protection de la conformité jusqu’à 1,4 fois. La conformité est un aspect de plus en plus important du développement de l’IA, car les entreprises doivent s’assurer que leurs systèmes d’IA sont conformes aux lois et réglementations en vigueur.

NeMo Retriever : Faciliter la récupération des connaissances

Le NeMo Retriever aide les agents d’IA à accéder et à extraire des informations précises à partir de bases de données. Ce microservice permet aux agents d’IA de localiser rapidement les connaissances correctes, améliorant ainsi leur capacité à répondre aux questions, à résoudre les problèmes et à prendre des décisions éclairées. En rationalisant le processus de récupération des connaissances, NeMo Retriever améliore l’efficacité globale des agents d’IA. La capacité de récupérer des informations pertinentes est essentielle pour les agents d’IA qui doivent interagir avec le monde réel et répondre aux requêtes des utilisateurs.

NeMo Curator : Former des modèles d’IA générative très précis

Le NeMo Curator est conçu pour former des modèles d’IA générative très précis. Ce microservice fournit aux développeurs les outils et les ressources nécessaires pour créer des agents d’IA capables de générer du texte, des images et d’autres types de contenu réalistes et cohérents. En optimisant le processus de formation, NeMo Curator permet le développement de solutions d’IA générative de pointe. L’IA générative est un domaine en pleine croissance qui permet de créer de nouveaux contenus de manière automatisée.

Le mécanisme de ‘Data Flywheel’

Le ‘Data Flywheel’ est un concept central de la plateforme NeMo, conçu pour permettre l’apprentissage continu et l’amélioration des modèles d’IA. Ce mécanisme crée une boucle de rétroaction positive où les agents d’IA apprennent de leurs interactions avec l’environnement, devenant plus intelligents et efficaces au fil du temps.

La boucle de rétroaction positive

Le ‘Data Flywheel’ fonctionne selon un cycle continu d’interaction, de collecte de données, d’évaluation et de perfectionnement. Lorsque les agents d’IA interagissent avec les utilisateurs et l’environnement, ils génèrent de grandes quantités de données, notamment des enregistrements de dialogue et des schémas d’utilisation. Ces données sont ensuite traitées par le NeMo Curator pour identifier les informations et les schémas pertinents. Le NeMo Evaluator évalue les performances de l’agent IA, en identifiant les domaines où il excelle et les domaines où il doit être amélioré. Enfin, le NeMo Customizer affine le modèle sur la base de cette évaluation, améliorant ainsi sa précision et son efficacité. Cette boucle continue permet d’améliorer constamment les performances des agents d’IA.

Intervention humaine minimale et autonomie maximale

Le ‘Data Flywheel’ est conçu pour fonctionner avec une intervention humaine minimale et une autonomie maximale. Cela permet aux agents d’IA d’apprendre et de s’améliorer en permanence sans nécessiter une supervision constante. En automatisant le processus d’apprentissage, le ‘Data Flywheel’ réduit la charge qui pèse sur les développeurs et permet aux agents d’IA de s’adapter aux conditions changeantes et aux besoins des utilisateurs. L’autonomie est un objectif clé du développement de l’IA, car elle permet aux agents d’IA de fonctionner de manière indépendante et de prendre des décisions sans intervention humaine.

Intégration et déploiement

La plateforme NeMo est conçue pour être facilement intégrée et déployée sur diverses infrastructures informatiques, y compris les environnements sur site et dans le cloud. Cette flexibilité permet aux organisations de tirer parti de la plateforme de la manière qui convient le mieux à leurs besoins et à leurs ressources.

Plateforme logicielle Nvidia AI Enterprise

La plateforme NeMo est déployée sur la plateforme logicielle Nvidia AI Enterprise, qui fournit une suite complète d’outils et de ressources pour le développement et le déploiement d’applications d’IA. Cette plateforme simplifie le processus de gestion et de mise à l’échelle des solutions d’IA, permettant aux organisations de se concentrer sur l’innovation et la valeur commerciale. Nvidia AI Enterprise offre un environnement stable et sécurisé pour le déploiement d’applications d’IA en production.

Exécution sur une infrastructure informatique accélérée

NeMo peut être exécuté sur n’importe quelle infrastructure informatique accélérée, ce qui permet aux organisations de tirer parti de la puissance des GPU et d’autres matériels spécialisés pour optimiser les performances de leurs agents d’IA. Cela garantit que les agents d’IA peuvent traiter facilement des tâches complexes et de grands ensembles de données. L’utilisation de GPU permet d’accélérer considérablement les calculs nécessaires pour le développement et le déploiement de l’IA.

Applications concrètes

La plateforme NeMo est conçue pour prendre en charge un large éventail d’applications dans divers secteurs. Les grandes entreprises peuvent construire des centaines d’agents d’IA avec différentes fonctionnalités, telles que la détection automatisée des fraudes, les assistants d’achat, la maintenance prédictive des machines et l’examen des documents. La flexibilité de la plateforme NeMo permet de l’adapter à de nombreux cas d’utilisation différents.

Mise en œuvre d’AT&T

AT&T s’est associé à Arize et Quantiphi pour tirer parti de NeMo afin de développer un agent d’IA avancé capable de traiter près de 10 000 documents de connaissances d’entreprise mis à jour chaque semaine. En combinant NeMo Customizer et Evaluator, AT&T a affiné Mistral 7B pour obtenir un service client personnalisé, la prévention de la fraude et l’optimisation des performances du réseau. Cette mise en œuvre a entraîné une augmentation de 40 % de la précision globale de la réponse de l’IA. L’exemple d’AT&T illustre la capacité de NeMo à résoudre des problèmes complexes et à améliorer les performances dans un environnement d’entreprise réel.

Prise en charge et intégration des modèles open source

Les microservices NeMo prennent en charge une variété de modèles open source populaires, notamment Llama, Microsoft Phi, Google Gemma, Mistral et Llama Nemotron Ultra. Cela permet aux développeurs de tirer parti des meilleurs modèles d’IA disponibles et de les personnaliser pour répondre à leurs besoins spécifiques. La prise en charge de modèles open source permet de réduire les coûts et d’accélérer le développement d’applications d’IA.

Intégration de Meta

Meta a intégré NeMo en ajoutant des connecteurs à Llamastack. Cette intégration permet aux développeurs d’intégrer de manière transparente les capacités de NeMo dans leurs flux de travail d’IA existants. L’intégration avec Llamastack facilite l’utilisation de NeMo avec d’autres outils et plateformes d’IA.

Intégration des fournisseurs de logiciels d’IA

Les fournisseurs de logiciels d’IA tels que Cloudera, Datadog, Dataiku, DataRobot, DataStax, SuperAnnotate et Weights & Biases ont intégré NeMo dans leurs plateformes. Cette intégration généralisée rend NeMo accessible à un large éventail de développeurs et d’organisations. La large adoption de NeMo par les fournisseurs de logiciels d’IA témoigne de sa valeur et de son potentiel. L’intégration de NeMo dans ces plateformes permet aux développeurs d’accéder à une large gamme de fonctionnalités et de ressources pour le développement d’applications d’IA. En résumé, la plateforme NeMo de Nvidia offre une solution complète et flexible pour le développement et le déploiement d’agents d’IA, avec une prise en charge de divers modèles open source, une intégration facile et une architecture modulaire qui permet de l’adapter à divers casd’utilisation. Le mécanisme de ‘Data Flywheel’ permet d’améliorer continuellement les performances des agents d’IA et de les rendre plus efficaces et pertinents pour les besoins des utilisateurs. L’engagement de Nvidia envers l’innovation et l’accessibilité se reflète dans la conception de NeMo et son intégration avec d’autres plateformes et outils d’IA. La plateforme NeMo est promise à un avenir brillant et jouera un rôle clé dans la démocratisation de l’IA et dans la transformation de divers secteurs d’activité. L’évolution constante de NeMo et l’ajout de nouvelles fonctionnalités et de nouveaux modèles garantissent qu’elle restera une plateforme de pointe pour le développement d’IA.