L’Oracle Cloud Infrastructure (OCI) Generative AI accueille un ensemble important de mises à niveau, notamment la publication des modèles Cohere Command A et Rerank 3.5, ainsi que l’introduction de Cohere Embed 3 avec une prise en charge multimodale. Ces nouveaux modèles visent à fournir aux clients OCI des fonctionnalités d’IA de niveau entreprise plus puissantes et à accroître davantage leurs capacités d’application d’IA dans divers scénarios d’application.
Command A : Le summum de la performance et de l’efficacité
Command A 03-2025 de Cohere est actuellement le modèle Command le plus puissant, avec un débit 150 % supérieur à celui de la génération précédente, tout en nécessitant seulement deux GPU. Selon les données fournies par Cohere, les performances de ce modèle dans les tâches d’entreprise de type agent rivalisent avec celles d’OpenAI 4o et de DeepSeekv3, voire les dépassent, et il présente une amélioration significative en termes d’efficacité de calcul.
La performance exceptionnelle de Command A découle de sa conception d’architecture avancée et de ses méthodes d’entraînement, qui lui permettent d’exceller dans une variété d’applications d’IA de niveau entreprise complexes. Qu’il s’agisse de traiter des volumes massifs de données, d’exécuter des tâches d’inférence complexes ou d’effectuer un traitement du langage naturel en temps réel, Command A est en mesure de fournir des solutions efficaces et fiables.
Les principales caractéristiques de Command A comprennent :
Fenêtre de contexte ultra-longue : Prenant en charge une longueur de contexte allant jusqu’à 256 000 tokens, le modèle est capable de traiter des séquences de texte plus longues, ce qui lui permet de mieux comprendre les informations contextuelles et de générer des réponses plus précises et cohérentes. Cela signifie que Command A peut traiter des documents complexes, des dialogues longs et des interactions multi-tours sans perdre d’informations essentielles.
Génération augmentée de récupération avancée (RAG) : Grâce à l’intégration de la technologie de génération augmentée de récupération, Command A peut récupérer des informations pertinentes à partir de volumes massifs de données et les incorporer dans le contenu généré, améliorant ainsi la qualité et la précision des résultats générés. Cette technologie réduit non seulement la dépendance du modèle à l’égard des connaissances externes, mais lui permet également de mieux s’adapter à l’environnement d’information en constante évolution.
Utilisation native des outils d’agent : Command A est doté d’une capacité d’utilisation native des outils d’agent, ce qui lui permet de s’intégrer à d’autres outils et services afin de réaliser des fonctions plus complexes. Par exemple, il peut interagir avec des moteurs de recherche, des bases de données, des API, etc. pour obtenir les informations nécessaires ou effectuer des opérations spécifiques. Cette capacité permet à Command A d’accomplir diverses tâches complexes, telles que l’automatisation du service client, les assistants intelligents et l’analyse des données.
Sécurité et confidentialité de niveau entreprise : Command A a été conçu en tenant compte des besoins des entreprises en matière de sécurité et de confidentialité, et adopte diverses mesures de sécurité pour protéger les données des clients. Par exemple, il prend en charge le chiffrement des données, le contrôle d’accès et les fonctions d’audit, garantissant ainsi que les données des clients ne sont pas soumises à un accès non autorisé ou à une divulgation.
Puissantes capacités multilingues : Command A a été entraîné sur 23 langues, dont l’anglais, le français, l’espagnol, l’italien, l’allemand, le portugais, le japonais, le coréen, l’arabe, le chinois, le russe, le polonais, le turc, le vietnamien, le néerlandais, le tchèque, l’indonésien, l’ukrainien, le roumain, le grec, l’hindi, l’hébreu et le persan. Cela lui permet de traiter des textes dans différentes langues et de fournir des services aux utilisateurs du monde entier.
Entrée et sortie de texte : Command A ne prend actuellement en charge que l’entrée et la sortie de texte, ce qui signifie qu’il est principalement utilisé pour traiter les tâches liées au texte, telles que la génération de texte, le résumé de texte, la traduction de texte et la classification de texte.
Remarque : Le modèle Command A ne prend actuellement pas en charge le réglage fin.
Rerank 3.5 : Améliorer la précision de la recherche d’entreprise
Rerank 3.5 est le tout dernier modèle de base de recherche d’IA de Cohere, conçu pour améliorer la précision des systèmes de recherche d’entreprise et de génération augmentée de récupération (RAG). Ce modèle est doté de capacités de raisonnement améliorées, peut comprendre les requêtes complexes des utilisateurs et est compatible avec différents types de données (notamment les documents longs, les e-mails, les tableaux, les JSON et le code). De plus, Rerank 3.5 prend en charge plus de 100 langues, ce qui lui permet de répondre aux besoins de recherche des entreprises du monde entier.
En réorganisant les résultats de recherche, Rerank 3.5 est en mesure de classer les résultats les plus pertinents en tête de liste, améliorant ainsi l’efficacité et la satisfaction des utilisateurs en matière de recherche. Il peut être appliqué non seulement à la recherche de texte traditionnelle, mais aussi à divers autres types de recherche, tels que la recherche d’images, la recherche de vidéos et la recherche audio.
Les principales caractéristiques de Rerank 3.5 comprennent :
Capacités de raisonnement améliorées : Rerank 3.5 est doté de capacités de raisonnement améliorées qui lui permettent de mieux comprendre les requêtes complexes des utilisateurs. Il peut analyser la sémantique et le contexte de la requête, identifier avec précision l’intention de l’utilisateur et renvoyer les résultats les plus pertinents.
Prise en charge diversifiée des données : Rerank 3.5 est compatible avec différents types de données, notamment les documents longs, les e-mails, les tableaux, les JSON et le code. Cela signifie qu’il peut traiter des données provenant de différentes sources et en extraire des informations utiles.
Prise en charge multilingue améliorée : Rerank 3.5 prend en charge plus de 100 langues, y compris les principales langues commerciales, telles que l’anglais, l’arabe, le chinois, le français, l’allemand, l’hindi, le japonais, le coréen, le portugais, le russe et l’espagnol. Cela lui permet de fournir des services de recherche de haute qualité aux utilisateurs du monde entier.
Plus grande précision de la recherche : Dans les tests portant sur les données financières, Rerank 3.5 a surpassé Hybris Search de 23,4 % et BM25 de 30,8 %. BM25 est une fonction de classement couramment utilisée dans les moteurs de recherche et les systèmes de recherche d’informations pour déterminer la pertinence d’un document par rapport à une requête de recherche donnée.
Prise en charge linguistique étendue : Comment Rerank 3.5 prend-il en charge plus de 100 langues ?
La capacité multilingue de Rerank 3.5 se manifeste dans sa capacité à comprendre et à traiter les requêtes provenant de plus de 100 langues. Cela signifie qu’il peut non seulement comprendre le sens littéral de la requête, mais aussi le contexte culturel et le contexte sous-jacent à la requête. Par exemple, si un utilisateur recherche en espagnol « meilleurs restaurants à Madrid », Rerank 3.5 peut comprendre que l’intention de l’utilisateur est de trouver les meilleurs restaurants de Madrid et renvoyer les résultats de recherche pertinents en espagnol.
Pour atteindre cet objectif, Rerank 3.5 utilise diverses technologies, notamment :
- Données d’entraînement multilingues : Rerank 3.5 a été entraîné sur une grande quantité de données multilingues, qui comprennent différents types de texte, tels que des articles de presse, des articles de blog, des publications sur les médias sociaux et des avis sur des produits.
- Intégration interlinguistique : Rerank 3.5 utilise la technologie d’intégration interlinguistique pour mapper les mots de différentes langues au même espace vectoriel. Cela permet au modèle de comprendre les relations sémantiques entre différentes langues et de renvoyer des résultats de recherche interlinguistiques pertinents.
- Détection et traduction de la langue : Rerank 3.5 peut détecter automatiquement la langue de la requête de l’utilisateur et la traduire en anglais ou dans d’autres langues prises en charge. Cela permet au modèle de traiter les requêtes dans différentes langues et de renvoyer les résultats de recherche pertinents.
En utilisant ces technologies, Rerank 3.5 est en mesure de fournir des services de recherche de haute qualité aux utilisateurs du monde entier, quelle que soit la langue qu’ils utilisent pour effectuer leur recherche.
Capacités de raisonnement améliorées : Comment Rerank 3.5 comprend-il les requêtes complexes ?
La capacité de raisonnement de Rerank 3.5 se manifeste dans sa capacité à comprendre les requêtes complexes et à en extraire des informations utiles. Par exemple, si un utilisateur recherche « quelles sociétés technologiques ont obtenu de meilleurs résultats en bourse que l’année dernière », Rerank 3.5 peut comprendre que l’intention de l’utilisateur est de trouver les sociétés technologiques dont les actions ont surpassé celles de l’année dernière.
Pour atteindre cet objectif, Rerank 3.5 utilise diverses technologies, notamment :
- Analyse sémantique : Rerank 3.5 utilise une technologie d’analyse sémantique pour analyser la structure sémantique et le contexte de la requête. Cela permet au modèle de comprendre le sens de la requête et d’identifier l’intention de l’utilisateur.
- Reconnaissance d’entités : Rerank 3.5 utilise la technologie de reconnaissance d’entités pour identifier les entités dans la requête, telles que les sociétés, les lieux et les personnes. Cela permet au modèle de relier la requête aux entités pertinentes et de renvoyer les résultats de recherche pertinents.
- Extraction de relations : Rerank 3.5 utilise la technologie d’extraction de relations pour extraire les relations entre les entités dans la requête. Cela permet au modèle de comprendre le sens de la requête et de renvoyer les résultats de recherche pertinents.
En utilisant ces technologies, Rerank 3.5 est en mesure de comprendre les requêtes complexes et de renvoyer les résultats de recherche pertinents, améliorant ainsi l’efficacité et la satisfaction des utilisateurs en matière de recherche.
Comment les clients OCI peuvent-ils utiliser ces modèles :
Les clients OCI peuvent utiliser ces modèles Cohere de différentes manières, notamment :
Intégration instantanée : Ces modèles sont accessibles de manière transparente via une interface de chat, une API ou un point de terminus dédié, sans avoir à se soucier de la gestion de l’infrastructure. Cela permet aux clients d’intégrer facilement ces modèles à leurs propres applications sans avoir à effectuer de configurations et de déploiements complexes.
Simplification du développement de l’IA : OCI Generative AI fournit un ensemble complet d’outils et de services qui peuvent aider les clients à simplifier le processus de développement de l’IA. Ces outils et services comprennent :
- Préparation des données : OCI Generative AI fournit une gamme d’outils de préparation des données qui peuvent aider les clients à nettoyer, transformer et préparer les données afin qu’elles puissent être utilisées pour la formation et l’inférence des modèles d’IA.
- Formation des modèles : OCI Generative AI fournit une gamme d’outils de formation des modèles qui peuvent aider les clients à former leurs propres modèles d’IA. Ces outils prennent en charge différents types de modèles et cadres, tels que TensorFlow, PyTorch et Scikit-learn.
- Déploiement des modèles : OCI Generative AI fournit une gamme d’outils de déploiement des modèles qui peuvent aider les clients à déployer leurs modèles d’IA formés dans des environnements de production.
- Surveillance des modèles : OCI Generative AI fournit une gamme d’outils de surveillance des modèles qui peuvent aider les clients à surveiller les performances et la précision des modèles d’IA.
Simplification des flux de travail RAG : L’utilisation de Command A pour la génération de contenu et l’optimisation de l’amélioration des résultats via Rerank 3.5 rend les flux de travail RAG complexes plus efficaces et simplifiés.
Diversité des scénarios d’application :
Ces modèles peuvent être appliqués à différents scénarios d’application d’entreprise, notamment :
- Service client : Command A et Rerank 3.5 peuvent être utilisés pour construire des robots de service client intelligents capables de répondre aux questions des clients, de résoudre leurs préoccupations et de fournir des services personnalisés.
- Génération de contenu : Command A peut être utilisé pour générer différents types de contenu textuel, tels que des articles de presse, des articles de blog, des descriptions de produits et des publications sur les médias sociaux.
- Recherche : Rerank 3.5 peut être utilisé pour améliorer la précision et l’efficacité de la recherche d’entreprise, aidant les utilisateurs à trouver rapidement les informations dont ils ont besoin.
- Analyse des données : Command A et Rerank 3.5 peuvent être utilisés pour analyser différents types de données, en extraire des informations utiles et aider les entreprises à prendre de meilleures décisions.
- Gestion des connaissances : Vous pouvez créer une base de connaissances intelligente où les employés peuvent trouver rapidement les informations dont ils ont besoin, améliorant ainsi leur efficacité au travail.
En fournissant des modèles d’IA performants, multifonctionnels et évolutifs, OCI Generative AI permet aux entreprises de construire diverses solutions d’IA innovantes, améliorant ainsi leur compétitivité et leur valeur commerciale.
Pour plus de détails sur l’intégration et les informations sur les prix, veuillez consulter notre documentation sur les services Generative AI ou contacter votre représentant Oracle.