Les modèles de langage massifs (LLM) sont en train de devenir rapidement des éléments transformateurs dans divers secteurs, offrant aux entreprises des opportunités sans précédent de rationaliser leurs opérations, d’améliorer leur efficacité et de stimuler l’innovation. Des plateformes LLM puissantes telles que GPT-4 d’OpenAI, Llama de Meta et Claude d’Anthropic transforment notre façon d’interagir avec la technologie. Cependant, pour exploiter pleinement la puissance de ces modèles, les entreprises doivent développer des stratégies réfléchies intégrant de manière transparente les LLM dans leurs flux de travail.
Rama Ramakrishnan, professeur de pratique à la Sloan School of Management du MIT, estime que les LLM sont des technologies de transformation qui permettent aux entreprises de créer des applications à une vitesse sans précédent. Lors d’un récent webinaire, M. Ramakrishnan a présenté trois approches distinctes permettant aux entreprises d’utiliser ces LLM prêts à l’emploi pour gérer un large éventail de tâches et de cas d’utilisation métier : l’invite, la génération augmentée par récupération (RAG) et le réglage fin des instructions.
1. L’invite : libérer la puissance des LLM
L’invite est la forme d’utilisation des LLM la plus simple et la plus accessible. Elle consiste à poser simplement une question ou à donner une instruction au modèle et à recevoir une réponse générée. Cette approche est particulièrement adaptée aux tâches qui peuvent être réalisées avec succès grâce au bon sens et aux connaissances générales, sans nécessiter de formation spécialisée ou d’expertise métier supplémentaire.
M. Ramakrishnan souligne que l’invite est particulièrement efficace pour certains types de tâches de classification. Par exemple, une société de commerce électronique pourrait utiliser les LLM pour analyser les commentaires des clients sur les produits publiés sur son site Web. En fournissant à un LLM les commentaires et en lui demandant d’identifier les défauts potentiels ou les caractéristiques impopularaires, la société peut obtenir des informations précieuses pour éclairer ses décisions de développement de produits et améliorer la satisfaction de ses clients. Ce processus élimine la nécessité d’étiqueter et de classer manuellement les commentaires, ce qui permet d’économiser du temps et des ressources.
Dans le secteur immobilier, l’invite peut être utilisée pour générer automatiquement des descriptions de biens. Les agents immobiliers peuvent fournir à un LLM les caractéristiques clés et les attributs distinctifs et obtenir en quelques secondes des descriptions convaincantes et persuasives pour attirer les acheteurs ou les locataires potentiels. Cela permet aux agents de se concentrer sur l’établissement de relations avec les clients et la conclusion de transactions, plutôt que de consacrer un temps excessive à l’écriture.
Dans le secteur financier, l’invite peut être utilisée pour analyser les tendances du marché et générer des rapports d’investissement. Les analystes financiers peuvent saisir des données et des informations sur le marché pertinentes dans un LLM et lui demander d’identifier des schémas, de faire des prévisions et de générer des rapports perspicaces. Cela aide les analystes à prendre des décisions plus éclairées et à se tenir au courant des dernières évolutions du marché.
Bien que l’invite soit une technique puissante, les entreprises doivent être conscientes de ses limites. Lorsque les tâches nécessitent des connaissances très spécialisées ou des informations à jour, il est possible que l’invite ne suffise pas à fournir des résultats précis et pertinents. Dans ces cas, des techniques plus avancées telles que RAG et le réglage fin des instructions peuvent être utilisées.
2. Génération augmentée par récupération (RAG) : améliorer les LLM avec des données pertinentes
La génération augmentée par récupération (RAG) est une technique plus avancée qui consiste à fournir à un LLM une instruction ou une question claire, ainsi que des données ou des informations supplémentaires pertinentes. Cette approche est particulièrement utile pour les tâches qui exigent que le LLM ait accès à des informations à jour ou à des connaissances propriétaires.
Par exemple, un détaillant peut utiliser la RAG pour créer un agent conversationnel de service à la clientèle capable de répondre avec précision aux questions concernant sa politique de retour de produits. En formant l’agent conversationnel à l’aide des documents de politique de retour de la société, le détaillant peut s’assurer que les clients reçoivent des informations exactes et à jour, ce qui améliore la satisfaction de la clientèle et réduit les coûts de support.
Au cœur de la RAG se trouve sa capacité à utiliser des moteurs de recherche d’entreprise traditionnels ou des techniques de récupération d’informations pour localiser le contenu pertinent dans de grands référentiels de documents. Cela permet aux entreprises d’exploiter de vastes bases de connaissances internes et de fournir aux LLM le contexte dont ils ont besoin pour réaliser des tâches.
Les prestataires de soins de santé peuvent utiliser la RAG pour aider les médecins à prendre des décisions en matière de diagnostic et de traitement. En fournissant aux LLM les antécédents médicaux des patients, les résultats des tests et les articles de recherche médicale, les médecins peuvent obtenir des informations précieuses pour les aider à déterminer les options de traitement les plus appropriées. Cela peut améliorer les résultats des patients et réduire les erreurs médicales.
Les cabinets d’avocats peuvent utiliser la RAG pour aider les avocats à faire des recherches et à rédiger des mémoires. En fournissant aux LLM la jurisprudence, les statues et les ouvrages juridiques pertinents, les avocats peuvent trouver rapidement les informations dont ils ont besoin pour étayer leurs arguments. Cela permet de gagner du temps et de l’énergie aux avocats et de leur permettre de se concentrer sur d’autres aspects importants des affaires.
Pour tirer le meilleur parti des invites et de la RAG, les entreprises doivent aider leurs employés à développer des compétences en matière d’ingénierie des invites. Une approche efficace consiste à utiliser l’invite « chaîne de pensée », dans laquelle les utilisateurs demandent au LLM de « réfléchir étape par étape ». Cette méthode produit souvent des résultats plus précis car elle encourage le LLM à décomposer les tâches complexes et à raisonner de manière structurée.
M. Ramakrishnan souligne qu’il faut faire preuve de prudence lors de l’ingénierie des invites pour s’assurer que les réponses fournies par les LLM sont bien celles dont nous avons besoin. En élaborant soigneusement les invites et en fournissant un contexte pertinent, les entreprises peuvent maximiser la précision et la pertinence des résultats fournis par les LLM.
3. Réglage fin des instructions : personnaliser les LLM pour répondre à des besoins spécifiques
Le réglage fin des instructions est une technique plus avancée qui consiste à entraîner davantage les LLM à l’aide d’exemples de questions-réponses spécifiques à l’application. Cette approche est particulièrement utile pour les tâches impliquant une terminologie et des connaissances spécifiques au domaine, ou des tâches difficiles à décrire facilement, telles que l’analyse des dossiers médicaux ou des documents juridiques.
Contrairement aux invites et à la RAG, le réglage fin des instructions implique de modifier le modèle lui-même. En entraînant les LLM avec des données spécifiques à l’application, les entreprises peuvent améliorer leur précision et leurs performances dans des domaines spécifiques.
Par exemple, une organisation qui tente de créer un agent conversationnel pour faciliter le diagnostic médical devra compiler des centaines d’exemples de questions-réponses et les fournir au LLM. Les requêtes contenant des détails sur le cas des patients seront associées à des réponses médicalement judicieuses, qui comprennent des informations sur les diagnostics possibles. Ces informations permettront d’entraîner davantage le LLM et d’augmenter ses chances de fournir des réponses précises aux questions médicales.
Les institutions financières peuvent utiliser le réglage fin des instructions pour améliorer la précision de leurs systèmes de détection de fraude. En entraînant les LLM avec des données historiques sur les transactions frauduleuses et non frauduleuses, les institutions peuvent améliorer leur capacité à identifier les activités frauduleuses. Cela aide les institutions à réduire les pertes financières et à protéger leurs clients contre la fraude.
Les entreprises manufacturières peuvent utiliser le réglage fin des instructions pour optimiser leurs processus de production. En entraînant les LLM avec des données sur leurs processus de production, les entreprises peuvent identifier les inefficacités et améliorer leur efficacité globale. Cela aide les entreprises à réduire les coûts et à améliorer leur productivité.
Bien que le réglage fin des instructions soit une technique puissante, il peut également prendre beaucoup de temps. Afin de créer les données nécessaires à l’entraînement des modèles, certaines sociétés peuvent choisir d’utiliser les LLM pour générer les données elles-mêmes. Ce processus est connu sous le nom de génération de données synthétiques et peut être un moyen efficace de réduire les coûts et les efforts associés au réglage fin des instructions.
Trouver la bonne approche LLM
Au fur et à mesure que les organisations approfondissent leur exploration des LLM et des applications d’IA génératives, elles ne doivent pas choisir entre ces approches, mais plutôt les adopter en combinaison, en fonction du cas d’utilisation.
M. Ramakrishnan estime que « l’invite est la plus facile en termes d’efforts, suivie de la RAG, puis du réglage fin des instructions. Plus l’effort est important, plus le rendement l’est aussi. »
En évaluant soigneusement leurs besoins et en choisissant la méthode LLM la plus appropriée, ou une combinaison de méthodes, les entreprises peuvent libérer tout le potentiel de ces technologies puissantes et stimuler l’innovation, améliorer l’efficacité et améliorer la prise de décision. À mesure que les LLM continuent d’évoluer, les entreprises doivent se tenir au courant des derniers développements et expérimenter de nouvelles techniques afin de tirer pleinement parti de ces technologies révolutionnaires.