Meta, le géant technologique, se retrouve au cœur d’une nouvelle vague de critiques, accusé d’« open washing ». Cette controverse découle de son parrainage d’un document de recherche de la Linux Foundation qui explore le paysage florissant des solutions d’IA open source. Le nœud du problème réside dans la perception selon laquelle Meta utilise ce parrainage pour promouvoir ses propres modèles d’IA Llama tout en contournant la véritable définition de l’« open source ».
L’étude de la Linux Foundation : Une arme à double tranchant
L’étude de la Linux Foundation, publiée au début du mois, défend les avantages des systèmes d’IA open source, en soulignant leur rentabilité pour les entreprises de toutes tailles, en particulier les petites entreprises. L’étude suggère que les organisations optant pour des modèles d’IA à source fermée pourraient encourir des dépenses logicielles trois fois et demie plus élevées que celles qui utilisent des alternatives open source.
Cette recherche s’aligne sur un nombre croissant de preuves soutenant les avantages de l’IA open source. Par exemple, une enquête menée par IBM et Morning Consult en janvier a révélé que plus de la moitié des entreprises utilisant des outils d’IA open source sont plus susceptibles de connaître un retour sur investissement (ROI) positif. De plus, les deux cinquièmes des répondants qui n’ont pas encore adopté de solutions d’IA open source ont exprimé leur intention d’intégrer ces outils dans leurs projets d’IA au cours de l’année à venir.
Cependant, l’implication de Meta dans l’étude de la Linux Foundation a suscité la controverse, les critiques arguant qu’elle sert de campagne de marketing à peine voilée pour les modèles d’IA Llama de l’entreprise.
Le dilemme de l’« Open Source » : Llama sous surveillance
Amanda Brock, PDG d’OpenUK, affirme que les modèles Llama de Meta ne répondent pas aux critères nécessaires pour être classés comme véritablement « open source ». Elle souligne que ni Meta ni l’étude ne reconnaissent cet écart.
« Llama n’est pas ‘open source’, quelle que soit la définition que vous choisissez », a déclaré Brock. « Personnellement, je préfère l’Open Source Software Definition (OSD) de l’Open Source Initiative (OSI). Llama ne satisfait pas à sa norme open source en raison de plusieurs raisons, notamment l’incorporation d’une restriction commerciale dans sa licence. »
Brock a ensuite expliqué les implications de cette restriction : « Cette limitation perturbe le libre flux qui est essentiel à la licence open source et crée des frictions. Nous comptons sur l’open source pour être utilisable par quiconque à toutes fins, et Llama ne répond pas à cette exigence. »
Les revendications Open Source de Meta : Une question litigieuse
La gamme de modèles Llama de Meta est étiquetée « open source », mais l’entreprise a fait face à des défis persistants de la part des parties prenantes de l’industrie concernant cette affirmation. Le principal point de discorde tourne autour des différentes interprétations de ce qui constitue véritablement l’« open source ».
Le cœur du désaccord réside dans les conditions de licence imposées aux utilisateurs une fois qu’ils atteignent un certain niveau de commercialisation. Bien que les modèles Llama offrent un accès ouvert, des limitations sont imposées aux utilisateurs dans des circonstances spécifiques.
Plus tôt cette année, l’Open Source Initiative (OSI) a publiquement critiqué Meta à ce sujet, affirmant que l’entreprise « continue de promouvoir faussement Llama comme open source ».
Reconnaissant les efforts de Meta avec la gamme Llama comme un « pas dans la bonne direction » pour promouvoir la sensibilisation à l’open source, Brock souligne que des progrès significatifs sont encore nécessaires pour lutter efficacement contre l’« open washing » au sein de l’industrie technologique.
« Avec le site Web de Meta soulignant un point essentiel de son rapport comme ‘La recherche de la Linux Foundation montre comment les modèles d’IA open source, comme Llama, stimulent la croissance économique, l’innovation et la concurrence en rendant les solutions technologiques cruciales plus accessibles’, il n’est guère surprenant que l’OSI soit vent debout et accuse la Linux Foundation de soutenir l’open washing », a noté Brock.
Elle a en outre souligné les implications plus larges de l’open washing, déclarant : « L’open washing n’est pas seulement un problème d’open source aujourd’hui. Avec des régulateurs comme l’UE utilisant le terme open source comme base d’exceptions de responsabilité dans l’IA et les normes qui doivent être respectées dans l’IA, l’impact de l’open washing est devenu sociétal. »
Au-delà de Meta : Une tendance industrielle plus large
Meta n’est pas le seul développeur industriel à avoir été pris sous le feu croisé du débat sur la définition de l’open source.
En mars 2024, Databricks a lancé son propre grand modèle de langage, DBRX, que des experts ont également affirmé ne pas respecter les normes open source. Cela a été attribué à l’inclusion d’une politique d’utilisation acceptable externe et à son fonctionnement sous une licence en dehors de la juridiction du cadre de l’OSI. La controverse DBRX souligne en outre l’ambiguïté et la complexité entourant le terme « open source » et les défis auxquels sont confrontés les développeurs pour naviguer dans ses diverses interprétations. Le débat souligne la nécessité d’une plus grande clarté et d’une normalisation dans la définition des principes de l’open source, en particulier dans le domaine de l’intelligence artificielle en évolution rapide. Sans une définition universellement acceptée, le risque d’« open washing » continuera de persister, ce qui pourrait saper la crédibilité et l’intégrité du mouvement open source.
Définir l’Open Source : Les principes fondamentaux
Pour comprendre la controverse entourant Llama de Meta et DBRX de Databricks, il est crucial d’approfondir les principes fondamentaux qui définissent les logiciels open source. L’Open Source Initiative (OSI) fournit une définition largement reconnue, décrivant dix critères clés qu’une licence logicielle doit respecter pour être considérée comme open source :
- Redistribution gratuite : La licence ne doit empêcher aucune partie de vendre ou de donner le logiciel en tant que composant d’une distribution logicielle agrégée contenant des programmes provenant de plusieurs sources différentes. La licence ne doit pas exiger de redevance ou d’autres frais pour une telle vente.
- Code source : Le programme doit inclure le code source et doit autoriser la distribution sous forme de code source ainsi que sous forme compilée. Lorsqu’une forme quelconque d’un produit n’est pas distribuée avec le code source, il doit exister un moyen bien publicisé d’obtenir le code source pour un coût de reproduction raisonnable – de préférence, le téléchargement via Internet sans frais. Le code source doit être la forme préférée dans laquelle un programmeur modifierait le programme. Le code source délibérément obscurci n’est pas autorisé. Les formes intermédiaires telles que la sortie d’un préprocesseur ou d’un traducteur ne sont pas autorisées.
- Œuvres dérivées : La licence doit autoriser les modifications et les œuvres dérivées, et doit leur permettre d’être distribuées aux mêmes conditions que la licence du logiciel original.
- Intégrité du code source de l’auteur : La licence peut restreindre la distribution du code source sous forme modifiée uniquement si la licence autorise la distribution de "fichiers patch" avec le code source dans le but de modifier le programme au moment de la construction. La licence doit explicitement autoriser la distribution de logiciels construits à partir de code source modifié. La licence peut exiger que les œuvres dérivées portent un nom ou un numéro de version différent du logiciel original.
- Aucune discrimination à l’encontre de personnes ou de groupes : La licence ne doit pas établir de discrimination à l’encontre de toute personne ou de tout groupe de personnes.
- Aucune discrimination à l’encontre de domaines d’activité : La licence ne doit empêcher personne d’utiliser le programme dans un domaine d’activité spécifique. Par exemple, elle ne peut pas empêcher l’utilisation du programme dans une entreprise ou pour la recherche génétique.
- Distribution de la licence : Les droits attachés au programme doivent s’appliquer à tous ceux à qui le programme est redistribué sans qu’il soit nécessaire que ces parties exécutent une autre licence.
- La licence ne doit pas être spécifique à un produit : Les droits attachés au programme ne doivent pas dépendre du fait que le programme fasse partie d’une distribution logicielle particulière. Si le programme est extrait de cette distribution et utilisé ou distribué selon les termes de la licence du programme, toutes les parties à qui le programme est redistribué doivent avoir les mêmes droits que ceux qui sont accordés conjointement avec la distribution logicielle originale.
- La licence ne doit pas restreindre d’autres logiciels : La licence ne doit pas imposer de restrictions à d’autres logiciels qui sont distribués avec le logiciel sous licence. Par exemple, la licence ne doit pas insister sur le fait que tous les autres programmes distribués sur le même support doivent être des logiciels open source.
- La licence doit être technologiquement neutre : Aucune disposition de la licence ne peut être fondée sur une technologie ou un style d’interface individuel.
Ces principes soulignent l’importance de la liberté, de la transparence et de la collaboration dans l’écosystème open source. Lorsqu’une licence logicielle s’écarte de ces principes, cela soulève des questions quant à savoir si le logiciel peut vraiment être considéré comme open source. Dans le cas de Llama de Meta et de DBRX de Databricks, les préoccupations tournent autour des restrictions commerciales, des politiques d’utilisation acceptable et des cadres de licence qui peuvent ne pas être pleinement conformes à la définition de l’OSI.
Les implications de l’« Open Washing »
La pratique de l’« open washing », où les entreprises présentent faussement leurs logiciels comme open source alors qu’ils ne répondent pas pleinement aux critères, peut avoir plusieurs conséquences négatives :
- Érosion de la confiance : Cela peut éroder la confiance dans le mouvement open source dans son ensemble, rendant difficile pour les utilisateurs de faire la distinction entre les véritables projets open source et ceux qui font simplement semblant.
- Découragement de la contribution : Cela peut décourager les contributions des développeurs qui se sont engagés à respecter les principes de l’open source, car ils peuvent estimer que leurs efforts sont sapés par des entreprises qui ne respectent pas les mêmes règles.
- Incertitude juridique : Cela peut créer une incertitude juridique pour les utilisateurs qui se fient au logiciel, car ils peuvent ne pas connaître leurs droits et obligations en vertu de la licence.
- Entrave à l’innovation : Cela peut entraver l’innovation en restreignant la liberté de modifier et de redistribuer le logiciel, ce qui est un moteur clé de l’innovation dans la communauté open source.
Par conséquent, il est essentiel que les entreprises soient transparentes quant aux conditions de licence de leurs logiciels et qu’elles évitent de faire des affirmations trompeuses quant à leur statut open source.
La nécessité d’une plus grande clarté et d’une normalisation
Le débat en cours sur Llama de Meta et DBRX de Databricks souligne la nécessité d’une plus grande clarté et d’une normalisation dans la définition des principes de l’open source. L’absence d’une définition universellement acceptée crée de la confusion et permet aux entreprises d’exploiter les failles et de se livrer à l’« open washing ».
Plusieurs initiatives sont en cours pour résoudre ce problème :
- L’Open Source Initiative (OSI) : L’OSI continue de jouer un rôle crucial dans la définition et la promotion des principes de l’open source. Elle fournit une définition largement reconnue de l’open source et certifie les licences qui répondent à ses critères.
- La Linux Foundation : La Linux Foundation s’efforce de promouvoir la collaboration et l’innovation dans la communauté open source. Elle fournit une plateforme pour les projets open source et organise des événements qui réunissent des développeurs, des utilisateurs et des entreprises.
- L’Union européenne (UE) : L’UE reconnaît de plus en plus l’importance de l’open source et l’intègre dans ses politiques et réglementations. Elle utilise le terme "open source" comme base d’exceptions de responsabilité dans l’IA et les normes qui doivent être respectées dans l’IA.
Ces initiatives contribuent à créer un écosystème open source plus transparent et normalisé. Cependant, davantage de travail est nécessaire pour garantir que les principes de l’open source soient clairement définis et appliqués de manière cohérente.
Aller de l’avant : Transparence et responsabilité
Pour lutter efficacement contre l’« open washing » et promouvoir un véritable open source, une approche à multiples facettes est nécessaire :
- Transparence : Les entreprises doivent être transparentes quant aux conditions de licence de leurs logiciels et éviter de faire des affirmations trompeuses quant à leur statut open source.
- Responsabilité : Les organisations industrielles et les organismes de réglementation doivent tenir les entreprises responsables de leurs affirmations concernant l’open source et prendre des mesures contre celles qui se livrent à l’« open washing ».
- Éducation : Les utilisateurs et les développeurs doivent être sensibilisés aux principes de l’open source et à la manière d’identifier les véritables projets open source.
- Collaboration : La communauté open source doit continuer à collaborer pour définir et promouvoir les principes de l’open source et pour développer des outils et des ressources qui aident les utilisateurs et les développeurs à naviguer dans l’écosystème open source.
En travaillant ensemble, nous pouvons créer un écosystème open source plus transparent, responsable et innovant qui profite à tous. L’avenir de l’IA et d’autres technologies en dépend.