Meta: Litige avec des éditeurs français

Allégations de violation du droit d’auteur

Meta Platforms Inc., le géant de la technologie, se retrouve impliqué dans une bataille juridique avec des éditeurs et des auteurs français. Le cœur du litige réside dans des accusations de violation du droit d’auteur. Les plaignants allèguent que Meta a illicitement utilisé leurs œuvres littéraires pour entraîner son modèle d’intelligence artificielle (IA) générative, le tout sans obtenir l’autorisation nécessaire.

Les plaignants et leurs griefs

Le procès a été intenté devant un tribunal de Paris, un lieu spécifiquement dédié aux questions de propriété intellectuelle. Cette action en justice a été initiée par une coalition comprenant le SNE, l’association professionnelle représentant d’importants éditeurs français tels que Hachette et Editis, ainsi que l’association d’auteurs SGDL et le syndicat d’écrivains SNAC. Ces organisations représentent collectivement une part substantielle du paysage littéraire français.

Lors d’une conférence de presse, le groupe a révélé qu’il avait amassé des preuves convaincantes indiquant des violations “massives” du droit d’auteur. Vincent Montagne, président du SNE, a déclaré qu’ils avaient déjà tenté de dialoguer avec Meta sur cette question, mais que leurs efforts s’étaient avérés vains. De plus, la Commission européenne a été informée, les plaignants soutenant que les actions de Meta sont en contravention directe avec les réglementations de l’UE régissant l’IA.

Le cœur du litige : Formation de l’IA et droit d’auteur

Au cœur de cet affrontement juridique se trouve la pratique de l’entraînement des modèles de langage d’IA générative. Des modèles comme Llama de Meta et ChatGPT d’OpenAI sont entraînés sur de vastes quantités de données textuelles, englobant un large éventail de sources, y compris des livres et des articles. Cette pratique a déclenché une vague mondiale de poursuites judiciaires, les éditeurs de contenu affirmant que l’utilisation de leur propriété intellectuelle pour entraîner des modèles d’IA s’apparente à du vol.

Les entreprises développant ces modèles d’IA ont généralement été réticentes à divulguer les sources précises de leurs données d’entraînement. Cependant, elles ont souvent invoqué la doctrine de l’’usage loyal’ (‘fair use’) en vertu de la loi américaine sur le droit d’auteur comme moyen de défense.

Une tendance mondiale aux contestations judiciaires

Le procès contre Meta n’est pas un incident isolé. Il s’inscrit dans une tendance plus large de contestations judiciaires contre les entreprises d’IA concernant l’utilisation de matériel protégé par le droit d’auteur à des fins de formation. Voici quelques autres cas notables:

  • En décembre 2023, le New York Times a engagé des poursuites judiciaires contre OpenAI et Microsoft Corp., alléguant l’utilisation non autorisée de ses articles pour entraîner des modèles de langage volumineux.
  • En avril 2024, un groupe d’auteurs a intenté un recours collectif contre Anthropic, une entreprise soutenue par Amazon.com Inc. Les auteurs ont affirmé que leurs livres avaient été utilisés pour entraîner le modèle d’IA d’Anthropic sans leur consentement.
  • Des éditeurs de livres indiens ont intenté un procès similaire contre OpenAI en janvier, soulignant la nature mondiale de ce problème juridique.

Approfondissement des arguments juridiques

Les arguments juridiques dans ces affaires reposent souvent sur l’interprétation du droit d’auteur et l’applicabilité de la doctrine de l’’usage loyal’. Le droit d’auteur accorde des droits exclusifs aux créateurs d’œuvres originales, y compris le droit de reproduire, de distribuer et de créer des œuvres dérivées. La doctrine de l’’usage loyal’, cependant, prévoit certaines exceptions à ces droits exclusifs, permettant l’utilisation limitée de matériel protégé par le droit d’auteur à des fins telles que la critique, le commentaire, le reportage d’actualité, l’enseignement, l’érudition ou la recherche.

La question centrale est de savoir si l’utilisation de matériel protégé par le droit d’auteur pour entraîner des modèles d’IA relève de l’’usage loyal’. Les entreprises d’IA soutiennent que leur utilisation est transformatrice, ce qui signifie qu’elle ajoute quelque chose de nouveau et de différent à l’œuvre originale, et qu’elle ne nuit pas au marché de l’œuvre originale. Les éditeurs de contenu, en revanche, soutiennent que l’utilisation n’est pas transformatrice, qu’elle est de nature commerciale et qu’elle pourrait potentiellement nuire au marché de leurs œuvres.

Les ramifications potentielles

L’issue de ces batailles juridiques pourrait avoir des ramifications importantes pour l’avenir du développement de l’IA et des industries créatives. Si les tribunaux se prononcent en faveur des éditeurs de contenu, cela pourrait obliger les entreprises d’IA à demander des licences pour l’utilisation de matériel protégé par le droit d’auteur, ce qui pourrait augmenter le coût de développement des modèles d’IA. Cela pourrait également conduire à une plus grande transparence concernant les sources des données d’entraînement.

Inversement, si les tribunaux se prononcent en faveur des entreprises d’IA, cela pourrait les encourager à continuer d’utiliser du matériel protégé par le droit d’auteur sans autorisation explicite, ce qui pourrait entraîner de nouvelles contestations judiciaires et des débats éthiques.

Le contexte plus large : IA, éthique et propriété intellectuelle

Ce litige juridique ne concerne pas seulement le droit d’auteur ; il touche également à des considérations éthiques plus larges entourant le développement de l’IA. Des questions sont soulevées quant à l’équité de l’utilisation de matériel protégé par le droit d’auteur sans compensation pour entraîner des modèles d’IA qui pourraient potentiellement générer des bénéfices importants pour les entreprises qui les développent.

Il existe également des préoccupations concernant le potentiel du contenu généré par l’IA à remplacer les créateurs humains, entraînant des pertes d’emplois et une baisse de la qualité et de la diversité des œuvres créatives.

Développer la défense de l’’usage loyal’

La défense de l’’usage loyal’, souvent invoquée par les entreprises d’IA, est une doctrine juridique complexe avec un test à quatre facteurs utilisé par les tribunaux américains pour déterminer son applicabilité :

  1. Le but et le caractère de l’utilisation : Ce facteur examine si l’utilisation est commerciale ou non commerciale, transformatrice ou dérivée. Les utilisations transformatrices, qui ajoutent quelque chose de nouveau et de différent à l’œuvre originale, sont plus susceptibles d’être considérées comme un usage loyal.

  2. La nature de l’œuvre protégée par le droit d’auteur : Ce facteur examine si l’œuvre protégée par le droit d’auteur est factuelle ou créative. Les œuvres factuelles, telles que les articles de presse, bénéficient généralement d’une protection moindre que les œuvres créatives, telles que les romans.

  3. La quantité et la substantialité de la portion utilisée : Ce facteur examine la quantité de l’œuvre protégée par le droit d’auteur qui a été utilisée et si la portion utilisée était le “cœur” de l’œuvre. L’utilisation d’une petite portion d’une œuvre est plus susceptible d’être considérée comme un usage loyal que l’utilisation d’une grande portion ou de la partie la plus importante de l’œuvre.

  4. L’effet de l’utilisation sur le marché potentiel ou la valeur de l’œuvre protégée par le droit d’auteur : Ce facteur examine si l’utilisation de l’œuvre protégée par le droit d’auteur nuit au marché de l’œuvre originale ou diminue sa valeur. Les utilisations qui ne nuisent pas au marché de l’œuvre originale sont plus susceptibles d’être considérées comme un usage loyal.

L’application de ces facteurs à la formation de l’IA est une question juridique nouvelle, et les tribunaux sont encore en train de déterminer comment les interpréter dans ce contexte.

La perspective européenne

Le procès en France met également en évidence les différences entre le droit d’auteur et la réglementation de l’IA entre les États-Unis et l’Union européenne. L’UE a adopté une approche plus proactive en matière de réglementation de l’IA, dans le but de garantir que les systèmes d’IA sont développés et utilisés d’une manière qui respecte les droits fondamentaux, y compris le droit d’auteur.

L’AI Act de l’UE, qui est en cours de finalisation, comprend des dispositions qui pourraient avoir un impact sur l’utilisation de matériel protégé par le droit d’auteur pour la formation de l’IA. Ces dispositions pourraient obliger les entreprises d’IA à obtenir le consentement des titulaires de droits avant d’utiliser leurs œuvres à des fins de formation, ou elles pourraient établir un système de rémunération pour l’utilisation de matériel protégé par le droit d’auteur.

Différentes perspectives des parties prenantes

Cette question implique une variété de parties prenantes, chacune ayant ses propres perspectives et intérêts :

  • Créateurs de contenu : Les auteurs, les éditeurs et autres créateurs de contenu sont soucieux de protéger leurs droits de propriété intellectuelle et de s’assurer qu’ils sont équitablement rémunérés pour l’utilisation de leurs œuvres.
  • Entreprises d’IA : Les entreprises d’IA cherchent à développer des modèles d’IA innovants et soutiennent que l’accès à de grandes quantités de données, y compris du matériel protégé par le droit d’auteur, est essentiel à cette fin.
  • Le public : Le public a un intérêt à la fois dans le développement de technologies d’IA bénéfiques et dans la protection des œuvres créatives.
  • Professionnels du droit : Les avocats et les juristes sont aux prises avec les questions juridiques complexes soulevées par l’IA et le droit d’auteur.
  • Régulateurs : Les gouvernements et les organismes de réglementation cherchent à trouver un équilibre entre la promotion de l’innovation et la protection des droits des créateurs.

Développements futurs potentiels

Le paysage juridique entourant l’IA et le droit d’auteur évolue rapidement. Il est probable que nous assisterons à de nouvelles contestations judiciaires et à de nouveaux développements réglementaires dans les années à venir. Voici quelques développements futurs possibles :

  • Nouvelle législation : Les gouvernements pourraient adopter une nouvelle législation traitant spécifiquement de l’utilisation de matériel protégé par le droit d’auteur pour la formation de l’IA.
  • Décisions de justice : Les tribunaux continueront de rendre des décisions dans les affaires impliquant l’IA et le droit d’auteur, fournissant des orientations supplémentaires sur l’interprétation des lois existantes.
  • Normes de l’industrie : Les entreprises d’IA et les créateurs de contenu pourraient élaborer des normes industrielles ou des meilleures pratiques pour l’utilisation de matériel protégé par le droit d’auteur dans la formation de l’IA.
  • Solutions technologiques : Des solutions technologiques, telles que le tatouage numérique (watermarking) ou la gestion des droits numériques, pourraient être développées pour aider à suivre et à gérer l’utilisation de matériel protégé par le droit d’auteur dans la formation de l’IA.
  • Accords de licence: Les entreprises d’IA pourraient commencer à obtenir des accords de licence auprès des créateurs de contenu avant d’utiliser le contenu pour former leurs modèles.

La bataille juridique entre Meta et les éditeurs français est un développement significatif dans le débat en cours sur l’IA et le droit d’auteur. L’issue de cette affaire, et d’autres similaires, façonnera l’avenir du développement de l’IA et des industries créatives pour les années à venir. Les complexités de l’’usage loyal’, les différences juridiques internationales et les implications éthiques plus larges continueront d’être débattues et affinées à mesure que la technologie de l’IA progresse.