L’ère numérique a ouvert des perspectives d’innovation sans précédent, en particulier dans le domaine de l’intelligence artificielle (IA). Cependant, ce progrès a également soulevé des questions essentielles sur les frontières éthiques et juridiques de l’utilisation des données, notamment en ce qui concerne les œuvres protégées par le droit d’auteur. Le débat concernant l’utilisation de livres piratés pour entraîner des modèles d’IA a atteint son point d’ébullition, exigeant une réévaluation des lois existantes sur le droit d’auteur et une position plus ferme contre la violation de la propriété intellectuelle.
Le problème central : l’utilisation non autorisée de matériel protégé par le droit d’auteur
Le cœur du problème réside dans l’utilisation non autorisée de livres protégés par le droit d’auteur pour entraîner des modèles d’IA. Cette pratique, qui aurait été employée par des géants de la technologie comme Meta, a suscité l’indignation des auteurs et des éditeurs qui estiment que leurs droits sont violés à des fins commerciales. Mark Price, ancien directeur général de Waitrose, a été un critique virulent de cette pratique, s’adressant directement au PDG de Meta, Mark Zuckerberg, et remettant en question la justification de l’entreprise pour l’exploitation des œuvres d’auteurs britanniques sans autorisation.
L’équipe juridique de Price explore de multiples pistes pour engager une action en justice contre Meta au Royaume-Uni. Une approche consiste à déterminer si des livres provenant de la base de données pirate LibGen ont été “ingérés et traités” au Royaume-Uni. Si cela est prouvé, cela pourrait constituer une base juridique solide contre Meta en vertu du droit d’auteur britannique.
Examen du résultat : une clé pour prouver la violation
Une autre approche, peut-être plus intéressante, consiste à analyser le contenu généré par le modèle d’IA de Meta, Llama. Price soutient que si Llama produit un contenu qui ressemble étroitement à des passages des livres utilisés pour l’entraîner, cela pourrait servir de preuve convaincante de violation du droit d’auteur. Cette ligne d’enquête établit des parallèles avec l’affaire Getty Images en cours contre Stability AI, qui porte sur la reproduction présumée d’images protégées par le droit d’auteur par le modèle Stable Diffusion de Stability AI.
L’affaire Getty Images, dont le procès est prévu en juin 2025, pourrait créer un précédent important pour les futurs litiges en matière de droit d’auteur impliquant du contenu généré par l’IA. Les demandeurs dans l’affaire Getty Images affirment que Stable Diffusion a reproduit des parties substantielles d’images protégées par le droit d’auteur utilisées lors de son entraînement. Si Getty Images gagne, cela pourrait encourager les auteurs et les éditeurs à engager des actions en justice similaires contre des entreprises comme Meta.
Meta a défendu ses pratiques en arguant que son modèle d’IA ne reproduit pas d’œuvres protégées par le droit d’auteur, mais les utilise simplement à des fins d’entraînement. L’entreprise affirme en outre que les auteurs ne subissent aucun dommage économique en conséquence. Cependant, si Getty Images peut démontrer que les modèles d’IA peuvent, en fait, reproduire du contenu protégé par le droit d’auteur, cela saperait la défense de Meta et exposerait l’entreprise à des responsabilités juridiques importantes.
Accords de licence : une solution potentielle ?
Les complexités du droit d’auteur à l’ère de l’IA sont encore soulignées par les accords de licence entre les éditeurs et les entreprises d’IA. Par exemple, HarperCollins aurait conclu un accord de licence avec Microsoft qui comprend des restrictions sur la quantité d’un livre qui peut être consultée dans le cadre de l’accord. De tels accords, tout en offrant une voie potentielle pour indemniser les détenteurs de droits d’auteur, soulèvent également des questions sur la portée et les limites de l’utilisation équitable dans l’entraînement de l’IA.
L’absence d’accords similaires entre Meta et les détenteurs de droits laisse l’entreprise vulnérable aux contestations judiciaires. Un ancien avocat de Meta a même reconnu que les conséquences imprévues des systèmes d’IA qui enfreignent potentiellement le droit d’auteur pourraient constituer une menace importante pour l’entreprise devant les tribunaux.
La loi sur les données (utilisation et accès) : une opportunité législative
La loi britannique sur les données (utilisation et accès) offre une opportunité cruciale de renforcer la législation sur le droit d’auteur et de relever les défis posés par l’IA. Les amendements au projet de loi, qui doivent être débattus à la Chambre des communes, visent à garantir la conformité, la transparence et l’application des réglementations en matière de droit d’auteur. S’ils sont approuvés, ces amendements pourraient freiner les tentatives du gouvernement britannique d’accorder aux entreprises technologiques des exemptions concernant l’utilisation de documents publiés pour l’entraînement de l’IA. C’est une position que beaucoup estiment que le gouvernement aurait dû adopter dès le départ.
Tom West, PDG de Publishers’ Licensing Services, soutient que la loi sur les données (utilisation et accès) pourrait “turbocharger” la concession de licences de contenu. Il souligne que l’appel à la responsabilisation n’est pas anti-technologique ou anti-innovation. Au contraire, il reflète la reconnaissance du fait que l’exactitude et la qualité de l’information sont primordiales, car l’IA générative joue un rôle de plus en plus important dans nos vies.
Un point d’inflexion : réguler l’impact de l’IA
La situation actuelle représente un point d’inflexion. Alors que la puissance et l’influence de l’IA continuent de croître, il est impératif d’établir des limites et des réglementations claires pour prévenir les dommages, le chaos ou les actions qui pourraient conduire à des regrets. Ce principe, emprunté à ChatGPT, souligne la nécessité d’un développement et d’un déploiement responsables des technologies de l’IA.
Plonger plus profondément dans le bourbier juridique et éthique
Le débat sur l’utilisation de matériel protégé par le droit d’auteur dans l’entraînement de l’IA n’est pas simplement une question juridique ; il touche également à des considérations éthiques fondamentales. La question de savoir si les entreprises d’IA devraient être autorisées à profiter de l’utilisation non autorisée d’œuvres créatives est une question d’équité et de respect des droits de propriété intellectuelle.
La doctrine de l’utilisation équitable : un argument juridique complexe
L’un des principaux arguments juridiques dans ce débat tourne autour de la doctrine de l’utilisation équitable (“fair use”). L’utilisation équitable est un principe juridique qui autorise l’utilisation limitée de matériel protégé par le droit d’auteur sans l’autorisation du détenteur du droit d’auteur. La doctrine est destinée à promouvoir la liberté d’expression et à encourager la créativité en permettant certaines utilisations transformatrices d’œuvres protégées par le droit d’auteur.
Cependant, l’application de la doctrine de l’utilisation équitable dans le contexte de l’entraînement de l’IA est complexe et contestée. Les entreprises d’IA soutiennent souvent que leur utilisation de matériel protégé par le droit d’auteur relève de l’utilisation équitable parce qu’elles utilisent le matériel pour créer des technologies nouvelles et transformatrices. Elles soutiennent que les modèles d’IA ne se contentent pas de reproduire les œuvres protégées par le droit d’auteur, mais qu’ils s’en inspirent pour générer des résultats entièrement nouveaux.
Les détenteurs de droits d’auteur, en revanche, soutiennent que l’utilisation de leurs œuvres pour entraîner des modèles d’IA est une utilisation commerciale qui les prive de revenus potentiels. Ils soutiennent que les entreprises d’IA devraient être tenues d’obtenir des licences pour le matériel protégé par le droit d’auteur qu’elles utilisent pour l’entraînement, tout comme elles le feraient pour toute autre utilisation commerciale.
L’impact économique sur les auteurs et les éditeurs
L’impact économique de l’entraînement non autorisé de l’IA sur les auteurs et les éditeurs est une préoccupation importante. Si les entreprises d’IA sont autorisées à utiliser librement des œuvres protégées par le droit d’auteur sans compensation, cela pourrait miner l’incitation pour les auteurs et les éditeurs à créer de nouveaux contenus. Cela pourrait entraîner une baisse de la qualité et de la disponibilité des œuvres créatives, ce qui nuirait à terme à la société dans son ensemble.
En outre, l’utilisation non autorisée de matériel protégé par le droit d’auteur pourrait créer des règles du jeu inégales sur le marché. Les entreprises d’IA qui utilisent des œuvres protégées par le droit d’auteur sans autorisation auraient un avantage concurrentiel sur celles qui obtiennent des licences ou créent leurs propres données d’entraînement. Cela pourrait étouffer l’innovation et conduire à une concentration du pouvoir entre les mains de quelques entreprises d’IA dominantes.
La nécessité de transparence et de responsabilisation
La transparence et la responsabilisation sont essentielles pour garantir que les entreprises d’IA utilisent le matériel protégé par le droit d’auteur de manière responsable. Les entreprises d’IA devraient être tenues de divulguer les sources des données qu’elles utilisent pour entraîner leurs modèles. Cela permettrait aux détenteurs de droits d’auteur de surveiller l’utilisation de leurs œuvres et de s’assurer qu’ils sont correctement rémunérés.
En outre, les entreprises d’IA devraient être tenues responsables de toute violation du droit d’auteur qui se produit en raison de leurs modèles d’IA. Cela pourrait inclure la responsabilité pour violation directe, ainsi que pour violation indirecte si le modèle d’IA est utilisé pour créer des œuvres contrefaisantes.
Explorer des solutions alternatives
En plus de renforcer la législation sur le droit d’auteur et de promouvoir la transparence, il est important d’explorer des solutions alternatives qui pourraient contribuer à équilibrer les intérêts des entreprises d’IA et des détenteurs de droits d’auteur.
La gestion collective
La gestion collective est une solution potentielle. Dans le cadre d’un système de gestion collective, une société de gestion collective (SGC) négocierait des licences avec les entreprises d’IA au nom des détenteurs de droits d’auteur. La SGC distribuerait ensuite les redevances perçues sur les licences aux détenteurs de droits d’auteur.
La gestion collective pourrait offrir aux entreprises d’IA un moyen plus efficace et rationalisé d’obtenir des licences pour le matériel protégé par le droit d’auteur dont elles ont besoin. Elle pourrait également garantir que les détenteurs de droits d’auteur sont rémunérés équitablement pour l’utilisation de leurs œuvres.
Les données Open Source
Une autre solution potentielle consiste à promouvoir le développement d’ensembles de données open source pour l’entraînement de l’IA. Les ensembles de données open source sont des ensembles de données qui sont librement disponibles pour que quiconque puisse les utiliser, les modifier et les distribuer.
Le développement d’ensembles de données open source pourrait réduire la dépendance des entreprises d’IA à l’égard du matériel protégé par le droit d’auteur. Il pourrait également promouvoir l’innovation et la concurrence dans le secteur de l’IA.
Les solutions technologiques
Les solutions technologiques pourraient également jouer un rôle dans la résolution des problèmes de droit d’auteur posés par l’IA. Par exemple, les technologies de filigrane pourraient être utilisées pour suivre l’utilisation de matériel protégé par le droit d’auteur dans l’entraînement de l’IA. Cela permettrait aux détenteurs de droits d’auteur de surveiller l’utilisation de leurs œuvres et d’identifier les cas d’utilisation non autorisée.
En outre, les technologies d’IA pourraient être utilisées pour détecter et prévenir la création d’œuvres contrefaisantes. Par exemple, des outils basés sur l’IA pourraient être utilisés pour identifier le contenu qui est substantiellement similaire à des œuvres protégées par le droit d’auteur.
La voie à suivre
Le débat sur l’utilisation de matériel protégé par le droit d’auteur dans l’entraînement de l’IA est complexe et multiforme. Il n’y a pas de réponses faciles. Cependant, en renforçant la législation sur le droit d’auteur, en promouvant la transparence et la responsabilisation, en explorant des solutions alternatives et en favorisant un dialogue ouvert entre les entreprises d’IA et les détenteurs de droits d’auteur, nous pouvons créer un cadre qui équilibre les intérêts de toutes les parties prenantes et promeut l’innovation tout en protégeant les droits de propriété intellectuelle. La loi sur les données (utilisation et accès) représente une étape essentielle dans cette direction, offrant une voie législative pour aborder ces questions urgentes et façonner l’avenir du droit d’auteur à l’ère numérique. Les décisions prises aujourd’hui auront des conséquences durables pour les industries créatives et le développement de l’IA pour les années à venir.