Meta aangeklaagd wegens AI-training

De kern van de beschuldiging: Verwijdering van Copyright Management Information

De rechtszaak, Kadrey et al. vs Meta Platforms, nam een belangrijke wending in januari 2025 toen de eisers beweerden dat Meta niet alleen op de hoogte was van het gebruik van auteursrechtelijk beschermd materiaal, maar ook dat zijn AI-modellen bijgevolg outputs zouden produceren die CMI bevatten. CMI omvat cruciale details die verband houden met auteursrechtelijk beschermde werken, zoals de identiteit van de maker, licentievoorwaarden, aanmaakdatum en andere relevante informatie.

Het centrale argument van de eisers is dat Meta deze CMI opzettelijk uit het trainingsmateriaal heeft verwijderd. Het doel, zo beweren ze, was om te verdoezelen dat de door AI gegenereerde outputs afkomstig waren van auteursrechtelijk beschermde bronnen. Deze vermeende verwijdering vormt de basis van de claim dat Meta de Digital Millennium Copyright Act (DMCA) heeft geschonden.

Rechterlijke uitspraak: DMCA-claim wordt voortgezet

Rechter Vince Chhabria, die de zaak in een federale rechtbank in San Francisco behandelt, oordeelde dat de claim van de eisers met betrekking tot de DMCA-schending kon worden voortgezet. Deze uitspraak vergroot de kans dat de zaak ofwel tot een schikking komt ofwel voor de rechter komt.

Rechter Chhabria verklaarde in zijn beschikking dat de beschuldigingen van de eisers een ‘redelijke, zij het niet bijzonder sterke, gevolgtrekking’ opriepen dat Meta CMI had verwijderd om te voorkomen dat zijn Llama AI-modellen CMI zouden uitvoeren en zo het gebruik van auteursrechtelijk beschermd materiaal in de training zouden onthullen. Hij benadrukte verder dat dit gebruik van auteursrechtelijk beschermd materiaal een duidelijk identificeerbare (vermeende) inbreuk vormde.

Meta's bekentenis en de Books3-dataset

Meta heeft erkend een dataset te hebben gebruikt die bekend staat als Books3 bij de training van zijn Llama 1 large language model. Deze dataset is geïdentificeerd als bevattende auteursrechtelijk beschermde werken, wat de claims van de eisers versterkt.

Gedeeltelijke afwijzing van claims

Hoewel de DMCA-claim wordt voortgezet, heeft rechter Chhabria één van de claims van de eisers afgewezen. Deze afgewezen claim beweerde dat Meta’s gebruik van ongelicentieerde boeken verkregen via peer-to-peer torrents voor Llama-training in strijd was met de California’s Comprehensive Computer Data Access & Fraud Act (CDAFA).

Mening van de expert: DMCA-claim en Fair Use

Edward Lee, professor in de rechten aan de Santa Clara University, waarschuwde ervoor om geen conclusies te trekken over fair use uitsluitend op basis van de DMCA-claim met betrekking tot de verwijderde CMI. Hij merkte op dat rechter Chhabria zijn scepsis had geuit over het vermogen van de eisers om de DMCA-claim te bewijzen en suggereerde de mogelijkheid om deze opnieuw te bekijken bij een kort geding. Lee benadrukte dat de advocaten van de eisers met succes een specifiekere feitelijke basis voor hun DMCA-claim hadden geïdentificeerd, die eerder was afgewezen.

Implicaties voor andere AI-gerelateerde rechtszaken

De voortgang van de CMI-claim tegen Meta, samen met een eerdere uitspraak in het voordeel van Thomson Reuters tegen Ross Intelligence, suggereert een mogelijke verschuiving in de manier waarop rechtbanken het gebruik van auteursrechtelijk beschermd materiaal in AI-training bekijken. Deze beslissingen zouden de positie van eisers in andere lopende AI-gerelateerde rechtszaken kunnen versterken.

Zo werd de zaak Tremblay et al. vs OpenAI et al. onlangs gewijzigd om een eerder afgewezen DMCA-claim nieuw leven in te blazen. De gewijzigde klacht, waarin nieuw bewijs wordt aangehaald dat tijdens de ontdekkingsfase aan het licht is gekomen, stelt dat OpenAI ook CMI heeft verwijderd tijdens de training van zijn large language models.

De bredere context: Auteursrecht en AI-training

De juridische strijd rond AI en auteursrecht benadrukt de complexe uitdagingen van het balanceren van innovatie met intellectuele eigendomsrechten. De ongedifferentieerde opname van auteursrechtelijk beschermd materiaal voor AI-training heeft geleid tot bezorgdheid over mogelijke inbreuken, met name wanneer AI-modellen outputs genereren die sterk lijken op of direct auteursrechtelijk beschermde werken reproduceren.

De uitkomsten van deze zaken kunnen aanzienlijke gevolgen hebben voor de toekomst van AI-ontwikkeling en het gebruik van auteursrechtelijk beschermd materiaal in trainingsdatasets. De beslissingen kunnen van invloed zijn op de manier waarop AI-bedrijven data-acquisitie en modeltraining benaderen, wat mogelijk kan leiden tot meer nadruk op licenties, attributie en de bescherming van copyright management information.

Het geschil tussen Meta en de auteurs onderstreept het evoluerende juridische landschap rond AI en intellectueel eigendom. Naarmate de AI-technologie zich verder ontwikkelt, zullen rechtbanken een cruciale rol spelen bij het definiëren van de grenzen van toelaatbaar gebruik en het vaststellen van juridische precedenten die de unieke uitdagingen van door AI gegenereerde content aanpakken. De lopende rechtszaken herinneren ons aan het belang van het respecteren van auteursrechtwetten en het waarborgen dat makers eerlijk worden gecompenseerd voor het gebruik van hun werken, zelfs in het snel evoluerende domein van kunstmatige intelligentie.

De juridische argumenten die in deze zaken worden gepresenteerd, verdiepen zich in de fijne kneepjes van het auteursrecht, de DMCA en de toepassing van fair use-principes in de context van AI. De eisers beweren dat de acties van Meta een opzettelijke poging vormen om auteursrechtelijke bescherming te omzeilen en makers hun rechtmatige erkenning en compensatie te ontnemen. Meta daarentegen kan aanvoeren dat het gebruik van auteursrechtelijk beschermd materiaal onder fair use valt of dat de verwijdering van CMI noodzakelijk was om technische redenen. De rechtbanken zullen uiteindelijk deze argumenten moeten afwegen en bepalen of de acties van Meta de grens van auteursrechtinbreuk hebben overschreden.

De zaken roepen ook vragen op over de verantwoordelijkheid van AI-ontwikkelaars om ervoor te zorgen dat hun modellen worden getraind op legaal verkregen data. Naarmate AI steeds alomtegenwoordiger wordt, wordt de behoefte aan transparantie en verantwoording in databronnen en modeltraining van het grootste belang. De juridische uitkomsten van deze geschillen kunnen de praktijken in de sector vormgeven en de ontwikkeling van ethische richtlijnen voor AI-ontwikkeling aanmoedigen.

Het debat over auteursrecht en AI is niet beperkt tot de juridische arena. Het strekt zich ook uit tot bredere maatschappelijke discussies over de rol van AI in creatieve inspanningen en de potentiële impact op menselijke kunstenaars en auteurs. Sommigen beweren dat door AI gegenereerde content een bedreiging vormt voor de menselijke creativiteit, terwijl anderen AI zien als een hulpmiddel dat de menselijke capaciteiten kan verbeteren en vergroten. Deze discussies benadrukken de behoefte aan een genuanceerd begrip van de relatie tussen AI en menselijke creativiteit en het belang van het bevorderen van een samenwerkingsomgeving die zowel makers als technologieontwikkelaars ten goede komt.

De juridische strijd die momenteel gaande is, vertegenwoordigt een cruciale stap in het navigeren door het complexe kruispunt van auteursrecht en kunstmatige intelligentie. De beslissingen die in deze zaken worden genomen, zullen waarschijnlijk verstrekkende gevolgen hebben, de toekomst van AI-ontwikkeling, de bescherming van intellectueel eigendom en de relatie tussen technologie en creativiteit vormgeven. De voortdurende dialoog tussen juridische experts, technologieontwikkelaars en makers is essentieel om ervoor te zorgen dat AI-innovatie verloopt op een manier die zowel wettelijke kaders als de rechten van makers respecteert.