De digitale tijdperk heeft ongekende mogelijkheden voor innovatie gecreëerd, met name op het gebied van kunstmatige intelligentie (AI). Deze vooruitgang heeft echter ook cruciale vragen opgeroepen over de ethische en wettelijke grenzen van gegevensgebruik, met name met betrekking tot auteursrechtelijk beschermd materiaal. Het debat over het gebruik van illegale boeken om AI-modellen te trainen heeft een kookpunt bereikt, waardoor een herbeoordeling van de bestaande auteursrechtwetten en een steviger standpunt tegen inbreuk op intellectueel eigendom noodzakelijk zijn.
De Kern van het Probleem: Ongeautoriseerd Gebruik van Auteursrechtelijk Beschermd Materiaal
De kern van de zaak is het ongeautoriseerde gebruik van auteursrechtelijk beschermde boeken om AI-modellen te trainen. Deze praktijk, naar verluidt toegepast door techreuzen zoals Meta, heeft verontwaardiging gewekt bij auteurs en uitgevers die vinden dat hun rechten worden geschonden voor commercieel gewin. Mark Price, voormalig Managing Director van Waitrose, is een uitgesproken criticus van deze praktijk en heeft zich rechtstreeks tot Meta CEO Mark Zuckerberg gericht en vraagtekens gezet bij de rechtvaardiging van het bedrijf voor het exploiteren van de werken van Britse auteurs zonder toestemming.
Het juridische team van Price onderzoekt verschillende mogelijkheden om juridische stappen te ondernemen tegen Meta in het VK. Een van de benaderingen is het vaststellen of boeken afkomstig uit de piratendatabase LibGen zijn “opgenomen en verwerkt” binnen het VK. Indien bewezen, zou dit een duidelijke zaak tegen Meta kunnen vormen op grond van de Britse auteursrechtwetgeving.
Onderzoek naar de Output: Een Sleutel tot het Bewijzen van Inbreuk
Een andere, misschien wel meer intrigerende benadering richt zich op het analyseren van de inhoud die wordt gegenereerd door Meta’s AI-model, Llama. Price stelt dat als Llama inhoud produceert die sterk lijkt op passages uit de boeken die zijn gebruikt om het te trainen, dit zou kunnen dienen als overtuigend bewijs van auteursrechtinbreuk. Deze onderzoekslijn vertoont parallellen met de lopende Getty Images-zaak tegen Stability AI, die draait om de vermeende reproductie van auteursrechtelijk beschermde afbeeldingen door het Stable Diffusion-model van Stability AI.
De Getty Images-zaak, gepland voor een proces in juni 2025, zou een belangrijk precedent kunnen scheppen voor toekomstige auteursrechtgeschillen met betrekking tot door AI gegenereerde inhoud. De eisers in de Getty Images-zaak beweren dat Stable Diffusion aanzienlijke delen van auteursrechtelijk beschermde afbeeldingen heeft gereproduceerd die tijdens de training zijn gebruikt. Als Getty Images wint, zou dit auteurs en uitgevers kunnen aanmoedigen om soortgelijke juridische stappen te ondernemen tegen bedrijven als Meta.
Meta heeft zijn praktijken verdedigd door te stellen dat zijn AI-model geen auteursrechtelijk beschermde werken reproduceert, maar ze slechts gebruikt voor trainingsdoeleinden. Het bedrijf beweert verder dat auteurs geen economische schade lijden als gevolg daarvan. Als Getty Images echter kan aantonen dat AI-modellen in feite auteursrechtelijk beschermde inhoud kunnen reproduceren, zou dit Meta’s verdediging ondermijnen en het bedrijf blootstellen aan aanzienlijke juridische aansprakelijkheden.
Licentieovereenkomsten: Een Potentiële Oplossing?
De complexiteit van het auteursrecht in het tijdperk van AI wordt verder benadrukt door licentieovereenkomsten tussen uitgevers en AI-bedrijven. HarperCollins heeft bijvoorbeeld naar verluidt een licentieovereenkomst gesloten met Microsoft die beperkingen bevat op de hoeveelheid van een boek waartoe toegang kan worden verkregen als onderdeel van de overeenkomst. Dergelijke overeenkomsten, hoewel ze een potentieel pad bieden voor het compenseren van auteursrechthebbenden, roepen ook vragen op over de reikwijdte en beperkingen van redelijk gebruik bij AI-training.
Het ontbreken van soortgelijke overeenkomsten tussen Meta en rechthebbenden maakt het bedrijf kwetsbaar voor juridische uitdagingen. Een voormalige advocaat van Meta heeft zelfs erkend dat de onbedoelde gevolgen van AI-systemen die mogelijk inbreuk maken op het auteursrecht een aanzienlijke bedreiging voor het bedrijf in de rechtbank kunnen vormen.
De Data (Gebruik en Toegang) Wet: Een Wetgevende Mogelijkheid
De Britse Data (Gebruik en Toegang) Wet biedt een cruciale mogelijkheid om de auteursrechtwetgeving te versterken en de uitdagingen aan te pakken die door AI worden opgeworpen. Amendementen op de wet, die in het Lagerhuis zullen worden besproken, zijn bedoeld om naleving, transparantie en handhaving van auteursrechtvoorschriften te waarborgen. Indien goedgekeurd, zouden deze amendementen de pogingen van de Britse overheid kunnen beteugelen om techbedrijven vrijstellingen te verlenen met betrekking tot het gebruik van gepubliceerd materiaal voor AI-training. Dit is een standpunt dat de overheid naar de mening van velen vanaf het begin had moeten innemen.
Tom West, CEO van de Publishers’ Licensing Services, stelt dat de Data (Gebruik en Toegang) Wet het verlenen van licenties voor inhoud zou kunnen “turbochargen”. Hij benadrukt dat de roep om verantwoording niet anti-tech of anti-innovatie is. In plaats daarvan weerspiegelt het een erkenning dat de nauwkeurigheid en kwaliteit van informatie van het grootste belang zijn nu generatieve AI een steeds belangrijkere rol speelt in ons leven.
Een Keerpunt: Regulering van de Impact van AI
De huidige situatie vertegenwoordigt een keerpunt. Naarmate de macht en invloed van AI blijven groeien, is het absoluut noodzakelijk om duidelijke grenzen en voorschriften vast te stellen om schade, chaos of acties die tot spijt kunnen leiden te voorkomen. Dit principe, ontleend aan ChatGPT, onderstreept de behoefte aan verantwoorde ontwikkeling en implementatie van AI-technologieën.
Dieper Duiken in het Juridische en Ethische Moeras
Het debat over het gebruik van auteursrechtelijk beschermd materiaal in AI-training is niet alleen een juridische kwestie; het raakt ook fundamentele ethische overwegingen. De vraag of AI-bedrijven winst mogen maken met het ongeautoriseerde gebruik van creatieve werken is een kwestie van eerlijkheid en respect voor intellectuele eigendomsrechten.
De Fair Use Doctrine: Een Complex Juridisch Argument
Een van de centrale juridische argumenten in dit debat draait om de fair use doctrine. Fair use is een juridisch principe dat het beperkte gebruik van auteursrechtelijk beschermd materiaal toestaat zonder toestemming van de auteursrechthebbende. De doctrine is bedoeld om de vrijheid van meningsuiting te bevorderen en creativiteit aan te moedigen door bepaalde transformatieve toepassingen van auteursrechtelijk beschermde werken toe te staan.
De toepassing van de fair use doctrine in de context van AI-training is echter complex en omstreden. AI-bedrijven beweren vaak dat hun gebruik van auteursrechtelijk beschermd materiaal onder fair use valt omdat ze het materiaal gebruiken om nieuwe en transformatieve technologieën te creëren. Ze beweren dat de AI-modellen niet simpelweg de auteursrechtelijk beschermde werken reproduceren, maar er in plaats daarvan van leren om volledig nieuwe output te genereren.
Auteursrechthebbenden daarentegen stellen dat het gebruik van hun werken om AI-modellen te trainen een commercieel gebruik is dat hen potentiële inkomsten ontneemt. Ze stellen dat AI-bedrijven verplicht moeten worden om licenties te verkrijgen voor het auteursrechtelijk beschermde materiaal dat ze gebruiken voor training, net zoals ze dat zouden doen voor elk ander commercieel gebruik.
De Economische Impact op Auteurs en Uitgevers
De economische impact van ongeautoriseerde AI-training op auteurs en uitgevers is een aanzienlijke zorg. Als AI-bedrijven vrijelijk auteursrechtelijk beschermde werken mogen gebruiken zonder compensatie, zou dit de stimulans voor auteurs en uitgevers om nieuwe inhoud te creëren kunnen ondermijnen. Dit zou kunnen leiden tot een afname van de kwaliteit en beschikbaarheid van creatieve werken, wat uiteindelijk de samenleving als geheel zou schaden.
Bovendien zou het ongeautoriseerde gebruik van auteursrechtelijk beschermd materiaal een ongelijk speelveld op de markt kunnen creëren. AI-bedrijven die auteursrechtelijk beschermde werken zonder toestemming gebruiken, zouden een concurrentievoordeel hebben ten opzichte van bedrijven die licenties verkrijgen of hun eigen trainingsgegevens creëren. Dit zou innovatie kunnen verstikken en kunnen leiden tot een concentratie van macht in de handen van een paar dominante AI-bedrijven.
De Noodzaak van Transparantie en Verantwoording
Transparantie en verantwoording zijn essentieel om ervoor te zorgen dat AI-bedrijven auteursrechtelijk beschermd materiaal op verantwoorde wijze gebruiken. AI-bedrijven moeten verplicht worden om de bronnen van de gegevens die ze gebruiken om hun modellen te trainen openbaar te maken. Dit zou auteursrechthebbenden in staat stellen om het gebruik van hun werken te controleren en ervoor te zorgen dat ze naar behoren worden gecompenseerd.
Bovendien moeten AI-bedrijven verantwoordelijk worden gehouden voor elke auteursrechtinbreuk die optreedt als gevolg van hun AI-modellen. Dit zou aansprakelijkheid kunnen omvatten voor directe inbreuk, evenals voor bijdragende inbreuk als het AI-model wordt gebruikt om inbreukmakende werken te creëren.
Onderzoek naar Alternatieve Oplossingen
Naast het versterken van de auteursrechtwetgeving en het bevorderen van transparantie, is het belangrijk om alternatieve oplossingen te onderzoeken die kunnen helpen om de belangen van AI-bedrijven en auteursrechthebbenden in evenwicht te brengen.
Collectieve Licentieverlening
Collectieve licentieverlening is een potentiële oplossing. Onder een collectief licentiesysteem zou een collectieve beheerorganisatie (CMO) namens auteursrechthebbenden licenties onderhandelen met AI-bedrijven. De CMO zou vervolgens de royalty’s die via de licenties worden geïnd, verdelen onder de auteursrechthebbenden.
Collectieve licentieverlening zou een efficiëntere en gestroomlijndere manier kunnen bieden voor AI-bedrijven om licenties te verkrijgen voor het auteursrechtelijk beschermde materiaal dat ze nodig hebben. Het zou er ook voor kunnen zorgen dat auteursrechthebbenden eerlijk worden gecompenseerd voor het gebruik van hun werken.
Open Source Gegevens
Een andere potentiële oplossing is het bevorderen van de ontwikkeling van open source datasets voor AI-training. Open source datasets zijn datasets die vrij beschikbaar zijn voor iedereen om te gebruiken, aan te passen en te distribueren.
De ontwikkeling van open source datasets zou de afhankelijkheid van AI-bedrijven van auteursrechtelijk beschermd materiaal kunnen verminderen. Het zou ook innovatie en concurrentie in de AI-industrie kunnen bevorderen.
Technologische Oplossingen
Technologische oplossingen zouden ook een rol kunnen spelen bij het aanpakken van de auteursrechtelijke uitdagingen die AI met zich meebrengt. Zo zouden watermerktechnologieën kunnen worden gebruikt om het gebruik van auteursrechtelijk beschermd materiaal in AI-training te volgen. Dit zou auteursrechthebbenden in staat stellen om het gebruik van hun werken te controleren en gevallen van ongeautoriseerd gebruik te identificeren.
Bovendien zouden AI-technologieën kunnen worden gebruikt om het creëren van inbreukmakende werken te detecteren en te voorkomen. Zo zouden AI-gestuurde tools kunnen worden gebruikt om inhoud te identificeren die in wezen gelijk is aan auteursrechtelijk beschermde werken.
Het Pad Voorwaarts
Het debat over het gebruik van auteursrechtelijk beschermd materiaal in AI-training is complex en veelzijdig. Er zijn geen gemakkelijke antwoorden. Door de auteursrechtwetgeving te versterken, transparantie en verantwoording te bevorderen, alternatieve oplossingen te onderzoeken en een open dialoog tussen AI-bedrijven en auteursrechthebbenden te stimuleren, kunnen we echter een kader creëren dat de belangen van alle belanghebbenden in evenwicht brengt en innovatie bevordert, terwijl tegelijkertijd intellectuele eigendomsrechten worden beschermd. De Data (Gebruik en Toegang) Wet vertegenwoordigt een cruciale stap in deze richting en biedt een wetgevende weg om deze dringende problemen aan te pakken en de toekomst van het auteursrecht in het digitale tijdperk vorm te geven. De beslissingen die nu worden genomen, zullen blijvende gevolgen hebben voor de creatieve industrieën en de ontwikkeling van AI voor de komende jaren.