Kodeks GPAI - Zmiany dot. Praw Autorskich

Wprowadzenie

Europejski Akt o Sztucznej Inteligencji (Rozporządzenie (UE) 2024/1689, zwane dalej ‘Aktem o AI’) nakłada szczegółowe obowiązki na dostawców modeli sztucznej inteligencji ogólnego przeznaczenia (‘GPAI’). Modele te, w tym te z rodziny GPT, Llama i Gemini, muszą spełniać wymagania, takie jak kompleksowa dokumentacja i ustanowienie polityki zapewniającej zgodność z unijnym prawem autorskim.

Aby ułatwić przestrzeganie tych postanowień, Akt o AI przewiduje opracowanie Kodeksów Postępowania dostosowanych do modeli GPAI. W następstwie zaproszenia ze strony Biura ds. AI, różni eksperci i interesariusze utworzyli cztery grupy robocze zajmujące się opracowaniem wstępnego Kodeksu Postępowania. Zatwierdzenie tego Kodeksu przez Komisję Europejską nadałoby mu ‘ogólną ważność’ w całej UE. Przyjęcie zatwierdzonego Kodeksu Postępowania GPAI oferuje firmom sposób na wykazanie proaktywnej zgodności, potencjalnie łagodząc kontrolę regulacyjną i związane z nią kary.

Biuro ds. AI opublikowało niedawno trzeci projekt Kodeksu Postępowania (‘3. Projekt’) opracowany przez te grupy robocze. Projekt ten obejmuje kilka kluczowych obszarów:

  • Zobowiązania
  • Przejrzystość
  • Prawa autorskie
  • Bezpieczeństwo

Ostateczna wersja tego Kodeksu Postępowania ma zostać opublikowana 2 maja 2025 r.

Niniejszy dokument szczegółowo omawia istotne kwestie zawarte w sekcji dotyczącej praw autorskich 3. Projektu. Zauważalną zmianą w stosunku do drugiego projektu (‘2. Projekt’) jest usprawnione i zwięzłe podejście 3. Projektu. Kluczową zmianą jest to, że 3. Projekt generalnie nakazuje, aby wysiłki w zakresie zgodności były współmierne do wielkości i możliwości dostawcy, w przeciwieństwie do 2. Projektu.

Dla kogo jest to istotne?

Kodeks Postępowania jest skierowany przede wszystkim do dostawców modeli GPAI. Modele te charakteryzują się znaczną ogólnością i zdolnością do sprawnego wykonywania szerokiego spektrum różnych zadań. Obejmuje to dostawców znanych dużych modeli językowych, takich jak GPT (OpenAI), Llama (Meta), Gemini (Google) i Mistral (Mistral AI). Jednak mniejsi dostawcy modeli mogą również podlegać jego zakresowi, pod warunkiem, że ich modele mogą być wykorzystywane do różnorodnych zadań. Ponadto firmy, które dostosowują modele do swoich specyficznych zastosowań, mogą również zostać sklasyfikowane jako dostawcy modeli GPAI.

‘Dostawcy niższego szczebla’, czyli firmy, które integrują modele GPAI w swoich systemach AI, również powinni zapoznać się z Kodeksem Postępowania. Kodeks ten ma stać się quasi-standardem dla modeli GPAI, określającym oczekiwania twórców systemów AI dotyczące możliwości modeli GPAI. Zrozumienie to może być kluczowe podczas negocjacji umów z dostawcami modeli GPAI.

Kluczowe koncepcje Kodeksu Postępowania w zakresie prawa autorskiego

Dostawcy modeli GPAI są zobowiązani do ustanowienia polityki zapewniającej zgodność z unijnym prawem autorskim (art. 53 ust. 1 lit. c) Aktu o AI). Biorąc pod uwagę nowość tego wymogu, brakowało praktycznych wskazówek dotyczących struktury i treści takiej polityki. Kodeks Postępowania ma na celu wypełnienie tej luki.

Kodeks Postępowania nakłada na dostawców obowiązek wdrożenia następujących środków:

Polityka Praw Autorskich

Dostawcy, którzy podpisują Kodeks Postępowania (‘Sygnatariusze’), są zobowiązani do sformułowania, utrzymania i wdrożenia polityki praw autorskich zgodnej z unijnym prawem autorskim. Wymóg ten wynika bezpośrednio z Aktu o AI. Sygnatariusze muszą również zapewnić, że ich organizacje przestrzegają tej polityki praw autorskich.

Istotną zmianą w stosunku do 2. Projektu jest to, że 3. Projekt nie nakazuje już publikacji polityki praw autorskich. Sygnatariusze są jedynie do tego zachęcani. Ten zmniejszony wymóg jest logiczny, ponieważ sam Akt o AI nie zmusza dostawców modeli do publikowania ich polityk praw autorskich.

Przeszukiwanie Sieci w Poszukiwaniu Treści Chronionych Prawem Autorskim

Sygnatariusze są generalnie uprawnieni do korzystania z robotów internetowych (web crawlers) do celów eksploracji tekstu i danych (TDM) w celu gromadzenia danych szkoleniowych dla swoich modeli GPAI. Muszą jednak zapewnić, że roboty te szanują technologie mające na celu ograniczenie dostępu do materiałów chronionych prawem autorskim, takie jak paywalle.

Ponadto Sygnatariusze są zobowiązani do wykluczenia ‘domen pirackich’, które są źródłami online, które głównie zajmują się dystrybucją materiałów naruszających prawa autorskie.

Przeszukiwanie Sieci oraz Identyfikacja i Przestrzeganie Rezygnacji z TDM

Sygnatariusze muszą zapewnić, że roboty internetowe identyfikują i szanują rezygnacje z TDM zadeklarowane przez podmioty praw autorskich. Chociaż unijne prawo autorskie generalnie zezwala na TDM, podmioty praw autorskich zachowują prawo do rezygnacji. W przypadku treści internetowych rezygnacja ta musi być możliwa do odczytania maszynowego. 3. Projekt precyzuje wymagania dotyczące robotów internetowych, określając, że muszą one identyfikować i przestrzegać szeroko przyjętego protokołu robots.txt. Ponadto roboty internetowe muszą przestrzegać innych istotnych, możliwych do odczytania maszynowego rezygnacji z TDM, takich jak metadane ustanowione jako standard branżowy lub rozwiązania powszechnie stosowane przez podmioty praw autorskich.

Sygnatariusze są zobowiązani do podjęcia uzasadnionych kroków w celu poinformowania podmiotów praw autorskich o używanych robotach internetowych i sposobie, w jaki te roboty obsługują dyrektywy robots.txt. Informacje te mogą być rozpowszechniane za pośrednictwem różnych kanałów, takich jak kanał internetowy. Warto zauważyć, że 3. Projekt nie zawiera już obowiązku publikowania tych informacji.

Identyfikacja i Przestrzeganie Rezygnacji z TDM dla Treści Nieprzeszukiwanych Przez Roboty Internetowe

Dostawcy modeli GPAI mogą również pozyskiwać zbiory danych od stron trzecich, zamiast samodzielnie przeprowadzać przeszukiwanie sieci. Podczas gdy 2. Projekt nakładał obowiązek należytej staranności w zakresie praw autorskich do zbiorów danych stron trzecich, 3. Projekt wymaga podjęcia uzasadnionych wysiłków w celu uzyskania informacji, czy roboty internetowe użyte do zebrania informacji przestrzegały protokołów robots.txt.

Łagodzenie Ryzyka, aby Zapobiec Tworzeniu Wyników Naruszających Prawa Autorskie

Istotnym ryzykiem związanym z używaniem sztucznej inteligencji jest możliwość generowania przez nią wyników naruszających prawa autorskie. Może to obejmować powielanie kodu lub obrazów znalezionych w Internecie, które są chronione prawem autorskim.

Sygnatariusze są zobowiązani do podjęcia uzasadnionych wysiłków w celu złagodzenia tego ryzyka. Stanowi to bardziej liberalne podejście w porównaniu z 2. Projektem, który zalecał środki mające na celu uniknięcie ‘nadmiernego dopasowania’. 3. Projekt przyjmuje bardziej neutralne technologicznie stanowisko, kładąc nacisk na uzasadnione wysiłki.

Ponadto Sygnatariusze muszą zawrzeć klauzulę w swoich warunkach (lub podobnych dokumentach) dla dostawców systemów AI niższego szczebla, zakazującą korzystania z ich modelu GPAI w sposób naruszający prawa autorskie.

Wyznaczenie Punktu Kontaktowego

Sygnatariusze są zobowiązani do zapewnienia punktu kontaktowego dla podmiotów praw autorskich. Muszą również ustanowić mechanizm umożliwiający podmiotom praw autorskich składanie skarg dotyczących naruszeń praw autorskich.

Zgodnie z 3. Projektem Sygnatariusze mają możliwość odmowy rozpatrzenia skarg, które zostaną uznane za bezpodstawne lub nadmierne.

Szczegółowa Analiza: Bardziej Szczegółowe Badanie Przepisów Dotyczących Praw Autorskich

  1. Projekt, choć pozornie usprawniony, wprowadza niuanse i zmiany w akcentach, które wymagają bliższego przyjrzenia się. Przeanalizujmy każdą sekcję bardziej szczegółowo:

Polityka Praw Autorskich: Przejście od Publikacji do Zachęty

Początkowy nakaz publikacji polityki praw autorskich, obecny w 2. Projekcie, budził obawy o potencjalne niekorzystne skutki dla konkurencji i ujawnienie poufnych informacji. Przejście 3. Projektu do zachęcania do publikacji, a nie jej wymagania, uwzględnia te obawy. Ta zmiana pozwala dostawcom zachować pewien stopień poufności w odniesieniu do ich wewnętrznych strategii zgodności, jednocześnie promując przejrzystość. Jednak aspekt ‘zachęty’ nadal wywiera subtelną presję na dostawców, aby byli otwarci na temat swoich polityk, co może z czasem doprowadzić do de facto standardu publikacji.

Przeszukiwanie Sieci: Równoważenie Pozyskiwania Danych z Poszanowaniem Praw Autorskich

Wyraźne zezwolenie na przeszukiwanie sieci, w połączeniu z wymogiem przestrzegania ograniczeń dostępu, takich jak paywalle, odzwierciedla delikatną równowagę. Akt o AI uznaje znaczenie danych do szkolenia modeli AI, ale podkreśla również potrzebę poszanowania praw twórców treści. Wykluczenie ‘domen pirackich’ jest kluczowym dodatkiem, wyraźnie skierowanym do źródeł, które aktywnie angażują się w naruszanie praw autorskich. Przepis ten wzmacnia zasadę, że rozwój AI nie powinien opierać się na nielegalnych działaniach.

Rezygnacje z TDM: Techniczna Specyfika Zgodności

Nacisk 3. Projektu na protokół robots.txt i inne mechanizmy rezygnacji możliwe do odczytania maszynowego podkreśla techniczne aspekty zgodności. Ta specyfika zapewnia jasność zarówno dostawcom GPAI, jak i podmiotom praw autorskich. Dostawcom określa konkretne kroki, które muszą podjąć, aby zapewnić, że ich roboty szanują żądania rezygnacji. Podmiotom praw autorskich wyjaśnia, w jaki sposób mogą skutecznie sygnalizować swoje preferencje dotyczące TDM. Uwzględnienie metadanych ‘standardu branżowego’ i ‘szeroko przyjętych’ rozwiązań potwierdza, że krajobraz mechanizmów rezygnacji ewoluuje i że elastyczność jest konieczna.

Treści Nieprzeszukiwane Przez Roboty Internetowe: Przeniesienie Odpowiedzialności i Należytej Staranności

Zmiana z ‘należytej staranności w zakresie praw autorskich’ na ‘uzasadnione wysiłki w celu uzyskania informacji’ dotyczących zbiorów danych stron trzecich stanowi subtelne, ale znaczące przesunięcie odpowiedzialności. Podczas gdy 2. Projekt nakładał większy ciężar na dostawców GPAI, aby aktywnie badali status prawnoautorski zbiorów danych, 3. Projekt koncentruje się na weryfikacji, czy proces gromadzenia danych (przez stronę trzecią) przestrzegał robots.txt. To pośrednio potwierdza, że dostawcy GPAI nie zawsze mogą mieć bezpośrednią kontrolę nad praktykami pozyskiwania danych stron trzecich, ale nadal mają obowiązek zapytać o zgodność.

Łagodzenie Wyników Naruszających Prawa Autorskie: Od ‘Nadmiernego Dopasowania’ do ‘Uzasadnionych Wysiłków’

Odejście od terminu ‘nadmierne dopasowanie’ jest mile widzianą zmianą. ‘Nadmierne dopasowanie’, termin techniczny w uczeniu maszynowym, odnosi się do modelu, który dobrze radzi sobie z danymi treningowymi, ale słabo z nowymi danymi. Chociaż nadmierne dopasowanie może przyczyniać się do naruszenia praw autorskich (np. poprzez zapamiętywanie i reprodukcję materiałów chronionych prawem autorskim), nie jest to jedyna przyczyna. Szersze skupienie się 3. Projektu na ‘uzasadnionych wysiłkach w celu złagodzenia ryzyka’ obejmuje szerszy zakres potencjalnych scenariuszy naruszeń i pozwala na większą elastyczność we wdrażaniu. Zmiana ta potwierdza również, że doskonałe zapobieganie naruszeniom praw autorskich może być nieosiągalne, a podejście oparte na ryzyku jest bardziej praktyczne.

Punkt Kontaktowy i Mechanizm Skarg: Usprawnienie Procesu

Wymóg wyznaczenia punktu kontaktowego i mechanizmu skarg zapewnia podmiotom praw autorskich jasną drogę do rozwiązywania potencjalnych naruszeń praw autorskich. Możliwość odmowy przez Sygnatariuszy rozpatrzenia ‘bezpodstawnych lub nadmiernych’ skarg jest praktycznym dodatkiem, zapobiegającym przeciążeniu systemu nieuzasadnionymi roszczeniami. Przepis ten pomaga zapewnić, że mechanizm skarg pozostaje realnym i skutecznym narzędziem do rozwiązywania uzasadnionych obaw dotyczących praw autorskich.

Szersze Implikacje i Przyszłe Rozważania

  1. Projekt Kodeksu Postępowania GPAI stanowi znaczący krok w kierunku operacjonalizacji przepisów dotyczących praw autorskich Aktu o AI. Zapewnia bardzo potrzebną jasność i wskazówki dla dostawców GPAI, jednocześnie starając się chronić prawa twórców treści. Pozostaje jednak kilka szerszych implikacji i przyszłych rozważań:
  • Standard ‘Uzasadnionych Wysiłków’: Powtarzające się użycie wyrażenia ‘uzasadnione wysiłki’ wprowadza pewien stopień subiektywności. To, co stanowi ‘uzasadnione’, prawdopodobnie będzie przedmiotem interpretacji i może ewoluować z czasem poprzez spory sądowe i najlepsze praktyki branżowe. Ta niejednoznaczność może prowadzić do niepewności dla dostawców, ale pozwala również na elastyczność i adaptację do różnych kontekstów.

  • Rola Dostawców Niższego Szczebla: Chociaż Kodeks jest skierowany przede wszystkim do dostawców GPAI, dostawcy niższego szczebla mają żywotny interes w zrozumieniu jego postanowień. Kodeks określa oczekiwania dotyczące jakości i zgodności modeli GPAI, co może wpływać na negocjacje umów i oceny ryzyka. Dostawcy niższego szczebla mogą również spotkać się z pośrednią presją, aby zapewnić, że ich wykorzystanie modeli GPAI jest zgodne z zasadami Kodeksu.

  • Ewolucja Technologii: Szybkie tempo rozwoju AI oznacza, że Kodeks Postępowania będzie musiał być żywym dokumentem. Mogą pojawić się nowe techniki pozyskiwania danych, szkolenia modeli i generowania wyników, wymagające aktualizacji postanowień Kodeksu. Odniesienie do metadanych ‘standardu branżowego’ i ‘szeroko przyjętych’ rozwiązań potwierdza tę potrzebę ciągłej adaptacji.

  • Harmonizacja Międzynarodowa: Unijny Akt o AI jest pionierskim aktem prawnym, ale nie działa w próżni. Inne jurysdykcje również borykają się z wyzwaniami związanymi z regulacją AI. Międzynarodowa harmonizacja przepisów dotyczących AI, w tym przepisów dotyczących praw autorskich, będzie miała kluczowe znaczenie dla uniknięcia fragmentacji i zapewnienia równych szans dla twórców AI.

  • Wpływ na Innowacje: Kodeks Postępowania ma na celu znalezienie równowagi między promowaniem innowacji w dziedzinie AI a ochroną praw autorskich. Jednak wpływ tych przepisów na tempo i kierunek rozwoju AI pozostaje do zobaczenia. Niektórzy twierdzą, że zbyt restrykcyjne przepisy mogą hamować innowacje, podczas gdy inni twierdzą, że jasne zasady są niezbędne do wspierania odpowiedzialnego rozwoju AI.

  • Egzekwowanie i Monitorowanie: Jak będzie sprawdzane przestrzeganie zasad? Skuteczność kodeksów będzie w dużej mierze zależeć od mechanizmów wprowadzonych w celu egzekwowania i monitorowania.

  1. Projekt Kodeksu Postępowania GPAI jest złożonym i ewoluującym dokumentem o daleko idących implikacjach. Stanowi znaczący wysiłek w celu rozwiązania problemów związanych z przestrzeganiem praw autorskich w erze AI, ale jest to również praca w toku. Ciągły dialog między zainteresowanymi stronami, w tym dostawcami GPAI, podmiotami praw autorskich, decydentami i szerszą społecznością AI, będzie miał zasadnicze znaczenie dla zapewnienia, że Kodeks osiągnie zamierzone cele i pozostanie aktualny w obliczu szybkich zmian technologicznych.