Въведение
Европейският акт за изкуствения интелект (Регламент (ЕС) 2024/1689, или ‘AI Act’) налага специфични задължения на доставчиците на модели с изкуствен интелект с общо предназначение (‘GPAI’). Тези модели, включително тези от семейството на GPT, Llama и Gemini, трябва да се придържат към изисквания като изчерпателна документация и установяване на политика, гарантираща спазването на законодателството на ЕС за авторското право.
За да се улесни спазването на тези разпоредби, AI Act предвижда разработването на Кодекси за поведение, пригодени за GPAI модели. След покана от Службата за ИИ, различни експерти и заинтересовани страни сформираха четири работни групи, посветени на изготвянето на първоначален Кодекс за поведение. Одобряването на този кодекс от Комисията на ЕС би му предоставило ‘обща валидност’ в целия ЕС. Приемането на одобрения Кодекс за поведение за GPAI предлага на компаниите средство да демонстрират проактивно съответствие, което потенциално намалява регулаторния контрол и свързаните с него санкции.
Службата за ИИ наскоро публикува третия проект на Кодекса за поведение (‘3-ти проект’), изготвен от тези работни групи. Този проект обхваща няколко ключови области:
- Ангажименти
- Прозрачност
- Авторско право
- Безопасност и сигурност
Окончателната версия на този Кодекс за поведение е планирана за пускане на 2 май 2025 г.
Този документ ще се задълбочи в значимите детайли в раздела за авторското право на 3-тия проект. Забележителна промяна от втория проект (‘2-ри проект’) е опростеният и сбит подход на 3-тия проект. Ключова промяна е, че 3-тият проект като цяло изисква усилията за съответствие да бъдат съизмерими с размера и възможностите на доставчика, за разлика от 2-рия проект.
За кого е релевантно това?
Кодексът за поведение е насочен предимно към доставчиците на GPAI модели. Тези модели се характеризират със своята значителна общност и способността си да изпълняват умело широк спектър от различни задачи. Това обхваща доставчиците на добре познати големи езикови модели като GPT (OpenAI), Llama (Meta), Gemini (Google) и Mistral (Mistral AI). Въпреки това, доставчиците на по-малки модели също могат да попаднат в неговия обхват, при условие че техните модели могат да се използват за разнообразен набор от задачи. Освен това, предприятията, които прецизират модели за своите специфични приложения, също могат да бъдат класифицирани като доставчици на GPAI модели.
‘Доставчиците надолу по веригата’, или предприятията, които интегрират GPAI модели в своите AI системи, също трябва да се запознаят с Кодекса за поведение. Този кодекс е готов да се превърне в квазистандарт за GPAI моделите, определяйки очакванията за разработчиците на AI системи по отношение на възможностите на GPAI моделите. Това разбиране може да бъде от решаващо значение по време на преговорите по договори с доставчици на GPAI модели.
Ключови концепции на Кодекса за поведение относно Закона за авторското право
Доставчиците на GPAI модели са задължени да установят политика, която гарантира спазването на законодателството на ЕС за авторското право (чл. 53, ал. 1, буква в) от AI Act). Предвид новостта на това изискване, липсваха практически насоки относно структурата и съдържанието на такава политика. Кодексът за поведение има за цел да запълни тази празнина.
Кодексът за поведение изисква от доставчиците да прилагат следните мерки:
Политика за авторско право
Доставчиците, които подписват Кодекса за поведение (‘Подписалите страни’), са длъжни да формулират, поддържат и прилагат политика за авторско право, която е в съответствие със законодателството на ЕС за авторското право. Това изискване произтича пряко от AI Act. Подписалите страни трябва също така да гарантират, че техните организации се придържат към тази политика за авторско право.
Значително отклонение от 2-рия проект е, че 3-тият проект вече не изисква публикуването на политиката за авторско право. Подписалите страни са само насърчавани да го направят. Това намалено изискване е логично, тъй като самият AI Act не задължава доставчиците на модели да публикуват своите политики за авторско право.
Уеб обхождане на съдържание, защитено с авторски права
Подписалите страни по принцип имат право да използват уеб обхождащи роботи за целите на извличане на текст и данни (‘TDM’), за да събират данни за обучение за своите GPAI модели. Те обаче трябва да гарантират, че тези обхождащи роботи зачитат технологиите, предназначени да ограничат достъпа до материали, защитени с авторски права, като например платени стени (paywalls).
Освен това, Подписалите страни са задължени да изключат ‘пиратски домейни’, които са онлайн източници, които основно се занимават с разпространението на материали, нарушаващи авторски права.
Уеб обхождане и идентифициране и спазване на TDM откази
Подписалите страни трябва да гарантират, че уеб обхождащите роботи идентифицират и зачитат TDM отказите, декларирани от носителите на права. Въпреки че законодателството на ЕС за авторското право по принцип разрешава TDM, носителите на права запазват правото си да се откажат. За уеб съдържание този отказ трябва да бъде машинно четим. 3-тият проект разработва изискванията за уеб обхождащите роботи, като уточнява, че те трябва да идентифицират и да се съобразяват с широко възприетия протокол robots.txt. Освен това, уеб обхождащите роботи трябва да се придържат към други релевантни машинно четими TDM откази, като например метаданни, установени като индустриален стандарт, или решения, които обикновено се използват от носителите на права.
Подписалите страни са длъжни да предприемат разумни стъпки, за да информират носителите на права за използваните уеб обхождащи роботи и как тези обхождащи роботи обработват директивите robots.txt. Тази информация може да бъде разпространена чрез различни канали, като например уеб емисия. Трябва да се отбележи, че 3-тият проект вече не включва задължение за публикуване на тази информация.
Идентифициране и спазване на TDM отказ за съдържание, което не е обходено от уеб
Доставчиците на GPAI модели могат също така да придобиват набори от данни от трети страни, вместо да извършват сами уеб обхождане. Докато 2-рият проект изискваше надлежна проверка на авторските права на набори от данни на трети страни, 3-тият проект изисква разумни усилия за получаване на информация относно това дали уеб обхождащите роботи, използвани за събиране на информацията, са спазили протоколите robots.txt.
Намаляване на риска за предотвратяване на производството на резултати, нарушаващи авторски права
Значителен риск, свързан с използването на AI, е потенциалът AI да генерира резултати, които нарушават авторските права. Това може да включва дублиране на код или изображения, намерени онлайн, които са защитени с авторски права.
Подписалите страни са длъжни да положат разумни усилия, за да намалят този риск. Това представлява по-снизходителен подход в сравнение с 2-рия проект, който предписваше мерки за избягване на ‘пренастройване’ (‘overfitting’). 3-тият проект възприема по-технологично неутрална позиция, като набляга на разумните усилия.
Освен това, Подписалите страни трябва да включат клауза в своите общи условия (или подобни документи) за доставчиците на AI системи надолу по веригата, забраняваща използването на техния GPAI модел по начин, който нарушава авторските права.
Определяне на лице за контакт
Подписалите страни са длъжни да предоставят лице за контакт за носителите на права. Те трябва също така да установят механизъм, който позволява на носителите на права да подават жалби относно нарушения на авторски права.
Съгласно 3-тия проект, Подписалите страни имат възможност да откажат да обработват жалби, които се считат за неоснователни или прекомерни.
По-задълбочен анализ: По-детайлно разглеждане на разпоредбите за авторското право
3-тият проект, макар и привидно опростен, въвежда нюанси и промени в акцента, които изискват по-внимателен поглед. Нека разгледаме всеки раздел по-подробно:
Политика за авторско право: Преминаването от публикуване към насърчаване
Първоначалното изискване за публикуване на политиката за авторско право, присъстващо във 2-рия проект, предизвика опасения относно потенциални конкурентни недостатъци и излагането на чувствителна информация. Преминаването на 3-тия проект към насърчаване на публикуването, вместо да го изисква, признава тези опасения. Тази промяна позволява на доставчиците да запазят известна степен на поверителност по отношение на своите вътрешни стратегии за съответствие, като същевременно насърчават прозрачността. Въпреки това, аспектът на ‘насърчаването’ все още оказва фин натиск върху доставчиците да бъдат открити относно своите политики, което потенциално може да доведе до де факто стандарт на публикуване с течение на времето.
Уеб обхождане: Балансиране на придобиването на данни със зачитането на авторските права
Изричното разрешение за уеб обхождане, съчетано с изискването за зачитане на ограниченията за достъп като платени стени, отразява деликатен баланс. AI Act признава значението на данните за обучение на AI модели, но също така подчертава необходимостта от зачитане на правата на създателите на съдържание. Изключването на ‘пиратски домейни’ е важно допълнение, изрично насочено към източници, които активно се занимават с нарушаване на авторски права. Тази разпоредба засилва принципа, че развитието на AI не трябва да се основава на незаконни дейности.
TDM откази: Техническата специфика на съответствието
Акцентът на 3-тия проект върху протокола robots.txt и други машинно четими механизми за отказ подчертава техническите аспекти на съответствието. Тази специфика осигурява яснота както за доставчиците на GPAI, така и за носителите на права. За доставчиците тя очертава конкретни стъпки, които трябва да предприемат, за да гарантират, че техните обхождащи роботи зачитат исканията за отказ. За носителите на права тя изяснява как могат ефективно да сигнализират своите предпочитания относно TDM. Включването на метаданни, ‘стандартни за индустрията’, и ‘широко възприети’ решения признава, че пейзажът на механизмите за отказ се развива и че е необходима гъвкавост.
Съдържание, което не е обходено от уеб: Прехвърляне на отговорност и надлежна проверка
Промяната от ‘надлежна проверка на авторските права’ към ‘разумни усилия за получаване на информация’ относно набори от данни на трети страни представлява фина, но значителна промяна в отговорността. Докато 2-рият проект поставяше по-голяма тежест върху доставчиците на GPAI да разследват активно статута на авторските права на наборите от данни, 3-тият проект се фокусира върху проверката дали процесът на събиране на данни (от третата страна) е спазил robots.txt. Това имплицитно признава, че доставчиците на GPAI може не винаги да имат пряк контрол върху практиките за придобиване на данни на трети страни, но те все пак имат отговорността да се информират за съответствието.
Намаляване на нарушаващите резултати: От ‘пренастройване’ към ‘разумни усилия’
Отдалечаването от термина ‘пренастройване’ е добре дошла промяна. ‘Пренастройване’, технически термин в машинното обучение, се отнася до модел, който се представя добре на данните за обучение, но зле на нови данни. Въпреки че пренастройването може да допринесе за нарушаване на авторски права (например чрез запомняне и възпроизвеждане на материали, защитени с авторски права), то не е единствената причина. По-широкият фокус на 3-тия проект върху ‘разумните усилия за намаляване на риска’ обхваща по-широк спектър от потенциални сценарии за нарушение и позволява по-голяма гъвкавост при прилагането. Тази промяна също така признава, че перфектното предотвратяване на нарушаване на авторски права може да бъде непостижимо и подходът, основан на риска, е по-практичен.
Лице за контакт и механизъм за подаване на жалби: Оптимизиране на процеса
Изискването за определено лице за контакт и механизъм за подаване на жалби предоставя на носителите на права ясен път за справяне с потенциални нарушения на авторски права. Възможността Подписалите страни да откажат ‘неоснователни или прекомерни’ жалби е практично допълнение, предотвратяващо претоварването на системата с несериозни искове. Тази разпоредба помага да се гарантира, че механизмът за подаване на жалби остава жизнеспособен и ефикасен инструмент за справяне с легитимни опасения за авторски права.
По-широките последици и бъдещи съображения
3-тият проект на Кодекса за поведение за GPAI представлява значителна стъпка към операционализиране на разпоредбите за авторското право на AI Act. Той предоставя така необходимата яснота и насоки за доставчиците на GPAI, като същевременно се стреми да защити правата на създателите на съдържание. Въпреки това, остават няколко по-широки последици и бъдещи съображения:
Стандартът за ‘разумни усилия’: Повторното използване на фразата ‘разумни усилия’ въвежда известна степен на субективност. Какво представлява ‘разумно’ вероятно ще подлежи на тълкуване и може да се развие с течение на времето чрез правни предизвикателства и най-добри практики в индустрията. Тази неяснота може да доведе до несигурност за доставчиците, но също така позволява гъвкавост и адаптиране към различни контексти.
Ролята на доставчиците надолу по веригата: Въпреки че Кодексът е насочен предимно към доставчиците на GPAI, доставчиците надолу по веригата имат пряк интерес да разберат неговите разпоредби. Кодексът определя очакванията за качеството и съответствието на GPAI моделите, което може да информира преговорите по договори и оценките на риска. Доставчиците надолу по веригата могат също така да бъдат изправени пред косвен натиск да гарантират, че използването им на GPAI модели е в съответствие с принципите на Кодекса.
Еволюцията на технологиите: Бързият темп на развитие на AI означава, че Кодексът за поведение ще трябва да бъде жив документ. Могат да се появят нови техники за придобиване на данни, обучение на модели и генериране на резултати, изискващи актуализации на разпоредбите на Кодекса. Позоваването на метаданни, ‘стандартни за индустрията’, и ‘широко възприети’ решения признава тази необходимост от непрекъснато адаптиране.
Международна хармонизация: EU AI Act е пионерско законодателство, но не работи във вакуум. Други юрисдикции също се борят с предизвикателствата на регулирането на AI. Международната хармонизация на разпоредбите за AI, включително разпоредбите за авторското право, ще бъде от решаващо значение за избягване на фрагментацията и осигуряване на равни условия за разработчиците на AI.
Въздействието върху иновациите: Кодексът за поведение има за цел да постигне баланс между насърчаването на иновациите в областта на AI и защитата на авторските права. Въпреки това, въздействието на тези разпоредби върху темпото и посоката на развитие на AI предстои да се види. Някои твърдят, че прекалено строгите разпоредби могат да задушат иновациите, докато други твърдят, че ясните правила са необходими за насърчаване на отговорното развитие на AI.
Прилагане и мониторинг: Как ще се проверява спазването? Ефективността на кодексите ще зависи до голяма степен от механизмите, въведени за прилагане и мониторинг.
3-тият проект на Кодекса за поведение за GPAI е сложен и развиващ се документ с широкообхватни последици. Той представлява значително усилие за справяне с предизвикателствата на спазването на авторските права в ерата на AI, но също така е работа в процес на развитие. Продължаващият диалог между заинтересованите страни, включително доставчиците на GPAI, носителите на права, политиците и по-широката AI общност, ще бъде от съществено значение, за да се гарантира, че Кодексът постига предвидените си цели и остава релевантен в лицето на бързите технологични промени.