Да обучаваме ли AI? Въпросът.

Възходът на изключенията от авторското право за обучение на AI

През последните години все повече държави въвеждат изключения в законите си за авторското право, специално за да улеснят извличането на текст и данни (text and data mining) от компании, занимаващи се с изкуствен интелект. Тези изключения имат за цел да насърчат иновациите в областта на изкуствения интелект, като позволяват на LLMs да бъдат обучавани върху огромни масиви от данни, без да е необходимо изрично разрешение от всеки носител на авторски права.

Сингапур, например, измени закона си за авторското право през 2021 г., за да създаде такова изключение. Този ход проправи пътя за разработчиците на AI в страната да имат достъп и да обработват защитени с авторски права произведения с цел обучение на техните модели. Сега други юрисдикции в Азия, включително Хонконг и Индонезия, обмислят подобни законодателни промени.

Китайската перспектива: Знаково дело за нарушение

Китай, основен играч в глобалния пейзаж на AI, също се бори със сложността на авторското право в ерата на LLMs. Знаково дело, iQiyi срещу MiniMax, изведе този въпрос на преден план.

В този случай iQiyi, известна платформа за стрийминг на видео, съди MiniMax, AI компания, за предполагаемо използване на нейните защитени с авторски права видео материали за обучение на AI модели без разрешение. Този съдебен процес бележи значително развитие като първото дело за нарушение на видео LLM в Китай, подчертавайки нарастващите опасения относно неразрешеното използване на защитено с авторски права съдържание при разработването на AI технологии.

Индийската издателска индустрия оспорва практиките за обучение на LLM

Дебатът се простира отвъд Азия. В Индия няколко издателски къщи са предприели правни действия срещу разработчици на LLM, твърдейки, че тези модели се обучават върху извлечени данни (scraped data), които включват техни защитени с авторски права произведения. Тези случаи подчертават напрежението между желанието за напредък в AI възможностите и необходимостта от защита на правата на интелектуална собственост на създателите.

Отвъд простото приемане: Нюансите на обучението на LLM

Предизвикателствата, поставени от обучението на LLM, са много по-сложни от простото приемане и обработка на данни. Индийските случаи и тясно дефинираните разпоредби на сингапурския закон подчертават многостранния характер на този въпрос.

Много собственици на интелектуална собственост изрично ограничават достъпа и използването на техните защитени с авторски права произведения, докато други не дават съгласие за такъв достъп и възпроизвеждане. Значителен брой създатели разчитат на лицензионни модели като основна част от своя бизнес и неразрешеното използване на техните произведения за обучение на AI пряко подкопава тези модели.

Освен това фактът, че голяма част от обучението може да се извърши в облака, повдига сложни юрисдикционни въпроси. Определянето кои закони се прилагат, когато данните се обработват през международни граници, добавя още едно ниво на сложност към вече сложния правен пейзаж.

В крайна сметка основният проблем се върти около това как LLMs осигуряват своите данни за обучение и дали и как трябва да компенсират носителите на авторски права за използването им.

Американските организации за авторско право се противопоставят на законовите изключения

Дебатът не се ограничава до отделните държави; той се е пренесъл и на международната арена. Коалиция от близо 50 търговски асоциации и индустриални групи в Съединените щати, известна като Digital Creators Coalition, изрази силни възражения срещу създаването на законови изключения за обучение на LLM в законите за авторското право без разпоредби за разрешение или компенсация.

Тези организации са представили коментари до Търговския представител на Съединените щати (USTR), призовавайки агенцията да разгледа този въпрос в годишния си преглед Special 301, който разглежда защитата на интелектуалната собственост и практиките за прилагане по света. Коалицията е предоставила списък с държави, които са въвели или предлагат такива изключения, подчертавайки глобалния мащаб на тази загриженост.

Дебатът в САЩ: Позицията на OpenAI и вътрешните противоречия

Дори в рамките на Съединените щати дебатът остава много актуален. OpenAI, компанията зад популярния ChatGPT, добави гласа си към дискусията, като представи отворено писмо до Службата за наука и технологии на Белия дом.

В това писмо OpenAI се застъпва за правото да извлича данни от интернет съгласно принципите на честната употреба (fair use), като ефективно се аргументира за широк достъп до защитени с авторски права материали за целите на обучението. Парадоксално обаче, OpenAI също така предполага, че чуждестранните разработчици на LLM трябва да бъдат ограничени да правят същото, потенциално чрез използването на американските политики за износ. Тази позиция разкрива вътрешно противоречие, застъпвайки се за отворен достъп за себе си, като същевременно се стреми да ограничи достъпа на други.

Пътят напред: Продължаващ дебат

С наближаването на 2025 г. дебатът за авторското право и обучението на AI със сигурност ще се засили. С продължаващата поява на нови LLMs по света, необходимостта от ясна и балансирана правна рамка става все по-належаща.

Настоящият правен пейзаж е смесица от национални закони, някои с изрични изключения за обучение на AI, а други без такива разпоредби. Тази непоследователност създава несигурност както за разработчиците на AI, така и за носителите на авторски права, възпрепятствайки иновациите и потенциално подкопавайки правата на създателите.

Ключови съображения за балансирана рамка:

  • Прозрачност и отчетност: Разработчиците на LLM трябва да бъдат прозрачни относно източниците на данни, използвани за обучение на техните модели, и да носят отговорност за всяко неразрешено използване на защитени с авторски права материали.
  • Справедлива компенсация: Трябва да се проучат механизми за компенсиране на носителите на авторски права за използването на техните произведения в обучението на AI. Това може да включва лицензионни споразумения, колективно управление на права или други иновативни решения.
  • Международна хармонизация: Усилията за хармонизиране на законите за авторското право, свързани с обучението на AI, в различните юрисдикции биха намалили правната несигурност и биха улеснили трансграничното сътрудничество.
  • Балансиране на иновациите и правата на създателите: Правната рамка трябва да постигне баланс между насърчаването на иновациите в AI и защитата на правата на създателите. Това изисква внимателно разглеждане на различните интереси.
  • Ролята на честната употреба: Необходимо е да се изясни приложимостта на принципите на честната употреба към обучението на AI. Това може да включва дефиниране на конкретни критерии за определяне дали използването на защитени с авторски права материали за целите на обучението се квалифицира като честна употреба.

Продължаващата дискусия около авторското право и обучението на AI подчертава предизвикателствата при адаптирането на съществуващите правни рамки към бързо развиващите се технологии. Намирането на решение, което балансира интересите на всички заинтересовани страни, ще изисква постоянен диалог, сътрудничество и желание за адаптиране към променящия се пейзаж на дигиталната епоха. Бъдещето на развитието на AI и защитата на творческите произведения може да зависи от резултата от този решаващ дебат. Въпросът за обучението ще бъде с нас дълго време.