Meta под судом за данные ИИ

Суть обвинения: Удаление информации об управлении авторскими правами

Недавнее судебное постановление обязало Meta, материнскую компанию Facebook и Instagram, ответить на обвинения в том, что она удалила информацию об управлении авторскими правами (CMI) из материалов, использованных для обучения своих моделей искусственного интеллекта (ИИ). Это решение вытекает из коллективного иска, поданного авторами Ричардом Кадри, Сарой Сильверман и Кристофером Голденом, которые утверждают, что использование Meta их защищенных авторским правом работ для обучения ИИ было незаконным.

Иск Kadrey et al. vs Meta Platforms принял существенный оборот в январе 2025 года, когда истцы заявили, что Meta не только знала об использовании защищенных авторским правом материалов, но и о том, что ее модели ИИ, следовательно, будут производить результаты, содержащие CMI. CMI включает в себя важные сведения, связанные с защищенными авторским правом произведениями, такие как личность создателя, условия лицензирования, дата создания и другая относящаяся к делу информация.

Центральный аргумент истцов заключается в том, что Meta намеренно удалила эту CMI из учебных материалов. Цель, как они утверждают, состояла в том, чтобы скрыть тот факт, что сгенерированные ИИ выходные данные были получены из защищенных авторским правом источников. Этот предполагаемый акт удаления составляет основу иска о том, что Meta нарушила Закон об авторском праве в цифровую эпоху (DMCA).

Постановление судьи: Иск по DMCA будет рассмотрен

Судья Винс Чабриа, председательствующий в деле в федеральном суде Сан-Франциско, постановил, что иск истцов о нарушении DMCA может быть рассмотрен. Это решение увеличивает вероятность того, что дело либо будет урегулировано, либо передано в суд.

В постановлении судьи Чабриа говорится, что утверждения истцов вызывают “разумное, хотя и не особенно сильное, предположение”, что Meta удалила CMI, чтобы предотвратить вывод CMI своими моделями Llama AI и, таким образом, раскрыть использование защищенных авторским правом материалов при обучении. Он также подчеркнул, что это использование защищенных авторским правом материалов представляет собой четко идентифицируемое (предполагаемое) нарушение.

Признание Meta и набор данных Books3

Meta признала использование набора данных, известного как Books3, при обучении своей большой языковой модели Llama 1. Этот набор данных был идентифицирован как содержащий защищенные авторским правом произведения, что добавляет веса утверждениям истцов.

Частичное отклонение исков

Хотя иск по DMCA продвигается вперед, судья Чабриа отклонил один из исков истцов. В этом отклоненном иске утверждалось, что использование Meta нелицензионных книг, полученных через одноранговые торренты для обучения Llama, нарушает Калифорнийский закон о всеобъемлющем доступе к компьютерным данным и мошенничестве (CDAFA).

Мнение эксперта: Иск по DMCA и добросовестное использование

Эдвард Ли, профессор права в Университете Санта-Клары, предостерег от выводов о добросовестном использовании, основанных исключительно на иске по DMCA, связанном с удаленной CMI. Он отметил выраженный судьей Чабриа скептицизм в отношении способности истцов доказать иск по DMCA и предположил возможность его пересмотра в порядке упрощенного судопроизводства. Ли подчеркнул, что адвокаты истцов успешно определили более конкретную фактическую основу для своего иска по DMCA, который ранее был отклонен.

Последствия для других судебных разбирательств, связанных с ИИ

Продвижение иска CMI против Meta, наряду с предыдущим решением в пользу Thomson Reuters против Ross Intelligence, предполагает потенциальный сдвиг в том, как суды рассматривают использование защищенных авторским правом материалов при обучении ИИ. Эти решения могут усилить позицию истцов в других продолжающихся судебных процессах, связанных с ИИ.

Например, в дело Tremblay et al. vs OpenAI et al. недавно были внесены поправки, чтобы возобновить ранее отклоненный иск по DMCA. В измененной жалобе, ссылаясь на новые доказательства, обнаруженные в ходе раскрытия информации, утверждается, что OpenAI также удаляла CMI во время обучения своих больших языковых моделей.

Более широкий контекст: Авторское право и обучение ИИ

Юридические баталии вокруг ИИ и авторского права подчеркивают сложные проблемы балансирования инноваций с правами интеллектуальной собственности. Неизбирательное использование защищенных авторским правом материалов для обучения ИИ вызвало обеспокоенность по поводу потенциального нарушения, особенно когда модели ИИ генерируют результаты, которые очень похожи или напрямую воспроизводят защищенные авторским правом произведения.

Результаты этих дел могут иметь значительные последствия для будущего развития ИИ и использования защищенных авторским правом материалов в обучающих наборах данных. Решения могут повлиять на то, как компании, занимающиеся ИИ, подходят к сбору данных и обучению моделей, что потенциально может привести к большему акценту на лицензировании, атрибуции и защите информации об управлении авторскими правами.

Спор между Meta и авторами подчеркивает развивающийся правовой ландшафт, окружающий ИИ и интеллектуальную собственность. По мере того как технология ИИ продолжает развиваться, суды будут играть решающую роль в определении границ допустимого использования и установлении правовых прецедентов, которые решают уникальные проблемы, связанные с контентом, созданным ИИ. Продолжающийся судебный процесс служит напоминанием о важности соблюдения законов об авторском праве и обеспечения того, чтобы создатели получали справедливую компенсацию за использование своих произведений, даже в быстро развивающейся области искусственного интеллекта.

Юридические аргументы, представленные в этих делах, углубляются в тонкости закона об авторском праве, DMCA и применение принципов добросовестного использования в контексте ИИ. Истцы утверждают, что действия Meta представляют собой преднамеренную попытку обойти защиту авторских прав и лишить создателей их законного признания и компенсации. Meta, с другой стороны, может утверждать, что ее использование защищенных авторским правом материалов подпадает под добросовестное использование или что удаление CMI было необходимо по техническим причинам. Судам в конечном итоге необходимо будет взвесить эти аргументы и определить, перешли ли действия Meta черту нарушения авторских прав.

Эти дела также поднимают вопросы об ответственности разработчиков ИИ за обеспечение того, чтобы их модели обучались на законно полученных данных. По мере того как ИИ становится все более распространенным, потребность в прозрачности и подотчетности в источниках данных и обучении моделей становится первостепенной. Юридические результаты этих споров могут сформировать отраслевую практику и способствовать разработке этических принципов для развития ИИ.

Дебаты об авторском праве и ИИ не ограничиваются юридической сферой. Они также распространяются на более широкие общественные дискуссии о роли ИИ в творческих начинаниях и потенциальном влиянии на художников и авторов. Некоторые утверждают, что контент, созданный ИИ, представляет угрозу для человеческого творчества, в то время как другие рассматривают ИИ как инструмент, который может улучшить и дополнить человеческие возможности. Эти дискуссии подчеркивают необходимость тонкого понимания взаимосвязи между ИИ и человеческим творчеством и важность создания среды сотрудничества, которая приносит пользу как создателям, так и разработчикам технологий.

Судебные баталии, которые в настоящее время ведутся, представляют собой решающий шаг в навигации по сложному пересечению закона об авторском праве и искусственного интеллекта. Решения, вынесенные по этим делам, вероятно, будут иметь далеко идущие последствия, формируя будущее развития ИИ, защиту интеллектуальной собственности и отношения между технологиями и творчеством. Продолжающийся диалог между юристами, разработчиками технологий и создателями необходим для обеспечения того, чтобы инновации в области ИИ осуществлялись таким образом, чтобы уважались как правовые рамки, так и права создателей.