Vụ kiện Kadrey và cộng sự kiện Meta Platforms
Một phán quyết gần đây của tòa án đã yêu cầu Meta, công ty mẹ của Facebook và Instagram, phải giải quyết các cáo buộc rằng họ đã xóa thông tin quản lý bản quyền (CMI) khỏi các tài liệu được sử dụng để huấn luyện các mô hình trí tuệ nhân tạo (AI) của mình. Quyết định này bắt nguồn từ một vụ kiện tập thể do các tác giả Richard Kadrey, Sarah Silverman và Christopher Golden đệ trình, những người cho rằng việc Meta sử dụng các tác phẩm có bản quyền của họ để huấn luyện AI là bất hợp pháp.
Cốt lõi của cáo buộc: Loại bỏ thông tin quản lý bản quyền
Vụ kiện, Kadrey và cộng sự kiện Meta Platforms, đã có một bước ngoặt quan trọng vào tháng 1 năm 2025 khi các nguyên đơn khẳng định rằng Meta không chỉ biết về việc sử dụng tài liệu có bản quyền mà còn biết rằng các mô hình AI của họ sẽ tạo ra các đầu ra chứa CMI. CMI bao gồm các chi tiết quan trọng liên quan đến các tác phẩm có bản quyền, chẳng hạn như danh tính của người tạo, điều khoản cấp phép, ngày tạo và các thông tin liên quan khác.
Lập luận trung tâm của các nguyên đơn là Meta đã cố tình loại bỏ CMI này khỏi các tài liệu huấn luyện. Mục đích, họ cáo buộc, là để che giấu sự thật rằng các đầu ra do AI tạo ra có nguồn gốc từ các nguồn có bản quyền. Hành động loại bỏ bị cáo buộc này tạo thành cơ sở cho khiếu nại rằng Meta đã vi phạm Đạo luật Bản quyền Kỹ thuật số Thiên niên kỷ (DMCA).
Phán quyết của Thẩm phán: Khiếu nại DMCA được tiếp tục
Thẩm phán Vince Chhabria, chủ tọa phiên tòa tại tòa án liên bang San Francisco, đã ra phán quyết rằng khiếu nại của nguyên đơn về vi phạm DMCA có thể được tiến hành. Phán quyết này làm tăng khả năng vụ việc sẽ đi đến thỏa thuận hoặc tiến hành xét xử.
Lệnh của Thẩm phán Chhabria tuyên bố rằng các cáo buộc của nguyên đơn đã đưa ra một “suy luận hợp lý, nếu không đặc biệt mạnh mẽ” rằng Meta đã xóa CMI để ngăn các mô hình AI Llama của mình xuất ra CMI và do đó tiết lộ việc sử dụng tài liệu có bản quyền trong quá trình huấn luyện. Ông nhấn mạnh thêm rằng việc sử dụng tài liệu có bản quyền này cấu thành một hành vi vi phạm (bị cáo buộc) có thể xác định rõ ràng.
Sự thừa nhận của Meta và tập dữ liệu Books3
Meta đã thừa nhận sử dụng một tập dữ liệu có tên là Books3 trong quá trình huấn luyện mô hình ngôn ngữ lớn Llama 1 của mình. Tập dữ liệu này đã được xác định là chứa các tác phẩm có bản quyền, làm tăng thêm trọng lượng cho các tuyên bố của nguyên đơn.
Bác bỏ một phần khiếu nại
Trong khi khiếu nại DMCA được tiến hành, Thẩm phán Chhabria đã bác bỏ một trong những khiếu nại của nguyên đơn. Khiếu nại bị bác bỏ này khẳng định rằng việc Meta sử dụng sách không có giấy phép thu được thông qua torrent ngang hàng để huấn luyện Llama đã vi phạm Đạo luật Toàn diện về Truy cập và Gian lận Dữ liệu Máy tính của California (CDAFA).
Ý kiến chuyên gia: Khiếu nại DMCA và Sử dụng hợp pháp
Edward Lee, giáo sư luật tại Đại học Santa Clara, cảnh báo không nên đưa ra suy luận về việc sử dụng hợp pháp chỉ dựa trên khiếu nại DMCA liên quan đến CMI bị xóa. Ông lưu ý sự hoài nghi của Thẩm phán Chhabria về khả năng của nguyên đơn chứng minh khiếu nại DMCA và gợi ý khả năng xem xét lại nó trong phán quyết tóm tắt. Lee nhấn mạnh rằng các luật sư của nguyên đơn đã xác định thành công một cơ sở thực tế cụ thể hơn cho khiếu nại DMCA của họ, vốn trước đó đã bị bác bỏ.
Ý nghĩa đối với các vụ kiện tụng liên quan đến AI khác
Việc khiếu nại CMI chống lại Meta được tiến hành, cùng với phán quyết trước đó có lợi cho Thomson Reuters chống lại Ross Intelligence, cho thấy một sự thay đổi tiềm năng trong cách các tòa án xem xét việc sử dụng tài liệu có bản quyền trong huấn luyện AI. Những quyết định này có thể củng cố vị thế của các nguyên đơn trong các vụ kiện tụng liên quan đến AI khác đang diễn ra.
Ví dụ, vụ kiện Tremblay và cộng sự kiện OpenAI và cộng sự gần đây đã được sửa đổi để khôi phục khiếu nại DMCA đã bị bác bỏ trước đó. Đơn khiếu nại sửa đổi, trích dẫn bằng chứng mới được phát hiện trong quá trình điều tra, lập luận rằng OpenAI cũng đã xóa CMI trong quá trình huấn luyện các mô hình ngôn ngữ lớn của mình.
Bối cảnh rộng hơn: Bản quyền và Huấn luyện AI
Các cuộc chiến pháp lý xung quanh AI và bản quyền làm nổi bật những thách thức phức tạp của việc cân bằng giữa đổi mới và quyền sở hữu trí tuệ. Việc sử dụng bừa bãi tài liệu có bản quyền để huấn luyện AI đã làm dấy lên lo ngại về khả năng vi phạm, đặc biệt là khi các mô hình AI tạo ra các đầu ra giống hoặc sao chép trực tiếp các tác phẩm có bản quyền.
Kết quả của những vụ kiện này có thể có ý nghĩa quan trọng đối với tương lai của sự phát triển AI và việc sử dụng tài liệu có bản quyền trong các tập dữ liệu huấn luyện. Các quyết định có thể ảnh hưởng đến cách các công ty AI tiếp cận việc thu thập dữ liệu và huấn luyện mô hình, có khả năng dẫn đến việc nhấn mạnh hơn vào cấp phép, ghi công và bảo vệ thông tin quản lý bản quyền.
Cuộc tranh chấp giữa Meta và các tác giả nhấn mạnh bối cảnh pháp lý đang phát triển xung quanh AI và sở hữu trí tuệ. Khi công nghệ AI tiếp tục phát triển, các tòa án sẽ đóng một vai trò quan trọng trong việc xác định ranh giới của việc sử dụng được phép và thiết lập các tiền lệ pháp lý giải quyết các thách thức đặc biệt do nội dung do AI tạo ra. Vụ kiện tụng đang diễn ra là một lời nhắc nhở về tầm quan trọng của việc tôn trọng luật bản quyền và đảm bảo rằng người sáng tạo được bồi thường xứng đáng cho việc sử dụng tác phẩm của họ, ngay cả trong lĩnh vực trí tuệ nhân tạo đang phát triển nhanh chóng.
Các lập luận pháp lý được trình bày trong các trường hợp này đi sâu vào sự phức tạp của luật bảnquyền, DMCA và việc áp dụng các nguyên tắc sử dụng hợp pháp trong bối cảnh AI. Các nguyên đơn cho rằng hành động của Meta cấu thành một nỗ lực cố ý nhằm phá vỡ các biện pháp bảo vệ bản quyền và tước đoạt của người sáng tạo sự công nhận và bồi thường chính đáng của họ. Mặt khác, Meta có thể lập luận rằng việc sử dụng tài liệu có bản quyền của họ thuộc phạm vi sử dụng hợp pháp hoặc việc xóa CMI là cần thiết vì lý do kỹ thuật. Các tòa án cuối cùng sẽ cần phải cân nhắc những lập luận này và xác định xem liệu hành động của Meta có vượt qua ranh giới vi phạm bản quyền hay không.
Các trường hợp này cũng đặt ra câu hỏi về trách nhiệm của các nhà phát triển AI trong việc đảm bảo rằng các mô hình của họ được huấn luyện trên dữ liệu thu được hợp pháp. Khi AI ngày càng trở nên phổ biến, nhu cầu minh bạch và trách nhiệm giải trình trong việc tìm nguồn cung ứng dữ liệu và huấn luyện mô hình trở nên tối quan trọng. Kết quả pháp lý của những tranh chấp này có thể định hình các thông lệ của ngành và khuyến khích sự phát triển của các hướng dẫn đạo đức cho sự phát triển AI.
Cuộc tranh luận về bản quyền và AI không chỉ giới hạn trong lĩnh vực pháp lý. Nó cũng mở rộng đến các cuộc thảo luận xã hội rộng lớn hơn về vai trò của AI trong các nỗ lực sáng tạo và tác động tiềm tàng đối với các nghệ sĩ và tác giả con người. Một số người cho rằng nội dung do AI tạo ra gây ra mối đe dọa cho sự sáng tạo của con người, trong khi những người khác xem AI như một công cụ có thể nâng cao và tăng cường khả năng của con người. Những cuộc thảo luận này làm nổi bật sự cần thiết phải có một sự hiểu biết sâu sắc về mối quan hệ giữa AI và sự sáng tạo của con người và tầm quan trọng của việc thúc đẩy một môi trường hợp tác mang lại lợi ích cho cả người sáng tạo và nhà phát triển công nghệ.
Các cuộc chiến pháp lý hiện đang diễn ra đại diện cho một bước quan trọng trong việc điều hướng giao điểm phức tạp của luật bản quyền và trí tuệ nhân tạo. Các quyết định được đưa ra trong các trường hợp này có thể sẽ có những hậu quả sâu rộng, định hình tương lai của sự phát triển AI, bảo vệ sở hữu trí tuệ và mối quan hệ giữa công nghệ và sáng tạo. Cuộc đối thoại đang diễn ra giữa các chuyên gia pháp lý, nhà phát triển công nghệ và người sáng tạo là rất cần thiết để đảm bảo rằng sự đổi mới AI tiến hành theo cách tôn trọng cả khuôn khổ pháp lý và quyền của người sáng tạo.