Bối cảnh
Đạo luật AI của Châu Âu (Quy định (EU) 2024/1689, hay ‘AI Act’) áp đặt các nghĩa vụ cụ thể đối với các nhà cung cấp mô hình AI đa năng (‘GPAI’). Các mô hình này, bao gồm các mô hình từ họ GPT, Llama và Gemini, phải tuân thủ các yêu cầu như tài liệu hóa toàn diện và thiết lập chính sách đảm bảo tuân thủ luật bản quyền của EU.
Để tạo điều kiện thuận lợi cho việc tuân thủ các quy định này, AI Act dự đoán việc phát triển các Bộ quy tắc thực hành phù hợp cho các mô hình GPAI. Theo lời mời từ Văn phòng AI, các chuyên gia và các bên liên quan khác nhau đã thành lập bốn nhóm làm việc chuyên trách soạn thảo Bộ quy tắc thực hành ban đầu. Việc Ủy ban EU phê duyệt Bộ quy tắc này sẽ cấp cho nó ‘giá trị chung’ trên toàn EU. Việc áp dụng Bộ quy tắc thực hành GPAI đã được phê duyệt cung cấp cho các công ty một phương tiện để chứng minh sự tuân thủ chủ động, có khả năng giảm thiểu sự giám sát của cơ quan quản lý và các hình phạt liên quan.
Văn phòng AI gần đây đã công bố dự thảo thứ ba của Bộ quy tắc thực hành (‘Dự thảo 3’) do các nhóm làm việc này তৈরি. Dự thảo này bao gồm một số lĩnh vực chính:
- Cam kết
- Tính minh bạch
- Bản quyền
- An toàn và Bảo mật
Phiên bản cuối cùng của Bộ quy tắc thực hành này dự kiến sẽ được phát hành vào ngày 2 tháng 5 năm 2025.
Tài liệu này sẽ đi sâu vào các chi tiết quan trọng trong phần bản quyền của Dự thảo 3. Một thay đổi đáng chú ý so với dự thảo thứ hai (‘Dự thảo 2’) là cách tiếp cận được sắp xếp hợp lý và ngắn gọn của Dự thảo 3. Một thay đổi quan trọng là Dự thảo 3 thường quy định rằng các nỗ lực tuân thủ phải tương xứng với quy mô và khả năng của nhà cung cấp, không giống như Dự thảo 2.
Đối tượng liên quan?
Bộ quy tắc thực hành chủ yếu nhắm đến các nhà cung cấp mô hình GPAI. Các mô hình này được đặc trưng bởi tính tổng quát đáng kể và khả năng thực hiện thành thạo một loạt các nhiệm vụ riêng biệt. Điều này bao gồm các nhà cung cấp các mô hình ngôn ngữ lớn nổi tiếng như GPT (OpenAI), Llama (Meta), Gemini (Google) và Mistral (Mistral AI). Tuy nhiên, các nhà cung cấp mô hình nhỏ hơn cũng có thể thuộc phạm vi của nó, miễn là các mô hình của họ có thể được sử dụng cho một loạt các nhiệm vụ khác nhau. Hơn nữa, các doanh nghiệp tinh chỉnh các mô hình cho các ứng dụng cụ thể của họ cũng có thể được phân loại là nhà cung cấp mô hình GPAI.
‘Các nhà cung cấp hạ nguồn’, hay các doanh nghiệp tích hợp các mô hình GPAI vào hệ thống AI của họ, cũng nên làm quen với Bộ quy tắc thực hành. Bộ quy tắc này sẵn sàng trở thành một tiêu chuẩn gần như cho các mô hình GPAI, xác định các kỳ vọng cho các nhà phát triển hệ thống AI về khả năng của mô hình GPAI. Sự hiểu biết này có thể rất quan trọng trong các cuộc đàm phán hợp đồng với các nhà cung cấp mô hình GPAI.
Các khái niệm chính của Bộ quy tắc thực hành về Luật Bản quyền
Các nhà cung cấp mô hình GPAI có nghĩa vụ thiết lập một chính sách đảm bảo tuân thủ luật bản quyền của EU (Điều 53 (1) (c) AI Act). Do tính mới của yêu cầu này, hướng dẫn thực tế về cấu trúc và nội dung của một chính sách như vậy đã bị thiếu. Bộ quy tắc thực hành nhằm mục đích giải quyết khoảng cách này.
Bộ quy tắc thực hành yêu cầu các nhà cung cấp thực hiện các biện pháp sau:
Chính sách bản quyền
Các nhà cung cấp ký Bộ quy tắc thực hành (‘Bên ký kết’) được yêu cầu xây dựng, duy trì và thực hiện chính sách bản quyền phù hợp với luật bản quyền của EU. Yêu cầu này có nguồn gốc trực tiếp từ AI Act. Các Bên ký kết cũng phải đảm bảo rằng các tổ chức của họ tuân thủ chính sách bản quyền này.
Một điểm khác biệt đáng kể so với Dự thảo 2 là Dự thảo 3 không còn bắt buộc công bố chính sách bản quyền. Các Bên ký kết chỉ được khuyến khích làm như vậy. Yêu cầu giảm này là hợp lý, vì bản thân AI Act không bắt buộc các nhà cung cấp mô hình phải công bố chính sách bản quyền của họ.
Thu thập thông tin trên web về nội dung có bản quyền
Các Bên ký kết thường được phép sử dụng trình thu thập thông tin web cho mục đích khai thác văn bản và dữ liệu (‘TDM’) để thu thập dữ liệu đào tạo cho các mô hình GPAI của họ. Tuy nhiên, họ phải đảm bảo rằng các trình thu thập thông tin này tôn trọng các công nghệ được thiết kế để hạn chế quyền truy cập vào các tài liệu có bản quyền, chẳng hạn như tường phí.
Hơn nữa, các Bên ký kết có nghĩa vụ loại trừ ‘các miền vi phạm bản quyền’, là các nguồn trực tuyến chủ yếu tham gia vào việc phân phối các tài liệu vi phạm bản quyền.
Thu thập thông tin trên web và Xác định và Tuân thủ các lựa chọn không tham gia TDM
Các Bên ký kết phải đảm bảo rằng trình thu thập thông tin web xác định và tôn trọng các lựa chọn không tham gia TDM do chủ sở hữu quyền tuyên bố. Mặc dù luật bản quyền của EU thường cho phép TDM, chủ sở hữu quyền vẫn có quyền chọn không tham gia. Đối với nội dung web, lựa chọn không tham gia này phải có thể đọc được bằng máy. Dự thảo 3 giải thích chi tiết về các yêu cầu đối với trình thu thập thông tin web, chỉ định rằng chúng phải xác định và tuân thủ giao thức robots.txt được áp dụng rộng rãi. Ngoài ra, trình thu thập thông tin web phải tuân thủ các lựa chọn không tham gia TDM có thể đọc được bằng máy có liên quan khác, chẳng hạn như siêu dữ liệu được thiết lập như một tiêu chuẩn ngành hoặc các giải pháp thường được chủ sở hữu quyền sử dụng.
Các Bên ký kết được yêu cầu thực hiện các bước hợp lý để thông báo cho chủ sở hữu quyền về các trình thu thập thông tin web đang được sử dụng và cách các trình thu thập thông tin này xử lý các chỉ thị robots.txt. Thông tin này có thể được phổ biến thông qua các kênh khác nhau, chẳng hạn như nguồn cấp dữ liệu web. Đáng chú ý, Dự thảo 3 không còn bao gồm nghĩa vụ công bố thông tin này.
Xác định và Tuân thủ lựa chọn không tham gia TDM cho Nội dung không được thu thập thông tin trên web
Các nhà cung cấp mô hình GPAI cũng có thể có được các tập dữ liệu từ các bên thứ ba thay vì tự mình tiến hành thu thập thông tin trên web. Trong khi Dự thảo 2 bắt buộc thẩm định bản quyền của các tập dữ liệu của bên thứ ba, Dự thảo 3 yêu cầu nỗ lực hợp lý để có được thông tin liên quan đến việc liệu trình thu thập thông tin web được sử dụng để thu thập thông tin có tuân thủ các giao thức robots.txt hay không.
Giảm thiểu rủi ro để ngăn chặn việc tạo ra đầu ra vi phạm bản quyền
Một rủi ro đáng kể liên quan đến việc sử dụng AI là khả năng AI tạo ra đầu ra vi phạm bản quyền. Điều này có thể liên quan đến việc sao chép mã hoặc hình ảnh được tìm thấy trực tuyến được bảo vệ bởi bản quyền.
Các Bên ký kết được yêu cầu thực hiện các nỗ lực hợp lý để giảm thiểu rủi ro này. Điều này thể hiện một cách tiếp cận khoan dung hơn so với Dự thảo 2, trong đó quy định các biện pháp để tránh ‘trang bị quá mức’. Dự thảo 3 áp dụng lập trường trung lập hơn về công nghệ, nhấn mạnh các nỗ lực hợp lý.
Hơn nữa, các Bên ký kết phải kết hợp một điều khoản trong các điều khoản và điều kiện của họ (hoặc các tài liệu tương tự) cho các nhà cung cấp hệ thống AI hạ nguồn, cấm sử dụng mô hình GPAI của họ theo cách vi phạm bản quyền.
Chỉ định một điểm liên hệ
Các Bên ký kết được yêu cầu cung cấp một điểm liên hệ cho chủ sở hữu quyền. Họ cũng phải thiết lập một cơ chế cho phép chủ sở hữu quyền gửi khiếu nại liên quan đến vi phạm bản quyền.
Theo Dự thảo 3, các Bên ký kết có quyền từ chối xử lý các khiếu nại được coi là không có cơ sở hoặc quá mức.
Tìm hiểu sâu hơn: Kiểm tra chi tiết hơn về các điều khoản bản quyền
Dự thảo 3, mặc dù có vẻ được sắp xếp hợp lý, giới thiệu các sắc thái và thay đổi trong sự nhấn mạnh cần được xem xét kỹ hơn. Hãy phân tích từng phần sâu hơn:
Chính sách bản quyền: Sự chuyển đổi từ Công bố sang Khuyến khích
Việc bắt buộc công bố chính sách bản quyền ban đầu, có trong Dự thảo 2, đã làm dấy lên lo ngại về những bất lợi cạnh tranh tiềm ẩn và việc tiết lộ thông tin nhạy cảm. Việc Dự thảo 3 chuyển sang khuyến khích công bố, thay vì yêu cầu, thừa nhận những lo ngại này. Thay đổi này cho phép các nhà cung cấp duy trì một mức độ bảo mật nhất định đối với các chiến lược tuân thủ nội bộ của họ, đồng thời vẫn thúc đẩy tính minh bạch. Tuy nhiên, khía cạnh ‘khuyến khích’ vẫn đặt một áp lực tinh tế lên các nhà cung cấp để cởi mở về các chính sách của họ, có khả năng dẫn đến một tiêu chuẩn công bố trên thực tế theo thời gian.
Thu thập thông tin trên web: Cân bằng việc thu thập dữ liệu với việc tôn trọng bản quyền
Sự cho phép rõ ràng đối với việc thu thập thông tin trên web, cùng với yêu cầu tôn trọng các hạn chế truy cập như tường phí, phản ánh một hành động cân bằng tinh tế. AI Act công nhận tầm quan trọng của dữ liệu để đào tạo các mô hình AI, nhưng nó cũng nhấn mạnh sự cần thiết phải tôn trọng quyền của người tạo nội dung. Việc loại trừ ‘các miền vi phạm bản quyền’ là một bổ sung quan trọng, nhắm mục tiêu rõ ràng đến các nguồn tích cực tham gia vào việc vi phạm bản quyền. Điều khoản này củng cố nguyên tắc rằng sự phát triển AI không nên được xây dựng trên nền tảng của các hoạt động bất hợp pháp.
Lựa chọn không tham gia TDM: Tính cụ thể về kỹ thuật của việc tuân thủ
Sự nhấn mạnh của Dự thảo 3 về giao thức robots.txt và các cơ chế chọn không tham gia có thể đọc được bằng máy khác làm nổi bật các khía cạnh kỹ thuật của việc tuân thủ. Tính cụ thể này cung cấp sự rõ ràng cho cả nhà cung cấp GPAI và chủ sở hữu quyền. Đối với các nhà cung cấp, nó phác thảo các bước cụ thể mà họ phải thực hiện để đảm bảo trình thu thập thông tin của họ tôn trọng các yêu cầu chọn không tham gia. Đối với chủ sở hữu quyền, nó làm rõ cách họ có thể báo hiệu hiệu quả các tùy chọn của mình liên quan đến TDM. Việc bao gồm siêu dữ liệu ‘tiêu chuẩn ngành’ và các giải pháp ‘được áp dụng rộng rãi’ thừa nhận rằng bối cảnh của các cơ chế chọn không tham gia đang phát triển và tính linh hoạt là cần thiết.
Nội dung không được thu thập thông tin trên web: Chuyển đổi trách nhiệm và thẩm định
Sự thay đổi từ ‘thẩm định bản quyền’ sang ‘nỗ lực hợp lý để có được thông tin’ liên quan đến các tập dữ liệu của bên thứ ba thể hiện một sự thay đổi tinh tế nhưng đáng kể về trách nhiệm. Trong khi Dự thảo 2 đặt gánh nặng lớn hơn cho các nhà cung cấp GPAI để chủ động điều tra tình trạng bản quyền của các tập dữ liệu, Dự thảo 3 tập trung vào việc xác minh xem quy trình thu thập dữ liệu (bởi bên thứ ba) có tôn trọng robots.txt hay không. Điều này ngầm thừa nhận rằng các nhà cung cấp GPAI có thể không phải lúc nào cũng có quyền kiểm soát trực tiếp đối với các hoạt động thu thập dữ liệu của các bên thứ ba, nhưng họ vẫn có trách nhiệm tìm hiểu về việc tuân thủ.
Giảm thiểu đầu ra vi phạm: Từ ‘Trang bị quá mức’ đến ‘Nỗ lực hợp lý’
Việc loại bỏ thuật ngữ ‘trang bị quá mức’ là một thay đổi đáng hoan nghênh. ‘Trang bị quá mức’, một thuật ngữ kỹ thuật trong học máy, đề cập đến một mô hình hoạt động tốt trên dữ liệu đào tạo nhưng kém trên dữ liệu mới. Mặc dù trang bị quá mức có thể góp phần vào việc vi phạm bản quyền (ví dụ: bằng cách ghi nhớ và sao chép tài liệu có bản quyền), nhưng đó không phải là nguyên nhân duy nhất. Sự tập trung rộng hơn của Dự thảo 3 vào ‘nỗ lực hợp lý để giảm thiểu rủi ro’ bao gồm một loạt các kịch bản vi phạm tiềm ẩn rộng hơn và cho phép linh hoạt hơn trong việc thực hiện. Thay đổi này cũng thừa nhận rằng việc ngăn chặn hoàn toàn vi phạm bản quyền có thể là không thể đạt được và một cách tiếp cận dựa trên rủi ro là thực tế hơn.
Điểm liên hệ và Cơ chế khiếu nại: Sắp xếp hợp lý quy trình
Yêu cầu về một điểm liên hệ được chỉ định và một cơ chế khiếu nại cung cấp cho chủ sở hữu quyền một con đường rõ ràng để giải quyết các vi phạm bản quyền tiềm ẩn. Khả năng các Bên ký kết từ chối các khiếu nại ‘không có cơ sở hoặc quá mức’ là một bổ sung thực tế, ngăn chặn hệ thống bị quá tải bởi các khiếu nại phù phiếm. Điều khoản này giúp đảm bảo rằng cơ chế khiếu nại vẫn là một công cụ khả thi và hiệu quả để giải quyết các mối quan tâm về bản quyền hợp pháp.
Các tác động rộng hơn và các cân nhắc trong tương lai
Dự thảo 3 của Bộ quy tắc thực hành GPAI thể hiện một bước tiến đáng kể hướng tới việc thực hiện các điều khoản bản quyền của AI Act. Nó cung cấp sự rõ ràng và hướng dẫn rất cần thiết cho các nhà cung cấp GPAI, đồng thời cũng tìm cách bảo vệ quyền của người tạo nội dung. Tuy nhiên, một số tác động rộng hơn và các cân nhắc trong tương lai vẫn còn:
Tiêu chuẩn ‘Nỗ lực hợp lý’: Việc sử dụng lặp đi lặp lại cụm từ ‘nỗ lực hợp lý’ giới thiệu một mức độ chủ quan. Những gì cấu thành ‘hợp lý’ có thể sẽ phải được giải thích và có thể phát triển theo thời gian thông qua các thách thức pháp lý và các thực tiễn tốt nhất của ngành. Sự mơ hồ này có thể dẫn đến sự không chắc chắn cho các nhà cung cấp, nhưng nó cũng cho phép sự linh hoạt và thích ứng với các bối cảnh khác nhau.
Vai trò của các nhà cung cấp hạ nguồn: Mặc dù Bộ quy tắc chủ yếu nhắm đến các nhà cung cấp GPAI, các nhà cung cấp hạ nguồn có lợi ích trong việc hiểu các điều khoản của nó. Bộ quy tắc đặt ra các kỳ vọng về chất lượng và sự tuân thủ của các mô hình GPAI, có thể thông báo cho các cuộc đàm phán hợp đồng và đánh giá rủi ro. Các nhà cung cấp hạ nguồn cũng có thể phải đối mặt với áp lực gián tiếp để đảm bảo rằng việc sử dụng các mô hình GPAI của họ phù hợp với các nguyên tắc của Bộ quy tắc.
Sự phát triển của công nghệ: Tốc độ phát triển AI nhanh chóng có nghĩa là Bộ quy tắc thực hành sẽ cần phải là một tài liệu sống. Các kỹ thuật mới để thu thập dữ liệu, đào tạo mô hình và tạo đầu ra có thể xuất hiện, đòi hỏi phải cập nhật các điều khoản của Bộ quy tắc. Việc tham chiếu đến siêu dữ liệu ‘tiêu chuẩn ngành’ và các giải pháp ‘được áp dụng rộng rãi’ thừa nhận nhu cầu thích ứng liên tục này.
Hài hòa quốc tế: AI Act của EU là một đạo luật tiên phong, nhưng nó không hoạt động trong chân không. Các khu vực pháp lý khác cũng đang vật lộn với những thách thức của việc điều chỉnh AI. Việc hài hòa quốc tế các quy định về AI, bao gồm các điều khoản bản quyền, sẽ rất quan trọng để tránh sự phân mảnh và đảm bảo một sân chơi bình đẳng cho các nhà phát triển AI.
Tác động đến đổi mới: Bộ quy tắc thực hành nhằm mục đích đạt được sự cân bằng giữa việc thúc đẩy đổi mới AI và bảo vệ bản quyền. Tuy nhiên, tác động của các quy định này đối với tốc độ và hướng phát triển AI vẫn còn phải xem xét. Một số người cho rằng các quy định quá nghiêm ngặt có thể kìm hãm sự đổi mới, trong khi những người khác cho rằng các quy tắc rõ ràng là cần thiết để thúc đẩy sự phát triển AI có trách nhiệm.
Thực thi và Giám sát Việc tuân thủ sẽ được kiểm tra như thế nào? Hiệu quả của các quy tắc sẽ phụ thuộc phần lớn vào các cơ chế được đưa ra để thực thi và giám sát.
Dự thảo 3 của Bộ quy tắc thực hành GPAI là một tài liệu phức tạp và đang phát triển với những tác động sâu rộng. Nó thể hiện một nỗ lực đáng kể để giải quyết các thách thức về tuân thủ bản quyền trong thời đại AI, nhưng nó cũng là một công việc đang được tiến hành. Đối thoại liên tục giữa các bên liên quan, bao gồm các nhà cung cấp GPAI, chủ sở hữu quyền, các nhà hoạch định chính sách và cộng đồng AI rộng lớn hơn, sẽ rất cần thiết để đảm bảo rằng Bộ quy tắc đạt được các mục tiêu đã định và vẫn phù hợp trước sự thay đổi công nghệ nhanh chóng.