Hiệu ứng Ghibli: AI tạo ảnh OpenAI gây bão bản quyền

Thế giới kỹ thuật số vận động với tốc độ chóng mặt, và không nơi nào điều này rõ ràng hơn trong lĩnh vực trí tuệ nhân tạo. Chỉ trong vòng một ngày sau khi OpenAI tung ra khả năng tạo ảnh mới nhất được tích hợp vào ChatGPT, các nền tảng mạng xã hội đã trở thành những bức vẽ cho một xu hướng nghệ thuật đặc biệt, nhưng ngay lập tức có thể nhận ra: các meme và hình ảnh được thể hiện theo phong cách riêng biệt, kỳ ảo của Studio Ghibli. Hãng phim hoạt hình Nhật Bản được yêu thích này, lực lượng sáng tạo đằng sau những kho báu điện ảnh như “My Neighbor Totoro” và bộ phim đoạt giải Oscar “Spirited Away”, đột nhiên thấy thẩm mỹ độc đáo của mình bị sao chép đến nhàm chán, áp dụng cho mọi thứ từ các tỷ phú công nghệ đến các sử thi giả tưởng.

Hiện tượng này không hề tinh tế. Các bảng tin tràn ngập những diễn giải theo phong cách Ghibli về các nhân vật đương đại và vũ trụ hư cấu. Chúng ta đã chứng kiến Elon Musk được tái hiện như một nhân vật có thể đang lang thang trong một khu rừng huyền bí, các cảnh trong “The Lord of the Rings” được phủ lên một nét vẽ anime mềm mại, và thậm chí cả cựu Tổng thống Hoa Kỳ, Donald Trump, cũng được khắc họa qua lăng kính nghệ thuật đặc trưng này. Xu hướng này trở nên phổ biến đến mức CEO của chính OpenAI, Sam Altman, dường như đã sử dụng một bức chân dung theo phong cách Ghibli, có lẽ được tạo ra bởi chính công cụ đang gây ra cuộc thảo luận, làm ảnh đại diện của mình. Cơ chế dường như đơn giản: người dùng đưa hình ảnh hiện có vào ChatGPT, yêu cầu AI diễn giải lại chúng theo phong cách Ghibli mang tính biểu tượng. Sự bùng nổ của việc bắt chước phong cách này, dù tạo ra sự thích thú lan truyền, ngay lập tức làm dấy lên những lo ngại sâu sắc xung quanh trí tuệ nhân tạo và quyền sở hữu trí tuệ.

Tia Lửa Lan Truyền và Tiếng Vang Của Nó

Đây không phải là lần đầu tiên một tính năng AI mới gây ra những gợn sóng liên quan đến việc thao túng hình ảnh và bản quyền. Bản cập nhật GPT-4o của OpenAI, cho phép chuyển đổi phong cách này, ra mắt ngay sau khi Google giới thiệu các chức năng hình ảnh AI tương đương trong mô hình Gemini Flash của mình. Bản phát hành đó cũng đã có khoảnh khắc nổi tiếng lan truyền vào đầu tháng Ba, mặc dù vì một lý do khác: người dùng phát hiện ra khả năng xóa watermark khỏi hình ảnh của nó, một hành vi thách thức trực tiếp quyền kiểm soát của các nhiếp ảnh gia và nghệ sĩ đối với tác phẩm của họ.

Những phát triển này từ các gã khổng lồ công nghệ như OpenAI và Google biểu thị một bước nhảy vọt đáng kể về khả năng tiếp cận và năng lực của việc tạo nội dung do AI điều khiển. Điều mà trước đây đòi hỏi phần mềm chuyên dụng và kỹ năng nghệ thuật đáng kể – sao chép một phong cách hình ảnh phức tạp – giờ đây có thể được mô phỏng gần đúng bằng một lời nhắc văn bản đơn giản. Gõ “theo phong cách của Studio Ghibli,” và AI sẽ thực hiện. Trong khi người dùng thích thú với sự mới lạ và tiềm năng sáng tạo, sự dễ dàng sao chép này lại chiếu một ánh sáng gay gắt vào một câu hỏi cơ bản ám ảnh ngành công nghiệp AI: Làm thế nào các mô hình mạnh mẽ này được huấn luyện để đạt được sự bắt chước như vậy? Điểm mấu chốt của vấn đề nằm ở dữ liệu được các hệ thống này tiếp nhận. Liệu các công ty như OpenAI có đang cung cấp cho thuật toán của họ một lượng lớn tài liệu có bản quyền, bao gồm cả các khung hình từ phim của Studio Ghibli, mà không có sự cho phép hoặc bồi thường? Và quan trọng là, việc huấn luyện như vậy có cấu thành hành vi vi phạm bản quyền không?

Bên Dưới Bề Mặt: Vấn Đề Nan Giải Về Bản Quyền

Câu hỏi này không chỉ mang tính học thuật; nó tạo thành nền tảng của nhiều cuộc chiến pháp lý có mức độ rủi ro cao hiện đang diễn ra chống lại các nhà phát triển mô hình AI tạo sinh. Bối cảnh pháp lý xung quanh dữ liệu huấn luyện AI, nói một cách nhẹ nhàng, là rất mơ hồ. Evan Brown, một luật sư sở hữu trí tuệ thuộc công ty luật Neal & McDevitt, mô tả tình hình hiện tại là đang hoạt động trong một “vùng xám pháp lý” đáng kể.

Một điểm phức tạp chính là phong cách nghệ thuật, khi đứng riêng lẻ, thường không được bảo vệ bởi luật bản quyền. Bản quyền bảo vệ sự thể hiện cụ thể của một ý tưởng – bức tranh hoàn chỉnh, cuốn tiểu thuyết đã viết, bài hát đã thu âm, các khung hình phim thực tế – chứ không phải kỹ thuật cơ bản, tâm trạng, hoặc các yếu tố hình ảnh đặc trưng tạo nên một “phong cách”. Do đó, Brown lưu ý, OpenAI có thể không vi phạm văn bản luật chỉ bằng cách tạo ra những hình ảnh trông giống như chúng có thể đến từ Studio Ghibli. Hành động tạo ra một hình ảnh mới theo một phong cách nhất định, về mặt bản chất, không phải là vi phạm bản quyền đối với chính phong cách đó.

Tuy nhiên, phân tích không thể dừng lại ở đó. Vấn đề quan trọng, như Brown nhấn mạnh, xoay quanh quá trình mà AI học cách sao chép phong cách đó. Các chuyên gia cho rằng, rất có thể, để đạt được sự mô phỏng phong cách chính xác như vậy, mô hình AI đã phải được huấn luyện trên một bộ dữ liệu khổng lồ, có khả năng bao gồm hàng triệu hình ảnh có bản quyền – thậm chí có thể là các khung hình trực tiếp – từ thư viện điện ảnh của Ghibli. Hành động sao chép các tác phẩm này vào cơ sở dữ liệu huấn luyện, ngay cả với mục đích “học hỏi”, bản thân nó có thể bị coi là vi phạm, bất kể kết quả cuối cùng có phải là bản sao trực tiếp của bất kỳ khung hình nào hay không.

“Điều này thực sự đưa chúng ta trở lại câu hỏi cơ bản đã âm ỉ trong vài năm qua,” Brown phát biểu trong một cuộc phỏng vấn. “Hàm ý vi phạm bản quyền của việc các hệ thống này đi ra ngoài, thu thập dữ liệu trên web và tiếp nhận một lượng lớn nội dung có khả năng có bản quyền vào cơ sở dữ liệu huấn luyện của chúng là gì?” Thách thức pháp lý cốt lõi nằm ở việc xác định xem giai đoạn sao chép ban đầu này, cần thiết cho chức năng của AI, có được phép theo các khuôn khổ bản quyền hiện hành hay không.

Đi Trên Dây Sử Dụng Hợp Lý (Fair Use)

Biện pháp bào chữa chính thường được các công ty AI viện dẫn trong bối cảnh này là học thuyết sử dụng hợp lý (fair use). Sử dụng hợp lý là một nguyên tắc pháp lý phức tạp trong luật bản quyền Hoa Kỳ cho phép sử dụng hạn chế tài liệu có bản quyền mà không cần sự cho phép của chủ sở hữu quyền trong những trường hợp cụ thể. Tòa án thường phân tích bốn yếu tố để xác định xem một việc sử dụng cụ thể có đủ điều kiện là sử dụng hợp lý hay không:

  1. Mục đích và tính chất của việc sử dụng: Việc sử dụng có mang tính biến đổi (thêm ý nghĩa hoặc thông điệp mới) không? Nó có mục đích thương mại hay phi lợi nhuận/giáo dục? Các công ty AI lập luận rằng việc huấn luyện mô hình là mang tính biến đổi vì AI học các mẫu thay vì chỉ lưu trữ bản sao, và mục tiêu cuối cùng là tạo ra các tác phẩm mới. Các nhà phê bình cho rằng việc sử dụng mang tính thương mại cao và thường cạnh tranh trực tiếp với thị trường của các tác phẩm gốc.
  2. Bản chất của tác phẩm có bản quyền: Việc sử dụng các tác phẩm dựa trên sự thật thường được ưu tiên hơn các tác phẩm có tính sáng tạo cao. Huấn luyện trên các tác phẩm nghệ thuật như phim hoặc tiểu thuyết có thể chống lại việc sử dụng hợp lý. Phim của Studio Ghibli, là những tác phẩm rất độc đáo và sáng tạo, thuộc loại thứ hai.
  3. Số lượng và phần đáng kể của phần được sử dụng: Bao nhiêu phần của tác phẩm gốc đã được sao chép? Mặc dù AI có thể không tái tạo toàn bộ một bộ phim, việc huấn luyện có khả năng liên quan đến việc sao chép một lượng lớn khung hình hoặc hình ảnh. Liệu việc sao chép hàng triệu khung hình có cấu thành việc sử dụng một phần “đáng kể” của toàn bộ tác phẩm Ghibli, ngay cả khi không có kết quả đầu ra nào sao chép một phần lớn? Đây vẫn là một điểm gây tranh cãi.
  4. Ảnh hưởng của việc sử dụng đối với thị trường tiềm năng hoặc giá trị của tác phẩm có bản quyền: Nội dung do AI tạo ra có thay thế thị trường cho các tác phẩm gốc hoặc các sản phẩm phái sinh được cấp phép không? Nếu người dùng có thể tạo hình ảnh theo phong cách Ghibli theo yêu cầu, điều đó có làm giảm giá trị của nghệ thuật, hàng hóa hoặc cơ hội cấp phép chính thức của Ghibli không? Các nhà sáng tạo lập luận mạnh mẽ rằng có.

Hiện tại, nhiều tòa án đang vật lộn với việc liệu việc huấn luyện các mô hình ngôn ngữ lớn (LLMs) và các trình tạo ảnh trên dữ liệu có bản quyền có cấu thành sử dụng hợp lý hay không. Không có tiền lệ pháp lý rõ ràng nào giải quyết cụ thể bối cảnh công nghệ hiện đại này, khiến kết quả trở nên rất không chắc chắn. Các quyết định trong những vụ kiện này sẽ có ý nghĩa sâu sắc đối với tương lai của cả sự phát triển AI và các ngành công nghiệp sáng tạo.

Bước Đi Trên Dây Của OpenAI: Chính Sách và Thực Tiễn

Để điều hướng địa hình pháp lý không chắc chắn này, OpenAI đã cố gắng vạch ra những ranh giới, mặc dù những ranh giới này có vẻ hơi mờ nhạt khi xem xét kỹ hơn. Theo một tuyên bố được cung cấp bởi người phát ngôn của OpenAI cho TechCrunch, chính sách của công ty quy định rằng ChatGPT nên từ chối các yêu cầu sao chép “phong cách của các nghệ sĩ cá nhân còn sống”. Tuy nhiên, chính sách tương tự lại cho phép rõ ràng việc sao chép “các phong cách studio rộng hơn”.

Sự phân biệt này ngay lập tức đặt ra câu hỏi. Điều gì cấu thành một “phong cách studio rộng hơn” nếu không phải là tầm nhìn và sự thực thi tổng hợp của các nghệ sĩ chủ chốt liên quan đến studio đó? Trong trường hợp của Studio Ghibli, thẩm mỹ của studio gắn liền chặt chẽ với tầm nhìn của người đồng sáng lập và đạo diễn chính, Hayao Miyazaki, một nghệ sĩ vẫn còn sống. Liệu người ta có thể thực sự tách rời “phong cách Ghibli” khỏi sự chỉ đạo, thiết kế nhân vật và các mối quan tâm về chủ đề đặc trưng của Miyazaki không? Chính sách này dường như dựa trên một sự phân biệt có khả năng là nhân tạo, có thể không đứng vững trước sự xem xét kỹ lưỡng, đặc biệt là khi bản sắc của studio gắn bó mạnh mẽ với những người sáng tạo cụ thể, có thể nhận dạng được.

Hơn nữa, hiện tượng Ghibli không phải là một sự cố cá biệt. Người dùng đã dễ dàng chứng minh khả năng của trình tạo ảnh GPT-4o trong việc bắt chước các phong cách dễ nhận biết khác. Các báo cáo xuất hiện về những bức chân dung được tạo ra theo phong cách không thể nhầm lẫn của Dr. Seuss (Theodor Geisel, đã qua đời, nhưng di sản của ông bảo vệ quyết liệt phong cách riêng biệt của mình) và những bức ảnh cá nhân được tái hiện với giao diện và cảm nhận đặc trưng của Pixar Animation Studios. Điều này cho thấy khả năng bắt chước phong cách là rộng rãi, và sự phân biệt chính sách giữa “nghệ sĩ còn sống” và “phong cách studio” có thể chỉ là một biện pháp phản ứng hơn là một ranh giới vững chắc về mặt kỹ thuật hoặc nhất quán về mặt đạo đức. Việc thử nghiệm trên các trình tạo ảnh AI khác nhau xác nhận quan sát này: trong khi những công cụ khác như Google Gemini, xAI Grok và Playground.ai có thể cố gắng mô phỏng phong cách, phiên bản mới nhất của OpenAI dường như đặc biệt thành thạo trong việc nắm bắt các sắc thái của thẩm mỹ Studio Ghibli, khiến nó trở thành tâm điểm của cuộc tranh cãi hiện tại.

Cơn Bão Đang Tích Tụ: Bối Cảnh Kiện Tụng

Những hình ảnh Ghibli lan truyền đóng vai trò như một minh họa sống động cho các vấn đề cốt lõi của các cuộc chiến pháp lý lớn đang diễn ra. Một số vụ kiện nổi bật đặt các nhà sáng tạo và nhà xuất bản chống lại các nhà phát triển AI, thách thức tính hợp pháp của các hoạt động huấn luyện của họ.

  • The New York Times và các nhà xuất bản khác vs. OpenAI: Vụ kiện mang tính bước ngoặt này cáo buộc rằng OpenAI đã tham gia vào hành vi vi phạm bản quyền hàng loạt bằng cách huấn luyện các mô hình của mình, bao gồm cả ChatGPT, trên hàng triệu bài báo có bản quyền mà không có sự cho phép, ghi công hoặc thanh toán. Các nhà xuất bản cho rằng điều này làm suy yếu mô hình kinh doanh của họ và cấu thành cạnh tranh không lành mạnh.
  • Authors Guild và các tác giả cá nhân vs. OpenAI và Microsoft: Các khiếu nại tương tự đang được theo đuổi bởi các tác giả cho rằng sách của họ đã bị sao chép bất hợp pháp để huấn luyện các mô hình ngôn ngữ lớn.
  • Nghệ sĩ vs. Stability AI, Midjourney, DeviantArt: Các nghệ sĩ thị giác đã đệ đơn kiện tập thể chống lại các công ty tạo ảnh AI, lập luận rằng tác phẩm của họ đã bị thu thập từ internet và sử dụng để huấn luyện mà không có sự đồng ý, cho phép AI tạo ra các tác phẩm cạnh tranh trực tiếp với họ.
  • Getty Images vs. Stability AI: Gã khổng lồ ảnh stock đang kiện Stability AI vì cáo buộc sao chép hàng triệu hình ảnh của mình, trong một số trường hợp còn nguyên cả watermark, để huấn luyện mô hình Stable Diffusion.

Những vụ kiện này cùng nhau lập luận rằng việc tiếp nhận trái phép tài liệu có bản quyền để huấn luyện các mô hình AI là vi phạm các quyền độc quyền của chủ sở hữu bản quyền để sao chép, phân phối và tạo ra các tác phẩm phái sinh. Họ không chỉ tìm kiếm bồi thường thiệt hại bằng tiền mà còn có khả năng yêu cầu các lệnh cấm có thể buộc các công ty AI phải huấn luyện lại mô hình của họ chỉ sử dụng dữ liệu được cấp phép hợp lệ – một nhiệm vụ sẽ cực kỳ tốn kém và tốn thời gian, có khả năng làm tê liệt khả năng hiện tại của họ. Ngược lại, các bị đơn phụ thuộc rất nhiều vào các lập luận về sử dụng hợp lý và khẳng định rằng công nghệ của họ thúc đẩy sự đổi mới và tạo ra các hình thức biểu đạt mới.

Cuộc Chạy Đua Vũ Trang Công Nghệ vs. Sự Thanh Trừng Pháp Lý

Bất chấp các mối đe dọa pháp lý tiềm ẩn và những tình huống khó xử về đạo đức rõ ràng, tốc độ phát triển AI không có dấu hiệu chậm lại. Các công ty như OpenAI và Google đang bị khóa chặt trong một cuộc chiến cạnh tranh khốc liệt, liên tục tung ra các tính năng và mô hình mới để chiếm lĩnh thị phần và thể hiện sự vượt trội về công nghệ. Việc triển khai nhanh chóng các công cụ tạo ảnh tiên tiến, có khả năng bắt chước phong cách tinh vi, dường như được thúc đẩy bởi mong muốn thu hút người dùng và giới thiệu tiến bộ, ngay cả khi nền tảng pháp lý vẫn còn lung lay.

Thực tế là OpenAI đã trải qua nhu cầu cao đến mức phải trì hoãn việc triển khai công cụ hình ảnh mới cho người dùng miễn phí nhấn mạnh sự mê hoặc và háo hức của công chúng trong việc tương tác với những khả năng này. Đối với các công ty AI, sự tham gia của người dùng và việc trình diễn các tính năng tiên tiến hiện tại có thể quan trọng hơn các rủi ro pháp lý tiềm ẩn, hoặc có lẽ đó là một canh bạc có tính toán rằng luật pháp cuối cùng sẽ thích ứng theo hướng có lợi cho họ, hoặc rằng các thỏa thuận dàn xếp có thể đạt được.

Tình huống này làm nổi bật sự căng thẳng ngày càng tăng giữa sự tăng tốc theo cấp số nhân của khả năng công nghệ và tốc độ có chủ ý, đo lường hơn của các khuôn khổ pháp lý và đạo đức. Luật pháp thường tụt hậu so với công nghệ, và AI tạo sinh đặt ra một thách thức đặc biệt phức tạp, buộc xã hội phải xem xét lại các quan niệm lâu đời về quyền tác giả, sự sáng tạo và sở hữu trí tuệ trong thời đại kỹ thuật số.

Tiếng Vang và Tiền Lệ

Lịch sử cung cấp những điểm tương đồng nơi các công nghệ đột phá đã phá vỡ các chuẩn mực bản quyền đã được thiết lập. Sự ra đời của máy photocopy đã làm dấy lên lo ngại về việc sao chép trái phép. Đàn piano tự chơi đã thách thức các định nghĩa về quyền biểu diễn âm nhạc. Máy ghi băng video (VCR) đã dẫn đến “vụ kiện Betamax” mang tính bước ngoặt (Sony Corp. of America v. Universal City Studios, Inc.), nơi Tòa án Tối cao Hoa Kỳ phán quyết rằng việc ghi lại các chương trình truyền hình để xem sau (“time-shifting”) cấu thành sử dụng hợp lý, một phần vì công nghệ này có những mục đích sử dụng không vi phạm đáng kể. Sau đó, các nền tảng chia sẻ nhạc kỹ thuật số như Napster đã gây ra một làn sóng tranh chấp pháp lý khác về phân phối trực tuyến và vi phạm bản quyền, cuối cùng dẫn đến các mô hình cấp phép mới như iTunes và các dịch vụ phát trực tuyến.

Mặc dù những ví dụ lịch sử này cung cấp bối cảnh, quy mô và bản chất của AI tạo sinh lại đặt ra những thách thức độc đáo. Không giống như VCR, chủ yếu cho phép sao chép cá nhân, AI tạo sinh tạo ra nội dung mới dựa trên các mẫu được học từ lượng lớn dữ liệu đầu vào có khả năng có bản quyền, đặt ra những câu hỏi khác nhau về tính biến đổi và tác hại thị trường. Liệu tòa án sẽ thấy việc huấn luyện AI tương tự như time-shifting hay giống hơn với hành vi vi phạm hàng loạt được tạo điều kiện bởi Napster vẫn còn phải xem xét.

Tương Lai Chưa Được Viết

Cơn sốt hiện tại xung quanh các hình ảnh theo phong cách Ghibli do AI tạo ra không chỉ là một xu hướng thoáng qua trên internet; đó là một triệu chứng của một cuộc đấu tranh lớn hơn nhiều, đang diễn ra để xác định ranh giới của sở hữu trí tuệ trong thời đại trí tuệ nhân tạo. Kết quả của các vụ kiện đang chờ xử lý, các hành động lập pháp tiềm năng và sự phát triển của các thông lệ trong ngành (chẳng hạn như các thỏa thuận cấp phép cho dữ liệu huấn luyện) sẽ định hình quỹ đạo phát triển của AI và tác động của nó đối với các ngành nghề sáng tạo trong nhiều năm tới.

Liệu tòa án sẽ phán quyết rằng việc huấn luyện trên dữ liệu có bản quyền đòi hỏi sự cho phép và cấp phép rõ ràng, có khả năng buộc phải tái cấu trúc tốn kém các mô hình AI hiện có? Hay họ sẽ thấy rằng việc huấn luyện như vậy thuộc phạm vi sử dụng hợp lý, mở đường cho sự phát triển nhanh chóng liên tục nhưng có khả năng làm giảm giá trị nội dung do con người tạo ra? Liệu một giải pháp trung gian có thể xuất hiện, liên quan đến các chương trình cấp phép bắt buộc mới hoặc các thỏa thuận toàn ngành?

Câu trả lời vẫn còn khó nắm bắt. Điều rõ ràng là sự dễ dàng mà AI hiện có thể bắt chước các phong cách nghệ thuật riêng biệt buộc phải đối mặt với những câu hỏi cơ bản về sự sáng tạo, quyền sở hữu và giá trị mà chúng ta đặt vào sự biểu đạt của con người. Những meme Ghibli kỳ ảo tràn ngập internet chỉ là bề mặt quyến rũ, dễ tiêu hóa của một tảng băng trôi pháp lý và đạo đức sâu sắc và phức tạp, mà toàn bộ kích thước của nó chỉ mới bắt đầu lộ diện. Việc giải quyết những vấn đề này sẽ quyết định không chỉ tương lai của AI mà còn cả bối cảnh cho các nghệ sĩ, nhà văn, nhạc sĩ và những người sáng tạo thuộc mọi lĩnh vực trong những thập kỷ tới.