吉卜力效應:OpenAI圖像生成器引爆版權風暴

數位世界的發展速度快如閃電,這一點在人工智能領域尤為明顯。就在 OpenAI 將其最新的圖像生成功能整合到 ChatGPT 中並發布後僅僅一天,社交媒體平台便成為了一種奇特卻又一眼可辨的藝術潮流的畫布:以 Studio Ghibli 獨特、奇幻風格渲染的迷因和圖像。這家備受喜愛的日本動畫公司,曾創作出像《龍貓》(My Neighbor Totoro) 和奧斯卡獲獎作品《神隱少女》(Spirited Away) 這樣的電影瑰寶,其獨特的美學風格突然被無休止地複製,應用於從科技億萬富翁到奇幻史詩等各種事物上。

這個現象並不隱晦。社交媒體動態充斥著對當代人物和虛構宇宙的 Ghibli 式詮釋。我們看到 Elon Musk 被重新想像成一個可能漫步在神秘森林中的角色,《魔戒》(The Lord of the Rings) 的場景被賦予了柔和、繪畫般的動畫觸感,甚至美國前總統 Donald Trump 也被透過這種特定的藝術鏡頭描繪。這股潮流如此引人注目,以至於 OpenAI 的 CEO Sam Altman 似乎也將一張可能是由引發討論的同款工具生成的 Ghibli 風格肖像,用作自己的個人頭像。其機制似乎很簡單:用戶將現有圖像輸入 ChatGPT,提示 AI 以標誌性的 Ghibli 風格重新詮釋它們。這種風格模仿的爆炸式增長,雖然帶來了病毒式的娛樂效果,卻也立即重新引發了圍繞人工智能和知識產權的深層焦慮。

病毒式火花及其迴響

這並非首次新的 AI 功能因圖像處理和版權問題引發波瀾。OpenAI 的 GPT-4o 更新實現了這種風格轉換,而就在此之前不久,Google 在其 Gemini Flash 模型中也引入了類似的 AI 圖像功能。那次發布在三月初也曾因不同原因引發病毒式關注:用戶發現它能熟練地去除圖像上的浮水印,這種做法直接挑戰了攝影師和藝術家對其作品的控制權。

來自 OpenAI 和 Google 等科技巨頭的這些發展,標誌著 AI 驅動內容創作的可及性和能力實現了重大飛躍。過去需要專業軟體和相當藝術技巧才能完成的事情——複製一種複雜的視覺風格——現在只需一個簡單的文本提示即可近似實現。輸入「in the style of Studio Ghibli」,AI 便會遵從。雖然用戶對這種新奇性和創造潛力感到欣喜,但這種複製的便捷性卻將一個困擾 AI 行業的基本問題置於聚光燈下:這些強大的模型是如何被訓練以實現這種模仿的? 問題的核心在於這些系統所吸收的數據。像 OpenAI 這樣的公司是否在未經許可或補償的情況下,將包括 Studio Ghibli 電影畫面在內的大量受版權保護的材料,餵給他們的演算法?以及至關重要的是,這樣的訓練是否構成版權侵權?

表面之下:版權難題

這個問題不僅僅是學術性的;它構成了目前針對生成式 AI 模型開發者展開的眾多高風險法律戰的基石。圍繞 AI 訓練數據的法律環境,委婉地說,是模糊不清的。Neal & McDevitt 律師事務所的知識產權律師 Evan Brown 將當前狀況描述為在一個顯著的「法律灰色地帶」中運作。

一個關鍵的複雜點在於,藝術風格本身,通常不受版權法保護。版權保護的是思想的具體表達——完成的畫作、寫成的小說、錄製的歌曲、實際的電影畫面——而不是構成「風格」的潛在技巧、氛圍或特徵性視覺元素。因此,Brown 指出,OpenAI 可能僅僅因為產生了看起來像是來自 Studio Ghibli 的圖像,而並未違反法律條文。生成某種風格的圖像的行為,其本身並不構成對風格本身的版權侵權。

然而,分析不能止步於此。正如 Brown 強調的,關鍵問題在於 AI 學習複製該風格的過程。專家們認為,要實現如此精確的風格模仿,AI 模型極有可能需要在一個巨大的數據集上進行訓練,該數據集可能包含了數百萬張受版權保護的圖像——甚至可能直接來自 Ghibli 電影庫的畫面。將這些作品複製到訓練數據庫中的行為,即使是為了「學習」的目的,本身也可能被視為侵權,無論最終輸出是否直接複製了任何單一畫面。

「這確實讓我們回到了過去幾年一直在醞釀的基本問題,」Brown 在一次採訪中表示。「這些系統出去抓取網頁,並將大量可能受版權保護的內容吸收到它們的訓練數據庫中,這會產生什麼樣的版權侵權影響?」核心的法律挑戰在於確定這個對於 AI 功能至關重要的初始複製階段,在現有的版權框架下是否被允許。

合理使用的鋼索

AI 公司在此背景下經常援引的主要辯護理由是合理使用 (fair use) 原則。合理使用是美國版權法中一個複雜的法律原則,允許在特定情況下未經權利人許可有限度地使用受版權保護的材料。法院通常分析四個因素來確定特定使用是否符合合理使用的條件:

  1. 使用的目的和性質: 使用是否具有轉化性(增加了新的意義或訊息)?是商業性的還是非營利/教育性的?AI 公司辯稱訓練模型是轉化性的,因為 AI 學習的是模式而非僅僅儲存副本,且最終目標是創造新作品。批評者則認為這種使用具有高度商業性,且常常直接與原作市場競爭。
  2. 受版權保護作品的性質: 使用事實性作品通常比使用高度創造性的作品更有利。在電影或小說等藝術作品上進行訓練可能會對合理使用不利。Studio Ghibli 的電影具有高度原創性和創造性,屬於後者。
  3. 所使用部分的數量和實質性: 複製了原作的多少?雖然 AI 可能不會複製整部電影,但訓練可能涉及複製大量的畫面或圖像。即使沒有任何單一輸出複製了 Ghibli 作品的大部分內容,複製數百萬個畫面是否構成使用了 Ghibli 全部作品的「實質性」部分?這仍然是一個有爭議的點。
  4. 使用對受版權保護作品潛在市場或價值的影響: AI 生成的內容是否取代了原作或授權衍生品的市場?如果用戶可以按需生成 Ghibli 風格的圖像,這是否會降低官方 Ghibli 藝術品、商品或授權機會的價值?創作者們強烈認為確實如此。

目前,多家法院正在努力解決在受版權保護的數據上訓練大型語言模型 (LLMs) 和圖像生成器是否構成合理使用的問題。目前尚無專門針對這種現代技術背景的權威法律先例,使得判決結果充滿高度不確定性。這些案件的判決將對 AI 發展和創意產業的未來產生深遠影響。

OpenAI 的鋼索行走:政策與實踐

在應對這片不確定的法律領域時,OpenAI 試圖劃定界線,儘管這些界線在仔細審視下顯得有些模糊。根據 OpenAI 發言人向 TechCrunch 提供的一份聲明,該公司的政策規定 ChatGPT 應拒絕複製「在世的個別藝術家風格」的要求。然而,同一政策明確允許複製「更廣泛的工作室風格」。

這種區分立即引發了疑問。如果不是該工作室相關主要藝術家的集體願景和執行,什麼才構成「更廣泛的工作室風格」?就 Studio Ghibli 而言,該工作室的美學與其聯合創始人兼主要導演宮崎駿 (Hayao Miyazaki) 的願景密不可分,而他是一位健在的藝術家。人們真的能將「Ghibli 風格」與宮崎駿標誌性的導演手法、角色設計和主題關懷分開嗎?該政策似乎依賴於一種可能站不住腳的人為區分,尤其是在工作室的身份與特定的、可識別的創作者如此緊密相連的情況下。

此外,Ghibli 現象並非孤立事件。用戶已輕易證明 GPT-4o 的圖像生成器能夠模仿其他可識別的風格。有報導稱,有人創作了具有 Dr. Seuss(Theodor Geisel,已故,但其遺產管理機構極力保護其獨特風格)明確風格的肖像,以及將個人照片以 Pixar Animation Studios 的特有外觀和感覺重新構想。這表明風格模仿的能力是廣泛的,而「在世藝術家」和「工作室風格」之間的政策區分,可能更多的是一種反應性措施,而非技術上穩健或倫理上一致的界限。對各種 AI 圖像生成器的測試證實了這一觀察:雖然像 Google 的 Gemini、xAI 的 Grok 和 Playground.ai 等其他工具可以嘗試風格模仿,但 OpenAI 的最新版本似乎在捕捉 Studio Ghibli 美學的細微差別方面尤為出色,使其成為當前爭議的焦點。

風暴聚集:訴訟格局

病毒式傳播的 Ghibli 圖像生動地說明了已在進行中的重大法律戰的核心問題。幾起引人注目的訴訟將創作者和出版商置於 AI 開發者的對立面,挑戰其訓練實踐的合法性。

  • 《紐約時報》(The New York Times) 及其他出版商 vs. OpenAI: 這起里程碑式的案件指控 OpenAI 在未經許可、署名或付費的情況下,利用數百萬篇受版權保護的新聞文章訓練其模型(包括 ChatGPT),從事了大規模版權侵權行為。出版商認為這破壞了他們的商業模式,並構成不正當競爭。
  • 作家協會 (Authors Guild) 及個別作家 vs. OpenAI 和 Microsoft: 作家們也提出了類似的訴訟,他們聲稱自己的書籍被非法複製用於訓練大型語言模型。
  • 藝術家 vs. Stability AI、Midjourney、DeviantArt: 視覺藝術家已對 AI 圖像生成公司提起集體訴訟,認為他們的作品在未經同意的情況下被從互聯網上抓取並用於訓練,使得 AI 能夠生成與他們直接競爭的作品。
  • Getty Images vs. Stability AI: 這家圖庫巨頭正在起訴 Stability AI,指控其涉嫌複製其數百萬張圖像(在某些情況下甚至帶有浮水印)來訓練 Stable Diffusion 模型。

這些訴訟共同主張,未經授權將受版權保護的材料用於訓練 AI 模型,侵犯了版權持有人複製、發行和創作衍生作品的專有權利。他們不僅尋求金錢賠償,還可能尋求禁令,迫使 AI 公司僅使用獲得適當許可的數據重新訓練其模型——這項任務將極其昂貴且耗時,可能嚴重削弱其現有能力。被告方則主要依賴合理使用論點,並聲稱他們的技術促進了創新並創造了新的表達形式。

技術軍備競賽 vs. 法律清算

儘管面臨迫在眉睫的法律威脅和明顯的倫理困境,AI 發展的步伐卻絲毫沒有放緩的跡象。像 OpenAI 和 Google 這樣的公司正陷入激烈的競爭戰,不斷推出新功能和模型以佔領市場份額並展示技術優勢。能夠進行複雜風格模仿的先進圖像生成工具的快速部署,似乎是為了吸引用戶和展示進步,即使其法律基礎仍然不穩固。

OpenAI 的新圖像工具需求如此之高,以至於不得不推遲向免費層級用戶的推出,這一事實突顯了公眾對這些功能的著迷和渴望參與。對於 AI 公司而言,用戶參與度和展示尖端功能目前可能比潛在的法律風險更重要,或者這或許是一場精心計算的賭博,賭法律最終會向有利於他們的方向調整,或者可以達成和解。

這種情況凸顯了技術能力指數級加速與法律和倫理框架更為審慎、有節奏的步伐之間日益加劇的緊張關係。法律往往滯後於技術,而生成式 AI 提出了一個尤為複雜的挑戰,迫使社會在數位時代重新思考關於作者身份、創造力和知識產權的長期觀念。

迴響與先例

歷史上不乏突破性技術擾亂既定版權規範的先例。影印機的出現引發了對未經授權複製的擔憂。自動演奏鋼琴挑戰了音樂表演權的定義。錄影機 (VCR) 導致了里程碑式的「Betamax 案」(Sony Corp. of America v. Universal City Studios, Inc.),美國最高法院在該案中裁定,錄製電視節目供以後觀看(「時移」)構成合理使用,部分原因是該技術具有大量的非侵權用途。後來,像 Napster 這樣的數位音樂共享平台引發了另一波關於線上發行和版權侵權的法律戰,最終促成了像 iTunes 和串流服務這樣的新授權模式。

雖然這些歷史案例提供了背景,但生成式 AI 的規模和性質帶來了獨特的挑戰。與主要用於個人複製的 VCR 不同,生成式 AI 基於從可能海量的受版權保護輸入中學習到的模式來創造內容,這就引發了關於轉化性和市場損害的不同問題。法院是否會認為 AI 訓練類似於時移,還是更接近於 Napster 所助長的大規模侵權,仍有待觀察。

未寫的未來

當前圍繞 AI 生成的 Ghibli 風格圖像的狂熱,不僅僅是一種短暫的互聯網趨勢;它是一個更大、持續進行的鬥爭的症狀,旨在界定人工智能時代知識產權的邊界。懸而未決的訴訟結果、潛在的立法行動以及行業實踐的演變(例如訓練數據的許可協議),將在未來數年塑造 AI 發展的軌跡及其對創意行業的影響。

法院會裁定在受版權保護的數據上進行訓練需要明確的許可和授權,從而可能迫使現有 AI 模型進行代價高昂的重組嗎?還是會認定此類訓練屬於合理使用,為持續快速發展鋪平道路,但可能貶低人類創作內容的價值?是否會出現中間地帶,涉及新的強制許可方案或全行業協議?

答案仍然難以捉摸。顯而易見的是,AI 現在能夠輕易模仿獨特藝術風格,迫使我們直面關於創造力、所有權以及我們賦予人類表達的價值的基本問題。充斥互聯網的奇幻 Ghibli 迷因,僅僅是一個深刻複雜的法律和倫理冰山的迷人、易於消化的表面,其全貌才剛剛開始顯現。這些問題的解決不僅將決定 AI 的未來,也將決定未來幾十年藝術家、作家、音樂家和各類創作者的生存環境。