Meta因AI訓練遭法國出版商提告

版權侵權指控

科技巨頭 Meta Platforms Inc. 正面臨法國出版商和作者提起的法律訴訟。爭議的核心在於版權侵權的指控。原告聲稱 Meta 在未獲得必要授權的情況下,非法使用其文學作品來訓練其生成式人工智慧 (AI) 模型。

原告及其訴求

該訴訟已提交至巴黎一家專門處理智慧財產權事務的法院。這項法律行動由 SNE(代表 Hachette 和 Editis 等法國主要出版商的行業協會)、作者協會 SGDL 和作家工會 SNAC 組成的聯盟發起。這些組織共同代表了法國文學界的很大一部分。

在一次新聞發布會上,該團體透露,他們已經收集了指向「大規模」侵犯版權的有力證據。SNE 主席 Vincent Montagne 表示,他們此前曾試圖就此問題與 Meta 溝通,但他們的努力並未成功。此外,原告已通知歐盟委員會,聲稱 Meta 的行為直接違反了歐盟關於 AI 的法規。

爭議核心:AI 訓練與版權法

這場法律衝突的核心在於訓練生成式 AI 語言模型的做法。像 Meta 的 Llama 和 OpenAI 的 ChatGPT 這樣的模型,都是在大量文本數據上進行訓練的,這些數據涵蓋了廣泛的來源,包括書籍和文章。這種做法引發了全球範圍內的訴訟浪潮,內容出版商聲稱,使用他們的智慧財產權來訓練 AI 模型無異於盜竊。

開發這些 AI 模型的公司通常不願透露其訓練數據的確切來源。然而,他們經常援引美國版權法下的「合理使用」原則作為辯護理由。

全球法律挑戰趨勢

針對 Meta 的訴訟並非孤立事件。它是針對 AI 公司因使用受版權保護的材料進行訓練而面臨的更廣泛法律挑戰趨勢的一部分。
以下是一些其他值得注意的案例:

  • 2023 年 12 月,《紐約時報》對 OpenAI 和 Microsoft Corp. 提起法律訴訟,指控其未經授權使用其文章來訓練大型語言模型。
  • 2024 年 4 月,一群作者對由 Amazon.com Inc. 支持的公司 Anthropic 提起集體訴訟。作者聲稱,他們的書籍在未經他們同意的情況下被用於訓練 Anthropic 的 AI 模型。
  • 印度圖書出版商於 1 月份對 OpenAI 提起了類似訴訟,突顯了這一法律問題的全球性。

深入探討法律論點

這些案件中的法律論點通常取決於對版權法的解釋以及「合理使用」原則的適用性。版權法賦予原創作品的創作者專有權利,包括複製、發行和創作衍生作品的權利。「合理使用」原則則對這些專有權利提供了一些例外情況,允許有限地使用受版權保護的材料,用於批評、評論、新聞報導、教學、學術或研究等目的。

核心問題是,使用受版權保護的材料來訓練 AI 模型是否屬於「合理使用」的範疇。AI 公司辯稱,他們的使用是變革性的,這意味著它為原始作品添加了新的和不同的東西,並且不會損害原始作品的市場。另一方面,內容出版商則認為,這種使用並非變革性的,具有商業性質,並且可能損害其作品的市場。

潛在影響

這些法律鬥爭的結果可能會對 AI 開發和創意產業的未來產生重大影響。如果法院判決有利於內容出版商,可能會迫使 AI 公司尋求使用受版權保護材料的許可,從而可能增加開發 AI 模型的成本。它還可能導致訓練數據來源的透明度提高。

相反,如果法院判決有利於 AI 公司,可能會鼓勵他們繼續在未經明確許可的情況下使用受版權保護的材料,從而可能導致進一步的法律挑戰和道德爭議。

更廣泛的背景:AI、道德與智慧財產權

這場法律糾紛不僅僅涉及版權法;它還觸及了圍繞 AI 開發的更廣泛的道德考量。人們對在沒有補償的情況下使用受版權保護的材料來訓練 AI 模型是否公平提出了質疑,這些模型可能會為開發它們的公司帶來巨額利潤。

還有人擔心 AI 生成的內容可能會取代人類創作者,導致失業以及創意作品的質量和多樣性下降。

擴展「合理使用」辯護

AI 公司經常援引的「合理使用」辯護是一種複雜的法律原則,美國法院使用四要素測試來確定其適用性:

  1. 使用的目的和性質: 這一要素考慮使用是商業性的還是非商業性的,是變革性的還是衍生性的。變革性使用,即為原始作品添加新的和不同的東西,更有可能被認為是合理使用。

  2. 受版權保護作品的性質: 這一要素考慮受版權保護的作品是事實性的還是創造性的。事實性作品,例如新聞文章,通常比創意作品(例如小說)受到的保護更少。

  3. 所使用部分的數量和實質性: 這一要素考慮使用了受版權保護作品的多少,以及所使用的部分是否是作品的「核心」。使用作品的一小部分比使用大部分或作品中最重要的部分更有可能被認為是合理使用。

  4. 使用對受版權保護作品的潛在市場或價值的影響: 這一要素考慮使用受版權保護的作品是否損害了原始作品的市場或降低了其價值。不損害原始作品市場的使用更有可能被認為是合理使用。

將這些要素應用於 AI 訓練是一個新穎的法律問題,法院仍在努力研究如何在此背景下解釋它們。

歐洲視角

法國的訴訟也突顯了美國和歐盟之間在版權法和 AI 監管方面的差異。歐盟一直在採取更積極主動的方法來監管 AI,旨在確保 AI 系統的開發和使用方式尊重基本權利,包括版權。

歐盟的《AI 法案》目前正在最後定稿,其中包括可能影響使用受版權保護材料進行 AI 訓練的條款。這些條款可能要求 AI 公司在使用其作品進行訓練之前獲得版權所有者的同意,或者它們可以建立一個使用受版權保護材料的報酬制度。

不同的利益相關者觀點

這個問題涉及多個利益相關者,每個利益相關者都有自己的觀點和利益:

  • 內容創作者: 作者、出版商和其他內容創作者關心保護他們的智慧財產權,並確保他們的作品的使用得到公平的補償。
  • AI 公司: AI 公司正在尋求開發創新的 AI 模型,並認為獲取大量數據(包括受版權保護的材料)對於實現這一目標至關重要。
  • 公眾: 公眾既關心有益的 AI 技術的發展,也關心創意作品的保護。
  • 法律專業人士: 律師和法律學者正在努力解決 AI 和版權法提出的複雜法律問題。
  • 監管機構: 政府和監管機構正在尋求在促進創新和保護創作者權利之間取得平衡。

未來可能的發展

圍繞 AI 和版權的法律格局正在迅速發展。未來幾年,我們可能會看到更多的法律挑戰和監管發展。一些可能的未來發展包括:

  • 新立法: 各國政府可能會頒布專門針對使用受版權保護材料進行 AI 訓練的新立法。
  • 法院判決: 法院將繼續對涉及 AI 和版權的案件作出裁決,為現有法律的解釋提供進一步的指導。
  • 行業標準: AI 公司和內容創作者可能會制定行業標準或最佳實踐,以規範在 AI 訓練中使用受版權保護的材料。
  • 技術解決方案: 可以開發水印或數位版權管理等技術解決方案,以幫助追蹤和管理在 AI 訓練中使用受版權保護的材料。
  • 授權協議: AI 公司可能會開始在使用內容訓練其模型之前,從內容創作者那裡獲得授權協議。

Meta 與法國出版商之間的法律鬥爭是關於 AI 和版權的持續爭論中的一個重要發展。此案以及其他類似案件的結果,將塑造未來幾年 AI 開發和創意產業的未來。隨著 AI 技術的進步,「合理使用」的複雜性、國際法律差異以及更廣泛的道德影響將繼續被辯論和完善。