訓練AI與否:一個關鍵問題

AI 訓練的版權例外情況興起

近年來,越來越多的國家在其版權法中特別制定了例外條款,以促進 AI 公司進行文本和數據挖掘。這些例外條款旨在透過允許 LLM 在無需每個版權持有者明確許可的情況下,接受大量數據集的訓練,從而促進人工智能領域的創新。

例如,新加坡於 2021 年修訂了其版權法,創建了這樣一個例外。此舉為該國的 AI 開發人員獲取和處理受版權保護的作品以訓練其模型鋪平了道路。現在,亞洲的其他司法管轄區,包括香港和印度尼西亞,正在考慮類似的立法變更。

中國視角:一個具有里程碑意義的侵權案件

中國作為全球 AI 領域的主要參與者,也在努力應對 LLM 時代版權的複雜性。一個具有里程碑意義的案件,iQiyi vs. MiniMax,將這個問題帶入了人們的視野。

在此案中,著名的視頻流媒體平台愛奇藝 (iQiyi) 起訴 AI 公司 MiniMax,指控其未經授權使用其受版權保護的視頻材料來訓練 AI 模型。這起訴訟標誌著一個重大的發展,因為這是中國首例 AI 視頻 LLM 侵權案件,突顯了人們對未經授權使用受版權保護的內容開發 AI 技術的日益關注。

印度出版業挑戰 LLM 訓練實踐

這場辯論不僅限於亞洲。在印度,幾家出版社已對 LLM 開發商提起法律訴訟,指控這些模型正在接受抓取數據的訓練,其中包括其受版權保護的作品。這些案例強調了推進 AI 能力的願望與保護創作者知識產權的需要之間的緊張關係。

超越簡單攝取:LLM 訓練的細微差別

LLM 訓練帶來的挑戰遠比簡單地攝取和處理數據複雜得多。印度的案例和新加坡法律中定義狹隘的條款突顯了這個問題的多方面性質。

許多知識產權所有者明確限制對其受版權保護作品的訪問和使用,而另一些則不同意此類訪問和複製。大量創作者依靠許可模式作為其業務的核心部分,未經授權將其作品用於 AI 訓練直接破壞了這些模式。

此外,大部分訓練都可以在雲端進行,這引發了複雜的管轄權問題。當數據跨國際邊界處理時,確定適用哪些法律給本已錯綜複雜的法律環境增加了另一層複雜性。

歸根結底,核心問題圍繞著 LLM 如何獲取其訓練數據,以及它們是否以及如何就其使用向版權持有者支付補償。

美國版權組織反對法定例外

這場辯論不僅限於個別國家;它也蔓延到國際舞台。美國近 50 個貿易協會和行業團體組成的聯盟,稱為 Digital Creators Coalition,強烈反對在版權法中為 LLM 訓練創建法定例外,而沒有授權或補償條款。

這些組織已向美國貿易代表 (USTR) 提交了意見,敦促該機構在其年度特別 301 審查中解決這個問題,該審查審查世界各地的知識產權保護和執法實踐。該聯盟提供了一份已實施或正在提議此類例外的國家名單,突顯了這一問題的全球範圍。

美國的辯論:OpenAI 的立場和內部矛盾

即使在美國,這場辯論仍然非常活躍。ChatGPT 背後的公司 OpenAI 通過向白宮科技辦公室提交一封公開信,加入了討論。

在這封信中,OpenAI 主張根據合理使用原則從互聯網上抓取數據的權利,實際上主張廣泛獲取受版權保護的材料用於訓練目的。然而,矛盾的是,OpenAI 還建議應限制外國 LLM 開發商這樣做,可能通過使用美國出口政策。這種立場揭示了一種內部矛盾,即主張自己可以開放訪問,同時試圖限制他人的訪問。

前進的道路:持續的辯論

隨著 2025 年的臨近,關於版權和 AI 訓練的辯論肯定會加劇。隨著世界各地不斷出現新的 LLM,對清晰和平衡的法律框架的需求變得越來越迫切。

目前的法律環境是各國法律的拼湊,一些國家對 AI 訓練有明確的例外規定,而另一些國家則缺乏此類規定。這種不一致性給 AI 開發商和版權持有者帶來了不確定性,阻礙了創新並可能損害創作者的權利。

平衡框架的關鍵考慮因素:

  • 透明度和問責制: LLM 開發商應對用於訓練其模型的數據來源保持透明,並對任何未經授權使用受版權保護的材料負責。
  • 公平補償: 應探索向版權持有者補償其作品在 AI 訓練中使用的機制。這可能涉及許可協議、集體權利管理或其他創新解決方案。
  • 國際協調: 努力協調不同司法管轄區與 AI 訓練相關的版權法將減少法律不確定性並促進跨境合作。
  • 平衡創新與創作者權利: 法律框架應在促進 AI 創新和保護創作者權利之間取得平衡。這需要仔細考慮各種利害關係。
  • 合理使用的作用: 需要澄清合理使用原則對 AI 訓練的適用性。這可能涉及定義具體標準,以確定將受版權保護的材料用於訓練目的的使用是否符合合理使用。

圍繞版權和 AI 訓練的持續討論突顯了使現有法律框架適應快速發展的技術的挑戰。找到一個平衡所有利益相關者利益的解決方案需要持續的對話、合作以及適應數字時代不斷變化的格局的意願。AI 發展的未來以及對創意作品的保護,很可能取決於這場關鍵辯論的結果。 關於訓練的問題將長期存在。