Background
欧州AI法 (規則 (EU) 2024/1689、または ‘AI法’) は、汎用AI (‘GPAI’) モデルのプロバイダーに特定の義務を課しています。GPTファミリー、Llama、Geminiなどのモデルは、包括的なドキュメントやEU著作権法への準拠を保証するポリシーの確立などの要件に従う必要があります。
これらの規定への準拠を容易にするために、AI法はGPAIモデルに合わせた実務規範の開発を想定しています。AI Officeからの招待を受けて、さまざまな専門家や利害関係者が、最初の実務規範の草案を作成するための4つのワーキンググループを形成しました。EU委員会によるこの規範の承認は、EU全体で’一般的な有効性’を付与します。承認されたGPAI実務規範の採用は、企業が積極的なコンプライアンスを実証する手段を提供し、規制当局の監視と関連する罰則を軽減する可能性があります。
AI Officeは最近、これらのワーキンググループによって作成された実務規範の第3草案 (‘第3草案’) を発表しました。この草案は、いくつかの主要分野を網羅しています。
- コミットメント
- 透明性
- 著作権
- 安全性とセキュリティ
この実務規範の最終版は、2025年5月2日にリリースされる予定です。
このドキュメントでは、第3草案の著作権セクション内の重要な詳細について詳しく説明します。第2草案 (‘第2草案’) からの注目すべき変更点は、第3草案の合理化された簡潔なアプローチです。主な変更点は、第2草案とは異なり、第3草案では一般的に、コンプライアンスの取り組みがプロバイダーの規模と能力に見合ったものであるべきであると義務付けていることです。
Who is this relevant for?
実務規範は、主にGPAIモデルのプロバイダーを対象としています。これらのモデルは、その顕著な汎用性と、広範囲の異なるタスクを熟練して実行する能力によって特徴付けられます。これには、GPT (OpenAI)、Llama (Meta)、Gemini (Google)、Mistral (Mistral AI) などの有名な大規模言語モデルのプロバイダーが含まれます。ただし、小規模なモデルプロバイダーも、そのモデルが多様なタスクに使用できる場合は、その対象となる可能性があります。さらに、特定のアプリケーションのためにモデルをファインチューニングする企業も、GPAIモデルプロバイダーとして分類される可能性があります。
‘ダウンストリームプロバイダー’、つまりGPAIモデルをAIシステムに統合する企業も、実務規範をよく理解しておく必要があります。この規範は、GPAIモデルの準標準となり、AIシステム開発者に対するGPAIモデルの機能に関する期待を定義する態勢を整えています。この理解は、GPAIモデルプロバイダーとの契約交渉において重要になる可能性があります。
Key Concepts of the Code of Practice on Copyright Law
GPAIモデルのプロバイダーは、EU著作権法 (AI法第53条(1)(c)) に準拠することを保証するポリシーを確立する義務があります。この要件の新規性を考えると、そのようなポリシーの構造と内容に関する実践的なガイダンスが不足していました。実務規範は、このギャップに対処することを目的としています。
実務規範は、プロバイダーが以下の措置を実施することを義務付けています。
Copyright Policy
規範に署名するプロバイダー (‘署名者’) は、EU著作権法に沿った著作権ポリシーを策定、維持、および実施する必要があります。この要件は、AI法から直接派生しています。署名者はまた、その組織がこの著作権ポリシーを遵守することを保証する必要があります。
第2草案からの重要な変更点は、第3草案が著作権ポリシーの公開を義務付けなくなったことです。署名者は、そうすることを推奨されるだけです。この軽減された要件は、AI法自体がモデルプロバイダーに著作権ポリシーの公開を強制していないため、論理的です。
Web Crawling of Copyrighted Content
署名者は、一般的に、GPAIモデルのトレーニングデータを収集するために、テキストおよびデータマイニング (‘TDM’) の目的でWebクローラーを使用することが許可されています。ただし、ペイウォールなど、著作権で保護された素材へのアクセスを制限するように設計されたテクノロジーを尊重する必要があります。
さらに、署名者は、主に著作権侵害資料の配布に関与するオンラインソースである’海賊版ドメイン’を除外する義務があります。
Web Crawling and Identifying and Complying with TDM Opt-outs
署名者は、Webクローラーが権利者によって宣言されたTDMオプトアウトを識別し、尊重することを保証する必要があります。EU著作権法は一般的にTDMを許可していますが、権利者はオプトアウトする権利を保持しています。Webコンテンツの場合、このオプトアウトは機械可読である必要があります。第3草案は、Webクローラーの要件について詳しく説明しており、広く採用されているrobots.txtプロトコルを識別し、遵守する必要があることを指定しています。さらに、Webクローラーは、業界標準として確立されたメタデータや権利者によって一般的に使用されるソリューションなど、他の関連する機械可読TDMオプトアウトに準拠する必要があります。
署名者は、使用中のWebクローラーと、これらのクローラーがrobots.txtディレクティブをどのように処理するかについて、権利者に通知するための合理的な措置を講じる必要があります。この情報は、Webフィードなどのさまざまなチャネルを通じて広めることができます。注目すべきことに、第3草案には、この情報を公開する義務は含まれていません。
Identifying and Complying with a TDM Opt-out for Non-Web-Crawled Content
GPAIモデルプロバイダーは、Webクローリングを自分で行うのではなく、サードパーティからデータセットを取得することもできます。第2草案ではサードパーティのデータセットの著作権デューデリジェンスを義務付けていましたが、第3草案では、情報を収集するために使用されたWebクローラーがrobots.txtプロトコルに準拠したかどうかに関する情報を取得するための合理的な努力が必要です。
Mitigate Risk to Prevent the Production of Copyright-Infringing Output
AIの使用に関連する重大なリスクは、AIが著作権を侵害する出力を生成する可能性があることです。これには、著作権で保護されているオンラインで見つかったコードや画像を複製することが含まれる場合があります。
署名者は、このリスクを軽減するために合理的な努力をする必要があります。これは、’過剰適合’を回避するための対策を規定していた第2草案と比較して、より寛大なアプローチを表しています。第3草案は、よりテクノロジーに中立的なスタンスを採用し、合理的な努力を強調しています。
さらに、署名者は、ダウンストリームAIシステムのプロバイダー向けの利用規約 (または同様のドキュメント) に、著作権を侵害する方法でGPAIモデルを使用することを禁止する条項を含める必要があります。
Designating a Point of Contact
署名者は、権利者のための連絡窓口を提供する必要があります。また、権利者が著作権侵害に関する苦情を提出できるメカニズムを確立する必要があります。
第3草案では、署名者は、根拠がない、または過剰であると見なされる苦情の処理を拒否するオプションがあります。
Delving Deeper: A More Granular Examination of the Copyright Provisions
第3草案は、一見合理化されているように見えますが、より詳細な検討を必要とするニュアンスと重点のシフトを導入しています。各セクションをさらに詳しく見ていきましょう。
Copyright Policy: The Shift from Publication to Encouragement
第2草案に存在していた著作権ポリシーを公開するという当初の義務は、潜在的な競争上の不利益と機密情報の公開に関する懸念を引き起こしました。第3草案の、それを要求するのではなく、公開を推奨するという動きは、これらの懸念を認識しています。この変更により、プロバイダーは内部コンプライアンス戦略に関するある程度の機密性を維持しながら、透明性を促進することができます。ただし、’推奨’の側面は、プロバイダーにポリシーについてオープンにするよう微妙な圧力をかけており、時間の経過とともに事実上の公開基準につながる可能性があります。
Web Crawling: Balancing Data Acquisition with Copyright Respect
ペイウォールなどのアクセス制限を尊重する必要性と相まって、Webクローリングの明示的な許可は、微妙なバランスをとっています。AI法は、AIモデルのトレーニングにおけるデータの重要性を認識していますが、コンテンツ作成者の権利を尊重する必要性も強調しています。’海賊版ドメイン’の除外は重要な追加であり、著作権侵害に積極的に関与するソースを明示的にターゲットにしています。この規定は、AI開発が違法行為の基盤の上に構築されるべきではないという原則を強化しています。
TDM Opt-outs: The Technical Specificity of Compliance
robots.txtプロトコルやその他の機械可読オプトアウトメカニズムを重視する第3草案は、コンプライアンスの技術的側面を強調しています。この特異性は、GPAIプロバイダーと権利者の両方に明確さを提供します。プロバイダーにとっては、クローラーがオプトアウト要求を確実に尊重するために実行する必要がある具体的な手順の概要を示しています。権利者にとっては、TDMに関する設定を効果的に通知する方法を明確にしています。’業界標準’のメタデータと’広く採用されている’ソリューションを含めることは、オプトアウトメカニズムの状況が進化しており、柔軟性が必要であることを認めています。
Non-Web-Crawled Content: Shifting Responsibility and Due Diligence
サードパーティのデータセットに関する’著作権デューデリジェンス’から’情報を取得するための合理的な努力’への変更は、責任の微妙だが重要なシフトを表しています。第2草案では、GPAIプロバイダーにデータセットの著作権ステータスを積極的に調査するより重い負担を課していましたが、第3草案では、(サードパーティによる) データ収集プロセスがrobots.txtを尊重したかどうかを確認することに焦点を当てています。これは、GPAIプロバイダーがサードパーティのデータ取得慣行を常に直接制御できるとは限らないことを暗黙のうちに認めていますが、コンプライアンスについて問い合わせる責任は依然としてあります。
Mitigating Infringing Output: From ‘Overfitting’ to ‘Reasonable Efforts’
‘過剰適合’という用語からの脱却は歓迎すべき変化です。機械学習の専門用語である’過剰適合’は、トレーニングデータではうまく機能するが、新しいデータではうまく機能しないモデルを指します。過剰適合は著作権侵害に寄与する可能性がありますが (たとえば、著作権で保護された素材を記憶して複製することによって)、それが唯一の原因ではありません。第3草案の’リスクを軽減するための合理的な努力’というより広範な焦点は、より広範囲の潜在的な侵害シナリオを包含し、実装におけるより柔軟性を可能にします。この変更は、著作権侵害の完全な防止が達成できない可能性があり、リスクベースのアプローチがより実用的であることも認めています。
Point of Contact and Complaint Mechanism: Streamlining the Process
指定された連絡窓口と苦情メカニズムの要件は、潜在的な著作権侵害に対処するための明確な手段を権利者に提供します。署名者が’根拠のない、または過剰な’苦情を拒否できることは、システムが軽薄な主張によって圧倒されるのを防ぐ実用的な追加です。この規定は、苦情メカニズムが正当な著作権上の懸念に対処するための実行可能で効率的なツールであり続けることを保証するのに役立ちます。
The Broader Implications and Future Considerations
GPAI実務規範の第3草案は、AI法の著作権規定を運用化するための重要な一歩を表しています。GPAIプロバイダーに必要な明確さとガイダンスを提供すると同時に、コンテンツ作成者の権利を保護しようとしています。ただし、いくつかのより広範な意味合いと将来の考慮事項が残っています。
‘合理的な努力’基準: ‘合理的な努力’というフレーズの繰り返しの使用は、ある程度の主観性を導入します。何が’合理的’と見なされるかは、解釈の対象となる可能性があり、法的異議申し立てや業界のベストプラクティスを通じて時間の経過とともに進化する可能性があります。この曖昧さはプロバイダーに不確実性をもたらす可能性がありますが、さまざまなコンテキストへの柔軟性と適応も可能にします。
ダウンストリームプロバイダーの役割: 規範は主にGPAIプロバイダーを対象としていますが、ダウンストリームプロバイダーは、その規定を理解することに既得権益を持っています。規範は、GPAIモデルの品質とコンプライアンスに関する期待を設定し、契約交渉とリスク評価に情報を提供できます。ダウンストリームプロバイダーは、GPAIモデルの使用が規範の原則に沿っていることを保証するという間接的な圧力に直面する可能性もあります。
テクノロジーの進化: AI開発の急速なペースは、実務規範が生きたドキュメントである必要があることを意味します。データ取得、モデルトレーニング、および出力生成のための新しい手法が登場する可能性があり、規範の規定の更新が必要になります。’業界標準’のメタデータと’広く採用されている’ソリューションへの言及は、この継続的な適応の必要性を認めています。
国際的な調和: EU AI法は先駆的な法律ですが、真空状態で運用されているわけではありません。他の法域もAI規制の課題に取り組んでいます。AI開発者のための公平な競争の場を確保し、断片化を回避するためには、著作権規定を含むAI規制の国際的な調和が不可欠です。
イノベーションへの影響: 実務規範は、AIイノベーションの促進と著作権の保護のバランスをとることを目的としています。ただし、これらの規制がAI開発のペースと方向に与える影響は、まだわかりません。過度に厳格な規制はイノベーションを阻害する可能性があると主張する人もいれば、責任あるAI開発を促進するためには明確なルールが必要であると主張する人もいます。
執行と監視 遵守はどのようにチェックされますか?規範の有効性は、執行と監視のために設けられたメカニズムに大きく依存します。
GPAI実務規範の第3草案は、広範囲に影響を与える複雑で進化するドキュメントです。AIの時代における著作権コンプライアンスの課題に対処するための重要な取り組みを表していますが、進行中の作業でもあります。GPAIプロバイダー、権利者、政策立案者、およびより広範なAIコミュニティを含む利害関係者間の継続的な対話は、規範が意図した目標を達成し、急速な技術変化に直面しても関連性を維持することを保証するために不可欠です。