مدونة ممارسات الذكاء الاصطناعي: مسودة 3

خلفية

يفرض قانون الذكاء الاصطناعي الأوروبي (اللائحة (الاتحاد الأوروبي) 2024/1689، أو ‘قانون الذكاء الاصطناعي’) التزامات محددة على مقدمي نماذج الذكاء الاصطناعي للأغراض العامة (‘GPAI’). يجب أن تلتزم هذه النماذج، بما في ذلك تلك من عائلة GPT و Llama و Gemini، بمتطلبات مثل التوثيق الشامل ووضع سياسة تضمن الامتثال لقانون حقوق النشر في الاتحاد الأوروبي.

لتسهيل الالتزام بهذه الشروط، يتوقع قانون الذكاء الاصطناعي تطوير مدونات ممارسات مصممة خصيصًا لنماذج GPAI. بعد دعوة من مكتب الذكاء الاصطناعي، شكل العديد من الخبراء وأصحاب المصلحة أربع مجموعات عمل مخصصة لصياغة مدونة ممارسات أولية. إن موافقة المفوضية الأوروبية على هذه المدونة ستمنحها ‘صلاحية عامة’ في جميع أنحاء الاتحاد الأوروبي. يوفر اعتماد مدونة ممارسات GPAI المعتمدة للشركات وسيلة لإثبات الامتثال الاستباقي، مما قد يخفف من التدقيق التنظيمي والعقوبات المرتبطة به.

أصدر مكتب الذكاء الاصطناعي مؤخرًا المسودة الثالثة لمدونة الممارسات (‘المسودة الثالثة’) التي أنتجتها مجموعات العمل هذه. تشمل هذه المسودة عدة مجالات رئيسية:

  • الالتزامات
  • الشفافية
  • حقوق النشر
  • السلامة والأمن

من المقرر إصدار النسخة النهائية من مدونة الممارسات هذه في 2 مايو 2025.

ستتعمق هذه الوثيقة في التفاصيل الهامة ضمن قسم حقوق النشر في المسودة الثالثة. التحول الملحوظ عن المسودة الثانية (‘المسودة الثانية’) هو النهج المبسط والموجز للمسودة الثالثة. التغيير الرئيسي هو أن المسودة الثالثة تفرض بشكل عام أن تكون جهود الامتثال متناسبة مع حجم وقدرات المزود، على عكس المسودة الثانية.

لمن هذا ذو صلة؟

تستهدف مدونة الممارسات في المقام الأول مقدمي نماذج GPAI. تتميز هذه النماذج بعموميتها الكبيرة وقدرتها على تنفيذ مجموعة واسعة من المهام المتميزة بكفاءة. يشمل هذا مقدمي نماذج اللغات الكبيرة المعروفة مثل GPT (OpenAI) و Llama (Meta) و Gemini (Google) و Mistral (Mistral AI). ومع ذلك، قد يندرج مقدمو النماذج الأصغر أيضًا ضمن اختصاصها، شريطة أن تكون نماذجهم قابلة للاستخدام لمجموعة متنوعة من المهام. علاوة على ذلك، قد يتم تصنيف الشركات التي تقوم بضبط النماذج لتطبيقاتها المحددة أيضًا كمقدمي نماذج GPAI.

يجب على ‘مقدمي الخدمات النهائية’، أو الشركات التي تدمج نماذج GPAI في أنظمة الذكاء الاصطناعي الخاصة بهم، أن يتعرفوا أيضًا على مدونة الممارسات. من المتوقع أن تصبح هذه المدونة معيارًا شبه قياسي لنماذج GPAI، حيث تحدد توقعات مطوري أنظمة الذكاء الاصطناعي فيما يتعلق بقدرات نموذج GPAI. يمكن أن يكون هذا الفهم حاسمًا أثناء مفاوضات العقد مع مقدمي نماذج GPAI.

المفاهيم الأساسية لمدونة الممارسات بشأن قانون حقوق النشر

يلتزم مقدمو نماذج GPAI بوضع سياسة تضمن الامتثال لقانون حقوق النشر في الاتحاد الأوروبي (المادة 53 (1) (ج) من قانون الذكاء الاصطناعي). نظرًا لحداثة هذا المطلب، كان هناك نقص في التوجيه العملي بشأن هيكل ومحتوى هذه السياسة. تهدف مدونة الممارسات إلى معالجة هذه الفجوة.

تفرض مدونة الممارسات على مقدمي الخدمات تنفيذ التدابير التالية:

سياسة حقوق النشر

يُطلب من مقدمي الخدمات الذين يوقعون على مدونة الممارسات (‘الموقعون’) صياغة سياسة حقوق نشر تتوافق مع قانون حقوق النشر في الاتحاد الأوروبي والحفاظ عليها وتنفيذها. هذا المطلب مشتق مباشرة من قانون الذكاء الاصطناعي. يجب على الموقعين أيضًا التأكد من أن مؤسساتهم تلتزم بسياسة حقوق النشر هذه.

الخروج الكبير عن المسودة الثانية هو أن المسودة الثالثة لم تعد تفرض نشر سياسة حقوق النشر. يتم تشجيع الموقعين فقط على القيام بذلك. هذا المطلب المخفض منطقي، حيث أن قانون الذكاء الاصطناعي نفسه لا يجبر مقدمي النماذج على نشر سياسات حقوق النشر الخاصة بهم.

الزحف على الويب للمحتوى المحمي بحقوق النشر

يُسمح للموقعين عمومًا باستخدام برامج زحف الويب لأغراض استخراج النصوص والبيانات (‘TDM’) لجمع بيانات التدريب لنماذج GPAI الخاصة بهم. ومع ذلك، يجب عليهم التأكد من أن برامج الزحف هذه تحترم التقنيات المصممة لتقييد الوصول إلى المواد المحمية بحقوق النشر، مثل الجدران النارية.

علاوة على ذلك، يلتزم الموقعون باستبعاد ‘مجالات القرصنة’، وهي مصادر عبر الإنترنت تشارك بشكل أساسي في توزيع المواد المخالفة لحقوق النشر.

الزحف على الويب وتحديد عمليات إلغاء الاشتراك في TDM والامتثال لها

يجب على الموقعين التأكد من أن برامج زحف الويب تحدد وتحترم عمليات إلغاء الاشتراك في TDM التي أعلن عنها أصحاب الحقوق. في حين أن قانون حقوق النشر في الاتحاد الأوروبي يسمح عمومًا بـ TDM، يحتفظ أصحاب الحقوق بالحق في إلغاء الاشتراك. بالنسبة لمحتوى الويب، يجب أن يكون إلغاء الاشتراك هذا قابلاً للقراءة آليًا. توضح المسودة الثالثة متطلبات برامج زحف الويب، وتحدد أنها يجب أن تحدد وتلتزم ببروتوكول robots.txt المعتمد على نطاق واسع. بالإضافة إلى ذلك، يجب أن تلتزم برامج زحف الويب بعمليات إلغاء الاشتراك الأخرى ذات الصلة القابلة للقراءة آليًا في TDM، مثل البيانات الوصفية التي تم تأسيسها كمعيار صناعي أو الحلول الشائعة الاستخدام من قبل أصحاب الحقوق.

يُطلب من الموقعين اتخاذ خطوات معقولة لإبلاغ أصحاب الحقوق ببرامج زحف الويب المستخدمة وكيف تتعامل برامج الزحف هذه مع توجيهات robots.txt. يمكن نشر هذه المعلومات من خلال قنوات مختلفة، مثل موجز ويب. والجدير بالذكر أن المسودة الثالثة لم تعد تتضمن التزامًا بنشر هذه المعلومات.

تحديد عملية إلغاء الاشتراك في TDM للمحتوى غير الزاحف على الويب والامتثال لها

قد يحصل مقدمو نماذج GPAI أيضًا على مجموعات بيانات من أطراف ثالثة بدلاً من إجراء الزحف على الويب بأنفسهم. في حين أن المسودة الثانية فرضت العناية الواجبة بحقوق النشر لمجموعات بيانات الطرف الثالث، تتطلب المسودة الثالثة بذل جهود معقولة للحصول على معلومات تتعلق بما إذا كانت برامج زحف الويب المستخدمة لجمع المعلومات قد امتثلت لبروتوكولات robots.txt.

التخفيف من المخاطر لمنع إنتاج مخرجات مخالفة لحقوق النشر

يتمثل أحد المخاطر الكبيرة المرتبطة باستخدام الذكاء الاصطناعي في احتمال أن ينتج الذكاء الاصطناعي مخرجات تنتهك حقوق النشر. قد يتضمن ذلك تكرار التعليمات البرمجية أو الصور الموجودة على الإنترنت والمحمية بموجب حقوق النشر.

يُطلب من الموقعين بذل جهود معقولة للتخفيف من هذه المخاطر. يمثل هذا نهجًا أكثر تساهلاً مقارنة بالمسودة الثانية، التي وصفت تدابير لتجنب ‘التجهيز الزائد’. تتبنى المسودة الثالثة موقفًا أكثر حيادية من الناحية التكنولوجية، مع التركيز على الجهود المعقولة.

علاوة على ذلك، يجب على الموقعين تضمين بند في شروطهم وأحكامهم (أو المستندات المماثلة) لمقدمي أنظمة الذكاء الاصطناعي النهائية، يحظر استخدام نموذج GPAI الخاص بهم بطريقة تنتهك حقوق النشر.

تعيين جهة اتصال

يُطلب من الموقعين توفير جهة اتصال لأصحاب الحقوق. يجب عليهم أيضًا إنشاء آلية تسمح لأصحاب الحقوق بتقديم شكاوى بشأن انتهاكات حقوق النشر.

بموجب المسودة الثالثة، يكون للموقعين خيار رفض معالجة الشكاوى التي تعتبر لا أساس لها أو مفرطة.

التعمق أكثر: فحص أكثر تفصيلاً لأحكام حقوق النشر

تقدم المسودة الثالثة، على الرغم من أنها تبدو مبسطة، فروقًا دقيقة وتحولات في التركيز تستدعي إلقاء نظرة فاحصة. دعونا نحلل كل قسم بمزيد من التفصيل:

سياسة حقوق النشر: التحول من النشر إلى التشجيع

أثار التفويض الأولي بنشر سياسة حقوق النشر، الموجود في المسودة الثانية، مخاوف بشأن العيوب التنافسية المحتملة والكشف عن المعلومات الحساسة. إن انتقال المسودة الثالثة إلى تشجيع النشر، بدلاً من اشتراطه، يقر بهذه المخاوف. يسمح هذا التغيير للمقدمين بالحفاظ على درجة من السرية فيما يتعلق باستراتيجيات الامتثال الداخلية الخاصة بهم، مع الاستمرار في تعزيز الشفافية. ومع ذلك، لا يزال جانب ‘التشجيع’ يضع ضغطًا خفيًا على مقدمي الخدمات ليكونوا منفتحين بشأن سياساتهم، مما قد يؤدي إلى معيار فعلي للنشر بمرور الوقت.

الزحف على الويب: موازنة الحصول على البيانات مع احترام حقوق النشر

يعكس الإذن الصريح بالزحف على الويب، إلى جانب شرط احترام قيود الوصول مثل الجدران النارية، عملية موازنة دقيقة. يقر قانون الذكاء الاصطناعي بأهمية البيانات لتدريب نماذج الذكاء الاصطناعي، ولكنه يؤكد أيضًا على الحاجة إلى احترام حقوق منشئي المحتوى. يعد استبعاد ‘مجالات القرصنة’ إضافة حاسمة، حيث يستهدف بشكل صريح المصادر التي تشارك بنشاط في انتهاك حقوق النشر. يعزز هذا الحكم مبدأ أنه لا ينبغي بناء تطوير الذكاء الاصطناعي على أساس الأنشطة غير القانونية.

عمليات إلغاء الاشتراك في TDM: الخصوصية التقنية للامتثال

يسلط تركيز المسودة الثالثة على بروتوكول robots.txt وآليات إلغاء الاشتراك الأخرى القابلة للقراءة آليًا الضوء على الجوانب التقنية للامتثال. توفر هذه الخصوصية وضوحًا لكل من مقدمي GPAI وأصحاب الحقوق. بالنسبة لمقدمي الخدمات، فإنه يحدد الخطوات الملموسة التي يجب عليهم اتخاذها لضمان احترام برامج الزحف الخاصة بهم لطلبات إلغاء الاشتراك. بالنسبة لأصحاب الحقوق، فإنه يوضح كيف يمكنهم الإشارة بشكل فعال إلى تفضيلاتهم فيما يتعلق بـ TDM. إن إدراج البيانات الوصفية ‘المعيارية للصناعة’ والحلول ‘المعتمدة على نطاق واسع’ يقر بأن مشهد آليات إلغاء الاشتراك يتطور وأن المرونة ضرورية.

المحتوى غير الزاحف على الويب: تحويل المسؤولية والعناية الواجبة

يمثل التغيير من ‘العناية الواجبة بحقوق النشر’ إلى ‘بذل جهود معقولة للحصول على معلومات’ فيما يتعلق بمجموعات بيانات الطرف الثالث تحولًا دقيقًا ولكنه مهم في المسؤولية. في حين أن المسودة الثانية وضعت عبئًا أكبر على مقدمي GPAI للتحقيق بنشاط في حالة حقوق النشر لمجموعات البيانات، تركز المسودة الثالثة على التحقق مما إذا كانت عملية جمع البيانات (من قبل الطرف الثالث) تحترم robots.txt. يقر هذا ضمنيًا بأن مقدمي GPAI قد لا يكون لديهم دائمًا سيطرة مباشرة على ممارسات الحصول على البيانات الخاصة بأطراف ثالثة، ولكن لا يزال لديهم مسؤولية الاستفسار عن الامتثال.

التخفيف من المخرجات المخالفة: من ‘التجهيز الزائد’ إلى ‘الجهود المعقولة’

يعد الابتعاد عن مصطلح ‘التجهيز الزائد’ تغييرًا مرحبًا به. يشير ‘التجهيز الزائد’، وهو مصطلح تقني في التعلم الآلي، إلى نموذج يعمل بشكل جيد على بيانات التدريب ولكنه يعمل بشكل سيئ على البيانات الجديدة. في حين أن التجهيز الزائد يمكن أن يساهم في انتهاك حقوق النشر (على سبيل المثال، عن طريق حفظ وإعادة إنتاج المواد المحمية بحقوق النشر)، إلا أنه ليس السبب الوحيد. إن تركيز المسودة الثالثة الأوسع على ‘بذل جهود معقولة للتخفيف من المخاطر’ يشمل نطاقًا أوسع من سيناريوهات الانتهاك المحتملة ويسمح بمزيد من المرونة في التنفيذ. يقر هذا التغيير أيضًا بأن المنع التام لانتهاك حقوق النشر قد يكون غير قابل للتحقيق، وأن النهج القائم على المخاطر هو أكثر عملية.

جهة الاتصال وآلية الشكاوى: تبسيط العملية

يوفر شرط وجود جهة اتصال معينة وآلية للشكاوى لأصحاب الحقوق وسيلة واضحة لمعالجة انتهاكات حقوق النشر المحتملة. إن قدرة الموقعين على رفض الشكاوى ‘التي لا أساس لها أو المفرطة’ هي إضافة عملية، تمنع النظام من أن تطغى عليه المطالبات التافهة. يساعد هذا الحكم على ضمان بقاء آلية الشكاوى أداة قابلة للتطبيق وفعالة لمعالجة مخاوف حقوق النشر المشروعة.

الآثار الأوسع والاعتبارات المستقبلية

تمثل المسودة الثالثة لمدونة ممارسات GPAI خطوة مهمة نحو تفعيل أحكام حقوق النشر في قانون الذكاء الاصطناعي. إنها توفر وضوحًا وتوجيهًا تمس الحاجة إليهما لمقدمي GPAI، بينما تسعى أيضًا إلى حماية حقوق منشئي المحتوى. ومع ذلك، لا تزال هناك العديد من الآثار الأوسع والاعتبارات المستقبلية:

  • معيار ‘الجهود المعقولة’: إن الاستخدام المتكرر لعبارة ‘الجهود المعقولة’ يقدم درجة من الذاتية. ما يشكل ‘معقولاً’ سيكون على الأرجح عرضة للتفسير وقد يتطور بمرور الوقت من خلال الطعون القانونية وأفضل الممارسات الصناعية. يمكن أن يؤدي هذا الغموض إلى عدم اليقين بالنسبة لمقدمي الخدمات، ولكنه يسمح أيضًا بالمرونة والتكيف مع السياقات المختلفة.

  • دور مقدمي الخدمات النهائية: في حين أن المدونة تستهدف في المقام الأول مقدمي GPAI، فإن مقدمي الخدمات النهائية لديهم مصلحة راسخة في فهم أحكامها. تحدد المدونة توقعات لجودة وامتثال نماذج GPAI، والتي يمكن أن تفيد مفاوضات العقود وتقييمات المخاطر. قد يواجه مقدمو الخدمات النهائية أيضًا ضغطًا غير مباشر لضمان توافق استخدامهم لنماذج GPAI مع مبادئ المدونة.

  • تطور التكنولوجيا: تعني الوتيرة السريعة لتطوير الذكاء الاصطناعي أن مدونة الممارسات ستحتاج إلى أن تكون وثيقة حية. قد تظهر تقنيات جديدة للحصول على البيانات وتدريب النماذج وتوليد المخرجات، مما يتطلب تحديثات لأحكام المدونة. إن الإشارة إلى البيانات الوصفية ‘المعيارية للصناعة’ والحلول ‘المعتمدة على نطاق واسع’ تقر بهذه الحاجة إلى التكيف المستمر.

  • التنسيق الدولي: يعد قانون الذكاء الاصطناعي في الاتحاد الأوروبي جزءًا رائدًا من التشريعات، لكنه لا يعمل في فراغ. تتصارع الولايات القضائية الأخرى أيضًا مع تحديات تنظيم الذكاء الاصطناعي. سيكون التنسيق الدولي للوائح الذكاء الاصطناعي، بما في ذلك أحكام حقوق النشر، أمرًا بالغ الأهمية لتجنب التجزئة وضمان تكافؤ الفرص لمطوري الذكاء الاصطناعي.

  • التأثير على الابتكار: تهدف مدونة الممارسات إلى تحقيق توازن بين تعزيز الابتكار في مجال الذكاء الاصطناعي وحماية حقوق النشر. ومع ذلك، فإن تأثير هذه اللوائح على وتيرة واتجاه تطوير الذكاء الاصطناعي لا يزال يتعين رؤيته. يجادل البعض بأن اللوائح الصارمة للغاية يمكن أن تخنق الابتكار، بينما يؤكد آخرون أن القواعد الواضحة ضرورية لتعزيز تطوير الذكاء الاصطناعي المسؤول.

  • التنفيذ والمراقبة: كيف سيتم التحقق من الالتزام؟ ستعتمد فعالية المدونات إلى حد كبير على الآليات الموضوعة للتنفيذ والمراقبة.

تعد المسودة الثالثة لمدونة ممارسات GPAI وثيقة معقدة ومتطورة ذات آثار بعيدة المدى. إنها تمثل جهدًا كبيرًا لمعالجة تحديات الامتثال لحقوق النشر في عصر الذكاء الاصطناعي، ولكنها أيضًا عمل قيد التقدم. سيكون الحوار المستمر بين أصحاب المصلحة، بما في ذلك مقدمو GPAI وأصحاب الحقوق وصناع السياسات ومجتمع الذكاء الاصطناعي الأوسع، ضروريًا لضمان تحقيق المدونة لأهدافها المقصودة وأن تظل ذات صلة في مواجهة التغيير التكنولوجي السريع.