معركة الذكاء الاصطناعي وحقوق النشر: قضية Cohere

تشهد ساحة تطوير الذكاء الاصطناعي مرة أخرى مواجهة قانونية، حيث أطلقت مجموعة من المؤسسات الإخبارية والإعلامية البارزة دعوى قضائية بشأن انتهاك حقوق الطبع والنشر والعلامات التجارية ضد شركة الذكاء الاصطناعي التوليدي الناشئة Cohere. تم رفع الدعوى في محكمة المقاطعة الأمريكية للمنطقة الجنوبية من نيويورك في فبراير 2025، وتضم أكثر من اثني عشر مدعياً، بما في ذلك منشورات تحظى باحترام كبير مثل Forbes و The Guardian و Los Angeles Times. جوهر القضية يكمن في استخدام Cohere لتقنية Retrieval-Augmented Generation (RAG)، والتي يدعي المدعون أنها تنطوي على استخدام غير مصرح به لموادهم المحمية بحقوق الطبع والنشر لإنشاء قواعد بيانات وإنتاج مخرجات.

تقنية RAG قيد التدقيق

ظهرت تقنية Retrieval-Augmented Generation (RAG) كحل محتمل لبعض التحديات الكامنة المرتبطة بنماذج اللغة الكبيرة (LLMs). تهدف RAG، التي اقترحها Patrick Lewis وزملاؤه في عام 2020، إلى التخفيف من قضايا مثل الهلوسة (توليد معلومات غير صحيحة أو غير منطقية من الناحية الواقعية)، والمعرفة القديمة، ونقص الشفافية في منطق النموذج. من المثير للاهتمام أن Patrick Lewis نفسه يعمل حالياً باحثاً في Cohere، ويواصل عمله على تقنية RAG. كان اعتماد RAG واسع الانتشار، حيث قام لاعبون رئيسيون مثل Microsoft و Google و Amazon و NVIDIA بدمجها في أنظمة الذكاء الاصطناعي الخاصة بهم.

تتمحور الدعوى القضائية التي رفعها ناشرو الأخبار حول عدة ادعاءات رئيسية بانتهاك حقوق الطبع والنشر ضد Cohere. تسلط هذه الادعاءات الضوء على الأسئلة القانونية المعقدة المحيطة باستخدام المواد المحمية بحقوق الطبع والنشر في تدريب وتشغيل نماذج الذكاء الاصطناعي التوليدية.

مطالبات انتهاك حقوق الطبع والنشر ضد Cohere

يمكن تقسيم ادعاءات المدعين ضد Cohere إلى أربع فئات رئيسية:

1. تدريب نموذج الذكاء الاصطناعي

يدور جوهر حجة المدعين حول كيفية قيام Cohere بتدريب نموذج اللغة الكبير الخاص بها، والمعروف باسم “عائلة Command”. يزعمون أن Cohere انخرطت في “كشط” مكثف للنصوص من الإنترنت، بما في ذلك المحتوى المحمي بحقوق الطبع والنشر من منشورات المدعين. تم بعد ذلك استخدام هذه البيانات المكشوطة لإنشاء مجموعات البيانات الضرورية لتدريب نموذج عائلة Command. علاوة على ذلك، يدعي المدعون أن Cohere استخدمت مجموعات بيانات تابعة لجهات خارجية مثل C4 الخاص بـ Common Crawl، والتي تحتوي على كميات كبيرة من موادهم المحمية بحقوق الطبع والنشر، دون الحصول على الأذونات اللازمة.

لقد أصبح استخدام المواد المحمية بحقوق الطبع والنشر في تدريب نماذج الذكاء الاصطناعي قضية خلافية. غالباً ما يجادل مطورو الذكاء الاصطناعي بأن هذا الاستخدام يندرج ضمن مبدأ “الاستخدام العادل”، والذي يسمح بالاستخدام المحدود للمواد المحمية بحقوق الطبع والنشر لأغراض مثل النقد أو التعليق أو التقارير الإخبارية أو التدريس أو الدراسة أو البحث. ومع ذلك، يجادل أصحاب حقوق الطبع والنشر بأن الكشط والاستخدام واسع النطاق لمحتواهم لأغراض تجارية، مثل تدريب نماذج الذكاء الاصطناعي، يتجاوز نطاق الاستخدام العادل. من المرجح أن تعتمد هذه المعركة القانونية على ما إذا كانت المحكمة تتفق مع تقييم المدعين.

2. الاستخدام في الوقت الفعلي / RAG

يركز جانب رئيسي آخر من الدعوى القضائية على كيفية استخدام خدمات Cohere، وخاصة واجهة الدردشة الخاصة بها، لتقنية RAG في الوقت الفعلي. يزعم المدعون أن نماذج Cohere تكشط المحتوى من مصادر خارجية، بما في ذلك مواقع الويب الخاصة بهم، لإنشاء استجابات لاستعلامات المستخدمين. هذا الكشط في الوقت الفعلي، وفقاً للمدعين، يشكل انتهاكاً لحقوق الطبع والنشر، خاصةً عندما تتجاوز نماذج Cohere جدران الدفع أو تتجاهل توجيهات “robots.txt”، وهي أوامر توجه زحافات الويب (بما في ذلك تلك التي تستخدمها نماذج الذكاء الاصطناعي) بعدم كشط محتوى معين من موقع ويب.

إن تجاوز جدران الدفع وتوجيهات robots.txt يثير أسئلة أخلاقية وقانونية خطيرة. تم تصميم جدران الدفع لحماية المحتوى المحمي بحقوق الطبع والنشر وضمان تعويض الناشرين عن عملهم. توجيهات Robots.txt هي آلية قياسية لأصحاب مواقع الويب للتحكم في كيفية الوصول إلى محتواهم واستخدامه بواسطة زحافات الويب. من خلال تجاهل هذه الضمانات، يتم اتهام Cohere بإظهار تجاهل لقوانين حقوق الطبع والنشر وحقوق منشئي المحتوى.

3. المخرجات المخالفة

يزعم المدعون أن خدمات Cohere تقدم مخرجات مخالفة في شكل نسخ أو مقتطفات جوهرية أو ملخصات بديلة لأعمالهم المحمية بحقوق الطبع والنشر استجابة لاستعلامات المستخدمين. يستشهدون بأمثلة لمخرجات Cohere Chat حيث تعرض اللوحة “Under the Hood” مقالات كاملة أو جزئية منسوخة مباشرة من مواقع الويب الخاصة بالمدعين.

يجادل المدعون بأن هذه المخرجات، سواء كانت نسخاً حرفية أو ملخصات، تحل مباشرة محل حاجة المستخدمين لزيارة المقالات الأصلية. وهذا بدوره يضر باشتراكهم الرقمي وإيرادات الإعلانات التي يعتمد عليها المدعون في الحفاظ على أعمالهم. جوهر هذه الحجة هو أن نماذج الذكاء الاصطناعي الخاصة بـ Cohere تعمل بشكل أساسي كموزعين غير مصرح لهم للمحتوى المحمي بحقوق الطبع والنشر، مما يحرم الناشرين الأصليين من تعويضهم المستحق.

4. التكييف غير المصرح به

بالإضافة إلى عرض أجزاء من أعمال المدعين في اللوحة “Under the Hood”، تقدم خدمات Cohere أيضاً ملخصات أو خلاصات لهذه الأعمال. يجادل المدعون بأن مستوى التفاصيل في هذه الملخصات واسع النطاق لدرجة أنها تحل أساساً محل الأعمال الأصلية، متجاوزة حدود الاستخدام العادل.

يحمي قانون حقوق الطبع والنشر ليس فقط النسخ الحرفي للأعمال المحمية بحقوق الطبع والنشر ولكن أيضاً إنشاء الأعمال المشتقة، وهي تعديلات أو تحويلات للأصل. يجادل المدعون بأن ملخصات Cohere شاملة لدرجة أنها تشكل أعمالاً مشتقة غير مصرح بها، وتخالف حقهم الحصري في إنشاء وتوزيع تعديلات لموادهم المحمية بحقوق الطبع والنشر.

المسؤولية الثانوية عن تصرفات المستخدم

بالإضافة إلى ادعاء انتهاك حقوق الطبع والنشر المباشر، يجادل المدعون أيضاً بأن Cohere مسؤولة بشكل ثانوي عن الأفعال المخالفة لمستخدميها. يجادلون بأن خدمات Cohere تسهل استنساخ وعرض وتوزيع أعمال المدعين من قبل المستخدمين، وأن Cohere لا يمكنها التهرب من المسؤولية عن طريق عزو الانتهاك فقط إلى تصرفات المستخدم. الأساس لهذا الادعاء هو أن منتج Cohere يولد إجابات فقط بعد أن يدخل المستخدم مطالبة، مما يجعل الشركة مشاركة في النشاط المخالف.

تعد حجة المسؤولية الثانوية هذه مهمة لأنها تسعى إلى تحميل مطوري الذكاء الاصطناعي المسؤولية عن تصرفات مستخدميهم، حتى عندما يكون هؤلاء المستخدمون هم الذين يشاركون بشكل مباشر في انتهاك حقوق الطبع والنشر. إذا نجحت هذه الحجة، فقد يكون لها آثار بعيدة المدى على تطوير ونشر تقنيات الذكاء الاصطناعي، لأنها ستتطلب من المطورين تنفيذ ضمانات لمنع مستخدميهم من انتهاك حقوق الطبع والنشر.

مطالبات انتهاك العلامات التجارية

تمتد الدعوى القضائية إلى ما هو أبعد من انتهاك حقوق الطبع والنشر لتشمل مطالبات بانتهاك العلامات التجارية. يزعم المدعون أن ممارسة Cohere المتمثلة في إسناد المصادر تشكل انتهاكاً للعلامة التجارية لأنها تستخدم العلامات التجارية المعروفة جيداً للمدعين دون إذن أو تربطها بمحتوى خاطئ تم إنشاؤه بواسطة الذكاء الاصطناعي. ويقولون إن هذا يؤدي إلى الإضرار بسمعة العلامة التجارية للمدعين وتخفيف تميزهم.

العلامات التجارية هي رموز أو تصميمات أو عبارات مسجلة قانونياً لتمثيل شركة أو منتج. يمكن أن يتسبب الاستخدام غير المصرح به لعلامة تجارية في إحداث ارتباك بين المستهلكين والإضرار بسمعة العلامة التجارية. يجادل المدعون بأن استخدام Cohere لعلاماتهم التجارية بالاشتراك مع المحتوى الذي تم إنشاؤه بواسطة الذكاء الاصطناعي قد يضلل المستخدمين للاعتقاد بأن المدعين يؤيدون أو ينتسبون إلى خدمات Cohere، وهو ليس كذلك.

السياق الأوسع: RAG ومستقبل قانون حقوق الطبع والنشر للذكاء الاصطناعي

هذه الدعوى القضائية ضد Cohere ليست حادثة معزولة. وهي تأتي في أعقاب دعوى قضائية سابقة بشأن حقوق الطبع والنشر في الولايات المتحدة في أكتوبر 2024 ركزت أيضاً على تطبيق RAG في خدمات الذكاء الاصطناعي. يسلط هذا العدد المتزايد من الحالات الضوء على التوتر المتزايد بين مطوري الذكاء الاصطناعي وأصحاب حقوق الطبع والنشر مع تزايد انتشار بنية RAG في خدمات الذكاء الاصطناعي.

من المحتمل أن تصبح المعارك القانونية المحيطة بتقنية RAG قضية مهمة في مستقبل قانون حقوق الطبع والنشر للذكاء الاصطناعي. تقدم RAG تحديات فريدة لأنها تنطوي على استرجاع واستخدام المواد المحمية بحقوق الطبع والنشر في الوقت الفعلي لإنشاء مخرجات. وهذا يثير أسئلة معقدة حول نطاق الاستخدام العادل ومسؤولية مطوري الذكاء الاصطناعي عن تصرفات المستخدم وحماية الملكية الفكرية في عصر الذكاء الاصطناعي.

يمكن أن يكون لنتائج هذه الدعاوى القضائية تأثير عميق على تطوير ونشر تقنيات الذكاء الاصطناعي. إذا حكمت المحاكم لصالح أصحاب حقوق الطبع والنشر، فقد يضطر مطورو الذكاء الاصطناعي إلى تنفيذ ضمانات أكثر صرامة لمنع انتهاك حقوق الطبع والنشر، مما قد يزيد من تكلفة وتعقيد تطوير نماذج الذكاء الاصطناعي. من ناحية أخرى، إذا حكمت المحاكم لصالح مطوري الذكاء الاصطناعي، فقد يحتاج أصحاب حقوق الطبع والنشر إلى إيجاد طرق جديدة لحماية ملكيتهم الفكرية في مواجهة تقنيات الذكاء الاصطناعي المتطورة بشكل متزايد.

يعمل الصدام بين ناشري الأخبار و Cohere كنقطة تحول حاسمة في النقاش الدائر حول الذكاء الاصطناعي وحقوق الطبع والنشر ومستقبل إنشاء المحتوى. سيكون لنتائج هذه القضية، إلى جانب قضايا أخرى مماثلة، بلا شك تأثير على المشهد القانوني للذكاء الاصطناعي التوليدي وتفاعله مع المواد المحمية بحقوق الطبع والنشر لسنوات قادمة. مع استمرار تطور الذكاء الاصطناعي وأصبح أكثر اندماجاً في جوانب مختلفة من حياتنا، من الضروري تحقيق توازن بين تعزيز الابتكار وحماية حقوق منشئي المحتوى. يجب على المحاكم والمشرعين ومجتمع الذكاء الاصطناعي العمل معاً لوضع مبادئ توجيهية ولوائح واضحة تعزز الإبداع مع ضمان احترام الملكية الفكرية.

تواجه صناعة الأخبار، على وجه الخصوص، مجموعة فريدة من التحديات في عصر الذكاء الاصطناعي. مع تزايد قدرة نماذج الذكاء الاصطناعي على إنشاء محتوى إخباري، من الضروري تعويض الناشرين عن استخدام موادهم المحمية بحقوق الطبع والنشر وحماية سلامة علاماتهم التجارية. تمثل الدعوى القضائية ضد Cohere جهداً من قبل ناشري الأخبار لتأكيد حقوقهم وضمان عدم استغلال عملهم من قبل شركات الذكاء الاصطناعي دون ترخيص مناسب.