جنریٹو AI کاپی رائٹ جنگ: کوہیئر نشانہ پر

جنریٹو AI (Generative AI) کی ترقی ایک بار پھر قانونی جنگ میں الجھ گئی ہے، کیونکہ ممتاز خبر رساں اور میڈیا تنظیموں کے ایک گروپ نے جنریٹو AI اسٹارٹ اپ کوہیئر (Cohere) کے خلاف کاپی رائٹ (Copyright) اور ٹریڈ مارک (Trademark) کی خلاف ورزی کا مقدمہ دائر کر دیا ہے۔ فروری 2025 میں یو ایس ڈسٹرکٹ کورٹ فار سدرن ڈسٹرکٹ آف نیویارک میں دائر کیے گئے اس مقدمے میں ایک درجن سے زائد مدعیان شامل ہیں، جن میں فوربس (Forbes)، دی گارڈین (The Guardian) اور لاس اینجلس ٹائمز (Los Angeles Times) جیسے معتبر اشاعتی ادارے شامل ہیں۔ اس معاملے کی تہہ میں کوہیئر کی ریٹریول آگمینٹڈ جنریشن (Retrieval-Augmented Generation) یعنی آر اے جی (RAG) ٹیکنالوجی کا استعمال ہے، جس کے بارے میں مدعیان کا دعویٰ ہے کہ اس میں ان کے کاپی رائٹ شدہ مواد کو غیر مجاز طریقے سے استعمال کر کے ڈیٹا بیس (Databases) بنائے جاتے ہیں اور نتائج اخذ کیے جاتے ہیں۔

آر اے جی (RAG) ٹیکنالوجی زیرِ تفتیش

ریٹریول آگمینٹڈ جنریشن (RAG) بڑے لسانی ماڈلز (Large Language Models) یعنی ایل ایل ایم (LLMs) سے وابستہ کچھ موروثی چیلنجز کا ممکنہ حل بن کر سامنے آئی ہے۔ 2020 میں پیٹرک لیوس (Patrick Lewis) اور ان کے ساتھیوں کی جانب سے تجویز کردہ، آر اے جی (RAG) کا مقصد ان مسائل کو کم کرنا ہے جیسے ہیلوسینیشن (Hallucination) یعنی حقائق کے منافی یا بے معنی معلومات کی تیاری، پرانا علم اور ماڈل کی استدلال میں شفافیت کی کمی۔ دلچسپ بات یہ ہے کہ پیٹرک لیوس خود اس وقت کوہیئر میں محقق ہیں اور آر اے جی (RAG) ٹیکنالوجی پر اپنا کام جاری رکھے ہوئے ہیں۔ آر اے جی (RAG) کو بڑے پیمانے پر اپنایا گیا ہے، اور مائیکروسافٹ (Microsoft)، گوگل (Google)، ایمیزون (Amazon) اور این ویڈیا (NVIDIA) جیسے بڑے کھلاڑی اسے اپنے AI نظاموں میں ضم کر رہے ہیں۔

خبر رساں اداروں کی جانب سے دائر کیا جانے والا مقدمہ کوہیئر کے خلاف کاپی رائٹ کی خلاف ورزی کے کئی کلیدی الزامات پر مرکوز ہے۔ یہ دعوے جنریٹو AI ماڈلز کی تربیت اور آپریشن میں کاپی رائٹ شدہ مواد کے استعمال سے متعلق پیچیدہ قانونی سوالات کو اجاگر کرتے ہیں۔

کوہیئر کے خلاف کاپی رائٹ کی خلاف ورزی کے دعوے

کوہیئر کے خلاف مدعیان کے الزامات کو چار اہم اقسام میں تقسیم کیا جا سکتا ہے:

1. اے آئی (AI) ماڈل کی تربیت

مدعیان کے استدلال کا مرکز اس بات کے گرد گھومتا ہے کہ کوہیئر نے اپنے بڑے لسانی ماڈل کو کیسے تربیت دی، جسے "کمانڈ فیملی" (Command Family) کے نام سے جانا جاتا ہے۔ ان کا دعویٰ ہے کہ کوہیئر نے انٹرنیٹ (Internet) سے متن کی وسیع پیمانے پر "سکریپنگ" (Scraping) کی، جس میں مدعیان کی مطبوعات سے کاپی رائٹ شدہ مواد بھی شامل ہے۔ اس سکریپ شدہ ڈیٹا (Scraped data) کو بعد میں کمانڈ فیملی (Command Family) ماڈل کی تربیت کے لیے ضروری ڈیٹا سیٹس (Datasets) بنانے کے لیے استعمال کیا گیا۔ مزید برآں، مدعیان کا الزام ہے کہ کوہیئر نے تھرڈ پارٹی (Third-party) ڈیٹا سیٹس جیسے کامن کرال (Common Crawl) کا سی فور (C4) استعمال کیا، جس میں ان کے کاپی رائٹ شدہ مواد کی نمایاں مقدار موجود ہے، بغیر ضروری اجازت حاصل کیے۔

اے آئی ماڈل کی تربیت میں کاپی رائٹ شدہ مواد کا استعمال ایک متنازعہ مسئلہ بن گیا ہے۔ اے آئی ڈویلپرز (AI developers) اکثر یہ دلیل دیتے ہیں کہ اس طرح کا استعمال "منصفانہ استعمال" (Fair use) کے اصول کے تحت آتا ہے، جو تنقید، تبصرہ، خبروں کی رپورٹنگ، تدریس، اسکالرشپ (Scholarship) یا تحقیق جیسے مقاصد کے لیے کاپی رائٹ شدہ مواد کے محدود استعمال کی اجازت دیتا ہے۔ تاہم، کاپی رائٹ ہولڈرز (Copyright holders) کا استدلال ہے کہ ان کے مواد کو تجارتی مقاصد کے لیے بڑے پیمانے پر سکریپ کرنا اور استعمال کرنا، جیسے کہ AI ماڈلز کی تربیت، منصفانہ استعمال کے دائرہ کار سے باہر ہے۔ یہ قانونی جنگ ممکنہ طور پر اس بات پر منحصر ہوگی کہ عدالت مدعیان کی تشخیص سے اتفاق کرتی ہے یا نہیں۔

2. ریئل ٹائم استعمال / آر اے جی (RAG)

مقدمے کا ایک اور اہم پہلو اس بات پر مرکوز ہے کہ کوہیئر کی خدمات، خاص طور پر اس کا چیٹ (Chat) انٹرفیس، ریئل ٹائم (Real-time) میں آر اے جی (RAG) ٹیکنالوجی کو کیسے استعمال کرتا ہے۔ مدعیان کا الزام ہے کہ کوہیئر کے ماڈلز بیرونی ذرائع سے مواد سکریپ کرتے ہیں، بشمول ان کی ویب سائٹوں سے، تاکہ صارف کے سوالات کے جوابات تیار کیے جا سکیں۔ مدعیان کے مطابق یہ ریئل ٹائم سکریپنگ (Real-time scraping) کاپی رائٹ کی خلاف ورزی ہے، خاص طور پر جب کوہیئر کے ماڈلز پے والز (Paywalls) کو نظر انداز کرتے ہیں یا "روبوٹس ڈاٹ ٹی ایکس ٹی" (robots.txt) ہدایات کو نظر انداز کرتے ہیں، جو وہ کمانڈز (Commands) ہیں جو ویب کرالرز (Web crawlers) (بشمول AI ماڈلز کے ذریعے استعمال ہونے والے) کو کسی ویب سائٹ (Website) سے مخصوص مواد کو سکریپ نہ کرنے کی ہدایت کرتے ہیں۔

پے والز (Paywalls) اور روبوٹس ڈاٹ ٹی ایکس ٹی (robots.txt) ہدایات کو نظر انداز کرنا سنگین اخلاقی اور قانونی سوالات اٹھاتا ہے۔ پے والز (Paywalls) کاپی رائٹ شدہ مواد کی حفاظت اور اس بات کو یقینی بنانے کے لیے بنائے گئے ہیں کہ ناشرین کو ان کے کام کا معاوضہ ادا کیا جائے۔ روبوٹس ڈاٹ ٹی ایکس ٹی (robots.txt) ہدایات ویب سائٹ کے مالکان کے لیے یہ کنٹرول کرنے کا ایک معیاری طریقہ کار ہے کہ ان کے مواد تک کیسے رسائی حاصل کی جاتی ہے اور ویب کرالرز کے ذریعے کیسے استعمال کیا جاتا ہے۔ ان حفاظتی تدابیر کو نظر انداز کر کے، کوہیئر پر کاپی رائٹ قوانین اور مواد تخلیق کاروں کے حقوق کی خلاف ورزی کا الزام ہے۔

3. خلاف ورزی کرنے والے نتائج

مدعیان کا استدلال ہے کہ کوہیئر کی خدمات صارف کے سوالات کے جواب میں ان کے کاپی رائٹ شدہ کاموں کی کاپیاں، ٹھوس اقتباسات یا متبادل خلاصے کی شکل میں خلاف ورزی کرنے والے نتائج فراہم کرتی ہیں۔ وہ کوہیئر چیٹ (Cohere Chat) کے ان نتائج کی مثالیں دیتے ہیں جہاں "انڈر دی ہڈ" (Under the Hood) پینل مدعیان کی ویب سائٹوں سے براہ راست کاپی کیے گئے مکمل یا جزوی مضامین دکھاتا ہے۔

مدعیان دلیل دیتے ہیں کہ یہ نتائج، چاہے وہ لفظی کاپیاں ہوں یا خلاصے، براہ راست صارفین کی اصل مضامین پر جانے کی ضرورت کو بدل دیتے ہیں۔ اس کے نتیجے میں، یہ ڈیجیٹل (Digital) سبسکرپشن (Subscription) اور اشتہاری آمدنی کو نقصان پہنچاتا ہے جس پر مدعیان اپنے کاروبار کو برقرار رکھنے کے لیے انحصار کرتے ہیں۔ اس دلیل کا بنیادی نکتہ یہ ہے کہ کوہیئر کے AI ماڈلز لازمی طور پر کاپی رائٹ شدہ مواد کے غیر مجاز تقسیم کار کے طور پر کام کر رہے ہیں، اصل ناشرین کو ان کے جائز معاوضے سے محروم کر رہے ہیں۔

4. غیر مجاز موافقت

"انڈر دی ہڈ" (Under the Hood) پینل میں مدعیان کے کاموں کے حصے دکھانے کے علاوہ، کوہیئر کی خدمات ان کاموں کے خلاصے یا اقتباسات بھی فراہم کرتی ہیں۔ مدعیان کا استدلال ہے کہ ان خلاصوں میں تفصیلات کی سطح اتنی وسیع ہے کہ وہ لازمی طور پر اصل کاموں کی جگہ لے لیتے ہیں، منصفانہ استعمال کی حدود سے تجاوز کر جاتے ہیں۔

کاپی رائٹ قانون نہ صرف کاپی رائٹ شدہ کاموں کی لفظی تولید کی حفاظت کرتا ہے بلکہ مشتق کاموں کی تخلیق کی بھی حفاظت کرتا ہے، جو اصل کی موافقت یا تبدیلیاں ہیں۔ مدعیان کا استدلال ہے کہ کوہیئر کے خلاصے اتنے جامع ہیں کہ وہ غیر مجاز مشتق کاموں کے مترادف ہیں، ان کے کاپی رائٹ شدہ مواد کی موافقت بنانے اور تقسیم کرنے کے خصوصی حق کی خلاف ورزی کرتے ہیں۔

صارف کے اعمال کے لیے ثانوی ذمہ داری

براہ راست کاپی رائٹ کی خلاف ورزی کے دعوے سے ہٹ کر، مدعیان یہ بھی دلیل دیتے ہیں کہ کوہیئر اپنے صارفین کے خلاف ورزی کرنے والے اعمال کے لیے ثانوی طور پر ذمہ دار ہے۔ ان کا استدلال ہے کہ کوہیئر کی خدمات صارفین کی جانب سے مدعیان کے کاموں کی تولید، نمائش اور تقسیم میں سہولت فراہم کرتی ہیں، اور یہ کہ کوہیئر صرف صارف کے اعمال کی طرف خلاف ورزی منسوب کر کے ذمہ داری سے بچ نہیں سکتا۔ اس دعوے کی بنیاد یہ ہے کہ کوہیئر کی پروڈکٹ (Product) صارف کے پرامپٹ (Prompt) داخل کرنے کے بعد ہی جوابات تیار کرتی ہے، جس سے کمپنی خلاف ورزی کی سرگرمی میں شریک ہوتی ہے۔

ثانوی ذمہ داری کا یہ استدلال اہم ہے کیونکہ اس کا مقصد AI ڈویلپرز کو ان کے صارفین کے اعمال کے لیے جوابدہ ٹھہرانا ہے، یہاں تک کہ جب وہ صارفین براہ راست کاپی رائٹ کی خلاف ورزی میں ملوث ہوں۔ اگر یہ استدلال کامیاب ہو جاتا ہے، تو اس کے AI ٹیکنالوجیز کی ترقی اور تعیناتی کے لیے دور رس نتائج ہو سکتے ہیں، کیونکہ اس کے لیے ڈویلپرز کو اپنے صارفین کو کاپی رائٹ کی خلاف ورزی سے روکنے کے لیے حفاظتی تدابیر نافذ کرنے کی ضرورت ہوگی۔

ٹریڈ مارک کی خلاف ورزی کے دعوے

مقدمہ کاپی رائٹ کی خلاف ورزی سے آگے بڑھ کر ٹریڈ مارک کی خلاف ورزی کے دعووں تک پھیلتا ہے۔ مدعیان کا الزام ہے کہ ذرائع کو منسوب کرنے کا کوہیئر کا طریقہ کار ٹریڈ مارک کی خلاف ورزی ہے کیونکہ یہ مدعیان کے معروف ٹریڈ مارکس کو بغیر اجازت کے استعمال کرتا ہے یا انہیں AI کے ذریعے تیار کردہ غلط مواد سے جوڑتا ہے۔ ان کا استدلال ہے کہ اس سے مدعیان کی برانڈ (Brand) کی ساکھ کو نقصان پہنچتا ہے اور ان کی امتیازی حیثیت کم ہوتی ہے۔

ٹریڈ مارک (Trademark) علامات، ڈیزائین (Design) یا جملے ہیں جو قانونی طور پر کسی کمپنی (Company) یا پروڈکٹ کی نمائندگی کے لیے رجسٹرڈ (Registered) ہیں۔ ٹریڈ مارک (Trademark) کا غیر مجاز استعمال صارفین میں الجھن پیدا کر سکتا ہے اور برانڈ (Brand) کی ساکھ کو نقصان پہنچا سکتا ہے۔ مدعیان کا استدلال ہے کہ AI کے ذریعے تیار کردہ مواد کے ساتھ ان کے ٹریڈ مارکس کا کوہیئر کا استعمال صارفین کو یہ یقین دلانے کا باعث بن سکتا ہے کہ مدعیان کوہیئر کی خدمات کی توثیق کرتے ہیں یا اس سے وابستہ ہیں، جو کہ ایسا نہیں ہے۔

وسیع تناظر: آر اے جی (RAG) اور AI کاپی رائٹ قانون کا مستقبل

کوہیئر کے خلاف یہ مقدمہ ایک الگ واقعہ نہیں ہے۔ اس سے پہلے اکتوبر 2024 میں امریکہ میں کاپی رائٹ کا ایک مقدمہ دائر کیا گیا تھا جس میں AI خدمات میں آر اے جی (RAG) ایپلی کیشن (Application) پر بھی توجہ مرکوز کی گئی تھی۔ کیسز کی یہ بڑھتی ہوئی تعداد AI ڈویلپرز (AI developers) اور کاپی رائٹ ہولڈرز (Copyright holders) کے درمیان بڑھتے ہوئے تناؤ کو ظاہر کرتی ہے کیونکہ آر اے جی (RAG) آرکیٹیکچر (Architecture) AI خدمات میں زیادہ عام ہوتا جا رہا ہے۔

آر اے جی (RAG) ٹیکنالوجی کے ارد گرد قانونی جنگیں غالباً AI کاپی رائٹ قانون کے مستقبل میں ایک اہم مسئلہ بن جائیں گی۔ آر اے جی (RAG) منفرد چیلنجز پیش کرتا ہے کیونکہ اس میں نتائج تیار کرنے کے لیے کاپی رائٹ شدہ مواد کی ریئل ٹائم (Real-time) بازیافت اور استعمال شامل ہے۔ یہ منصفانہ استعمال کے دائرہ کار، صارف کے اعمال کے لیے AI ڈویلپرز کی ذمہ داری اور مصنوعی ذہانت کے دور میں دانشورانہ ملکیت کے تحفظ کے بارے میں پیچیدہ سوالات اٹھاتا ہے۔

ان مقدمات کے نتائج کا AI ٹیکنالوجیز کی ترقی اور تعیناتی پر گہرا اثر پڑ سکتا ہے۔ اگر عدالتیں کاپی رائٹ ہولڈرز کے حق میں فیصلہ سناتی ہیں، تو AI ڈویلپرز کو کاپی رائٹ کی خلاف ورزی کو روکنے کے لیے سخت حفاظتی تدابیر نافذ کرنے پر مجبور کیا جا سکتا ہے، جس سے AI ماڈلز تیار کرنے کی لاگت اور پیچیدگی میں اضافہ ہو سکتا ہے۔ دوسری طرف، اگر عدالتیں AI ڈویلپرز کے حق میں فیصلہ سناتی ہیں، تو کاپی رائٹ ہولڈرز کو تیزی سے جدید AI ٹیکنالوجیز کے پیش نظر اپنی دانشورانہ ملکیت کے تحفظ کے لیے نئے طریقے تلاش کرنے کی ضرورت پڑ سکتی ہے۔

خبر رساں اداروں اور کوہیئر کے درمیان تصادم AI، کاپی رائٹ اور مواد کی تخلیق کے مستقبل کے بارے میں جاری بحث میں ایک نازک موڑ کا کام کرتا ہے۔ اس کیس کا نتیجہ، اس طرح کے دوسرے مقدمات کے ساتھ، بلاشبہ جنریٹو AI اور کاپی رائٹ شدہ مواد کے ساتھ اس کے تعامل کے لیے قانونی منظر نامے کو آنے والے برسوں تک تشکیل دے گا۔ جیسے جیسے AI مسلسل ترقی کر رہی ہے اور ہماری زندگیوں کے مختلف پہلوؤں میں زیادہ مربوط ہوتی جا رہی ہے، اختراع کو فروغ دینے اور مواد تخلیق کاروں کے حقوق کے تحفظ کے درمیان توازن قائم کرنا ضروری ہے۔ عدالتوں، قانون سازوں اور AI کمیونٹی (AI community) کو مل کر کام کرنا چاہیے تاکہ واضح ہدایات اور ضوابط قائم کیے جا سکیں جو دانشورانہ ملکیت کا احترام کرتے ہوئے تخلیقی صلاحیتوں کو فروغ دیں۔

خاص طور پر خبروں کی صنعت کو AI کے دور میں چیلنجز کے ایک منفرد سیٹ کا سامنا ہے۔ جیسے جیسے AI ماڈلز خبروں کا مواد تیار کرنے کے لیے تیزی سے قابل ہوتے جا رہے ہیں، یہ ضروری ہے کہ ناشرین کو ان کے کاپی رائٹ شدہ مواد کے استعمال کا معاوضہ ادا کیا جائے اور ان کے برانڈز کی سالمیت کو تحفظ فراہم کیا جائے۔ کوہیئر کے خلاف مقدمہ خبر رساں اداروں کی جانب سے اپنے حقوق جتانے اور اس بات کویقینی بنانے کی ایک کوشش کی نمائندگی کرتا ہے کہ ان کے کام کو AI کمپنیوں کی جانب سے مناسب منظوری کے بغیر استعمال نہ کیا جائے۔