اے آئی کی تربیت دیں یا نہیں؛ یہی سوال ہے۔

AI تربیت کے لیے کاپی رائٹ استثناء کا عروج

حالیہ برسوں میں، متعدد ممالک نے اپنے کاپی رائٹ قوانین میں خاص طور پر AI کمپنیوں کی جانب سے ٹیکسٹ اور ڈیٹا مائننگ کی سہولت فراہم کرنے کے لیے استثناء شامل کیے ہیں۔ ان استثناء کا مقصد مصنوعی ذہانت کے میدان میں جدت کو فروغ دینا ہے، جس سے LLMs کو ہر کاپی رائٹ ہولڈر سے واضح اجازت کی ضرورت کے بغیر وسیع ڈیٹا سیٹس پر تربیت دی جا سکتی ہے۔

مثال کے طور پر، سنگاپور نے 2021 میں اپنے کاپی رائٹ قانون میں ترمیم کی تاکہ اس طرح کا استثناء پیدا کیا جا سکے۔ اس اقدام نے ملک میں AI ڈویلپرز کے لیے اپنے ماڈلز کی تربیت کے مقصد سے کاپی رائٹ شدہ کاموں تک رسائی اور ان پر کارروائی کرنے کی راہ ہموار کی۔ اب، ایشیا میں دیگر دائرہ اختیار، بشمول ہانگ کانگ اور انڈونیشیا، اسی طرح کی قانون سازی تبدیلیوں پر غور کر رہے ہیں۔

چینی نقطہ نظر: ایک اہم خلاف ورزی کا مقدمہ

چین، عالمی AI منظر نامے میں ایک بڑا کھلاڑی، LLMs کے دور میں کاپی رائٹ کی پیچیدگیوں سے بھی نبرد آزما ہے۔ ایک اہم مقدمہ، iQiyi بمقابلہ MiniMax، نے اس مسئلے کو نمایاں کیا ہے۔

اس مقدمے میں، iQiyi، ایک ممتاز ویڈیو اسٹریمنگ پلیٹ فارم، نے MiniMax، ایک AI کمپنی، پر الزام لگایا کہ اس نے AI ماڈلز کو تربیت دینے کے لیے اس کے کاپی رائٹ شدہ ویڈیو مواد کو بغیر اجازت کے استعمال کیا۔ یہ مقدمہ ایک اہم پیش رفت کی نشاندہی کرتا ہے کیونکہ چین کا پہلا AI ویڈیو LLM خلاف ورزی کا مقدمہ، AI ٹیکنالوجیز کی ترقی میں کاپی رائٹ شدہ مواد کے غیر مجاز استعمال کے بارے میں بڑھتے ہوئے خدشات کو اجاگر کرتا ہے۔

بھارت کی اشاعتی صنعت LLM تربیتی طریقوں کو چیلنج کرتی ہے

یہ بحث ایشیا سے آگے تک پھیلی ہوئی ہے۔ بھارت میں، کئی پبلشنگ ہاؤسز نے LLM ڈویلپرز کے خلاف قانونی کارروائی شروع کی ہے، یہ الزام لگاتے ہوئے کہ یہ ماڈل اسکریپ شدہ ڈیٹا پر تربیت یافتہ ہیں جس میں ان کے کاپی رائٹ شدہ کام شامل ہیں۔ یہ مقدمے AI صلاحیتوں کو آگے بڑھانے کی خواہش اور تخلیق کاروں کے املاک دانش کے حقوق کے تحفظ کی ضرورت کے درمیان تناؤ کو واضح کرتے ہیں۔

سادہ انجیشن سے آگے: LLM تربیت کی باریکیاں

LLM تربیت کی وجہ سے درپیش چیلنجز صرف ڈیٹا کو انجیسٹ کرنے اور اس پر کارروائی کرنے کے عمل سے کہیں زیادہ پیچیدہ ہیں۔ بھارتی مقدمات اور سنگاپور کے قانون کی محدود تعریفیں اس مسئلے کی کثیر جہتی نوعیت کو اجاگر کرتی ہیں۔

بہت سے املاک دانش کے مالکان اپنے کاپی رائٹ شدہ کاموں تک رسائی اور استعمال کو واضح طور پر محدود کرتے ہیں، جبکہ دیگر ایسی رسائی اور دوبارہ تخلیق پر رضامند نہیں ہوتے ہیں۔ تخلیق کاروں کی ایک خاصی تعداد لائسنسنگ ماڈلز پر اپنے کاروبار کے بنیادی حصے کے طور پر انحصار کرتی ہے، اور AI تربیت کے لیے ان کے کاموں کا غیر مجاز استعمال براہ راست ان ماڈلز کو کمزور کرتا ہے۔

مزید برآں، یہ حقیقت کہ زیادہ تر تربیت کلاؤڈ میں ہو سکتی ہے، پیچیدہ دائرہ اختیار کے سوالات اٹھاتی ہے۔ یہ طے کرنا کہ کون سے قوانین لاگو ہوتے ہیں جب ڈیٹا پر بین الاقوامی سرحدوں پر کارروائی کی جاتی ہے، ایک پہلے سے ہی پیچیدہ قانونی منظر نامے میں پیچیدگی کی ایک اور تہہ کا اضافہ کرتا ہے۔

بالآخر، بنیادی مسئلہ اس بات کے گرد گھومتا ہے کہ LLMs اپنے تربیتی ڈیٹا کو کیسے محفوظ کرتے ہیں اور کیا، اور کیسے، انہیں کاپی رائٹ ہولڈرز کو اس کے استعمال کے لیے معاوضہ دینا چاہیے۔

US کاپی رائٹ تنظیمیں قانونی استثناء پر اعتراض کرتی ہیں

یہ بحث صرف انفرادی ممالک تک محدود نہیں ہے۔ یہ بین الاقوامی میدان میں بھی پھیل چکی ہے۔ ریاستہائے متحدہ میں تقریباً 50 تجارتی انجمنوں اور صنعتی گروپوں کا ایک اتحاد، جسے ڈیجیٹل کریئٹرز کولیشن کے نام سے جانا جاتا ہے، نے اجازت یا معاوضے کی دفعات کے بغیر کاپی رائٹ قوانین میں LLM تربیت کے لیے قانونی استثناء کے قیام پر سخت اعتراضات کا اظہار کیا ہے۔

ان تنظیموں نے یونائیٹڈ سٹیٹس ٹریڈ ریپریزنٹیٹو (USTR) کو تبصرے جمع کرائے ہیں، جس میں ایجنسی پر زور دیا گیا ہے کہ وہ اپنی سالانہ اسپیشل 301 جائزہ میں اس مسئلے کو حل کرے، جو دنیا بھر میں املاک دانش کے تحفظ اور نفاذ کے طریقوں کا جائزہ لیتا ہے۔ اتحاد نے ان ممالک کی ایک فہرست فراہم کی ہے جنہوں نے اس طرح کے استثناء کو نافذ کیا ہے یا تجویز کر رہے ہیں، جو اس تشویش کے عالمی پیمانے کو اجاگر کرتا ہے۔

امریکی بحث: OpenAI کا موقف اور اندرونی تضادات

یہاں تک کہ ریاستہائے متحدہ کے اندر بھی، بحث بہت زیادہ زندہ ہے۔ OpenAI، مقبول ChatGPT کے پیچھے کمپنی، نے وائٹ ہاؤس آفس آف سائنس اینڈ ٹیکنالوجی کو ایک کھلا خط جمع کروا کر بحث میں اپنی آواز شامل کی ہے۔

اس خط میں، OpenAI منصفانہ استعمال کے اصولوں کے تحت انٹرنیٹ سے ڈیٹا اسکریپ کرنے کے حق کی وکالت کرتا ہے، مؤثر طریقے سے تربیتی مقاصد کے لیے کاپی رائٹ شدہ مواد تک وسیع رسائی کے لیے بحث کرتا ہے۔ تاہم، متضاد طور پر، OpenAI یہ بھی تجویز کرتا ہے کہ غیر ملکی LLM ڈویلپرز کو ایسا کرنے سے روکا جانا چاہیے، ممکنہ طور پر امریکی برآمدی پالیسیوں کے استعمال کے ذریعے۔ یہ موقف ایک اندرونی تضاد کو ظاہر کرتا ہے، اپنے لیے کھلی رسائی کی وکالت کرتا ہے جبکہ دوسروں کی رسائی کو محدود کرنے کی کوشش کرتا ہے۔

آگے کا راستہ: ایک جاری بحث

جیسے جیسے 2025 قریب آرہا ہے، کاپی رائٹ اور AI تربیت پر بحث یقینی طور پر تیز ہوگی۔ دنیا بھر میں نئے LLMs کے مسلسل ابھرنے کے ساتھ، ایک واضح اور متوازن قانونی فریم ورک کی ضرورت تیزی سے بڑھ رہی ہے۔

موجودہ قانونی منظر نامہ قومی قوانین کا ایک مجموعہ ہے، کچھ میں AI تربیت کے لیے واضح استثناء ہیں اور دیگر میں ایسی دفعات کا فقدان ہے۔ یہ تضاد AI ڈویلپرز اور کاپی رائٹ ہولڈرز دونوں کے لیے غیر یقینی صورتحال پیدا کرتا ہے، جدت کو روکتا ہے اور ممکنہ طور پر تخلیق کاروں کے حقوق کو کمزور کرتا ہے۔

متوازن فریم ورک کے لیے اہم غور و فکر:

  • شفافیت اور جوابدہی: LLM ڈویلپرز کو اپنے ماڈلز کی تربیت کے لیے استعمال کیے جانے والے ڈیٹا کے ذرائع کے بارے میں شفاف ہونا چاہیے اور کاپی رائٹ شدہ مواد کے کسی بھی غیر مجاز استعمال کے لیے جوابدہ ہونا چاہیے۔
  • منصفانہ معاوضہ: AI تربیت میں اپنے کاموں کے استعمال کے لیے کاپی رائٹ ہولڈرز کو معاوضہ دینے کے طریقہ کار کو تلاش کیا جانا چاہیے۔ اس میں لائسنسنگ معاہدے، اجتماعی حقوق کا انتظام، یا دیگر جدید حل شامل ہو سکتے ہیں۔
  • بین الاقوامی ہم آہنگی: مختلف دائرہ اختیار میں AI تربیت سے متعلق کاپی رائٹ قوانین کو ہم آہنگ کرنے کی کوششیں قانونی غیر یقینی صورتحال کو کم کریں گی اور سرحد پار تعاون کو آسان بنائیں گی۔
  • جدت اور تخلیق کار کے حقوق میں توازن: قانونی فریم ورک کو AI میں جدت کو فروغ دینے اور تخلیق کاروں کے حقوق کے تحفظ کے درمیان توازن قائم کرنا چاہیے۔ اس کے لیے مختلف مفادات پر غور کرنے کی ضرورت ہے۔
  • منصفانہ استعمال کا کردار: AI تربیت پر منصفانہ استعمال کے اصولوں کے اطلاق کو واضح کرنے کی ضرورت ہے۔ اس میں مخصوص معیار کی وضاحت شامل ہو سکتی ہے تاکہ یہ طے کیا جا سکے کہ آیا تربیتی مقاصد کے لیے کاپی رائٹ شدہ مواد کا استعمال منصفانہ استعمال کے طور پر اہل ہے یا نہیں۔

کاپی رائٹ اور AI تربیت کے ارد گرد جاری بحث تیزی سے تیار ہوتی ہوئی ٹیکنالوجیز کے مطابق موجودہ قانونی فریم ورک کو ڈھالنے کے چیلنجوں کو اجاگر کرتی ہے۔ ایک ایسا حل تلاش کرنا جو تمام اسٹیک ہولڈرز کے مفادات میں توازن رکھتا ہو، اس کے لیے جاری بات چیت، تعاون، اور ڈیجیٹل دور کے بدلتے ہوئے منظر نامے کے مطابق ڈھالنے کی خواہش کی ضرورت ہوگی۔ AI ترقی کا مستقبل، اور تخلیقی کاموں کا تحفظ، اس اہم بحث کے نتیجے پر منحصر ہو سکتا ہے۔ تربیت کا سوال ایک طویل عرصے تک ہمارے ساتھ رہے گا۔