Reddit اور Anthropic کے درمیان قانونی جنگ

Reddit نے مصنوعی ذہانت کی کمپنی Anthropic کے خلاف قانونی کارروائی شروع کر دی ہے، جس میں الزام لگایا گیا ہے کہ اس نے اپنے AI چیٹ بوٹ Claude کو تربیت دینے کے لیے صارف کی جانب سے تیار کردہ مواد کو غیر مجاز طور پر استعمال کیا ہے۔ یہ مقدمہ، جو کیلیفورنیا کی سپیریئر کورٹ ان سان فرانسسکو میں دائر کیا گیا ہے، Anthropic پر Reddit پلیٹ فارم سے لاکھوں تبصرے بغیر اجازت کے "سکریپ" کرنے، کمپنی کی سروس کی شرائط کی خلاف ورزی کرنے، اور غیر منصفانہ مقابلے میں ملوث ہونے کا الزام عائد کرتا ہے۔

ڈیٹا سکریپنگ کے الزامات

مقدمے کی بنیاد Reddit کا یہ دعویٰ ہے کہ Anthropic نے پلیٹ فارم سے مواد تک رسائی اور اسے نکالنے کے لیے خودکار بوٹس کا استعمال کیا، باوجود اس کے کہ ایسی سرگرمیوں کو بند کرنے کی واضح درخواستیں کی گئیں۔ اس عمل کو "سکریپنگ" کے نام سے جانا جاتا ہے، جس میں ویب سائٹس سے منظم طریقے سے ڈیٹا اکٹھا کرنا شامل ہے، اکثر ویب سائٹ کی رضامندی کے بغیر۔ Reddit کا کہنا ہے کہ Anthropic نے اس سکریپ کیے گئے ڈیٹا کو اپنے Claude چیٹ بوٹ کو تربیت دینے کے لیے استعمال کیا، جس سے Reddit صارفین کی ذاتی معلومات کو ان کے علم یا اجازت کے بغیر مؤثر طریقے سے استعمال کیا گیا۔

Reddit کے چیف قانونی افسر، Ben Lee، نے ڈیٹا کے استعمال پر کمپنی کے موقف پر زور دیتے ہوئے کہا کہ "AI کمپنیوں کو معلومات اور مواد کو لوگوں سے اس بات پر واضح پابندیوں کے بغیر حاصل کرنے کی اجازت نہیں ہونی چاہیے کہ وہ اس ڈیٹا کو کیسے استعمال کر سکتے ہیں۔" یہ بیان Reddit کی اس تشویش کو اجاگر کرتا ہے کہ AI کمپنیاں صارف کی جانب سے تیار کردہ مواد کو صارف کی رازداری اور ڈیٹا کے تحفظ کے لیے مناسب حفاظتی اقدامات فراہم کیے بغیر استعمال کر رہی ہیں۔

Reddit کے الزامات کے جواب میں، Anthropic نے ایک بیان جاری کیا جس میں دعووں سے عدم اتفاق کا اظہار کیا گیا اور "اپنا بھرپور دفاع کرنے" کے ارادے کا اظہار کیا گیا۔ کمپنی کا دفاع ممکنہ طور پر مناسب استعمال، عوامی سطح پر دستیاب ڈیٹا کی نوعیت، اور اس حد تک متعلقہ دلائل پر منحصر ہوگا کہ اس کی AI تربیت کے طریقے قانونی اور اخلاقی معیارات کی تعمیل کرتے ہیں۔

Reddit کے لائسنسنگ معاہدے

Anthropic کے خلاف قانونی کارروائی Reddit کے دیگر AI کمپنیوں، جن میں Google اور OpenAI شامل ہیں، کے ساتھ موجودہ لائسنسنگ معاہدوں کے تناظر میں سامنے آئی ہے۔ یہ معاہدے ان کمپنیوں کو Reddit کی عوامی تبصروں کے وسیع ذخیرے پر اپنے AI سسٹمز کو تربیت دینے کی اجازت دیتے ہیں، جو اس کے 100 ملین سے زیادہ روزانہ صارفین کے ذریعہ تیار کیے جاتے ہیں۔ اس ڈیٹا تک رسائی کے بدلے، Reddit معاوضہ وصول کرتا ہے اور، سب سے اہم بات، صارف کے تحفظات کو نافذ کرنے کی صلاحیت حاصل کرتا ہے۔

Ben Lee کے مطابق، یہ لائسنسنگ معاہدے "ہمیں اپنے صارفین کے لیے بامعنی تحفظات کو نافذ کرنے کے قابل بناتے ہیں، بشمول آپ کے مواد کو حذف کرنے کا حق، صارف کی رازداری کے تحفظات، اور صارفین کو اس مواد کا استعمال کرتے ہوئے سپیم کیے جانے سے روکنا۔" یہ AI کمپنیوں کی جانب سے اس کے ڈیٹا کے استعمال کو منظم کرنے کے لیے Reddit کے فعال انداز کو اجاگر کرتا ہے، اس بات کو یقینی بناتا ہے کہ صارفین کے حقوق اور رازداری کا احترام کیا جائے۔

Anthropic کے خلاف مقدمہ کو Reddit کی جانب سے اپنی ڈیٹا کے استعمال کی پالیسیوں کو نافذ کرنے اور اپنے صارفین کے مفادات کے تحفظ کی ایک کوشش کے طور پر دیکھا جا سکتا ہے۔ قانونی کارروائی کے ذریعے، Reddit AI کمپنیوں کو ایک واضح پیغام بھیج رہا ہے کہ وہ غیر مجاز ڈیٹا سکریپنگ کو برداشت نہیں کرے گا اور اپنے حقوق اور اپنے صارفین کے حقوق کا فعال طور پر دفاع کرے گا۔

Anthropic کی AI ترقی

Anthropic، جس کی بنیاد 2021 میں OpenAI کے سابق ایگزیکٹوز نے رکھی تھی، AI چیٹ بوٹ مارکیٹ میں ایک اہم کھلاڑی کے طور پر ابھری ہے۔ اس کی اہم پروڈکٹ Claude، OpenAI کے ChatGPT کا براہ راست حریف ہے۔ اگرچہ OpenAI کی مائیکروسافٹ کے ساتھ قریبی شراکت داری ہے، لیکن Anthropic کا بنیادی تجارتی پارٹنر Amazon ہے، جو اپنے Alexa وائس اسسٹنٹ کو بہتر بنانے کے لیے Claude کا استعمال کر رہا ہے۔

بہت سی AI کمپنیوں کی طرح، Anthropic اپنے AI ماڈلز کو تربیت دینے کے لیے متن اور کوڈ کے بڑے ڈیٹا سیٹس پر انحصار کرتا ہے۔ ان ڈیٹا سیٹس میں اکثر Wikipedia اور Reddit جیسی ویب سائٹس کا مواد شامل ہوتا ہے، جو موضوعات کی ایک وسیع رینج پر معلومات کی دولت فراہم کرتے ہیں اور انسانی زبان کی باریکیوں کی عکاسی کرتے ہیں۔ مقدمہ AI کمپنیوں کے آسانی سے دستیاب آن لائن مواد پر انحصار کو اجاگر کرتا ہے، جس سے AI تربیت کے لیے اس طرح کے ڈیٹا کے استعمال کے اخلاقی اور قانونی مضمرات کے بارے میں سوالات اٹھتے ہیں۔

"سکریپنگ" پر بحث

ویب سائٹس سے ڈیٹا "سکریپ" کرنے کا عمل AI صنعت میں ایک متنازع مسئلہ بن گیا ہے۔ AI کمپنیاں دلیل دیتی ہیں کہ ان کے AI ماڈلز کو تربیت دینے کے لیے مطلوبہ ڈیٹا کی وسیع مقدار کو جمع کرنے کے لیے سکریپنگ ضروری ہے۔ وہ اکثر "مناسب استعمال" کے تصور کا حوالہ دیتے ہیں، جو تعلیمی، تحقیقی، اور تبصرے جیسے بعض مقاصد کے لیے کاپی رائٹ شدہ مواد کے استعمال کی اجازت دیتا ہے۔

تاہم، ویب سائٹ کے مالکان اور مواد تخلیق کاروں کا استدلال ہے کہ سکریپنگ ان کی سروس کی شرائط کی خلاف ورزی کر سکتی ہے، ان کے کاپی رائٹس کی خلاف ورزی کر سکتی ہے، اور ان کے کاروباری ماڈلز کو کمزور کر سکتی ہے۔ ان کا کہنا ہے کہ AI کمپنیوں کو اپنے ڈیٹا کو سکریپ کرنے سے پہلے اجازت حاصل کرنی چاہیے اور ان کے مواد کے استعمال کے لیے انہیں معاوضہ ادا کرنا چاہیے۔

Anthropic کے خلاف Reddit کا مقدمہ ڈیٹا سکریپنگ پر AI کمپنیوں اور مواد فراہم کرنے والوں کے درمیان بڑھتے ہوئے تناؤ کی صرف ایک مثال ہے۔ چونکہ AI ٹیکنالوجی مسلسل ترقی کر رہی ہے، اس لیے یہ قانونی اور اخلاقی بحثیں تیز ہونے کا امکان ہے، جس کی وجہ سے AI تربیت کے لیے ڈیٹا کے استعمال کو کنٹرول کرنے والے نئے قوانین اور ضوابط تیار ہوں گے۔

2021 کا مقالہ

Anthropic کے CEO Dario Amodei کے مشترکہ تصنیف کردہ 2021 کے ایک تحقیقی مقالے کا حوالہ Reddit مقدمے میں دیا گیا تھا۔ اس مقالے میں ان مخصوص subreddits، یا موضوعاتی فورمز پر روشنی ڈالی گئی، جنہیں Anthropic کے محققین نے AI تربیت کے لیے اعلیٰ معیار کے ڈیٹا پر مشتمل قرار دیا۔ ان subreddits نے باغبانی اور تاریخ سے لے کر تعلقات کے مشورے اور شاور کے خیالات تک موضوعات کی ایک وسیع رینج کا احاطہ کیا۔

مقدمے میں اس مقالے کا حوالہ Reddit کے اس دعوے کی تائید کرتا ہے کہ Anthropic نے جان بوجھ کر ڈیٹا سکریپنگ کے لیے اپنے پلیٹ فارم کو نشانہ بنایا۔ مخصوص subreddits کو AI تربیت کے ڈیٹا کے قیمتی ذرائع کے طور پر شناخت کر کے، Anthropic نے مبینہ طور پر Reddit سے بغیر اجازت کے مواد نکالنے کا اپنا ارادہ ظاہر کیا۔

Anthropic کا کاپی رائٹ دلیل

امریکہ کے کاپی رائٹ آفس کو 2023 کے ایک خط میں، Anthropic نے دلیل دی کہ اس کے AI تربیت کے طریقے "مواد کا ایک لازمی طور پر قانونی استعمال" ہیں۔ کمپنی نے دعویٰ کیا کہ اس کے AI ماڈلز صرف بڑے ڈیٹا سیٹس پر شماریاتی تجزیہ کرنے کے مقصد کے لیے معلومات کی کاپیاں بناتے ہیں، جو اس کے خیال میں مناسب استعمال کے اصول کے تحت آتا ہے۔

تاہم، اس دلیل کو عالمگیر طور پر قبول نہیں کیا گیا ہے۔ Anthropic کو فی الحال بڑے میوزک پبلشرز کی جانب سے ایک علیحد?? مقدمے کا سامنا ہے، جو الزام لگاتے ہیں کہ Claude کاپی رائٹ شدہ گانوں کے بول دوبارہ پیش کرتا ہے۔ یہ مقدمہ AI ماڈلز کے ذریعہ کاپی رائٹ شدہ مواد کو دوبارہ پیش کرنے یا تقسیم کرنے کے ذریعہ کاپی رائٹس کی خلاف ورزی کرنے کے امکانات کے بارے میں خدشات کو جنم دیتا ہے۔

سروس کی شرائط کی خلاف ورزی

Anthropic کے خلاف Reddit کا مقدمہ AI کمپنیوں کے خلاف لائے جانے والے دیگر قانونی چیلنجوں سے اس لحاظ سے مختلف ہے کہ اس میں کاپی رائٹ کی خلاف ورزی کا الزام نہیں لگایا گیا ہے۔ اس کے بجائے، یہ Reddit کی سروس کی شرائط کی مبینہ خلاف ورزی اور اس خلاف ورزی کے نتیجے میں ہونے والے غیر منصفانہ مقابلے پر توجہ مرکوز کرتا ہے۔

Reddit کا استدلال ہے کہ Anthropic نے پلیٹ فارم سے بغیر اجازت کے مواد کو سکریپ کر کے اپنی سروس کی شرائط کی خلاف ورزی کی ہے۔ اس کا یہ بھی کہنا ہے کہ Anthropic کے اقدامات نے اسے Reddit سے ڈیٹا لائسنسنگ سے وابستہ اخراجات کو برداشت کیے بغیر اپنے AI چیٹ بوٹ کو تیار کرنے کی اجازت دے کر غیر منصفانہ مقابلہ پیدا کیا۔

ان مسائل پر توجہ مرکوز کر کے، Reddit ایک قانونی مثال قائم کرنے کی کوشش کر رہا ہے جو AI صنعت کے لیے اہم مضمرات کا حامل ہو سکتا ہے۔ اگر Reddit اپنے مقدمے میں کامیاب ہو جاتا ہے، تو AI کمپنیوں کے لیے بغیر اجازت کے ویب سائٹس سے ڈیٹا کو سکریپ کرنا زیادہ مشکل ہو سکتا ہے، جس سے ممکنہ طور پر AI ماڈلز کے تربیت دینے کے طریقے میں تبدیلی آ سکتی ہے۔

AP اور OpenAI معاہدہ

Associated Press (AP) اور OpenAI کے درمیان ایک لائسنسنگ اور ٹیکنالوجی معاہدہ ہے جو OpenAI کو AP کے ٹیکسٹ آرکائیوز کے ایک حصے تک رسائی فراہم کرتا ہے۔ یہ معاہدہ AI تربیت کے مقاصد کے لیے اپنے ڈیٹا کو لائسنس دینے کے لیے مواد فراہم کرنے والوں کے AI کمپنیوں کے ساتھ شراکت کرنے کے بڑھتے ہوئے رجحان کی عکاسی کرتا ہے۔

اس طرح کے معاہدے مواد فراہم کرنے والوں کو اپنے ڈیٹا سے آمدنی پیدا کرنے کا ایک طریقہ پیش کرتے ہیں جبکہ اس بات پر کنٹرول بھی برقرار رکھتے ہیں کہ اس ڈیٹا کو کس طرح استعمال کیا جاتا ہے۔ وہ AI کمپنیوں کو اعلیٰ معیار کے ڈیٹا تک رسائی بھی فراہم کرتے ہیں جو ان کے AI ماڈلز کی کارکردگی کو بہتر بنا سکتا ہے۔

وسیع تر مضمرات

Anthropic کے خلاف Reddit کا مقدمہ صرف دو کمپنیوں کے درمیان تنازعہ نہیں ہے۔ یہ AI ترقی کے ارد گرد وسیع تر قانونی اور اخلاقی بحثوں کا پیش خیمہ ہے۔ اس کیس کے نتائج AI صنعت کے لیے اہم مضمرات کا حامل ہو سکتا ہے، اور ممکنہ طور پر AI ماڈلز کے تربیت پانے کے طریقے اور مواد فراہم کرنے والوں کے حقوق کی تشکیل کر سکتا ہے۔

چونکہ AI ٹیکنالوجی مسلسل ترقی کر رہی ہے، اس لیے یہ ضروری ہے کہ ان مسائل کو ایک سوچے سمجھے اور جامع انداز میں حل کیا جائے۔ اس کے لیے AI کمپنیوں، مواد فراہم کرنے والوں، پالیسی سازوں اور عوام کے درمیان تعاون کی ضرورت ہوگی تاکہ ایک ایسا فریم ورک تیار کیا جا سکے جو AI اختراع کے فوائد کو صارف کی رازداری، دانشورانہ املاک اور منصفانہ مقابلے کے تحفظ کی ضرورت کے ساتھ متوازن کرے۔

سکریپنگ کی تعریف

اس تناظر میں، سکریپنگ سے مراد ویب سائٹس سے ڈیٹا کا خودکار نکالنا ہے۔ HTML کوڈ کو پارس کرنے اور مخصوص عناصر جیسے متن، تصاویر، یا لنکس کو نکالنے کے لیے ٹولز استعمال کیے جاتے ہیں۔ Reddit کے معاملے میں، مبینہ طور پر Anthropic نے صارف کے تبصروں کو سکریپ کرنے کے لیے بوٹس کا استعمال کیا، جو زبان کے ماڈلز کو تربیت دینے کے لیے قیمتی ہیں۔

سکریپنگ کی قانونی حیثیت ایک غیر واضح علاقہ ہے۔ ویب سائٹس میں عموماً سروس کی شرائط ہوتی ہیں جو اس طرح کی سرگرمی کو منع کرتی ہیں، لیکن نفاذ مشکل ہو سکتا ہے۔ کچھ کا استدلال ہے کہ عوامی سطح پر دستیاب ڈیٹا قابل رسائی ہونا چاہیے، جبکہ دیگر ویب سائٹ کے مالکان کے اپنے مواد کو کنٹرول کرنے کے حقوق پر زور دیتے ہیں۔

مناسب استعمال کا اصول

مناسب استعمال کا اصول ایک قانونی اصول ہے جو کاپی رائٹ کے مالک سے اجازت کے بغیر کاپی رائٹ شدہ مواد کے محدود استعمال کی اجازت دیتا ہے۔ اصول کا مقصد تبصرے، تنقید، خبروں کی رپورٹنگ، تدریس، اسکالرشپ اور تحقیق کی اجازت دے کر اظہار خیال की آزادی کو فروغ دینا ہے۔

تاہم، AI تربیت کے لیے مناسب استعمال کے اصول کا اطلاق پیچیدہ اور متنازع ہے۔ AI کمپنیاں دلیل دیتی ہیں کہ ترب??تی مقاصد کے لیے کاپی رائٹ شدہ مواد کا ان کا استعمال تبدیلی کرنے والا ہے اور کاپی رائٹ کے مالکان کے حقوق کی خلاف ورزی نہیں کرتا ہے۔ دوسری طرف، مواد فراہم کرنے والوں کا استدلال ہے کہ AI تربیت ایک تجارتی سرگرمی ہے جس کے لیے اجازت اور معاوضے کی ضرورت ہوتی ہے۔

AI تربیت کا مستقبل

Anthropic کے خلاف Reddit کا مقدمہ AI تربیت کے مستقبل کے ارد گرد درپیش چیلنجوں اور غیر یقینی صورتحالوں کو اجاگر کرتا ہے۔ چونکہ AI ماڈلز زیادہ نفیس ہوتے جاتے ہیں اور بڑے ڈیٹا سیٹوں کی ضرورت ہوتی ہے، اس لیے ڈیٹا کی مانگ میں اضافہ ہی ہوگا۔ اس سے ممکنہ طور پر مزید قانونی لڑائیاں اور ڈیٹا سکریپنگ اور AI تربیت کے اخلاقی اور قانونی مضمرات کو حل کرنے کی ریگولیٹری کوششیں ہوں گی۔

یہ ضروری ہے کہ اسٹیک ہولڈرز مل کر ایک ایسا فریم ورک تیار کریں جو اختراع کو فروغ دے جبکہ مواد فراہم کرنے والوں کے حقوق کا تحفظ بھی کرے اور ذمہ دار ڈیٹا طریقوں کو یقینی بنائے۔ اس فریم ورک کو 데이터 رازداری، کاپی رائٹ، شفافیت، اور جوابدہی جیسے مسائل کو حل کرنا چاہیے۔

متبادل ڈیٹا سورس

ویب سکریپنگ کی قانونی جانچ پڑتال تیز ہونے کے ساتھ، AI کمپنیاں اپنے ماڈلز کو تربیت دینے کے لیے ڈیٹا کے متبادل ذرائع تلاش کر रही ہیں۔ ان میں شامل ہیں:

  • لائسنس یافتہ ڈیٹا: Reddit، AP، اور دیگر جیسے مواد فراهم کننده গণের কাছ থেকে লাইসেন্সিং চুক্তির মাধ্যমে ডেটা নেওয়া۔
  • سنتھیٹک ڈیٹا: مصنوعی डाटा تیار کرنا جو حقیقی دنیا के डेटा की नकल करता है কিন্তু কোনও ذاتی طور پر قابل شناخت معلومات یا کاپی رائٹ شدہ مواد پر مشتمل نہیں ہوتا ہے۔
  • اوپن سورس ڈیٹا: عوامی طور پر دستیاب ڈیٹا سیٹوں کا استعمال کرنا جو تجارتی استعمال کے لیے لائسنس یافتہ ہیں۔
  • داخلی ڈیٹا: کمپنی کی اپنی مصنوعات اور خدمات کے ذریعے तैयार کردہ डेटा کا فائدہ উঠানা۔

اپنے ڈیٹا ذرائع کو متنوع بنا کر، AI কম্পনیاں ویب স্ক্র্যাপিং पर اپنی انحصار کم کرنا اور قانونی چیلنجوں اور اخलाقی خدشات سے وابستہ خطرات کو کم کرنا۔

صارف کا نقطہ نظر

بالآخر، AI تربیتی طریقوں پر بحث انٹرنیٹ صارفین کے حقوق کے بارے میں بنیادی سوالات اٹھاتی ہے۔ صارفین Reddit جیسے پلیٹ فارمز پر تیار شدہ مواد کی وسیع مقدار تیار کرتے ہیں، اکثر یہ پوری طرح سے سمجھ نہیں پاتے کہ اس مواد کو کس طرح استعمال کیا جائے گا۔

یہ ضروری ہے کہ صارفین کو اس بارے میں آگاہ किया जाए कि ان کا ڈیٹا کیسے اکٹھا کیا جا رہا ہے، इस्तेमाल کیا جا رہا ہے اور شیئر کیا جا رہا ہے۔ انہیں اپنے ڈیٹا کو کنٹرول करने اور अपने डेटा को AI ट्रैning مقاصد کے لیے इस्तेमाल होने से روکنے की آزادی بھی ہونی چاہیے۔

Reddit جیسے پلیٹ فارمز کی ذمہ داری ہے کہ وہ اپنے یوزرز के डेटा की حفاظت करें और یہ सुनिश्चित کریں کہ ان کے डेटा کو एक ذمہ دارانہ اور اخলাقی طریقے سے استعમાل کیا जाए۔ इसमें यूजर्स کے लिए स्पष्ट और transparent रा privacidad नीतिहरू فراہم کرنا، نیز તેમના ડേറ്റાને नियत्रित करने के लिए उपाय शामिल ہیں۔

ممکنہ نتائج

Anthropic کے خلاف Reddit کے مقدمے کے ممکنہ نتائج متنوع हैं और اس کے نتائج کے مطابق AI صنعت کے لیے اہم مضمرات हो सकते ہیں۔

  • Settlement: दोनों कंपनियां ट्रायल کے بغیر تنازعہ حل کرنے والا ایک سمجھوتہ کر सकती ہیں۔
  • Reddit جیتتا ہے: عدالت Reddit के हक میں فیصلہ دے سکتی ہے, यह पाते हुए कि Anthropic ने सर्विस की शर्तो का उल्लंघन किया और अनुचित मुकाबले में शामिल रहा।
  • Anthropic جیتتا ہے: عدالت Anthropic के हक में फैसला دے سکتی ہے, یہ पाते हुए कि اس کے AI тренировъчны prácticas நியாயமான භාවිත کے सिद्धांत کے तहत законны ہیں۔
  • 混战的判决: कोर्टミックスড রুলिंग ইস্যু করতে পারেন, कुछ शिकायतों पर Reddit کےحق में और अन्य complaints पर Anthropic के حق میں پاا جانا ہے۔

मुकदमे का نتیجہ بہت સે فیکٹروں پر منحصر ہو گا,جن میں کیس ਕੇ 특정 ਫੱਕਸ,relevant legal precedent