generetiva ai kŏpīrā’īṭa yud’dha: kōhērē lakṣya
generetiva ai kŏpīrā’īṭa yud’dha: kōhērē lakṣya
bātamī prakāśakānnī janarēṭiva ai sṭārṭapa kōhērē (Cohere) virōdhāta raga tantrajñānāmuḷē kŏpīrā’īṭa āṇi ṭrēḍamārka ullaṁghanācā khaṭalā dākhala kēlā āhē.
जनरेटिव्ह एआय कॉपीराइट युद्ध पेटले: वृत्त प्रकाशकांचे कोहेरेवर लक्ष्य
एआय विकासाचे क्षेत्र पुन्हा एकदा कायदेशीर लढाईत अडकले आहे, कारण अनेक प्रमुख वृत्त आणि मीडिया संस्थांनी जनरेटिव्ह एआय स्टार्टअप कोहेरे (Cohere) विरोधात कॉपीराइट आणि ट्रेडमार्क उल्लंघनाचा खटला दाखल केला आहे. न्यूयॉर्कच्या दक्षिण जिल्ह्यातील यू.एस. जिल्हा न्यायालयात फेब्रुवारी २०२५ मध्ये हा खटला दाखल करण्यात आला आहे, ज्यात फोर्ब्स (Forbes), द गार्डियन (The Guardian) आणि लॉस एंजेलिस टाइम्स (Los Angeles Times) सारख्या प्रतिष्ठित प्रकाशनांसह डझनभर वादी आहेत. या खटल्याच्या केंद्रस्थानी कोहेरेने वापरलेले रिट्रीव्हल-ऑगमेंटेड जनरेशन (Retrieval-Augmented Generation) (RAG) तंत्रज्ञान आहे, ज्यामध्ये डेटाबेस तयार करण्यासाठी आणि आउटपुट (Output) निर्माण करण्यासाठी वादींच्या कॉपीराइट केलेल्या सामग्रीचा अनधिकृत वापर केला जातो, असा आरोप आहे.
RAG तंत्रज्ञानाची छाननी
लार्ज लँग्वेज मॉडेल (Large Language Model) (LLM) संबंधित काही मूळ समस्यांवर संभाव्य उपाय म्हणून रिट्रीव्हल-ऑगमेंटेड जनरेशन (RAG) उदयास आले. पॅट्रिक लुईस आणि त्यांच्या सहकाऱ्यांनी २०२० मध्ये प्रस्तावित केलेले RAG, हल्लुसिनेशन (Hallucination) (तथ्यात्मकदृष्ट्या चुकीची किंवा अर्थहीन माहिती तयार करणे), जुने ज्ञान आणि मॉडेलच्या युक्तिवादातील पारदर्शकतेचा अभाव यासारख्या समस्या कमी करण्याचा प्रयत्न करते. विशेष म्हणजे पॅट्रिक लुईस हे सध्या कोहेरे येथे संशोधक आहेत आणि RAG तंत्रज्ञानावर आपले कार्य सुरू ठेवत आहेत. RAG चा अवलंब मोठ्या प्रमाणावर झाला आहे, मायक्रोसॉफ्ट (Microsoft), गुगल (Google), ॲमेझॉन (Amazon) आणि एनव्हिडिया (NVIDIA) सारख्या प्रमुख खेळाडूंनी ते त्यांच्या एआय सिस्टममध्ये समाविष्ट केले आहे.
वृत्त प्रकाशकांनी दाखल केलेल्या खटल्यात कोहेरेविरोधात कॉपीराइट उल्लंघनाच्या आरोपांवर लक्ष केंद्रित केले आहे. हे दावे जनरेटिव्ह एआय मॉडेलच्या प्रशिक्षण आणिOperation मध्ये कॉपीराइट केलेल्या सामग्रीच्या वापराशी संबंधित गुंतागुंतीचे कायदेशीर प्रश्न अधोरेखित करतात.
कोहेरेवरील कॉपीराइट उल्लंघनाचे दावे
वादींचे कोहेरेवरील आरोप चार मुख्य भागांमध्ये विभागले जाऊ शकतात:
१. एआय मॉडेल प्रशिक्षण
वादींच्या युक्तिवादाचा गाभा म्हणजे कोहेरेने त्याचे मोठे भाषिक मॉडेल “कमांड फॅमिली” (Command Family) कसे प्रशिक्षित केले. त्यांचा दावा आहे की कोहेरेने इंटरनेटवरून मोठ्या प्रमाणावर मजकूर “स्क्रॅप” (Scraping) केला, ज्यात वादींच्या प्रकाशनांमधील कॉपीराइट केलेल्या सामग्रीचा समावेश आहे. हा स्क्रॅप केलेला डेटा नंतर कमांड फॅमिली मॉडेलला प्रशिक्षित करण्यासाठी आवश्यक डेटासेट (Dataset) तयार करण्यासाठी वापरला गेला. याव्यतिरिक्त, वादींनी आरोप केला आहे की कोहेरेने कॉमन क्रॉलच्या (Common Crawl) C4 सारख्या तृतीय-पक्ष डेटासेटचा उपयोग केला, ज्यात त्यांच्या कॉपीराइट केलेल्या सामग्रीचा मोठ्या प्रमाणात समावेश आहे, त्यासाठी आवश्यक परवानगी घेतलेली नाही.
एआय मॉडेल प्रशिक्षणात कॉपीराइट केलेल्या सामग्रीचा वापर हा एक कठीण मुद्दा बनला आहे. एआय विकसक अनेकदा असा युक्तिवाद करतात की असा वापर “Fair Use” च्या सिद्धांतानुसार येतो, जो टीका, भाष्य, वृत्त अहवाल, शिक्षण, शिष्यवृत्ती किंवा संशोधन यासारख्या उद्देशांसाठी कॉपीराइट केलेल्या सामग्रीच्या मर्यादित वापरास परवानगी देतो. तथापि, कॉपीराइट धारकांचे म्हणणे आहे की व्यावसायिक उद्देशांसाठी मोठ्या प्रमाणावर स्क्रॅपिंग (Scraping) आणि त्यांच्या सामग्रीचा वापर, जसे की एआय मॉडेलला प्रशिक्षण देणे, Fair Use च्या कक्षेत येत नाही. ही कायदेशीर लढाई यावर अवलंबून असण्याची शक्यता आहे की न्यायालय वादींच्या मूल्यांकनाशी सहमत आहे की नाही.
२. रिअल-टाइम (Real-Time) वापर / RAG
खटल्याचा आणखी एक महत्त्वाचा भाग म्हणजे कोहेरेच्या सेवा, विशेषत: त्याचे चॅट इंटरफेस, रिअल-टाइममध्ये (Real-Time) RAG तंत्रज्ञानाचा वापर कसा करतात यावर लक्ष केंद्रित केले आहे. वादींचा आरोप आहे की कोहेरेचे मॉडेल वापरकर्त्यांच्या प्रश्नांची उत्तरे देण्यासाठी त्यांच्या वेबसाइट्ससह बाह्य स्त्रोतांकडून सामग्री स्क्रॅप (Scraping) करतात. वादींच्या म्हणण्यानुसार हे रिअल-टाइम स्क्रॅपिंग (Real-Time Scraping) कॉपीराइटचे उल्लंघन आहे, खासकरून जेव्हा कोहेरेचे मॉडेल पेवॉलला (Paywall) बायपास (Bypass) करतात किंवा “Robots.txt” निर्देशांकडे दुर्लक्ष करतात, जे वेब क्रॉलर्सना (Web crawlers) (एआय मॉडेलद्वारे वापरल्या जाणाऱ्यांसह) वेबसाइटवरून विशिष्ट सामग्री स्क्रॅप (Scrap) न करण्याची सूचना देणारे आदेश आहेत.
पेवॉल (Paywall) आणि Robots.txt निर्देशांचे उल्लंघन गंभीर नैतिक आणि कायदेशीर प्रश्न उभे करते. पेवॉल (Paywall) कॉपीराइट केलेल्या सामग्रीचे संरक्षण करण्यासाठी आणि प्रकाशकांना त्यांच्या कामासाठी मोबदला मिळण्याची खात्री करण्यासाठी डिझाइन (Design) केलेले आहेत. Robots.txt निर्देश हे वेबसाइट मालकांसाठी त्यांची सामग्री वेब क्रॉलर्सद्वारे (Web crawlers) कशी ऍक्सेस (Access) केली जाते आणि वापरली जाते यावर नियंत्रण ठेवण्याचे एक मानक यंत्रणा आहे. या सुरक्षा उपायांकडे दुर्लक्ष करून, कोहेरेवर कॉपीराइट कायदे आणि सामग्री निर्मात्यांच्या हक्कांबद्दल अनादर दर्शवण्याचा आरोप आहे.
३. उल्लंघन करणारे आउटपुट (Output)
वादींचा असा युक्तिवाद आहे की कोहेरेच्या सेवा वापरकर्त्याच्या प्रश्नांना प्रतिसाद म्हणून त्यांच्या कॉपीराइट केलेल्या कामांच्या प्रती, महत्त्वपूर्ण उतारे किंवा पर्यायी सारांश स्वरूपात उल्लंघन करणारे आउटपुट (Output) प्रदान करतात. ते कोहेरे चॅट आउटपुटची उदाहरणे देतात जिथे “अंडर द हूड” (“Under the Hood”) पॅनेल वादींच्या वेबसाइटवरून थेट कॉपी (Copy) केलेले पूर्ण किंवा आंशिक लेख प्रदर्शित करते.
वादींचा युक्तिवाद आहे की हे आउटपुट (Output), मग ते तंतोतंत प्रती असोत किंवा सारांश, वापरकर्त्यांना मूळ लेख पाहण्याची गरज नाही. यामधून, डिजिटल सदस्यता आणि जाहिरात महसुलाचे नुकसान होते, ज्यावर वादींचा व्यवसाय टिकून आहे. या युक्तिवादाचा गाभा असा आहे की कोहेरेचे एआय मॉडेल (AI Model) अनधिकृत वितरक म्हणून काम करत आहेत, जे मूळ प्रकाशकांना त्यांच्या योग्य भरपाईपासून वंचित ठेवत आहेत.
४. अनधिकृत रूपांतरण
“अंडर द हूड” (“Under the Hood”) पॅनेलमध्ये वादींच्या कामांचे भाग प्रदर्शित करण्याव्यतिरिक्त, कोहेरेच्या सेवा या कामांचे सारांश देखील प्रदान करतात. वादींचा युक्तिवाद आहे की या सारांशातील तपशीलांची पातळी इतकी विस्तृत आहे की ते Fair Use च्या सीमा ओलांडून मूळ कामांची जागा घेतात.
कॉपीराइट कायदा केवळ कॉपीराइट केलेल्या कामांच्या तंतोतंत पुनरुत्पादनाचेच संरक्षण करत नाही, तर मूळ कामांचे रूपांतरण किंवा बदलांपासून तयार झालेल्या डेरिव्हेटिव्ह्ह (Derivative) कामांचे देखील संरक्षण करतो. वादींचा युक्तिवाद आहे की कोहेरेचे सारांश इतके व्यापक आहेत की ते अनधिकृत डेरिव्हेटिव्ह्ह (Derivative) कामे आहेत, जे त्यांच्या कॉपीराइट केलेल्या सामग्रीचे रूपांतरण तयार करण्याच्या आणि वितरीत करण्याच्या त्यांच्या अनन्य अधिकाराचे उल्लंघन करतात.
वापरकर्त्यांच्या कृतींसाठी दुय्यम दायित्व
प्रत्यक्ष कॉपीराइट उल्लंघनाच्या दाव्यांव्यतिरिक्त, वादी असा युक्तिवाद करतात की कोहेरे त्यांच्या वापरकर्त्यांच्या उल्लंघन कृतींसाठी दुय्यम जबाबदार आहे. ते म्हणतात की कोहेरेच्या सेवा वापरकर्त्यांद्वारे वादींच्या कामांचे पुनरुत्पादन, प्रदर्शन आणि वितरण सुलभ करतात आणि कोहेरे केवळ वापरकर्त्यांच्या कृतींना उत्तरदायी ठरवून जबाबदारी टाळू शकत नाही. या दाव्याचा आधार असा आहे की कोहेरेचे उत्पादन केवळ वापरकर्त्याने प्रॉम्प्ट (Prompt) प्रविष्ट केल्यानंतर उत्तरे निर्माण करते, ज्यामुळे कंपनी उल्लंघन करणाऱ्या कृतीत सहभागी होते.
दुय्यम दायित्वाचा हा युक्तिवाद महत्त्वपूर्ण आहे कारण तो एआय विकसकांना त्यांच्या वापरकर्त्यांच्या कृतींसाठी जबाबदार धरतो, जरी ते वापरकर्ते थेट कॉपीराइट उल्लंघनात गुंतलेले असले तरीही. जर हे यशस्वी झाले, तर एआय तंत्रज्ञानाच्या विकास आणि तैनातीसाठी त्याचे दूरगामी परिणाम होऊ शकतात, कारण विकासकांना त्यांच्या वापरकर्त्यांना कॉपीराइटचे उल्लंघन करण्यापासून रोखण्यासाठी सुरक्षा उपाय लागू करणे आवश्यक असेल.
ट्रेडमार्क उल्लंघनाचे दावे
खटल्यात कॉपीराइट उल्लंघनापलीकडे ट्रेडमार्क उल्लंघनाचे दावे देखील समाविष्ट आहेत. वादींचा आरोप आहे की कोहेरेची स्त्रोत दर्शविण्याची पद्धत ट्रेडमार्कचे उल्लंघन आहे कारण ते वादींचे प्रसिद्ध ट्रेडमार्क (Trademark) परवानगीशिवाय वापरतात किंवा त्यांना एआय-व्युत्पन्न त्रुटीपूर्ण सामग्रीशी जोडतात. यामुळे, वादींच्या ब्रँड प्रतिमेचे नुकसान होते आणि त्यांची विशिष्टता कमी होते, असा त्यांचा युक्तिवाद आहे.
ट्रेडमार्क (Trademark) हे चिन्ह, डिझाइन (Design) किंवा वाक्यांश आहेत जे कायदेशीररित्या कंपनी किंवा उत्पादनाचे प्रतिनिधित्व करण्यासाठी नोंदणीकृत आहेत. ट्रेडमार्कचा अनधिकृत वापर ग्राहकांमध्ये संभ्रम निर्माण करू शकतो आणि ब्रँडच्या प्रतिमेला हानी पोहोचवू शकतो. वादींचा युक्तिवाद आहे की कोहेरेने त्यांच्या ट्रेडमार्कचा (Trademark) वापर एआयनं (AI) व्युत्पन्न केलेल्या सामग्रीच्या संयोगाने केल्याने वापरकर्त्यांना असे वाटू शकते की वादी कोहेरेच्या सेवांचे समर्थन करतात किंवा त्यांच्याशी संलग्न आहेत, जे खरे नाही.
व्यापक संदर्भ: RAG आणि एआय कॉपीराइट कायद्याचे भविष्य
कोहेरे (Cohere) विरोधातील हा खटला एक Isolated Incident नाही. यापूर्वी ऑक्टोबर २०२४ मध्ये यू.एस. मध्ये दाखल झालेल्या कॉपीराइट खटल्यात एआय सेवांमधील RAG ऍप्लिकेशनवर लक्ष केंद्रित केले होते. RAG आर्किटेक्चर (Architecture) एआय सेवांमध्ये अधिक प्रचलित झाल्यामुळे ही वाढती प्रकरणे एआय विकासक आणि कॉपीराइट धारकांमधील वाढता तणाव दर्शवतात.
RAG तंत्रज्ञानाशी संबंधित कायदेशीर लढाया भविष्यात एआय कॉपीराइट कायद्यातील एक महत्त्वपूर्ण मुद्दा बनण्याची शक्यता आहे. RAG मध्ये आउटपुट (Output) तयार करण्यासाठी कॉपीराइट केलेल्या सामग्रीचे रिअल-टाइममध्ये (Real-Time) पुनर्प्राप्ती आणि वापर समाविष्ट आहे. हे Fair Use चा आवाका, वापरकर्त्यांच्या कृतींसाठी एआय विकासकांची जबाबदारी आणि कृत्रिम बुद्धिमत्तेच्या युगात बौद्धिक संपत्तीचे संरक्षण याबद्दल गुंतागुंतीचे प्रश्न निर्माण करते.
या खटल्यांच्या निकालाचा एआय तंत्रज्ञानाच्या विकास आणि तैनातीवर मोठा परिणाम होऊ शकतो. जर न्यायालयाने कॉपीराइट धारकांच्या बाजूने निर्णय दिला, तर एआय विकासकांना कॉपीराइटचे उल्लंघन रोखण्यासाठी कठोर उपाययोजना करण्यास भाग पाडले जाऊ शकते, ज्यामुळे एआय मॉडेल विकसित करण्याचा खर्च आणि गुंतागुंत वाढू शकते. दुसरीकडे, जर न्यायालयाने एआय विकासकांच्या बाजूने निर्णय दिला, तर कॉपीराइट धारकांना अधिकाधिक अत्याधुनिक एआय तंत्रज्ञानाचा सामना करण्यासाठी त्यांच्या बौद्धिक संपत्तीचे संरक्षण करण्यासाठी नवीन मार्ग शोधावे लागतील.
वृत्त प्रकाशक आणि कोहेरे (Cohere) यांच्यातील संघर्ष एआय, कॉपीराइट आणि सामग्री निर्मितीच्या भविष्याशी संबंधित चालू असलेल्या वादातील एक महत्त्वाचा टप्पा आहे. या प्रकरणाचा निकाल, इतर प्रकरणांसोबत, जनरेटिव्ह एआय (Generative AI) आणि कॉपीराइट केलेल्या सामग्रीशी असलेल्या संबंधांसाठी कायदेशीर परिदृश्य निश्चित करेल. जसजसे एआय विकसित होत आहे आणि आपल्या जीवनातील विविध पैलूंमध्ये अधिकाधिक समाकलित होत आहे, तसतसे नवकल्पनांना प्रोत्साहन देणे आणि सामग्री निर्मात्यांच्या हक्कांचे संरक्षण करणे यामध्ये संतुलन राखणे आवश्यक आहे. न्यायालये, कायदे निर्माते आणि एआय समुदायाने एकत्रितपणे स्पष्ट मार्गदर्शक तत्त्वे आणि नियम स्थापित करण्यासाठी कार्य केले पाहिजे जे बौद्धिक संपत्तीचा आदर राखताना सर्जनशीलतेला प्रोत्साहन देतील.
विशेषतः, वृत्त उद्योगाला एआयच्या युगात अनेक अनोख्या आव्हानांचा सामना करावा लागत आहे. जसजसे एआय मॉडेल (AI Model) वृत्त सामग्री तयार करण्यास अधिकाधिक सक्षम होत आहेत, प्रकाशकांना त्यांच्या कॉपीराइट केलेल्या सामग्रीच्या वापरासाठी भरपाई मिळणे आणि त्यांच्या ब्रँडची अखंडता जपली जाणे महत्त्वाचे आहे. कोहेरे (Cohere) विरोधातील खटला वृत्त प्रकाशकांनी त्यांचे अधिकार बजावण्यासाठी आणि हे सुनिश्चित करण्यासाठी केलेल्या प्रयत्नांचे प्रतिनिधित्व करतो की त्यांचे कार्य योग्य परवानगीशिवाय एआय कंपन्यांद्वारे वापरले जाणार नाही.