एआई को प्रशिक्षित करें या नहीं; यही सवाल है।

एआई प्रशिक्षण के लिए कॉपीराइट अपवादों का उदय

हाल के वर्षों में, कई देशों ने एआई कंपनियों द्वारा टेक्स्ट और डेटा माइनिंग की सुविधा के लिए अपने कॉपीराइट कानूनों में विशेष रूप से अपवाद बनाए हैं। इन अपवादों का उद्देश्य आर्टिफिशियल इंटेलिजेंस के क्षेत्र में नवाचार को बढ़ावा देना है, जिससे LLMs को प्रत्येक कॉपीराइट धारक से स्पष्ट अनुमति की आवश्यकता के बिना विशाल डेटासेट पर प्रशिक्षित किया जा सके।

उदाहरण के लिए, सिंगापुर ने 2021 में अपने कॉपीराइट कानून में संशोधन करके ऐसा अपवाद बनाया। इस कदम ने देश में एआई डेवलपर्स के लिए अपने मॉडल को प्रशिक्षित करने के उद्देश्य से कॉपीराइट कार्यों तक पहुंचने और संसाधित करने का मार्ग प्रशस्त किया। अब, एशिया में अन्य क्षेत्राधिकार, जिनमें हांगकांग और इंडोनेशिया शामिल हैं, समान विधायी परिवर्तनों पर विचार कर रहे हैं।

चीनी परिप्रेक्ष्य: एक ऐतिहासिक उल्लंघन मामला

चीन, वैश्विक एआई परिदृश्य में एक प्रमुख खिलाड़ी, LLMs के युग में कॉपीराइट की जटिलताओं से भी जूझ रहा है। एक ऐतिहासिक मामला, iQiyi बनाम MiniMax, ने इस मुद्दे को सुर्खियों में ला दिया है।

इस मामले में, iQiyi, एक प्रमुख वीडियो स्ट्रीमिंग प्लेटफॉर्म, ने MiniMax, एक एआई कंपनी, पर मुकदमा दायर किया, जिसमें आरोप लगाया गया कि उसने बिना प्राधिकरण के एआई मॉडल को प्रशिक्षित करने के लिए अपनी कॉपीराइट वाली वीडियो सामग्री का उपयोग किया। यह मुकदमा एक महत्वपूर्ण विकास का प्रतीक है क्योंकि यह चीन का पहला एआई वीडियो LLM उल्लंघन मामला है, जो एआई प्रौद्योगिकियों के विकास में कॉपीराइट सामग्री के अनधिकृत उपयोग के बारे में बढ़ती चिंताओं को उजागर करता है।

भारत का प्रकाशन उद्योग LLM प्रशिक्षण प्रथाओं को चुनौती देता है

यह बहस एशिया से आगे तक फैली हुई है। भारत में, कई प्रकाशन गृहों ने LLM डेवलपर्स के खिलाफ कानूनी कार्रवाई शुरू की है, जिसमें आरोप लगाया गया है कि इन मॉडलों को स्क्रैप किए गए डेटा पर प्रशिक्षित किया जा रहा है जिसमें उनके कॉपीराइट कार्य शामिल हैं। ये मामले एआई क्षमताओं को आगे बढ़ाने की इच्छा और रचनाकारों के बौद्धिक संपदा अधिकारों की रक्षा करने की आवश्यकता के बीच तनाव को रेखांकित करते हैं।

सरल अंतर्ग्रहण से परे: LLM प्रशिक्षण की बारीकियां

LLM प्रशिक्षण द्वारा उत्पन्न चुनौतियाँ केवल डेटा को अंतर्ग्रहण और संसाधित करने के कार्य से कहीं अधिक जटिल हैं। भारतीय मामले और सिंगापुर के कानून के संकीर्ण रूप से परिभाषित प्रावधान इस मुद्दे की बहुआयामी प्रकृति को उजागर करते हैं।

कई बौद्धिक संपदा मालिक अपने कॉपीराइट कार्यों की पहुंच और उपयोग को स्पष्ट रूप से प्रतिबंधित करते हैं, जबकि अन्य ऐसी पहुंच और पुनरुत्पादन के लिए सहमति नहीं देते हैं। रचनाकारों की एक महत्वपूर्ण संख्या अपने व्यवसाय के मूल भाग के रूप में लाइसेंसिंग मॉडल पर निर्भर करती है, और एआई प्रशिक्षण के लिए उनके कार्यों का अनधिकृत उपयोग सीधे इन मॉडलों को कमजोर करता है।

इसके अलावा, तथ्य यह है कि अधिकांश प्रशिक्षण क्लाउड में हो सकता है, जटिल क्षेत्राधिकार संबंधी प्रश्न उठाता है। यह निर्धारित करना कि डेटा को अंतरराष्ट्रीय सीमाओं के पार संसाधित किए जाने पर कौन से कानून लागू होते हैं, पहले से ही जटिल कानूनी परिदृश्य में जटिलता की एक और परत जोड़ता है।

अंततः, मुख्य मुद्दा इस बात के इर्द-गिर्द घूमता है कि LLMs अपने प्रशिक्षण डेटा को कैसे सुरक्षित करते हैं और क्या, और कैसे, उन्हें कॉपीराइट धारकों को इसके उपयोग के लिए क्षतिपूर्ति करनी चाहिए।

अमेरिकी कॉपीराइट संगठन वैधानिक अपवादों पर आपत्ति जताते हैं

यह बहस केवल अलग-अलग देशों तक ही सीमित नहीं है; यह अंतरराष्ट्रीय क्षेत्र में भी फैल गया है। संयुक्त राज्य अमेरिका में लगभग 50 व्यापार संघों और उद्योग समूहों का एक गठबंधन, जिसे डिजिटल क्रिएटर्स गठबंधन के रूप में जाना जाता है, ने प्राधिकरण या मुआवजे के प्रावधानों के बिना कॉपीराइट कानूनों में LLM प्रशिक्षण के लिए वैधानिक अपवाद बनाने पर कड़ी आपत्ति जताई है।

इन संगठनों ने संयुक्त राज्य व्यापार प्रतिनिधि (USTR) को टिप्पणियां प्रस्तुत की हैं, जिसमें एजेंसी से अपनी वार्षिक विशेष 301 समीक्षा में इस मुद्दे को संबोधित करने का आग्रह किया गया है, जो दुनिया भर में बौद्धिक संपदा संरक्षण और प्रवर्तन प्रथाओं की जांच करती है। गठबंधन ने उन देशों की एक सूची प्रदान की है जिन्होंने ऐसे अपवादों को लागू किया है या प्रस्तावित कर रहे हैं, जो इस चिंता के वैश्विक पैमाने को उजागर करते हैं।

अमेरिकी बहस: OpenAI का रुख और आंतरिक विरोधाभास

यहां तक कि संयुक्त राज्य अमेरिका के भीतर भी, बहस बहुत जीवंत बनी हुई है। OpenAI, लोकप्रिय ChatGPT के पीछे की कंपनी, ने व्हाइट हाउस ऑफिस ऑफ साइंस एंड टेक्नोलॉजी को एक खुला पत्र प्रस्तुत करके चर्चा में अपनी आवाज जोड़ी है।

इस पत्र में, OpenAI उचित उपयोग के सिद्धांतों के तहत इंटरनेट से डेटा स्क्रैप करने के अधिकार की वकालत करता है, प्रभावी रूप से प्रशिक्षण उद्देश्यों के लिए कॉपीराइट सामग्री तक व्यापक पहुंच के लिए बहस करता है। हालांकि, विरोधाभासी रूप से, OpenAI यह भी सुझाव देता है कि विदेशी LLM डेवलपर्स को ऐसा करने से प्रतिबंधित किया जाना चाहिए, संभावित रूप से अमेरिकी निर्यात नीतियों के उपयोग के माध्यम से। यह रुख एक आंतरिक विरोधाभास को प्रकट करता है, अपने लिए खुली पहुंच की वकालत करते हुए दूसरों की पहुंच को सीमित करने की मांग करता है।

आगे का रास्ता: एक सतत बहस

जैसे-जैसे 2025 नजदीक आ रहा है, कॉपीराइट और एआई प्रशिक्षण पर बहस तेज होना निश्चित है। दुनिया भर में नए LLMs के निरंतर उद्भव के साथ, एक स्पष्ट और संतुलित कानूनी ढांचे की आवश्यकता तेजी से जरूरी हो जाती है।

वर्तमान कानूनी परिदृश्य राष्ट्रीय कानूनों का एक चिथड़ा है, कुछ में एआई प्रशिक्षण के लिए स्पष्ट अपवाद हैं और अन्य में ऐसे प्रावधानों का अभाव है। यह असंगति एआई डेवलपर्स और कॉपीराइट धारकों दोनों के लिए अनिश्चितता पैदा करती है, नवाचार में बाधा डालती है और संभावित रूप से रचनाकारों के अधिकारों को कमजोर करती है।

एक संतुलित ढांचे के लिए मुख्य विचार:

  • पारदर्शिता और जवाबदेही: LLM डेवलपर्स को अपने मॉडल को प्रशिक्षित करने के लिए उपयोग किए जाने वाले डेटा स्रोतों के बारे में पारदर्शी होना चाहिए और कॉपीराइट सामग्री के किसी भी अनधिकृत उपयोग के लिए जवाबदेह होना चाहिए।
  • उचित मुआवजा: एआई प्रशिक्षण में उनके कार्यों के उपयोग के लिए कॉपीराइट धारकों को मुआवजा देने के लिए तंत्र तलाशा जाना चाहिए। इसमें लाइसेंसिंग समझौते, सामूहिक अधिकार प्रबंधन या अन्य नवीन समाधान शामिल हो सकते हैं।
  • अंतर्राष्ट्रीय सामंजस्य: विभिन्न न्यायालयों में एआई प्रशिक्षण से संबंधित कॉपीराइट कानूनों में सामंजस्य स्थापित करने के प्रयासों से कानूनी अनिश्चितता कम होगी और सीमा पार सहयोग की सुविधा होगी।
  • नवाचार और निर्माता अधिकारों को संतुलित करना: कानूनी ढांचे को एआई में नवाचार को बढ़ावा देने और रचनाकारों के अधिकारों की रक्षा करने के बीच संतुलन बनाना चाहिए। इसके लिए दांव पर लगे विभिन्न हितों पर सावधानीपूर्वक विचार करने की आवश्यकता है।
  • उचित उपयोग की भूमिका: एआई प्रशिक्षण के लिए उचित उपयोग सिद्धांतों की प्रयोज्यता को स्पष्ट करने की आवश्यकता है। इसमें यह निर्धारित करने के लिए विशिष्ट मानदंड परिभाषित करना शामिल हो सकता है कि क्या प्रशिक्षण उद्देश्यों के लिए कॉपीराइट सामग्री का उपयोग उचित उपयोग के रूप में योग्य है।

कॉपीराइट और एआई प्रशिक्षण के आसपास चल रही चर्चा तेजी से विकसित हो रही प्रौद्योगिकियों के लिए मौजूदा कानूनी ढांचे को अनुकूलित करने की चुनौतियों को उजागर करती है। एक ऐसा समाधान खोजना जो सभी हितधारकों के हितों को संतुलित करे, निरंतर संवाद, सहयोग और डिजिटल युग के बदलते परिदृश्य के अनुकूल होने की इच्छा की आवश्यकता होगी। एआई विकास का भविष्य, और रचनात्मक कार्यों की सुरक्षा, इस महत्वपूर्ण बहस के परिणाम पर निर्भर हो सकती है। प्रशिक्षण का प्रश्न हमारे साथ लंबे समय तक रहेगा।