डेटा (उपयोग और पहुंच) विधेयक: कॉपीराइट के लिए निर्णायक क्षण

डिजिटल युग ने नवाचार के अभूतपूर्व अवसर लाए हैं, खासकर कृत्रिम बुद्धिमत्ता (AI) के क्षेत्र में। हालाँकि, इस प्रगति ने डेटा उपयोग की नैतिक और कानूनी सीमाओं के बारे में भी महत्वपूर्ण प्रश्न उठाए हैं, खासकर कॉपीराइट सामग्री के संबंध में। AI मॉडल को प्रशिक्षित करने के लिए पायरेटेड पुस्तकों के उपयोग के आसपास की बहस एक उबलते बिंदु पर पहुंच गई है, मौजूदा कॉपीराइट कानूनों के पुनर्मूल्यांकन और बौद्धिक संपदा उल्लंघन के खिलाफ एक मजबूत रुख की मांग कर रही है।

मूल मुद्दा: कॉपीराइट सामग्री का अनधिकृत उपयोग

मामले का मूल कॉपीराइट पुस्तकों का AI मॉडल को प्रशिक्षित करने के लिए अनधिकृत उपयोग में निहित है। यह प्रथा, कथित तौर पर Meta जैसे तकनीकी दिग्गजों द्वारा नियोजित की जा रही है, ने लेखकों और प्रकाशकों के बीच आक्रोश पैदा कर दिया है, जिन्हें लगता है कि उनके अधिकारों का वाणिज्यिक लाभ के लिए उल्लंघन किया जा रहा है। Waitrose के पूर्व प्रबंध निदेशक मार्क प्राइस इस प्रथा के मुखर आलोचक रहे हैं, Meta के CEO मार्क जुकरबर्ग को सीधे संबोधित करते हुए और कंपनी के ब्रिटिश लेखकों के कार्यों का बिना अनुमति के शोषण करने के औचित्य पर सवाल उठा रहे हैं।

प्राइस की कानूनी टीम यूके में Meta के खिलाफ कानूनी कार्रवाई करने के लिए कई रास्ते तलाश रही है। एक दृष्टिकोण में यह निर्धारित करना शामिल है कि क्या समुद्री डाकू डेटाबेस LibGen से प्राप्त पुस्तकों को यूके के भीतर "ग्रहण और संसाधित" किया गया है। यदि सिद्ध हो जाता है, तो यह यूके कॉपीराइट कानून के तहत Meta के खिलाफ एक स्पष्ट मामला स्थापित कर सकता है।

आउटपुट की जाँच: उल्लंघन साबित करने की कुंजी

एक और, शायद अधिक दिलचस्प, दृष्टिकोण Meta के AI मॉडल, Llama द्वारा उत्पन्न सामग्री का विश्लेषण करने पर केंद्रित है। प्राइस का तर्क है कि यदि Llama ऐसी सामग्री का उत्पादन करता है जो इसे प्रशिक्षित करने के लिए उपयोग की जाने वाली पुस्तकों के अंशों से मिलती-जुलती है, तो यह कॉपीराइट उल्लंघन का ठोस सबूत हो सकता है। जांच की यह पंक्ति Stability AI के खिलाफ चल रहे Getty Images मामले के समानांतर है, जो Stability AI के Stable Diffusion मॉडल द्वारा कॉपीराइट छवियों के कथित पुनरुत्पादन पर केंद्रित है।

Getty Images मामला, जो जून 2025 में परीक्षण के लिए निर्धारित है, AI-जनरेटेड सामग्री से जुड़े भविष्य के कॉपीराइट विवादों के लिए एक महत्वपूर्ण मिसाल कायम कर सकता है। Getty Images मामले में वादियों का तर्क है कि Stable Diffusion ने अपने प्रशिक्षण के दौरान उपयोग की जाने वाली कॉपीराइट छवियों के पर्याप्त हिस्से को पुन: प्रस्तुत किया। यदि Getty Images प्रबल होता है, तो यह Meta जैसी कंपनियों के खिलाफ इसी तरह की कानूनी कार्रवाई करने के लिए लेखकों और प्रकाशकों को प्रोत्साहित कर सकता है।

Meta ने अपनी प्रथाओं का बचाव करते हुए तर्क दिया है कि इसका AI मॉडल कॉपीराइट कार्यों को पुन: प्रस्तुत नहीं करता है, बल्कि केवल उन्हें प्रशिक्षण उद्देश्यों के लिए उपयोग करता है। कंपनी का आगे दावा है कि लेखकों को इसके परिणामस्वरूप कोई आर्थिक नुकसान नहीं होता है। हालाँकि, यदि Getty Images यह प्रदर्शित कर सकता है कि AI मॉडल वास्तव में कॉपीराइट सामग्री को पुन: प्रस्तुत कर सकते हैं, तो यह Meta के बचाव को कमजोर कर देगा और कंपनी को महत्वपूर्ण कानूनी देनदारियों के लिए उजागर कर देगा।

लाइसेंसिंग समझौते: एक संभावित समाधान?

AI के युग में कॉपीराइट की जटिलताओं को प्रकाशकों और AI कंपनियों के बीच लाइसेंसिंग समझौतों द्वारा और उजागर किया गया है। उदाहरण के लिए, HarperCollins ने कथित तौर पर Microsoft के साथ एक लाइसेंसिंग व्यवस्था में प्रवेश किया है जिसमें समझौते के भाग के रूप में एक्सेस की जा सकने वाली पुस्तक की मात्रा पर प्रतिबंध शामिल हैं। इस तरह के समझौते, जबकि कॉपीराइट धारकों को मुआवजा देने के लिए एक संभावित मार्ग प्रदान करते हैं, AI प्रशिक्षण में उचित उपयोग के दायरे और सीमाओं के बारे में भी प्रश्न उठाते हैं।

Meta और अधिकार धारकों के बीच इसी तरह के समझौतों की अनुपस्थिति कंपनी को कानूनी चुनौतियों के प्रति संवेदनशील बनाती है। Meta के एक पूर्व वकील ने यहां तक ​​मान लिया है कि AI सिस्टम के अनपेक्षित परिणाम संभावित रूप से कॉपीराइट का उल्लंघन करते हैं, जिससे अदालत में कंपनी के लिए एक महत्वपूर्ण खतरा हो सकता है।

डेटा (उपयोग और पहुंच) विधेयक: एक विधायी अवसर

यूके का डेटा (उपयोग और पहुंच) विधेयक कॉपीराइट कानून को मजबूत करने और AI द्वारा प्रस्तुत चुनौतियों का समाधान करने के लिए एक महत्वपूर्ण अवसर प्रस्तुत करता है। विधेयक में संशोधन, जिस पर हाउस ऑफ कॉमन्स में बहस होनी है, का उद्देश्य कॉपीराइट नियमों का अनुपालन, पारदर्शिता और प्रवर्तन सुनिश्चित करना है। यदि अनुमोदित किया जाता है, तो ये संशोधन AI प्रशिक्षण के लिए प्रकाशित सामग्रियों के उपयोग के संबंध में तकनीकी कंपनियों को छूट देने के यूके सरकार के प्रयासों को रोक सकते हैं। यह एक ऐसा रुख है जिसे कई लोगों का मानना ​​है कि सरकार को शुरू से ही अपनाना चाहिए था।

Publishers’ Licensing Services के CEO टॉम वेस्ट का तर्क है कि डेटा (उपयोग और पहुंच) विधेयक सामग्री के लाइसेंसिंग को "टर्बो चार्ज" कर सकता है। उन्होंने जोर देकर कहा कि जवाबदेही के लिए कॉल तकनीक विरोधी या नवाचार विरोधी नहीं है। इसके बजाय, यह इस मान्यता को दर्शाता है कि जानकारी की सटीकता और गुणवत्ता सर्वोपरि है क्योंकि जेनरेटिव AI हमारे जीवन में तेजी से महत्वपूर्ण भूमिका निभाता है।

एक मोड़: AI के प्रभाव को विनियमित करना

वर्तमान स्थिति एक महत्वपूर्ण मोड़ का प्रतिनिधित्व करती है। जैसे-जैसे AI की शक्ति और प्रभाव बढ़ता जा रहा है, नुकसान, अराजकता या उन कार्यों को रोकने के लिए स्पष्ट सीमाएं और नियम स्थापित करना अनिवार्य है जो पछतावे का कारण बन सकते हैं। ChatGPT से उधार लिया गया यह सिद्धांत, AI तकनीकों के जिम्मेदार विकास और तैनाती की आवश्यकता को रेखांकित करता है।

कानूनी और नैतिक दलदल में गहराई से उतरना

AI प्रशिक्षण में कॉपीराइट सामग्री का उपयोग करने के आसपास की बहस केवल एक कानूनी मामला नहीं है; यह मौलिक नैतिक विचारों को भी छूता है। क्या AI कंपनियों को रचनात्मक कार्यों के अनधिकृत उपयोग से लाभ उठाने की अनुमति दी जानी चाहिए, यह निष्पक्षता और बौद्धिक संपदा अधिकारों के सम्मान का मामला है।

उचित उपयोग सिद्धांत: एक जटिल कानूनी तर्क

इस बहस में केंद्रीय कानूनी तर्कों में से एक उचित उपयोग सिद्धांत के आसपास घूमता है। उचित उपयोग एक कानूनी सिद्धांत है जो कॉपीराइट धारक से अनुमति के बिना कॉपीराइट सामग्री के सीमित उपयोग की अनुमति देता है। सिद्धांत का उद्देश्य अभिव्यक्ति की स्वतंत्रता को बढ़ावा देना और कॉपीराइट कार्यों के कुछ परिवर्तनकारी उपयोगों की अनुमति देकर रचनात्मकता को प्रोत्साहित करना है।

हालांकि, AI प्रशिक्षण के संदर्भ में उचित उपयोग सिद्धांत का अनुप्रयोग जटिल और विवादित है। AI कंपनियां अक्सर तर्क देती हैं कि कॉपीराइट सामग्री का उनका उपयोग उचित उपयोग के अंतर्गत आता है क्योंकि वे सामग्रियों का उपयोग नई और परिवर्तनकारी तकनीकों को बनाने के लिए कर रही हैं। उनका तर्क है कि AI मॉडल केवल कॉपीराइट कार्यों को पुन: प्रस्तुत नहीं कर रहे हैं, बल्कि इसके बजाय पूरी तरह से नए आउटपुट उत्पन्न करने के लिए उनसे सीख रहे हैं।

दूसरी ओर, कॉपीराइट धारकों का तर्क है कि AI मॉडल को प्रशिक्षित करने के लिए उनके कार्यों का उपयोग एक वाणिज्यिक उपयोग है जो उन्हें संभावित राजस्व से वंचित करता है। उनका तर्क है कि AI कंपनियों को प्रशिक्षण के लिए उपयोग की जाने वाली कॉपीराइट सामग्री के लिए लाइसेंस प्राप्त करने की आवश्यकता होनी चाहिए, जैसे कि वे किसी अन्य वाणिज्यिक उपयोग के लिए करेंगे।

लेखकों और प्रकाशकों पर आर्थिक प्रभाव

लेखकों और प्रकाशकों पर अनधिकृत AI प्रशिक्षण का आर्थिक प्रभाव एक महत्वपूर्ण चिंता है। यदि AI कंपनियों को बिना मुआवजे के कॉपीराइट कार्यों का स्वतंत्र रूप से उपयोग करने की अनुमति दी जाती है, तो यह लेखकों और प्रकाशकों को नई सामग्री बनाने के लिए प्रोत्साहन को कमजोर कर सकता है। इससे रचनात्मक कार्यों की गुणवत्ता और उपलब्धता में गिरावट आ सकती है, जिससे अंततः पूरे समाज को नुकसान होगा।

इसके अलावा, कॉपीराइट सामग्री का अनधिकृत उपयोग बाजार में एक असमान खेल मैदान बना सकता है। AI कंपनियां जो बिना अनुमति के कॉपीराइट कार्यों का उपयोग करती हैं, उन्हें उन लोगों पर प्रतिस्पर्धात्मक लाभ होगा जो लाइसेंस प्राप्त करते हैं या अपना प्रशिक्षण डेटा बनाते हैं। यह नवाचार को दबा सकता है और कुछ प्रमुख AI कंपनियों के हाथों में शक्ति की एकाग्रता का कारण बन सकता है।

पारदर्शिता और जवाबदेही की आवश्यकता

यह सुनिश्चित करने के लिए पारदर्शिता और जवाबदेही आवश्यक है कि AI कंपनियां कॉपीराइट सामग्री का जिम्मेदारी से उपयोग करें। AI कंपनियों को उन डेटा के स्रोतों का खुलासा करने की आवश्यकता होनी चाहिए जिनका उपयोग वे अपने मॉडल को प्रशिक्षित करने के लिए करते हैं। इससे कॉपीराइट धारकों को अपने कार्यों के उपयोग की निगरानी करने और यह सुनिश्चित करने की अनुमति मिलेगी कि उन्हें उचित मुआवजा दिया जा रहा है।

इसके अलावा, AI कंपनियों को उनके AI मॉडल के परिणामस्वरूप होने वाले किसी भी कॉपीराइट उल्लंघन के लिए जवाबदेह ठहराया जाना चाहिए। इसमें प्रत्यक्ष उल्लंघन के लिए दायित्व शामिल हो सकता है, साथ ही साथ सहायक उल्लंघन के लिए भी यदि AI मॉडल का उपयोग उल्लंघनकारी कार्यों को बनाने के लिए किया जाता है।

वैकल्पिक समाधानों की खोज

कॉपीराइट कानून को मजबूत करने और पारदर्शिता को बढ़ावा देने के अलावा, वैकल्पिक समाधानों का पता लगाना महत्वपूर्ण है जो AI कंपनियों और कॉपीराइट धारकों के हितों को संतुलित करने में मदद कर सकते हैं।

सामूहिक लाइसेंसिंग

सामूहिक लाइसेंसिंग एक संभावित समाधान है। एक सामूहिक लाइसेंसिंग योजना के तहत, एक सामूहिक प्रबंधन संगठन (CMO) कॉपीराइट धारकों की ओर से AI कंपनियों के साथ लाइसेंस पर बातचीत करेगा। CMO तब लाइसेंस से एकत्र रॉयल्टी को कॉपीराइट धारकों को वितरित करेगा।

सामूहिक लाइसेंसिंग AI कंपनियों के लिए आवश्यक कॉपीराइट सामग्री के लिए लाइसेंस प्राप्त करने का एक अधिक कुशल और सुव्यवस्थित तरीका प्रदान कर सकती है। यह यह भी सुनिश्चित कर सकता है कि कॉपीराइट धारकों को उनके कार्यों के उपयोग के लिए उचित मुआवजा दिया जाए।

ओपन सोर्स डेटा

एक और संभावित समाधान AI प्रशिक्षण के लिए ओपन सोर्स डेटा सेट के विकास को बढ़ावा देना है। ओपन सोर्स डेटा सेट डेटा सेट हैं जो किसी को भी उपयोग करने, संशोधित करने और वितरित करने के लिए स्वतंत्र रूप से उपलब्ध हैं।

ओपन सोर्स डेटा सेट का विकास कॉपीराइट सामग्री पर AI कंपनियों की निर्भरता को कम कर सकता है। यह AI उद्योग में नवाचार और प्रतिस्पर्धा को भी बढ़ावा दे सकता है।

तकनीकी समाधान

तकनीकी समाधान AI द्वारा प्रस्तुत कॉपीराइट चुनौतियों का समाधान करने में भी भूमिका निभा सकते हैं। उदाहरण के लिए, AI प्रशिक्षण में कॉपीराइट सामग्री के उपयोग को ट्रैक करने के लिए वॉटरमार्किंग तकनीकों का उपयोग किया जा सकता है। इससे कॉपीराइट धारकों को अपने कार्यों के उपयोग की निगरानी करने और अनधिकृत उपयोग के उदाहरणों की पहचान करने की अनुमति मिलेगी।

इसके अलावा, AI तकनीकों का उपयोग उल्लंघनकारी कार्यों के निर्माण का पता लगाने और रोकने के लिए किया जा सकता है। उदाहरण के लिए, AI-संचालित उपकरणों का उपयोग उस सामग्री की पहचान करने के लिए किया जा सकता है जो कॉपीराइट कार्यों के समान है।

आगे का रास्ता

AI प्रशिक्षण में कॉपीराइट सामग्री का उपयोग करने के आसपास की बहस जटिल और बहुआयामी है। कोई आसान जवाब नहीं हैं। हालांकि, कॉपीराइट कानून को मजबूत करके, पारदर्शिता और जवाबदेही को बढ़ावा देकर, वैकल्पिक समाधानों की खोज करके, और AI कंपनियों और कॉपीराइट धारकों के बीच खुली बातचीत को बढ़ावा देकर, हम एक ऐसा ढांचा बना सकते हैं जो सभी हितधारकों के हितों को संतुलित करता है और बौद्धिक संपदा अधिकारों की रक्षा करते हुए नवाचार को बढ़ावा देता है। डेटा (उपयोग और पहुंच) विधेयक इस दिशा में एक महत्वपूर्ण कदम का प्रतिनिधित्व करता है, जो इन महत्वपूर्ण मुद्दों को संबोधित करने और डिजिटल युग में कॉपीराइट कानून के भविष्य को आकार देने के लिए एक विधायी मार्ग प्रदान करता है। अब लिए गए फैसलों का रचनात्मक उद्योगों और आने वाले वर्षों के लिए AI के विकास पर स्थायी परिणाम होगा।