डीपसीक विवाद और अमेरिकी टेक उद्योग की प्रतिक्रिया
जनवरी में, एक चीनी कंपनी डीपसीक ने अपना प्रमुख ओपन-सोर्स AI मॉडल अनावरण किया। इस शुरुआत ने अमेरिकी टेक उद्योग में आशंका की लहरें भेज दीं। लगभग तुरंत, गोपनीयता और सुरक्षा चिंताओं का एक कोरस उत्पन्न हुआ। निजी और सरकारी संगठनों ने संभावित जोखिमों पर चिंताओं से प्रेरित होकर, डीपसीक के उपयोग को घरेलू और अंतरराष्ट्रीय स्तर पर प्रतिबंधित करने के लिए तेजी से कदम उठाए।
आशंका का मूल इस विश्वास से उपजा था कि डीपसीक, अपनी चीनी उत्पत्ति के साथ, अमेरिकी जनता के लिए एक बढ़ा हुआ जोखिम प्रस्तुत करता है। निगरानी, साइबर युद्ध और अन्य राष्ट्रीय सुरक्षा खतरों के डर का अक्सर हवाला दिया जाता था। इन चिंताओं को बढ़ावा देने वाला डीपसीक की गोपनीयता नीति में एक विशिष्ट खंड था, जिसमें कहा गया था: “हम आपसे जो व्यक्तिगत जानकारी एकत्र करते हैं, उसे आपके निवास के देश के बाहर स्थित सर्वर पर संग्रहीत किया जा सकता है। हम एकत्र की गई जानकारी को पीपुल्स रिपब्लिक ऑफ चाइना में स्थित सुरक्षित सर्वरों में संग्रहीत करते हैं।”
इस प्रतीत होता है कि अहानिकर बयान को कुछ लोगों ने चीनी सरकार के लिए संवेदनशील उपयोगकर्ता डेटा तक पहुंचने के लिए एक संभावित प्रवेश द्वार के रूप में व्याख्या की थी। वैश्विक AI विकास की तीव्र प्रगति, और अमेरिका और चीन के बीच कथित “AI हथियारों की दौड़” ने इन चिंताओं को और बढ़ा दिया, जिससे गहरा अविश्वास का माहौल पैदा हुआ और नैतिक प्रश्न उठे।
एक आश्चर्यजनक रहस्योद्घाटन: जेमिनी की डेटा भूख
हालांकि, डीपसीक को लेकर मचे बवाल के बीच एक चौंकाने वाला खुलासा हुआ है। चीनी AI मॉडल पर निर्देशित गहन जांच के बावजूद, यह पता चला है कि डीपसीक चैटबॉट क्षेत्र में सबसे महत्वपूर्ण डेटा कलेक्टर नहीं है। एक प्रतिष्ठित वीपीएन प्रदाता, सर्फशार्क द्वारा हाल ही में की गई एक जांच ने कुछ सबसे लोकप्रिय AI चैटबॉट अनुप्रयोगों की डेटा संग्रह प्रथाओं पर प्रकाश डाला है।
शोधकर्ताओं ने दस प्रमुख चैटबॉट्स के गोपनीयता विवरणों का सावधानीपूर्वक विश्लेषण किया, जो सभी ऐप्पल ऐप स्टोर पर आसानी से उपलब्ध हैं: ChatGPT, Gemini, Copilot, Perplexity, DeepSeek, Grok, Jasper, Poe, Claude, और Pi। उनका विश्लेषण तीन प्रमुख पहलुओं पर केंद्रित था:
- एकत्र किए गए डेटा के प्रकार: प्रत्येक एप्लिकेशन उपयोगकर्ता जानकारी की कौन सी विशिष्ट श्रेणियां एकत्र करता है?
- डेटा लिंकेज: क्या एकत्र किया गया कोई भी डेटा सीधे उपयोगकर्ता की पहचान से जुड़ा हुआ है?
- तृतीय-पक्ष विज्ञापनदाता: क्या एप्लिकेशन बाहरी विज्ञापन संस्थाओं के साथ उपयोगकर्ता डेटा साझा करता है?
निष्कर्ष चौंकाने वाले थे। Google का Gemini सबसे अधिक डेटा-गहन AI चैटबॉट ऐप के रूप में उभरा, जो एकत्र की गई व्यक्तिगत जानकारी की मात्रा और विविधता में अपने प्रतिस्पर्धियों को बौना कर देता है। एप्लिकेशन 35 संभावित उपयोगकर्ता डेटा प्रकारों में से 22 को इकट्ठा करता है। इसमें अत्यधिक संवेदनशील डेटा जैसे शामिल हैं:
- सटीक स्थान डेटा: उपयोगकर्ता के सटीक भौगोलिक स्थान को इंगित करना।
- उपयोगकर्ता सामग्री: ऐप के भीतर उपयोगकर्ता के इंटरैक्शन की सामग्री को कैप्चर करना।
- संपर्क सूची: उपयोगकर्ता के डिवाइस संपर्कों तक पहुँचना।
- ब्राउज़िंग इतिहास: उपयोगकर्ता की वेब ब्राउज़िंग गतिविधि को ट्रैक करना।
यह व्यापक डेटा संग्रह अध्ययन में जांचे गए अन्य लोकप्रिय चैटबॉट्स की तुलना में कहीं अधिक है। डीपसीक, जो बहुत विवाद का विषय है, दस अनुप्रयोगों में से पांचवें स्थान पर है, जो तुलनात्मक रूप से 11 अद्वितीय डेटाटाइप एकत्र करता है।
स्थान डेटा और तृतीय-पक्ष साझाकरण: एक करीब से देखें
अध्ययन में स्थान डेटा और तृतीय-पक्षों के साथ डेटा साझा करने के संबंध में चिंताजनक रुझानों का भी पता चला। केवल Gemini, Copilot और Perplexity को सटीक स्थान डेटा एकत्र करते हुए पाया गया, जो एक अत्यधिक संवेदनशील जानकारी है जो उपयोगकर्ता के आंदोलनों और आदतों के बारे में बहुत कुछ प्रकट कर सकती है।
अधिक मोटे तौर पर, विश्लेषण किए गए लगभग 30% चैटबॉट संवेदनशील उपयोगकर्ता डेटा साझा करते हुए पाए गए, जिसमें स्थान डेटा और ब्राउज़िंग इतिहास शामिल है, बाहरी संस्थाओं जैसे डेटा ब्रोकर के साथ। यह प्रथा महत्वपूर्ण गोपनीयता चिंताएं पैदा करती है, क्योंकि यह उपयोगकर्ता की जानकारी को अभिनेताओं के एक व्यापक नेटवर्क के सामने उजागर करती है, संभावित रूप से उपयोगकर्ता के ज्ञान या नियंत्रण से परे उद्देश्यों के लिए।
उपयोगकर्ता डेटा को ट्रैक करना: लक्षित विज्ञापन और उससे आगे
एक और खतरनाक खोज उपयोगकर्ता डेटा को लक्षित विज्ञापन और अन्य उद्देश्यों के लिए ट्रैक करने की प्रथा थी। तीस प्रतिशत चैटबॉट, विशेष रूप से Copilot, Poe और Jasper, अपने उपयोगकर्ताओं को ट्रैक करने के लिए डेटा एकत्र करते हुए पाए गए। इसका मतलब है कि ऐप से एकत्र किया गया उपयोगकर्ता डेटा तृतीय-पक्ष डेटा से जुड़ा हुआ है, जो लक्षित विज्ञापन या विज्ञापन प्रभावशीलता के माप को सक्षम करता है।
Copilot और Poe को इस उद्देश्य के लिए डिवाइस आईडी एकत्र करते हुए पाया गया, जबकि Jasper ने सर्फशार्क के विशेषज्ञों के अनुसार, न केवल डिवाइस आईडी बल्कि उत्पाद इंटरैक्शन डेटा, विज्ञापन डेटा और “ऐप में उपयोगकर्ता गतिविधि के बारे में कोई अन्य डेटा” भी इकट्ठा किया।
डीपसीक: सर्वश्रेष्ठ नहीं, सबसे खराब नहीं
विवादास्पद डीपसीक R1 मॉडल, गहन जांच के अधीन होने के बावजूद, डेटा संग्रह के मामले में एक मध्य मैदान रखता है। यह औसतन 11 अद्वितीय डेटा प्रकार एकत्र करता है, मुख्य रूप से इस पर ध्यान केंद्रित करता है:
- संपर्क जानकारी: नाम, ईमेल पते, फोन नंबर, आदि।
- उपयोगकर्ता सामग्री: ऐप के भीतर उपयोगकर्ताओं द्वारा उत्पन्न सामग्री।
- डायग्नोस्टिक्स: ऐप के प्रदर्शन और समस्या निवारण से संबंधित डेटा।
सबसे अधिक गोपनीयता-सम्मान करने वाला चैटबॉट नहीं होने के बावजूद, डीपसीक की डेटा संग्रह प्रथाएं अपने कुछ अमेरिकी-आधारित समकक्षों, विशेष रूप से जेमिनी की तुलना में कम व्यापक हैं।
चैटजीपीटी: एक तुलनात्मक परिप्रेक्ष्य
तुलना के लिए, चैटजीपीटी, सबसे व्यापक रूप से उपयोग किए जाने वाले AI चैटबॉट्स में से एक, 10 अद्वितीय प्रकार के डेटा एकत्र करता है। इसमें शामिल है:
- संपर्क जानकारी
- उपयोगकर्ता सामग्री
- पहचानकर्ता
- उपयोग डेटा
- डायग्नोस्टिक्स
यह ध्यान रखना महत्वपूर्ण है कि चैटजीपीटी चैट इतिहास भी एकत्र करता है। हालांकि, उपयोगकर्ताओं के पास “अस्थायी चैट” का उपयोग करने का विकल्प होता है, जो वार्तालाप इतिहास को संग्रहीत न करके इसे कम करने के लिए डिज़ाइन की गई एक सुविधा है।
डीपसीक की गोपनीयता नीति: उपयोगकर्ता नियंत्रण और डेटा विलोपन
डीपसीक की गोपनीयता नीति, जबकि कुछ के लिए चिंता का विषय है, चैट इतिहास पर उपयोगकर्ता नियंत्रण के लिए प्रावधान शामिल हैं। नीति में कहा गया है कि उपयोगकर्ता अपने चैट इतिहास का प्रबंधन कर सकते हैं और अपनी सेटिंग्स के माध्यम से इसे हटाने का विकल्प चुन सकते हैं। यह नियंत्रण की एक डिग्री प्रदान करता है जो हमेशा अन्य चैटबॉट अनुप्रयोगों में मौजूद नहीं होती है।
व्यापक संदर्भ: AI विकास और अमेरिका-चीन गतिशील
डीपसीक के आसपास की चिंताएं, और AI डेटा गोपनीयता के बारे में व्यापक बहस, वैश्विक AI विकास के तेजी से त्वरण और अमेरिका और चीन के बीच कथित AI हथियारों की दौड़ से अटूट रूप से जुड़ी हुई हैं। यह भू-राजनीतिक संदर्भ इस मुद्दे में जटिलता की एक और परत जोड़ता है, राष्ट्रीय सुरक्षा और AI प्रौद्योगिकियों के संभावित दुरुपयोग के बारे में चिंताओं को बढ़ावा देता है।
हालांकि, सर्फशार्क अध्ययन के निष्कर्ष एक महत्वपूर्ण अनुस्मारक के रूप में काम करते हैं कि डेटा गोपनीयता चिंताएं विशिष्ट देशों में विकसित AI मॉडल तक सीमित नहीं हैं। विश्लेषण किए गए लोकप्रिय चैटबॉट्स में सबसे गंभीर डेटा कलेक्टर वास्तव में एक अमेरिकी-आधारित एप्लिकेशन है। यह AI डेटा गोपनीयता के लिए एक अधिक सूक्ष्म और व्यापक दृष्टिकोण की आवश्यकता को रेखांकित करता है, जो राष्ट्रीय सीमाओं को पार करता है और व्यक्तिगत कंपनियों की प्रथाओं और उनके द्वारा लागू किए गए सुरक्षा उपायों पर ध्यान केंद्रित करता है। यह अनिवार्य है कि उपयोगकर्ता उन AI उपकरणों की डेटा संग्रह प्रथाओं के बारे में सूचित हों जिनका वे उपयोग करते हैं, चाहे उनकी उत्पत्ति कुछ भी हो, और तेजी से विकसित हो रहे AI परिदृश्य में उपयोगकर्ता की गोपनीयता की रक्षा के लिए मजबूत नियम बनाए जाएं। ध्यान डेटा संग्रह, उपयोग और साझाकरण के लिए स्पष्ट मानक स्थापित करने, पारदर्शिता और उपयोगकर्ता नियंत्रण सुनिश्चित करने और कंपनियों को उनकी डेटा प्रथाओं के लिए जवाबदेह ठहराने पर होना चाहिए।