डीपसीकची चिंता? जेमिनी मोठा डेटा चोरणारा

डीपसीक वाद आणि अमेरिकन टेक उद्योगाचा प्रतिसाद

जानेवारीमध्ये, डीपसीक (DeepSeek) या चिनी कंपनीने त्यांचे ओपन-सोर्स AI मॉडेल सादर केले. यामुळे अमेरिकन टेक उद्योगात चिंतेची लाट पसरली. लगेचच, गोपनीयता आणि सुरक्षिततेबद्दल प्रश्न उपस्थित झाले. संभाव्य धोक्यांमुळे, खाजगी आणि सरकारी संस्थांनी डीपसीकचा वापर देशांतर्गत आणि आंतरराष्ट्रीय स्तरावर बंद केला.

डीपसीक चीनमधून आल्यामुळे अमेरिकन लोकांसाठी ते धोकादायक आहे, अशी भीती होती. हेरगिरी, सायबर युद्ध आणि राष्ट्रीय सुरक्षेला धोका, अशा अनेक शंका व्यक्त केल्या गेल्या. डीपसीकच्या गोपनीयता धोरणातील एक विशिष्ट कलम या चिंतेला कारणीभूत ठरले, ज्यात म्हटले होते: ‘आम्ही तुमच्याकडून गोळा केलेली वैयक्तिक माहिती तुमच्या देशाबाहेरील सर्वरवर संग्रहित केली जाऊ शकते. आम्ही गोळा केलेली माहिती चीनमधील सुरक्षित सर्व्हरमध्ये ठेवतो.’

या विधानाचा अर्थ असा घेण्यात आला की चिनी सरकार वापरकर्त्यांच्या संवेदनशील माहितीवर सहज प्रवेश करू शकते. जागतिक AI विकासाची गती आणि अमेरिका आणि चीनमधील ‘AI शर्यत’ यामुळे ही चिंता वाढली, ज्यामुळे अविश्वास आणि नैतिक प्रश्न निर्माण झाले.

एक धक्कादायक खुलासा: जेमिनीचा डेटा संग्रह

डीपसीकबद्दल (DeepSeek) वाद चालू असताना, एक धक्कादायक सत्य समोर आले आहे. चिनी AI मॉडेलवर तीव्र टीका होत असताना, डीपसीक चॅटबॉट क्षेत्रात सर्वाधिक डेटा गोळा करत नाही. Surfshark या VPN प्रदात्याने केलेल्या तपासणीत, काही लोकप्रिय AI चॅटबॉट ऍप्लिकेशन्सच्या डेटा संकलन पद्धतींवर प्रकाश टाकण्यात आला आहे.

संशोधकांनी ॲपल ॲप स्टोअरवर (Apple App Store) उपलब्ध असलेल्या दहा प्रमुख चॅटबॉट्सच्या गोपनीयतेच्या तपशीलांचे विश्लेषण केले: ChatGPT, Gemini, Copilot, Perplexity, DeepSeek, Grok, Jasper, Poe, Claude, आणि Pi. त्यांचे विश्लेषण तीन मुख्य गोष्टींवर आधारित होते:

  1. गोळा केलेल्या डेटाचे प्रकार: प्रत्येक ॲप्लिकेशन वापरकर्त्याची कोणती विशिष्ट माहिती गोळा करते?
  2. डेटा लिंकेज: गोळा केलेला कोणताही डेटा वापरकर्त्याच्या ओळखीशी थेट जोडलेला आहे का?
  3. तृतीय-पक्ष जाहिरातदार: ॲप्लिकेशन वापरकर्त्याचा डेटा बाह्य जाहिरात कंपन्यांसोबत शेअर करते का?

निष्कर्ष धक्कादायक होते. Google चे Gemini हे सर्वाधिक डेटा गोळा करणारे AI चॅटबॉट ॲप ठरले. ते 35 पैकी 22 प्रकारची वापरकर्त्यांची माहिती गोळा करते. यात खालील संवेदनशील डेटा समाविष्ट आहे:

  • नेमके ठिकाण: वापरकर्त्याचे भौगोलिक स्थान.
  • वापरकर्त्याने तयार केलेला मजकूर: ॲपमधील वापरकर्त्याच्या संवादाचा मजकूर.
  • संपर्क यादी: वापरकर्त्याच्या डिव्हाइसमधील संपर्क.
  • ब्राउझिंग इतिहास: वापरकर्त्याने कोणत्या वेबसाइट्सना भेट दिली, याचा मागोवा.

हा विस्तृत डेटा संग्रह इतर लोकप्रिय चॅटबॉट्सपेक्षा खूप जास्त आहे. डीपसीक, ज्यावर खूप वाद झाला, ते दहा ॲप्लिकेशन्सपैकी पाचव्या क्रमांकावर आहे, जे फक्त 11 प्रकारचा डेटा गोळा करते.

स्थान डेटा आणि तृतीय-पक्षासोबत शेअर करणे: एक सखोल दृष्टीक्षेप

अभ्यासात स्थान डेटा आणि तृतीय पक्षांसोबत डेटा शेअर करण्याबद्दल चिंताजनक गोष्टी समोर आल्या. फक्त Gemini, Copilot आणि Perplexity हे वापरकर्त्याचे नेमके ठिकाण गोळा करतात, जी एक अत्यंत संवेदनशील माहिती आहे आणि वापरकर्त्याच्या हालचाली आणि सवयींबद्दल बरेच काही सांगू शकते.

जवळपास 30% चॅटबॉट्सनी वापरकर्त्यांचा संवेदनशील डेटा, ज्यात स्थान डेटा आणि ब्राउझिंग इतिहास समाविष्ट आहे, डेटा ब्रोकर्ससारख्या बाह्य कंपन्यांसोबत शेअर केल्याचे आढळले. ही पद्धत गोपनीयतेबद्दल गंभीर चिंता निर्माण करते, कारण यामुळे वापरकर्त्याची माहिती मोठ्या नेटवर्कमध्ये उघड होते, जी वापरकर्त्याच्या नकळत किंवा नियंत्रणाबाहेर वापरली जाऊ शकते.

वापरकर्त्याच्या डेटाचा मागोवा: लक्ष्यित जाहिरात आणि इतर

आणखी एक चिंताजनक गोष्ट म्हणजे लक्ष्यित जाहिराती आणि इतर कारणांसाठी वापरकर्त्याच्या डेटाचा मागोवा घेणे. 30% चॅटबॉट्स, विशेषतः Copilot, Poe आणि Jasper, वापरकर्त्यांचा डेटा ट्रॅक करण्यासाठी गोळा करत असल्याचे आढळले. याचा अर्थ असा की ॲपमधून गोळा केलेला वापरकर्त्याचा डेटा तृतीय-पक्षाच्या डेटाशी जोडला जातो, ज्यामुळे लक्ष्यित जाहिरात किंवा जाहिरातींच्या प्रभावीतेचे मापन करणे शक्य होते.

Copilot आणि Poe यासाठी डिव्हाइस आयडी गोळा करत असल्याचे आढळले, तर Jasper आणखी पुढे जाऊन, डिव्हाइस आयडीसोबतच उत्पादनाशी संबंधित संवाद, जाहिरात डेटा आणि ‘ॲपमधील वापरकर्त्याच्या इतर कोणत्याही हालचालींची माहिती’ गोळा करत असल्याचे Surfshark च्या तज्ञांनी सांगितले.

डीपसीक: सर्वोत्तम नाही, वाईटही नाही

वादग्रस्त डीपसीक R1 मॉडेल, तीव्र तपासणी करूनही, डेटा संकलनाच्या बाबतीत मध्यम स्थितीत आहे. ते सरासरी 11 प्रकारचा डेटा गोळा करते, ज्यात प्रामुख्याने हे समाविष्ट आहे:

  • संपर्क माहिती: नावे, ईमेल पत्ते, फोन नंबर इ.
  • वापरकर्त्याने तयार केलेला मजकूर: वापरकर्त्यांनी ॲपमध्ये तयार केलेला मजकूर.
  • डायग्नॉस्टिक्स: ॲपची कार्यक्षमता आणि समस्या निवारणाशी संबंधित डेटा.

डीपसीक (DeepSeek) सर्वात जास्त गोपनीयता राखणारे चॅटबॉट नसले, तरी त्याची डेटा संकलन पद्धत Gemini सारख्या अमेरिकन चॅटबॉट्सपेक्षा कमी आहे.

ChatGPT: एक तुलनात्मक दृष्टीकोन

तुलनेसाठी, ChatGPT, जे सर्वात जास्त वापरले जाणारे AI चॅटबॉट्सपैकी एक आहे, ते 10 प्रकारचा डेटा गोळा करते. यात समाविष्ट आहे:

  • संपर्क माहिती
  • वापरकर्त्याने तयार केलेला मजकूर
  • ओळखणारे
  • वापराचा डेटा
  • डायग्नॉस्टिक्स

हे लक्षात घेणे महत्त्वाचे आहे की ChatGPT चॅट इतिहास देखील जमा करते. तथापि, वापरकर्त्यांकडे ‘Temporary chat’ वापरण्याचा पर्याय आहे, जे संभाषण इतिहास संग्रहित न करून हे कमी करण्यासाठी डिझाइन केलेले आहे.

डीपसीकचे गोपनीयता धोरण: वापरकर्ता नियंत्रण आणि डेटा हटवणे

डीपसीकचे (DeepSeek) गोपनीयता धोरण, काहींसाठी चिंतेचा विषय असला तरी, त्यात वापरकर्त्यांना चॅट इतिहासावर नियंत्रण ठेवण्याची सुविधा आहे. धोरणात म्हटले आहे की वापरकर्ते त्यांचा चॅट इतिहास व्यवस्थापित करू शकतात आणि त्यांच्या सेटिंग्जमधून तो हटवू शकतात. हे एक प्रकारचे नियंत्रण देते जे इतर चॅटबॉट ॲप्लिकेशन्समध्ये नेहमीच उपलब्ध नसते.

व्यापक संदर्भ: AI विकास आणि अमेरिका-चीन संबंध

डीपसीकबद्दल (DeepSeek) चिंता आणि AI डेटा गोपनीयतेबद्दलची व्यापक चर्चा, जागतिक AI विकासाची गती आणि अमेरिका आणि चीनमधील AI शर्यत यांच्याशी संबंधित आहे. हे भू-राजकीय संदर्भ या समस्येला आणखी एक पदर जोडतात, ज्यामुळे राष्ट्रीय सुरक्षा आणि AI तंत्रज्ञानाचा गैरवापर होण्याची शक्यता याबद्दल चिंता वाढते.

Surfshark अभ्यासाचे निष्कर्ष हे दर्शवतात की डेटा गोपनीयतेची चिंता फक्त विशिष्ट देशांमध्ये विकसित केलेल्या AI मॉडेल्सपुरती मर्यादित नाही. लोकप्रिय चॅटबॉट्समध्ये सर्वाधिक डेटा गोळा करणारे ॲप प्रत्यक्षात अमेरिकन आहे. हे AI डेटा गोपनीयतेसाठी अधिक व्यापक दृष्टिकोन असण्याची गरज दर्शवते, जो राष्ट्रीय सीमांच्या पलीकडे जाऊन वैयक्तिक कंपन्यांच्या पद्धती आणि त्यांनी लागू केलेल्या सुरक्षा उपायांवर लक्ष केंद्रित करतो. वापरकर्त्यांना ते वापरत असलेल्या AI साधनांच्या डेटा संकलन पद्धतींबद्दल माहिती असणे आवश्यक आहे, मग ते कुठूनही आलेले असोत, आणि वापरकर्त्यांच्या गोपनीयतेचे संरक्षण करण्यासाठी कठोर नियम असणे आवश्यक आहे. डेटा संकलन, वापर आणि शेअरिंग यासाठी स्पष्ट मानके स्थापित करणे, पारदर्शकता आणि वापरकर्त्याचे नियंत्रण सुनिश्चित करणे आणि कंपन्यांना त्यांच्या डेटा पद्धतींसाठी जबाबदार धरणे यावर लक्ष केंद्रित केले पाहिजे.