டீப்சீக் பற்றி கவலையா? ஜெமினிதான் மிகப்பெரிய தரவு மீறல் செய்பவர்

டீப்சீக் சர்ச்சை மற்றும் அமெரிக்க தொழில்நுட்பத் துறையின் பதில்

ஜனவரியில், சீன நிறுவனமான டீப்சீக், அதன் முதன்மை ஓப்பன் சோர்ஸ் AI மாடலை வெளியிட்டது. இந்த அறிமுகம் அமெரிக்க தொழில்நுட்பத் துறையில் அச்சத்தை ஏற்படுத்தியது. கிட்டத்தட்ட உடனடியாக, தனியுரிமை மற்றும் பாதுகாப்பு குறித்த கவலைகள் எழுந்தன. சாத்தியமான அபாயங்கள் குறித்த அச்சங்களால் தூண்டப்பட்ட தனியார் மற்றும் அரசு நிறுவனங்கள், டீப்சீக்கின் பயன்பாட்டை உள்நாட்டிலும் சர்வதேச அளவிலும் தடை செய்ய விரைவாக நகர்ந்தன.

சீனாவில் அதன் தோற்றம் கொண்ட டீப்சீக், அமெரிக்க மக்களுக்கு அதிக ஆபத்தை ஏற்படுத்துவதாக நம்பப்பட்டது. கண்காணிப்பு, இணையப் போர் மற்றும் பிற தேசிய பாதுகாப்பு அச்சுறுத்தல்கள் பற்றிய அச்சங்கள் அடிக்கடி குறிப்பிடப்பட்டன. டீப்சீக்கின் தனியுரிமைக் கொள்கையில் உள்ள ஒரு குறிப்பிட்ட உட்பிரிவு இந்தக் கவலைகளைத் தூண்டியது, அதில் கூறப்பட்டதாவது: ‘நாங்கள் உங்களிடமிருந்து சேகரிக்கும் தனிப்பட்ட தகவல்கள் நீங்கள் வசிக்கும் நாட்டைத் தவிர வேறு நாட்டில் அமைந்துள்ள ஒரு சர்வரில் சேமிக்கப்படலாம். நாங்கள் சேகரிக்கும் தகவல்களை சீன மக்கள் குடியரசில் அமைந்துள்ள பாதுகாப்பான சர்வர்களில் சேமிக்கிறோம்.’

இந்த வெளித்தோற்றத்திற்கு பாதிப்பில்லாத அறிக்கை, சீன அரசாங்கம் முக்கியமான பயனர் தரவை அணுகுவதற்கான சாத்தியமான நுழைவாயிலாக சிலரால் விளக்கப்பட்டது. உலகளாவிய AI வளர்ச்சியின் விரைவான முன்னேற்றம் மற்றும் அமெரிக்காவிற்கும் சீனாவிற்கும் இடையிலான ‘AI ஆயுதப் போட்டி’ ஆகியவை இந்தக் கவலைகளை அதிகப்படுத்தின, இது ஆழ்ந்த அவநம்பிக்கை மற்றும் நெறிமுறை கேள்விகளை எழுப்பியது.

ஆச்சரியமான வெளிப்பாடு: ஜெமினியின் தரவு பசி

இருப்பினும், டீப்சீக்கைச் சுற்றியுள்ள கூச்சலுக்கு மத்தியில், ஒரு ஆச்சரியமான வெளிப்பாடு வெளிப்பட்டுள்ளது. சீன AI மாடலை நோக்கி செலுத்தப்பட்ட தீவிர ஆய்வுகள் இருந்தபோதிலும், சாட்போட் அரங்கில் டீப்சீக் மிகப்பெரிய தரவு சேகரிப்பாளர் அல்ல என்பது தெரியவந்துள்ளது. ஒரு புகழ்பெற்ற VPN வழங்குநரான சர்ஃப்ஷார்க் (Surfshark) நடத்திய சமீபத்திய விசாரணையானது, மிகவும் பிரபலமான சில AI சாட்போட் பயன்பாடுகளின் தரவு சேகரிப்பு நடைமுறைகள் குறித்து வெளிச்சம் போட்டுள்ளது.

ஆராய்ச்சியாளர்கள் ஆப்பிள் ஆப் ஸ்டோரில் உடனடியாகக் கிடைக்கக்கூடிய பத்து முக்கிய சாட்போட்களின் தனியுரிமை விவரங்களை கவனமாக ஆய்வு செய்தனர்: ChatGPT, Gemini, Copilot, Perplexity, DeepSeek, Grok, Jasper, Poe, Claude மற்றும் Pi. அவர்களின் பகுப்பாய்வு மூன்று முக்கிய அம்சங்களில் கவனம் செலுத்தியது:

  1. சேகரிக்கப்பட்ட தரவுகளின் வகைகள்: ஒவ்வொரு பயன்பாடும் பயனர் தகவலின் எந்த குறிப்பிட்ட வகைகளை சேகரிக்கிறது?
  2. தரவு இணைப்பு: சேகரிக்கப்பட்ட தரவுகளில் ஏதேனும் பயனரின் அடையாளத்துடன் நேரடியாக இணைக்கப்பட்டுள்ளதா?
  3. மூன்றாம் தரப்பு விளம்பரதாரர்கள்: பயன்பாடு பயனர் தரவை வெளிப்புற விளம்பர நிறுவனங்களுடன் பகிர்ந்து கொள்கிறதா?

கண்டுபிடிப்புகள் திகைக்க வைத்தன. கூகிளின் ஜெமினி (Google’s Gemini), மிகவும் தரவு-தீவிர AI சாட்போட் பயன்பாடாக உருவெடுத்தது, அது சேகரிக்கும் தனிப்பட்ட தகவல்களின் அளவு மற்றும் வகைகளில் அதன் போட்டியாளர்களை விட அதிகமாக இருந்தது. பயன்பாடு 35 சாத்தியமான பயனர் தரவு வகைகளில் 22 ஐ சேகரிக்கிறது. இதில் மிகவும் முக்கியமான தரவுகளும் அடங்கும்:

  • துல்லியமான இருப்பிடத் தரவு: பயனரின் சரியான புவியியல் இருப்பிடத்தைக் கண்டறிதல்.
  • பயனர் உள்ளடக்கம்: பயன்பாட்டிற்குள் பயனர் தொடர்புகளின் உள்ளடக்கத்தைப் படம்பிடித்தல்.
  • தொடர்புப் பட்டியல்: பயனரின் சாதனத் தொடர்புகளை அணுகுதல்.
  • உலாவல் வரலாறு: பயனரின் இணைய உலாவல் செயல்பாட்டைக் கண்காணித்தல்.

இந்த விரிவான தரவு சேகரிப்பு ஆய்வில் ஆராயப்பட்ட பிற பிரபலமான சாட்போட்களை விட அதிகமாக உள்ளது. அதிக சர்ச்சைக்கு உள்ளான டீப்சீக், பத்து பயன்பாடுகளில் ஐந்தாவது இடத்தைப் பிடித்தது, ஒப்பீட்டளவில் மிதமான 11 தனித்துவமான தரவு வகைகளை சேகரித்தது.

இருப்பிடத் தரவு மற்றும் மூன்றாம் தரப்பினருடன் பகிர்தல்: ஒரு நெருக்கமான பார்வை

இருப்பிடத் தரவு மற்றும் மூன்றாம் தரப்பினருடன் தரவைப் பகிர்வது தொடர்பான கவலைக்குரிய போக்குகளையும் இந்த ஆய்வு வெளிப்படுத்தியது. ஜெமினி, கோபிலாட் மற்றும் பெர்ப்ளெக்சிட்டி மட்டுமே துல்லியமான இருப்பிடத் தரவைச் சேகரிப்பதாகக் கண்டறியப்பட்டது, இது பயனரின் இயக்கங்கள் மற்றும் பழக்கவழக்கங்களைப் பற்றி அதிகம் வெளிப்படுத்தக்கூடிய மிகவும் முக்கியமான தகவலாகும்.

மிகவும் பரந்த அளவில், பகுப்பாய்வு செய்யப்பட்ட சாட்போட்களில் சுமார் 30% தரவு தரகர்கள் போன்ற வெளிப்புற நிறுவனங்களுடன் இருப்பிடத் தரவு மற்றும் உலாவல் வரலாறு உள்ளிட்ட முக்கியமான பயனர் தரவைப் பகிர்வதாகக் கண்டறியப்பட்டது. இந்த நடைமுறை குறிப்பிடத்தக்க தனியுரிமை கவலைகளை எழுப்புகிறது, ஏனெனில் இது பயனர் தகவல்களை பரந்த நெட்வொர்க்குகளுக்கு வெளிப்படுத்துகிறது, இது பயனரின் அறிவு அல்லது கட்டுப்பாட்டிற்கு அப்பாற்பட்ட நோக்கங்களுக்காக இருக்கலாம்.

பயனர் தரவைக் கண்காணித்தல்: இலக்கு வைக்கப்பட்ட விளம்பரம் மற்றும் அதற்கு அப்பால்

மற்றொரு ஆபத்தான கண்டுபிடிப்பு, இலக்கு வைக்கப்பட்ட விளம்பரம் மற்றும் பிற நோக்கங்களுக்காக பயனர் தரவைக் கண்காணிக்கும் நடைமுறையாகும். 30 சதவீத சாட்போட்கள், குறிப்பாக கோபிலாட், போ மற்றும் ஜாஸ்பர் ஆகியவை தங்கள் பயனர்களைக் கண்காணிக்க தரவைச் சேகரிப்பதாகக் கண்டறியப்பட்டது. இதன் பொருள், பயன்பாட்டிலிருந்து சேகரிக்கப்பட்ட பயனர் தரவு மூன்றாம் தரப்பு தரவுடன் இணைக்கப்பட்டுள்ளது, இது இலக்கு வைக்கப்பட்ட விளம்பரத்தை அல்லது விளம்பரத்தின் செயல்திறனை அளவிட உதவுகிறது.

கோபிலாட் மற்றும் போ இந்த நோக்கத்திற்காக சாதன ஐடிகளை சேகரிப்பதாகக் கண்டறியப்பட்டது, அதே நேரத்தில் ஜாஸ்பர் இன்னும் மேலே சென்று, சாதன ஐடிகளை மட்டுமல்லாமல், தயாரிப்பு தொடர்பு தரவு, விளம்பர தரவு மற்றும் ‘பயன்பாட்டில் பயனர் செயல்பாட்டைப் பற்றிய வேறு எந்த தரவையும்’ சேகரித்தது என்று சர்ஃப்ஷார்க்கின் நிபுணர்கள் தெரிவித்தனர்.

டீப்சீக்: சிறந்தது அல்ல, மோசமானது அல்ல

தீவிர ஆய்வுக்கு உட்படுத்தப்பட்ட சர்ச்சைக்குரிய டீப்சீக் R1 மாடல், தரவு சேகரிப்பின் அடிப்படையில் ஒரு நடுநிலையான இடத்தைப் பிடித்துள்ளது. இது சராசரியாக 11 தனித்துவமான தரவு வகைகளை சேகரிக்கிறது, முக்கியமாக கவனம் செலுத்துகிறது:

  • தொடர்புத் தகவல்: பெயர்கள், மின்னஞ்சல் முகவரிகள், தொலைபேசி எண்கள் போன்றவை.
  • பயனர் உள்ளடக்கம்: பயன்பாட்டிற்குள் பயனர்களால் உருவாக்கப்பட்ட உள்ளடக்கம்.
  • பரிசோதனைகள்: பயன்பாட்டின் செயல்திறன் மற்றும் சரிசெய்தல் தொடர்பான தரவு.

மிகவும் தனியுரிமையை மதிக்கும் சாட்போட் இல்லையென்றாலும், டீப்சீக்கின் தரவு சேகரிப்பு நடைமுறைகள் அதன் அமெரிக்காவை தளமாகக் கொண்ட சில சகாக்களை விட, குறிப்பாக ஜெமினியை விட குறைவானவை.

சாட்ஜிபிடி (ChatGPT): ஒரு ஒப்பீட்டு பார்வை

ஒப்பீட்டளவில், மிகவும் பரவலாகப் பயன்படுத்தப்படும் AI சாட்போட்களில் ஒன்றான சாட்ஜிபிடி, 10 தனித்துவமான தரவு வகைகளைச் சேகரிக்கிறது. இதில் அடங்குபவை:

  • தொடர்புத் தகவல்
  • பயனர் உள்ளடக்கம்
  • அடையாளங்காட்டிகள்
  • பயன்பாட்டுத் தரவு
  • பரிசோதனைகள்

சாட்ஜிபிடி உரையாடல் வரலாற்றையும் குவிக்கிறது என்பது குறிப்பிடத்தக்கது. இருப்பினும், பயனர்கள் ‘தற்காலிக அரட்டை’யைப் பயன்படுத்த விருப்பம் உள்ளது, இது உரையாடல் வரலாற்றைச் சேமிக்காமல் இதைத் தணிக்கும் வகையில் வடிவமைக்கப்பட்டுள்ளது.

டீப்சீக்கின் தனியுரிமைக் கொள்கை: பயனர் கட்டுப்பாடு மற்றும் தரவு நீக்கம்

டீப்சீக்கின் தனியுரிமைக் கொள்கை, சிலருக்கு கவலைக்குரியதாக இருந்தாலும், உரையாடல் வரலாற்றின் மீது பயனர் கட்டுப்பாட்டிற்கான விதிகளை உள்ளடக்கியது. பயனர்கள் தங்கள் அரட்டை வரலாற்றை நிர்வகிக்கலாம் மற்றும் அதை தங்கள் அமைப்புகள் மூலம் நீக்குவதற்கான விருப்பம் உள்ளது என்று கொள்கை கூறுகிறது. இது மற்ற சாட்போட் பயன்பாடுகளில் எப்போதும் இல்லாத ஒரு அளவிலான கட்டுப்பாட்டை வழங்குகிறது.

பரந்த சூழல்: AI வளர்ச்சி மற்றும் அமெரிக்க-சீன இயக்கவியல்

டீப்சீக்கைச் சுற்றியுள்ள கவலைகள் மற்றும் AI தரவு தனியுரிமை பற்றிய பரந்த விவாதம், உலகளாவிய AI வளர்ச்சியின் விரைவான முடுக்கம் மற்றும் அமெரிக்காவிற்கும் சீனாவிற்கும் இடையிலான AI ஆயுதப் போட்டியுடன் பிரிக்கமுடியாத வகையில் இணைக்கப்பட்டுள்ளன. இந்த புவிசார் அரசியல் சூழல் இந்த பிரச்சினைக்கு மற்றொரு சிக்கலான தன்மையை சேர்க்கிறது, தேசிய பாதுகாப்பு மற்றும் AI தொழில்நுட்பங்களை தவறாகப் பயன்படுத்துவதற்கான சாத்தியக்கூறுகள் பற்றிய அச்சங்களை தூண்டுகிறது.

இருப்பினும், சர்ஃப்ஷார்க்கின் ஆய்வின் கண்டுபிடிப்புகள், தரவு தனியுரிமை கவலைகள் குறிப்பிட்ட நாடுகளில் உருவாக்கப்பட்ட AI மாடல்களுக்கு மட்டும் அல்ல என்பதை ஒரு முக்கியமான நினைவூட்டலாக செயல்படுகின்றன. பகுப்பாய்வு செய்யப்பட்ட பிரபலமான சாட்போட்களில் மிகவும் மோசமான தரவு சேகரிப்பாளர் உண்மையில் அமெரிக்காவை தளமாகக் கொண்ட ஒரு பயன்பாடு ஆகும். இது AI தரவு தனியுரிமைக்கு மிகவும் நுணுக்கமான மற்றும் விரிவான அணுகுமுறையின் அவசியத்தை அடிக்கோடிட்டுக் காட்டுகிறது, இது தேசிய எல்லைகளைத் தாண்டி தனிப்பட்ட நிறுவனங்களின் நடைமுறைகள் மற்றும் அவர்கள் செயல்படுத்தும் பாதுகாப்புகளில் கவனம் செலுத்துகிறது. பயனர்கள் தாங்கள் பயன்படுத்தும் AI கருவிகளின் தரவு சேகரிப்பு நடைமுறைகள் குறித்து, அவற்றின் தோற்றத்தைப் பொருட்படுத்தாமல், அவர்களுக்குத் தெரிவிக்கப்படுவது அவசியம், மேலும் வேகமாக வளர்ந்து வரும் AI நிலப்பரப்பில் பயனர் தனியுரிமையைப் பாதுகாக்க வலுவான விதிமுறைகள் வைக்கப்படுவது அவசியம். தரவு சேகரிப்பு, பயன்பாடு மற்றும் பகிர்தல் ஆகியவற்றிற்கான தெளிவான தரநிலைகளை நிறுவுதல், வெளிப்படைத்தன்மை மற்றும் பயனர் கட்டுப்பாட்டை உறுதி செய்தல் மற்றும் நிறுவனங்கள் தங்கள் தரவு நடைமுறைகளுக்கு பொறுப்பேற்கச் செய்தல் ஆகியவற்றில் கவனம் செலுத்தப்பட வேண்டும்.