அறிவின் விலை: AI சாட்பாட்களின் தரவுப் பசி

செயற்கை நுண்ணறிவுப் புரட்சி வெறுமனே கதவைத் தட்டவில்லை; அது நமது டிஜிட்டல் வாழ்க்கை அறைகளில் உறுதியாகத் தன்னை நிலைநிறுத்திக் கொண்டுள்ளது. இந்த மாற்றத்தின் மையமாக AI சாட்பாட்கள் உள்ளன, இவை உடனடி பதில்கள் முதல் ஆக்கப்பூர்வமான ஒத்துழைப்பு வரை அனைத்தையும் உறுதியளிக்கும் அதிநவீன உரையாடல் முகவர்கள். ChatGPT போன்ற கருவிகள் விரைவாக வியக்கத்தக்க பிரபலத்தை அடைந்துள்ளன, வாரத்திற்கு 200 மில்லியனுக்கும் அதிகமான செயலில் உள்ள பயனர்களை ஈடுபடுத்துவதாகக் கூறப்படுகிறது. ஆயினும், தடையற்ற தொடர்புகளின் மேற்பரப்பிற்கு அடியில், நமது தனிப்பட்ட தகவல்களின் நாணயத்தில் அளவிடப்படும் இந்த வசதியின் விலை என்ன என்ற ஒரு முக்கியமான கேள்வி எழுகிறது. இந்த டிஜிட்டல் உதவியாளர்கள் நமது வாழ்க்கையில் மேலும் ஒருங்கிணைக்கப்படுவதால், பயனர் தரவை உட்கொள்வதில் எவை மிகவும் பேராசை கொண்டவை என்பதைப் புரிந்துகொள்வது விவேகமானது மட்டுமல்ல, அவசியமானதும் ஆகும்.

Apple App Store போன்ற தளங்களில் பட்டியலிடப்பட்டுள்ள தனியுரிமை வெளிப்பாடுகளின் பகுப்பாய்வு, தற்போது கிடைக்கக்கூடிய மிக முக்கியமான AI சாட்பாட்களிடையே பரந்த அளவிலான தரவு சேகரிப்பு நடைமுறைகளை வெளிப்படுத்தி, இந்த வளர்ந்து வரும் பிரச்சினைக்கு வெளிச்சம் போடுகிறது. வெளிப்படைத்தன்மையை வழங்கக் கட்டாயப்படுத்தப்பட்ட இந்த வெளிப்பாடுகள், பயனர்கள் மறைமுகமாகப் பகிர ஒப்புக்கொள்ளும் தகவல்களின் வகைகள் மற்றும் அளவைப் பற்றிய ஒரு சாளரத்தை வழங்குகின்றன. கண்டுபிடிப்புகள் ஒரு சிக்கலான சித்திரத்தை வரைகின்றன, தரவு தனியுரிமைக்கு வரும்போது எல்லா AI தோழர்களும் சமமாக உருவாக்கப்படவில்லை என்பதைக் குறிக்கிறது. சிலர் லேசாக நடக்கிறார்கள், மற்றவர்கள் தங்கள் பயனர்களைப் பற்றிய விரிவான கோப்புகளைச் சேகரிப்பதாகத் தெரிகிறது. இந்த மாறுபாடு, இந்த கருவிகளின் திறன்களுக்கு அப்பால், அவற்றின் பின்னணியில் உள்ள தரவுப் பொருளாதாரங்களைப் புரிந்துகொள்வதன் முக்கியத்துவத்தை அடிக்கோடிட்டுக் காட்டுகிறது.

தரவு சேகரிப்பு ஸ்பெக்ட்ரம்: ஒரு முதல் பார்வை

செயற்கை நுண்ணறிவின் வளர்ந்து வரும் நிலப்பரப்பில் பயணிப்பது பெரும்பாலும் அறியப்படாத பிரதேசத்தை ஆராய்வது போல் உணர்கிறது. மிகவும் புலப்படும் அடையாளங்களில் AI சாட்பாட்கள் உள்ளன, அவை முன்னோடியில்லாத அளவிலான தொடர்பு மற்றும் உதவியை உறுதியளிக்கின்றன. இருப்பினும், ஒரு நெருக்கமான ஆய்வு இந்த நிறுவனங்கள் எவ்வாறு செயல்படுகின்றன என்பதில் குறிப்பிடத்தக்க வேறுபாடுகளை வெளிப்படுத்துகிறது, குறிப்பாக அவை சேகரிக்கும் தனிப்பட்ட தகவல்களைப் பொறுத்தவரை. பிரபலமான சாட்பாட் பயன்பாடுகளுடன் தொடர்புடைய தனியுரிமைக் கொள்கைகளின் சமீபத்திய ஆய்வு, தரவு கையகப்படுத்துதலின் ஒரு தனித்துவமான படிநிலையை எடுத்துக்காட்டுகிறது.

இந்த ஸ்பெக்ட்ரமின் ஒரு முனையில், பயனர் தகவல்களுக்கு கணிசமான பசியைக் காட்டும் தளங்களைக் காண்கிறோம், அவை அவற்றின் வழிமுறைகளைச் செம்மைப்படுத்த அல்லது பரந்த வணிக மாதிரிகளை ஆதரிக்க பரந்த தரவுத்தொகுப்புகளைப் பயன்படுத்தக்கூடும். எதிர் முனையில், சில சாட்பாட்கள் மிகவும் கட்டுப்படுத்தப்பட்ட அணுகுமுறையுடன் செயல்படுவதாகத் தோன்றுகிறது, அடிப்படை செயல்பாடு மற்றும் மேம்பாட்டிற்கு அவசியமானதை மட்டுமே சேகரிக்கிறது. இந்த வேறுபாடு வெறுமனே கல்விசார்ந்தது அல்ல; இது வடிவமைப்புத் தத்துவங்கள், மூலோபாய முன்னுரிமைகள் மற்றும் ஒருவேளை இந்த சக்திவாய்ந்த கருவிகளுக்குப் பின்னால் உள்ள நிறுவனங்களின் அடிப்படை வருவாய் மாதிரிகள் பற்றியும் பேசுகிறது. தரவு சேகரிப்பில் தெளிவான முன்னணியை நிறுவுதல் மற்றும் இலகுவான தொடுதலுடன் இருப்பவர்களை அடையாளம் காண்பது, AI யுகத்தில் தங்கள் டிஜிட்டல் தனியுரிமை குறித்து தகவலறிந்த தேர்வுகளைச் செய்ய விரும்பும் பயனர்களுக்கு ஒரு முக்கியமான தொடக்க புள்ளியை வழங்குகிறது. இந்தத் தரவுப் பந்தயத்தில் முன்னணியில் இருப்பவர், சிலருக்கு ஆச்சரியமில்லாமல், தரவுப் பயன்பாட்டில் நீண்ட வரலாற்றைக் கொண்ட ஒரு தொழில்நுட்ப நிறுவனத்திடமிருந்து வருகிறார், அதே நேரத்தில் மிகவும் பழமைவாத வீரர் AI அரங்கில் ஒரு புதிய, ஆனால் உயர்நிலை, நுழைபவரிடமிருந்து வெளிப்படுகிறார்.

Google’s Gemini: மறுக்கமுடியாத தரவு சாம்பியன்

அதன் சகாக்களிடமிருந்து தனித்து நின்று, Google’s Gemini (மார்ச் 2023 இல் அறிமுகமானது) சமீபத்திய ஆய்வுகளில் அடையாளம் காணப்பட்ட மிகவும் விரிவான தரவு சேகரிப்பு நடைமுறைகளைக் காட்டுகிறது. தனியுரிமை வெளிப்பாடுகளின்படி, Gemini குறிப்பிடத்தக்க 22 வெவ்வேறு தரவுப் புள்ளிகளை சேகரிக்கிறது, இது 10 வகைகளின் விரிவான பட்டியலில் பரவியுள்ளது. இது பரவலாகப் பயன்படுத்தப்படும் சாட்பாட்களிடையே தரவு கையகப்படுத்துதலில் Google இன் வழங்கலை உச்சத்தில் நிலைநிறுத்துகிறது.

Gemini ஆல் சேகரிக்கப்பட்ட தகவல்களின் அகலம் குறிப்பிடத்தக்கது. இது ஒரு பயனரின் டிஜிட்டல் வாழ்க்கையின் பல பரிமாணங்களை உள்ளடக்கியது:

  • Contact Info: பெயர் அல்லது மின்னஞ்சல் முகவரி போன்ற நிலையான விவரங்கள், கணக்கு அமைப்பிற்கு அடிக்கடி தேவைப்படும்.
  • Location: துல்லியமான அல்லது தோராயமான புவியியல் தரவு, உள்ளூர்மயமாக்கப்பட்ட பதில்கள் அல்லது பகுப்பாய்வுகளுக்குப் பயன்படுத்தப்படலாம்.
  • Contacts: பயனரின் முகவரி புத்தகம் அல்லது தொடர்புகள் பட்டியலுக்கான அணுகல் – இந்த குறிப்பிட்ட ஒப்பீட்டுக் குழுவிற்குள் Gemini ஆல் தனித்துவமாகத் தட்டப்பட்ட ஒரு வகை, பயனரின் நெட்வொர்க் பற்றிய குறிப்பிடத்தக்க தனியுரிமைக் கவலைகளை எழுப்புகிறது.
  • User Content: இந்த பரந்த வகை பயனர்கள் உள்ளிடும் தூண்டுதல்கள், அவர்கள் சாட்பாட்டுடன் நடத்தும் உரையாடல்கள் மற்றும் பதிவேற்றப்பட்ட கோப்புகள் அல்லது ஆவணங்கள் ஆகியவற்றை உள்ளடக்கியிருக்கலாம். இது பெரும்பாலும் AI பயிற்சிக்கு முக்கியமானது ஆனால் மிகவும் உணர்திறன் வாய்ந்தது.
  • History: உலாவல் வரலாறு அல்லது தேடல் வரலாறு, சாட்பாட்டுடனான நேரடித் தொடர்புக்கு அப்பால் பயனர் ஆர்வங்கள் மற்றும் ஆன்லைன் செயல்பாடுகள் பற்றிய நுண்ணறிவுகளை வழங்குகிறது.
  • Identifiers: சாதன ஐடிகள், பயனர் ஐடிகள் அல்லது பிற தனிப்பட்டகுறிச்சொற்கள், பயன்பாட்டு முறைகளைக் கண்காணிக்கவும், வெவ்வேறு சேவைகள் அல்லது அமர்வுகளில் செயல்பாட்டை இணைக்கவும் தளத்தை அனுமதிக்கும்.
  • Diagnostics: செயல்திறன் தரவு, செயலிழப்பு பதிவுகள் மற்றும் நிலைத்தன்மையைக் கண்காணிக்கவும் சேவையை மேம்படுத்தவும் பயன்படுத்தப்படும் பிற தொழில்நுட்ப தகவல்கள். ஆய்வில் உள்ள அனைத்து போட்களும் இந்த வகை தரவைச் சேகரித்தன.
  • Usage Data: பயனர் பயன்பாட்டுடன் எவ்வாறு தொடர்பு கொள்கிறார் என்பது பற்றிய தகவல் – அம்ச பயன்பாட்டு அதிர்வெண், அமர்வு காலம், தொடர்பு முறைகள் போன்றவை.
  • Purchases: நிதி பரிவர்த்தனை வரலாறு அல்லது கொள்முதல் தகவல். Perplexity உடன் சேர்ந்து, Gemini இந்த வகையை அணுகுவதில் தனித்துவமானது, AI தொடர்புத் தரவை நுகர்வோர் நடத்தையுடன் இணைக்கக்கூடும்.
  • Other Data: வேறு எங்கும் குறிப்பிடப்படாத பல்வேறு வகையான பிற தகவல்களை உள்ளடக்கிய ஒரு பிடிப்பு வகை.

Gemini ஆல் சேகரிக்கப்பட்ட தரவின் அளவு மற்றும், மிக முக்கியமாக, தன்மை கவனமாக பரிசீலிக்கப்பட வேண்டும். ஒரு பயனரின் Contacts பட்டியலை அணுகுவது வழக்கமான சாட்பாட் தேவைகளுக்கு அப்பாற்பட்ட ஒரு குறிப்பிடத்தக்க விரிவாக்கத்தைக் குறிக்கிறது. இதேபோல், Purchase வரலாற்றைச் சேகரிப்பது AI பயன்பாட்டை நிதிச் செயல்பாட்டுடன் பின்னிப்பிணைக்கிறது, இது மிகவும் குறிப்பிட்ட பயனர் விவரக்குறிப்பு அல்லது இலக்கு விளம்பரத்திற்கான வழிகளைத் திறக்கிறது, இந்த பகுதிகளில் Google ஆழ்ந்த நிபுணத்துவத்தையும் நன்கு நிறுவப்பட்ட வணிக மாதிரியையும் கொண்டுள்ளது. கண்டறியும் மற்றும் பயன்பாட்டுத் தரவு சேவை மேம்பாட்டிற்கு ஒப்பீட்டளவில் தரமானதாக இருந்தாலும், இருப்பிடம், பயனர் உள்ளடக்கம், வரலாறு மற்றும் தனிப்பட்ட அடையாளங்காட்டிகளுடன் இணைந்து, அதன் பயனர்களைப் பற்றிய குறிப்பிடத்தக்க விரிவான புரிதலை உருவாக்க வடிவமைக்கப்பட்ட ஒரு அமைப்பின் சித்திரத்தை வரைகிறது. இந்த விரிவான தரவு சேகரிப்பு Google இன் பரந்த சுற்றுச்சூழல் அமைப்புடன் ஒத்துப்போகிறது, இது தனிப்பயனாக்கப்பட்ட சேவைகள் மற்றும் விளம்பர வருவாய்க்காக பயனர் தகவல்களை மேம்படுத்துவதில் செழித்து வளர்கிறது. குறைந்தபட்ச தரவு வெளிப்பாட்டிற்கு முன்னுரிமை அளிக்கும் பயனர்களுக்கு, தரவுப் புள்ளி சேகரிப்பில் முன்னணியில் உள்ள Gemini இன் நிலை, கவனமாக மதிப்பீடு செய்யக் கோரும் ஒரு விதிவிலக்காக அமைகிறது.

நடுநிலைப் பாதையை வரைதல்: Claude, Copilot, மற்றும் DeepSeek

Gemini இன் விரிவான அணுகலுக்கும் மற்றவர்களின் மிகவும் குறைந்தபட்ச அணுகுமுறைக்கும் இடையிலான இடைவெளியை ஆக்கிரமிப்பது பல முக்கிய AI சாட்பாட்கள்: Claude, Copilot, மற்றும் DeepSeek. இந்த தளங்கள் சந்தையின் குறிப்பிடத்தக்க பகுதியைக் குறிக்கின்றன மற்றும் தரவு சேகரிப்பு நடைமுறைகளைக் காட்டுகின்றன, அவை கணிசமானவை என்றாலும், முன்னணியை விட குறைவான விரிவானவை.

Claude, Anthropic (AI பாதுகாப்பில் அதன் முக்கியத்துவத்திற்காக அறியப்பட்ட ஒரு நிறுவனம்) ஆல் உருவாக்கப்பட்டது, 13 தரவுப் புள்ளிகளை சேகரிப்பதாகக் கூறப்படுகிறது. அதன் சேகரிப்பு Contact Info, Location, User Content, Identifiers, Diagnostics, மற்றும் Usage Data உள்ளிட்ட வகைகளை உள்ளடக்கியது. Gemini உடன் ஒப்பிடும்போது, Contacts, History, Purchases, மற்றும் தெளிவற்ற ‘Other Data’ ஆகியவை குறிப்பிடத்தக்க வகையில் இல்லை. Location மற்றும் User Content போன்ற முக்கியமான தகவல்களை இன்னும் சேகரிக்கும் அதே வேளையில், Claude இன் சுயவிவரம் சற்று அதிக கவனம் செலுத்திய தரவு கையகப்படுத்தல் உத்தியைக் குறிக்கிறது. User Content இன் சேகரிப்பு ஒரு முக்கிய பகுதியாக உள்ளது, இது மாதிரி பயிற்சி மற்றும் மேம்பாட்டிற்கு முக்கியமானது, ஆனால் சாத்தியமான தனிப்பட்ட உரையாடல் தரவுகளின் களஞ்சியமாகவும் உள்ளது.

Microsoft இன் Copilot, Windows மற்றும் Microsoft 365 சுற்றுச்சூழல் அமைப்புகளில் ஆழமாக ஒருங்கிணைக்கப்பட்டுள்ளது, 12 தரவுப் புள்ளிகளை சேகரிக்கிறது. அதன் சேகரிப்பு சுயவிவரம் Claude ஐ நெருக்கமாகப் பிரதிபலிக்கிறது, ஆனால் கலவையில் ‘History’ ஐச் சேர்க்கிறது, இது Contact Info, Location, User Content, History, Identifiers, Diagnostics, மற்றும் Usage Data ஆகியவற்றை உள்ளடக்கியது. ‘History’ இன் சேர்க்கை, நேரடி சாட்பாட் தொடர்புகளுக்கு அப்பால் பயனர் செயல்பாட்டைப் புரிந்துகொள்வதில் Gemini ஐப் போன்ற ஒரு ஆர்வத்தைக் குறிக்கிறது, இது Microsoft சூழலில் பரந்த தனிப்பயனாக்கத்திற்கு இதைப் பயன்படுத்தக்கூடும். இருப்பினும், இது Contacts அல்லது Purchase தகவல்களை அணுகுவதைத் தவிர்க்கிறது, இது Google இன் அணுகுமுறையிலிருந்து வேறுபடுகிறது.

DeepSeek, சீனாவிலிருந்து உருவானது மற்றும் சமீபத்திய நுழைபவராகக் குறிப்பிடப்பட்டது (சுமார் ஜனவரி 2025, வெளியீட்டு காலக்கெடு நெகிழ்வானதாக இருக்கலாம்), 11 தரவுப் புள்ளிகளை சேகரிக்கிறது. அதன் அறிவிக்கப்பட்ட வகைகளில் Contact Info, User Content, Identifiers, Diagnostics, மற்றும் Usage Data ஆகியவை அடங்கும். Claude மற்றும் Copilot உடன் ஒப்பிடும்போது, DeepSeek இந்த குறிப்பிட்ட பகுப்பாய்வின் அடிப்படையில் Location அல்லது History தரவைச் சேகரிப்பதாகத் தெரியவில்லை. அதன் கவனம் இறுக்கமாகத் தெரிகிறது, முதன்மையாக பயனர் அடையாளம், தொடர்புகளின் உள்ளடக்கம் மற்றும் செயல்பாட்டு அளவீடுகள் ஆகியவற்றில் மையமாக உள்ளது. User Content இன் சேகரிப்பு மையமாக உள்ளது, இது உரையாடல் தரவைப் பயன்படுத்தும் பெரும்பாலான பிற முக்கிய சாட்பாட்களுடன் அதை சீரமைக்கிறது.

இந்த நடுத்தர சேகரிப்பாளர்கள் User Content, Identifiers, Diagnostics, மற்றும் Usage Data ஆகியவற்றில் ஒரு பொதுவான சார்புநிலையை எடுத்துக்காட்டுகின்றனர். இந்த முக்கிய தொகுப்பு தற்போதைய தலைமுறை AI சாட்பாட்களின் செயல்பாடு, மேம்பாடு மற்றும் சாத்தியமான தனிப்பயனாக்கத்திற்கு அடிப்படையாகத் தோன்றுகிறது. இருப்பினும், Location, History மற்றும் பிற வகைகளைப் பற்றிய மாறுபாடுகள் வேறுபட்ட முன்னுரிமைகள் மற்றும் செயல்பாடு, தனிப்பயனாக்கம் மற்றும் பயனர் தனியுரிமை ஆகியவற்றுக்கு இடையேயான வேறுபட்ட சமநிலைச் செயல்களை வெளிப்படுத்துகின்றன. Claude, Copilot, அல்லது DeepSeek உடன் தொடர்பு கொள்ளும் பயனர்கள் இன்னும் குறிப்பிடத்தக்க அளவு தகவல்களைப் பகிர்ந்து கொள்கிறார்கள், அவர்களின் தொடர்புகளின் பொருள் உட்பட, ஆனால் ஒட்டுமொத்த நோக்கம் Gemini ஐ விட குறைவான முழுமையானதாகத் தோன்றுகிறது, குறிப்பாக தொடர்பு பட்டியல்கள் மற்றும் நிதி நடவடிக்கைகளுக்கான அணுகலைப் பொறுத்தவரை.

மிகவும் ஒதுக்கப்பட்ட சேகரிப்பாளர்கள்: ChatGPT, Perplexity, மற்றும் Grok

சில AI சாட்பாட்கள் பயனர் தரவிற்காக ஒரு பரந்த வலையை வீசும்போது, மற்றவை மிகவும் அளவிடப்பட்ட அணுகுமுறையைக் காட்டுகின்றன. இந்த குழுவில் மிகவும் பிரபலமான ChatGPT, தேடல்-மையப்படுத்தப்பட்ட Perplexity மற்றும் புதிய நுழைபவர் Grok ஆகியோர் அடங்குவர். அவர்களின் தரவு சேகரிப்பு நடைமுறைகள், இல்லாதவை அல்ல என்றாலும், அளவின் உச்சியில் இருப்பவர்களை விட குறைவான விரிவானதாகத் தோன்றுகின்றன.

ChatGPT, தற்போதைய AI சாட்பாட் ஏற்றத்திற்கு வினையூக்கியாக இருக்கலாம், இது 10 தரவுப் புள்ளிகளை சேகரிப்பதாகக் கூறப்படுகிறது. அதன் பாரிய பயனர் தளம் இருந்தபோதிலும், இந்த வெளிப்பாடுகளில் பிரதிபலிக்கும் அதன் தரவுப் பசி, Gemini, Claude, அல்லது Copilot உடன் ஒப்பிடும்போது மிதமானது. ChatGPT ஆல் தட்டப்பட்ட வகைகளில் Contact Info, User Content, Identifiers, Diagnostics, மற்றும் Usage Data ஆகியவை அடங்கும். இந்த பட்டியல் Location, History, Contacts, மற்றும் Purchases ஆகியவற்றை குறிப்பிடத்தக்க வகையில் விலக்குகிறது. சேகரிப்பு குறிப்பிடத்தக்கதாக உள்ளது, குறிப்பாக User Content இன் சேர்க்கை, இது பயனர் தொடர்புகளின் அடிப்படையை உருவாக்குகிறது மற்றும் OpenAI இன் மாதிரி செம்மைப்படுத்தலுக்கு இன்றியமையாதது. இருப்பினும், இருப்பிட கண்காணிப்பு, உலாவல் வரலாறு சுரங்கப்பாதை, தொடர்பு பட்டியல் அணுகல் அல்லது நிதித் தரவு இல்லாதது, முதன்மையாக நேரடி பயனர்-சாட்பாட் தொடர்பு மற்றும் செயல்பாட்டு ஒருமைப்பாடு ஆகியவற்றில் அக்கறை கொண்ட ஒரு சாத்தியமான அதிக கவனம் செலுத்திய நோக்கத்தைக் குறிக்கிறது. மில்லியன் கணக்கானவர்களுக்கு, ChatGPT உற்பத்தி AI உடனான முதன்மை இடைமுகத்தைக் குறிக்கிறது, மேலும் அதன் தரவு நடைமுறைகள், குறைந்தபட்சம் இல்லை என்றாலும், வேறு இடங்களில் காணப்படும் மிகவும் ஊடுருவும் சில வகைகளைத் தவிர்க்கின்றன.

Perplexity, பெரும்பாலும் பாரம்பரிய தேடலுக்கு சவால் விடும் AI-இயங்கும் பதில் இயந்திரமாக நிலைநிறுத்தப்படுகிறது, இது 10 தரவுப் புள்ளிகளை சேகரிக்கிறது, இது ChatGPT ஐ அளவில் பொருத்துகிறது ஆனால் வகையில் கணிசமாக வேறுபடுகிறது. Perplexity இன் சேகரிப்பில் Location, Identifiers, Diagnostics, Usage Data, மற்றும், சுவாரஸ்யமாக, Purchases ஆகியவை அடங்கும். ChatGPT மற்றும் இந்த ஒப்பீட்டில் உள்ள பெரும்பாலான மற்றவர்களைப் போலல்லாமல் (Gemini தவிர), Perplexity கொள்முதல் தகவலில் ஆர்வத்தைக் காட்டுகிறது. இருப்பினும், இது User Content அல்லது Contact Info ஐ மற்றவர்கள் செய்யும் அதே வழியில் சேகரிக்கவில்லை என்று அறிவிப்பதன் மூலம் தன்னை வேறுபடுத்திக் கொள்கிறது. இந்த தனித்துவமான சுயவிவரம் வேறுபட்ட மூலோபாய கவனத்தைக் குறிக்கிறது – ஒருவேளை தொடர்புடைய பதில்களுக்கு இருப்பிடத்தைப் பயன்படுத்துதல் மற்றும் பயனர் பொருளாதார நடத்தை அல்லது விருப்பங்களைப் புரிந்துகொள்வதற்கான கொள்முதல் தரவு, அதே நேரத்தில் அதன் முக்கிய மாதிரிக்கு உரையாடல் உள்ளடக்கத்தில் குறைவான நேரடி முக்கியத்துவத்தை வைப்பது, அல்லது அதை ஆப் ஸ்டோர் வெளிப்பாடுகளில் ‘User Content’ வகையின் கீழ் அறிவிக்கப்படாத வழியில் கையாளுதல்.

இறுதியாக, Grok, Elon Musk இன் xAI ஆல் உருவாக்கப்பட்டது மற்றும் நவம்பர் 2023 இல் வெளியிடப்பட்டது, இந்த குறிப்பிட்ட பகுப்பாய்வில் மிகவும் தரவு-பழமைவாத சாட்பாட்டாக வெளிப்படுகிறது, இது 7 தனிப்பட்ட தரவுப் புள்ளிகளை மட்டுமே சேகரிக்கிறது. சேகரிக்கப்பட்ட தகவல்கள் Contact Info, Identifiers, மற்றும் Diagnostics க்குள் கட்டுப்படுத்தப்பட்டுள்ளன. Location, User Content, History, Purchases, Contacts, மற்றும் Usage Data ஆகியவை வெளிப்படையாக இல்லை. இந்த குறைந்தபட்ச அணுகுமுறை Grok ஐ வேறுபடுத்துகிறது. இது அடிப்படை கணக்கு மேலாண்மை (Contact Info), பயனர்/சாதன அடையாளம் (Identifiers), மற்றும் கணினி ஆரோக்கியம் (Diagnostics) ஆகியவற்றில் முதன்மை கவனம் செலுத்துவதைக் குறிக்கிறது. User Content க்கான அறிவிக்கப்பட்ட சேகரிப்பு இல்லாதது குறிப்பாக குறிப்பிடத்தக்கது, மாதிரி எவ்வாறு பயிற்றுவிக்கப்படுகிறது மற்றும் மேம்படுத்தப்படுகிறது அல்லது இந்தத் தரவு வித்தியாசமாகக் கையாளப்படுகிறதா என்பது பற்றிய கேள்விகளை எழுப்புகிறது. எல்லாவற்றிற்கும் மேலாக குறைந்தபட்ச தரவுப் பகிர்வுக்கு முன்னுரிமை அளிக்கும் பயனர்களுக்கு, Grok இன் அறிவிக்கப்பட்ட நடைமுறைகள், மேற்பரப்பில், ஆய்வு செய்யப்பட்ட முக்கிய வீரர்களிடையே குறைந்தபட்சம் ஊடுருவக்கூடியதாகத் தோன்றுகின்றன. இது அதன் புதிய நிலை, தரவு மீதான வேறுபட்ட தத்துவ நிலைப்பாடு அல்லது அதன் வளர்ச்சி மற்றும் பணமாக்குதல் உத்தியில் வேறுபட்ட கட்டத்தை பிரதிபலிக்கக்கூடும்.

தரவுப் புள்ளிகளை டிகோட் செய்தல்: அவர்கள் உண்மையில் என்ன எடுக்கிறார்கள்?

AI சாட்பாட்களால் சேகரிக்கப்பட்ட தரவு வகைகளின் பட்டியல்கள் ஒரு தொடக்க புள்ளியை வழங்குகின்றன, ஆனால் உண்மையான உலக தாக்கங்களைப் புரிந்துகொள்வதற்கு இந்த லேபிள்கள் உண்மையில் எதைக் குறிக்கின்றன என்பதை ஆராய வேண்டும். ஒரு சாட்பாட் ‘Identifiers’ அல்லது ‘User Content’ ஐ சேகரிக்கிறது என்பதை வெறுமனே அறிவது சாத்தியமான தனியுரிமை தாக்கத்தை முழுமையாக வெளிப்படுத்தாது.

  • Identifiers: இது பெரும்பாலும் ஒரு பயனர்பெயரை விட அதிகம். இது தனிப்பட்ட சாதன அடையாளங்காட்டிகள் (உங்கள் தொலைபேசியின் விளம்பர ஐடி போன்றவை), சேவைக்கு குறிப்பிட்ட பயனர் கணக்கு ஐடிகள், IP முகவரிகள் மற்றும் அமர்வுகள், சாதனங்கள் அல்லது அவற்றின் சுற்றுச்சூழல் அமைப்பிற்குள் உள்ள வெவ்வேறு சேவைகளில் உங்களை அடையாளம் காண நிறுவனத்தை அனுமதிக்கும் பிற குறிப்பான்களை உள்ளடக்கியிருக்கலாம். இவை பயனர் நடத்தையைக் கண்காணிப்பதற்கும், அனுபவங்களைத் தனிப்பயனாக்குவதற்கும், சில சமயங்களில், விளம்பர நோக்கங்களுக்காக செயல்பாட்டை இணைப்பதற்கும் அடிப்படை கருவிகள். அதிக அடையாளங்காட்டிகள் சேகரிக்கப்படும்போது, ஒரு விரிவான சுயவிவரத்தை உருவாக்குவது எளிதாகிறது.

  • Usage Data & Diagnostics: சேவையை சீராக இயங்க வைப்பதற்கு அவசியமானதாக அடிக்கடி முன்வைக்கப்படும் இந்த வகைகள் மிகவும் வெளிப்படையானவையாக இருக்கலாம். Diagnostics செயலிழப்பு அறிக்கைகள், செயல்திறன் பதிவுகள் மற்றும் சாதன விவரக்குறிப்புகளை உள்ளடக்கியிருக்கலாம். Usage Data, இருப்பினும், நீங்கள் சேவையை எவ்வாறு பயன்படுத்துகிறீர்கள் என்பதை ஆராய்கிறது: கிளிக் செய்யப்பட்ட அம்சங்கள், சில பணிகளில் செலவழித்த நேரம், பயன்பாட்டின் அதிர்வெண், தொடர்பு முறைகள், அழுத்தப்பட்ட பொத்தான்கள் மற்றும் அமர்வு நீளங்கள். வெளித்தோற்றத்தில் பாதிப்பில்லாததாகத் தோன்றினாலும், ஒருங்கிணைந்த பயன்பாட்டுத் தரவு நடத்தை முறைகள், விருப்பத்தேர்வுகள் மற்றும் ஈடுபாட்டு நிலைகளை வெளிப்படுத்த முடியும், இது தயாரிப்பு வளர்ச்சிக்கு மதிப்புமிக்கது ஆனால் பயனர் விவரக்குறிப்பிற்கும் சாத்தியமானது.

  • User Content: இது ஒரு சாட்பாட்டிற்கான மிகவும் உணர்திறன் வாய்ந்த வகையாக இருக்கலாம். இது உங்கள் தூண்டுதல்களின் உரை, AI இன் பதில்கள், உங்கள் உரையாடல்களின் முழு ஓட்டம் மற்றும் நீங்கள் பதிவேற்றக்கூடிய கோப்புகள் (ஆவணங்கள், படங்கள்) ஆகியவற்றை உள்ளடக்கியது. இந்தத் தரவு AI மாதிரிகளைப் பயிற்றுவிப்பதற்கும் மேம்படுத்துவதற்கும் உயிர்நாடியாகும் – அவர்களிடம் எவ்வளவு உரையாடல் தரவு இருக்கிறதோ, அவ்வளவு சிறப்பாக அவை மாறும். இருப்பினும், இது உங்கள் எண்ணங்கள், கேள்விகள், கவலைகள், ஆக்கப்பூர்வமான முயற்சிகள் மற்றும் சாட்பாட்டுடன் பகிரப்பட்ட சாத்தியமான ரகசியத் தகவல்களின் நேரடிப் பதிவாகும். இந்த உள்ளடக்கத்தின் சேகரிப்பு, சேமிப்பு மற்றும் சாத்தியமான மீறல் அல்லது தவறான பயன்பாட்டுடன் தொடர்புடைய அபாயங்கள் கணிசமானவை. மேலும், பயனர் உள்ளடக்கத்திலிருந்து பெறப்பட்ட நுண்ணறிவுகள், மூல உரை நேரடியாக விளம்பரதாரர்களுடன் பகிரப்படாவிட்டாலும் கூட, இலக்கு விளம்பரத்திற்கு விலைமதிப்பற்றதாக இருக்கும்.

  • Location: சேகரிப்பு தோராயமானது (நகரம் அல்லது பகுதி, IP முகவரியிலிருந்து பெறப்பட்டது) முதல் துல்லியமானது (உங்கள் மொபைல் சாதனத்திலிருந்து GPS தரவு) வரை இருக்கலாம். சூழல்-குறிப்பிட்ட பதில்களுக்கு (எ.கா., ‘எனக்கு அருகிலுள்ள உணவகங்கள்’) சாட்பாட்கள் இருப்பிடத்தைக் கோரலாம். இருப்பினும், தொடர்ச்சியான இருப்பிட கண்காணிப்பு உங்கள் இயக்கங்கள், பழக்கவழக்கங்கள் மற்றும் நீங்கள் அடிக்கடி செல்லும் இடங்களின் விரிவான சித்திரத்தை வழங்குகிறது, இது இலக்கு சந்தைப்படுத்தல் மற்றும் நடத்தை பகுப்பாய்விற்கு மிகவும் மதிப்புமிக்கது.

  • Contact Info & Contacts: Contact Info (பெயர், மின்னஞ்சல், தொலைபேசி எண்) கணக்கு உருவாக்கம் மற்றும் தகவல்தொடர்புக்கு தரமானது. ஆனால் Gemini போன்ற ஒரு சேவை உங்கள் சாதனத்தின் Contacts பட்டியலுக்கான அணுகலைக் கோரும்போது, அது உங்கள் தனிப்பட்ட மற்றும் தொழில்முறை நெட்வொர்க்கில் தெரிவுநிலையைப் பெறுகிறது. ஒரு சாட்பாட்டில் இந்த அளவிலான அணுகல் தேவைப்படுவதற்கான நியாயம் பெரும்பாலும் தெளிவாக இல்லை மற்றும் இது ஒரு குறிப்பிடத்தக்க தனியுரிமை ஊடுருவலைக் குறிக்கிறது, இது சேவையின் பயனர்கள் கூட இல்லாத நபர்களைப் பற்றிய தகவல்களை வெளிப்படுத்தக்கூடும்.

  • Purchases: நீங்கள் வாங்குவதைப் பற்றிய தகவல்களை அணுகுவது உங்கள் நிதி நடத்தை, வாழ்க்கை முறை மற்றும் நுகர்வோர் விருப்பத்தேர்வுகளுக்கான நேரடி சாளரமாகும். Gemini மற்றும் Perplexity போன்ற தளங்களுக்கு, இந்தத் தரவு ஆர்வங்களை ஊகிக்க, எதிர்கால வாங்கும் நடத்தையை கணிக்க அல்லது குறிப்பிடத்தக்க துல்லியத்துடன் விளம்பரங்களை குறிவைக்க பயன்படுத்தப்படலாம். இது உங்கள் ஆன்லைன் தொடர்புகளுக்கும் உங்கள் உண்மையான பொருளாதார நடவடிக்கைகளுக்கும் இடையிலான இடைவெளியைக் குறைக்கிறது.

இந்த நுணுக்கங்களைப் புரிந்துகொள்வது முக்கியம். ஒவ்வொரு தரவுப் புள்ளியும் உங்கள் டிஜிட்டல் அடையாளம் அல்லது நடத்தையின் ஒரு பகுதியைக் கைப்பற்றப்பட்டு, சேமிக்கப்பட்டு, பகுப்பாய்வு செய்யப்பட்டு அல்லது பணமாக்கப்படுவதைக் குறிக்கிறது. பல வகைகளைச் சேகரிப்பதன் ஒட்டுமொத்த விளைவு, குறிப்பாக User Content, Contacts, Location, மற்றும் Purchases போன்ற உணர்திறன் வாய்ந்தவை, இந்த AI கருவிகளை வழங்கும் நிறுவனங்களால் நம்பமுடியாத அளவிற்கு விரிவான பயனர் சுயவிவரங்களை விளைவிக்கலாம்.

காணப்படாத பரிமாற்றம்: வசதி vs. ரகசியம்

AI சாட்பாட்களின் விரைவான தத்தெடுப்பு டிஜிட்டல் யுகத்தில் நிகழும் ஒரு அடிப்படை பரிவர்த்தனையை அடிக்கோடிட்டுக் காட்டுகிறது: அதிநவீன சேவைகளுக்காக தனிப்பட்ட தரவின் பரிமாற்றம். மிகவும் சக்திவாய்ந்த AI கருவிகள் பல இலவசமாக அல்லது குறைந்த செலவில் வழங்கப்படுகின்றன, ஆனால் இந்த அணுகல் பெரும்பாலும் உண்மையான விலையை மறைக்கிறது – நமது தகவல். வசதிக்கும் ரகசியத்திற்கும் இடையிலான இந்த பரிமாற்றம் AI தரவு சேகரிப்பைச் சுற்றியுள்ள விவாதத்தின் மையத்தில் உள்ளது.

உரையை உருவாக்குதல், சிக்கலான கேள்விகளுக்கு பதிலளித்தல், குறியீடு எழுதுதல், மின்னஞ்சல்களை வரைவு செய்தல் மற்றும் தோழமையை வழங்குதல் ஆகியவற்றில் அவற்றின் குறிப்பிடத்தக்க திறனுக்காக பயனர்கள் இந்த தளங்களுக்கு வருகிறார்கள். உணரப்பட்ட மதிப்பு மகத்தானது, நேரத்தை மிச்சப்படுத்துகிறது மற்றும் புதிய ஆக்கப்பூர்வமான திறனைத் திறக்கிறது. இத்தகைய பயன்பாட்டிற்கு முகங்கொடுத்து, நீண்ட தனியுரிமைக் கொள்கைகளில் புதைக்கப்பட்ட விவரங்கள் பெரும்பாலும் பின்னணியில் மங்கிவிடும். ‘click-to-accept’ சோர்வு என்ற ஒரு தெளிவான உணர்வு உள்ளது, அங்கு பயனர்கள் தாங்கள் விட்டுக்கொடுக்கும் தரவின் அளவை முழுமையாக உள்வாங்காமல் விதிமுறைகளை ஒப்புக்கொள்கிறார்கள். இது தகவலறிந்த சம்மதமா, அல்லது நவீன தொழில்நுட்ப சுற்றுச்சூழல் அமைப்பில் தரவுப் பகிர்வின் தவிர்க்க முடியாத தன்மைக்கு வெறுமனே ராஜினாமா செய்வதா?

இந்த விரிவான தரவு சேகரிப்புடன் தொடர்புடைய அபாயங்கள் பன்முகத்தன்மை கொண்டவை. தரவு மீறல்கள் ஒரு தொடர்ச்சியான அச்சுறுத்தலாகவே இருக்கின்றன; ஒரு நிறுவனம் எவ்வளவு தரவை வைத்திருக்கிறதோ, அவ்வளவு கவர்ச்சிகரமான இலக்காக அது தீங்கிழைக்கும் நடிகர்களுக்கு மாறும். உணர்திறன் வாய்ந்த User Content அல்லது இணைக்கப்பட்ட Identifiers சம்பந்தப்பட்ட மீறல் பேரழிவு தரும் விளைவுகளை ஏற்படுத்தும். மீறல்களுக்கு அப்பால், தரவு தவறாகப் பயன்படுத்தப்படும் ஆபத்து உள்ளது. சேவை மேம்பாட்டிற்காக சேகரிக்கப்பட்ட தகவல்கள் ஊடுருவும் விளம்பரம், பயனர் கையாளுதல் அல்லது சில சூழல்களில் சமூக மதிப்பெண் பெறுவதற்கு கூட சாத்தியமான முறையில் மறுபயன்படுத்தப்படலாம். தொடர்புத் தரவை இருப்பிடம், கொள்முதல் வரலாறு மற்றும் தொடர்பு நெட்வொர்க்குகளுடன் இணைத்து, மிக விரிவான தனிப்பட்ட சுயவிவரங்களை உருவாக்குவது, கண்காணிப்பு மற்றும் சுயாட்சி பற்றிய ஆழ்ந்த நெறிமுறைக் கேள்விகளை எழுப்புகிறது.

மேலும், இன்று சேகரிக்கப்பட்ட தரவு நாளை இன்னும் சக்திவாய்ந்த AI அமைப்புகளின் வளர்ச்சிக்கு எரிபொருளாகிறது. இந்த கருவிகளுடன் தொடர்புகொள்வதன் மூலம், பயனர்கள் பயிற்சி செயல்முறையில் தீவிரமாக பங்கேற்கிறார்கள், எதிர்கால AI திறன்களை வடிவமைக்கும் மூலப்பொருளை வழங்குகிறார்கள். இந்த கூட்டு அம்சம் பெரும்பாலும் கவனிக்கப்படுவதில்லை, ஆனால் பயனர் தரவு ஒரு துணை தயாரிப்பு மட்டுமல்ல, முழு AI தொழில்துறைக்கும் ஒரு அடிப்படை வளம் என்பதை இது எடுத்துக்காட்டுகிறது.

இறுதியில், பயனர்களுக்கும் AI சாட்பாட்களுக்கும் இடையிலான உறவு ஒரு தொடர்ச்சியான பேச்சுவார்த்தையை உள்ளடக்கியது. பயனர்கள் சக்திவாய்ந்த தொழில்நுட்பத்திற்கான அணுகலைப் பெறுகிறார்கள், அதே நேரத்தில் நிறுவனங்கள் மதிப்புமிக்க தரவிற்கான அணுகலைப் பெறுகின்றன. தற்போதைய நிலப்பரப்பு, இருப்பினும், இந்தப் பேச்சுவார்த்தை பெரும்பாலும் மறைமுகமானது மற்றும் சமநிலையற்றது என்பதைக் குறிக்கிறது. Grok இன் ஒப்பீட்டு குறைந்தபட்சம் முதல் Gemini இன் விரிவான சேகரிப்பு வரை தரவு சேகரிப்பு நடைமுறைகளில் குறிப்பிடத்தக்க மாறுபாடு, வெவ்வேறு மாதிரிகள் சாத்தியம் என்பதைக் குறிக்கிறது. இது தொழில்நுட்ப நிறுவனங்களிடமிருந்து அதிக வெளிப்படைத்தன்மை மற்றும் பயனர்களிடையே அதிக விழிப்புணர்வு தேவை என்பதை அடிக்கோடிட்டுக் காட்டுகிறது. ஒரு AI சாட்பாட்டைத் தேர்ந்தெடுப்பது அதன் செயல்திறனை மதிப்பிடுவது மட்டுமல்ல; இது தரவு தனியுரிமை தாக்கங்களின் நனவான மதிப்பீடு மற்றும் வழங்கப்படும் வசதி சரணடைந்த தகவலுக்கு மதிப்புள்ளதா என்ற தனிப்பட்ட கணக்கீடு தேவைப்படுகிறது. AI அதன் இடைவிடாத அணிவகுப்பைத் தொடரும்போது, இந்த பரிமாற்றத்தை புத்திசாலித்தனமாக வழிநடத்துவது, பெருகிய முறையில் தரவு சார்ந்த உலகில் தனிப்பட்ட தனியுரிமை மற்றும் கட்டுப்பாட்டைப் பராமரிப்பதற்கு மிக முக்கியமானது. இந்த தளங்களை ஒப்பிடுவதன் மூலம் பெறப்பட்ட நுண்ணறிவுகள், ‘இலவச’ டிஜிட்டல் சேவைகளின் துறையில், பயனரின் தரவு பெரும்பாலும் அறுவடை செய்யப்படும் உண்மையான தயாரிப்பு என்பதை ஒரு முக்கியமான நினைவூட்டலாகச் செயல்படுகின்றன. புதுமை மற்றும் தனியுரிமை இணைந்து வாழக்கூடிய எதிர்காலத்தை வடிவமைப்பதில் விழிப்புணர்வும் தகவலறிந்த தேர்வுகளும் நமது மிகவும் பயனுள்ள கருவிகளாக இருக்கின்றன.