ডিপসিক নিয়ে চিন্তিত? জেমিনি সবচেয়ে বড় ডেটা অপরাধী

ডিপসিক বিতর্ক এবং আমেরিকান প্রযুক্তি শিল্পের প্রতিক্রিয়া

জানুয়ারিতে, একটি চীনা কোম্পানি ডিপসিক, তার ফ্ল্যাগশিপ ওপেন সোর্স AI মডেল উন্মোচন করে। এই আত্মপ্রকাশ আমেরিকান প্রযুক্তি শিল্পের মধ্যে আশঙ্কার ঢেউ পাঠিয়েছিল। প্রায় অবিলম্বে, গোপনীয়তা এবং নিরাপত্তা উদ্বেগের একটি সমস্বর উঠেছিল। ব্যক্তিগত এবং সরকারী সংস্থাগুলি, সম্ভাব্য ঝুঁকির বিষয়ে উদ্বেগ দ্বারা চালিত হয়ে, ডিপসিকের ব্যবহার অভ্যন্তরীণ এবং আন্তর্জাতিকভাবে নিষিদ্ধ করার জন্য দ্রুত পদক্ষেপ নিয়েছিল।

আশঙ্কার মূলে ছিল এই বিশ্বাস যে ডিপসিক, চীনে এর উৎপত্তির সাথে, আমেরিকান জনগণের জন্য একটি বর্ধিত ঝুঁকি তৈরি করেছে। নজরদারি, সাইবার যুদ্ধ এবং অন্যান্য জাতীয় নিরাপত্তা হুমকির ভয় প্রায়শই উল্লেখ করা হয়েছিল। এই উদ্বেগগুলিকে আরও বাড়িয়ে তুলেছিল ডিপসিকের গোপনীয়তা নীতির একটি নির্দিষ্ট ধারা, যেখানে বলা হয়েছে: ‘আপনার কাছ থেকে আমরা যে ব্যক্তিগত তথ্য সংগ্রহ করি তা আপনার বসবাসের দেশের বাইরের কোনো সার্ভারে সংরক্ষণ করা হতে পারে। আমরা যে তথ্য সংগ্রহ করি তা গণপ্রজাতন্ত্রী চীনের সুরক্ষিত সার্ভারগুলিতে সংরক্ষণ করি।’

এই আপাতদৃষ্টিতে নিরীহ বিবৃতিটিকে কেউ কেউ চীনা সরকারের সংবেদনশীল ব্যবহারকারীর ডেটা অ্যাক্সেস করার সম্ভাব্য প্রবেশদ্বার হিসাবে ব্যাখ্যা করেছেন। গ্লোবাল AI উন্নয়নের দ্রুত অগ্রগতি এবং মার্কিন যুক্তরাষ্ট্র ও চীনের মধ্যে অনুভূত ‘AI অস্ত্র প্রতিযোগিতা’ কেবল এই উদ্বেগগুলিকে আরও বাড়িয়ে তুলেছে, গভীর অবিশ্বাসের পরিবেশ তৈরি করেছে এবং নৈতিক প্রশ্ন উত্থাপন করেছে।

একটি বিস্ময়কর তথ্য: জেমিনির ডেটা ক্ষুধা

যাইহোক, ডিপসিককে ঘিরে বিতর্কের মধ্যে, একটি বিস্ময়কর তথ্য প্রকাশিত হয়েছে। চীনা AI মডেলের উপর তীব্র নজরদারি সত্ত্বেও, দেখা যাচ্ছে যে ডিপসিক চ্যাটবট ক্ষেত্রে সবচেয়ে গুরুত্বপূর্ণ ডেটা সংগ্রহকারী নয়। একটি সাম্প্রতিক তদন্তে, Surfshark নামক একটি ভিপিএন প্রোভাইডার, কয়েকটি জনপ্রিয় AI চ্যাটবট অ্যাপ্লিকেশনের ডেটা সংগ্রহের পদ্ধতিগুলির উপর আলোকপাত করেছে।

গবেষকরা দশটি বিশিষ্ট চ্যাটবটের গোপনীয়তার বিবরণ পুঙ্খানুপুঙ্খভাবে বিশ্লেষণ করেছেন, যেগুলি অ্যাপল অ্যাপ স্টোরে সহজেই পাওয়া যায়: ChatGPT, Gemini, Copilot, Perplexity, DeepSeek, Grok, Jasper, Poe, Claude, এবং Pi। তাদের বিশ্লেষণ তিনটি মূল দিকের উপর দৃষ্টি নিবদ্ধ করে:

  1. সংগৃহীত ডেটার প্রকার: প্রতিটি অ্যাপ্লিকেশন ব্যবহারকারীর তথ্যের কোন নির্দিষ্ট বিভাগগুলি সংগ্রহ করে?
  2. ডেটা লিঙ্কেজ: সংগৃহীত ডেটার কোনোটি কি সরাসরি ব্যবহারকারীর পরিচয়ের সাথে যুক্ত?
  3. তৃতীয় পক্ষের বিজ্ঞাপনদাতা: অ্যাপ্লিকেশনটি কি ব্যবহারকারীর ডেটা বাইরের বিজ্ঞাপন সংস্থাগুলির সাথে শেয়ার করে?

ফলাফলগুলি চমকপ্রদ ছিল। Google-এর Gemini সবচেয়ে বেশি ডেটা-ইনটেনসিভ AI চ্যাটবট অ্যাপ হিসাবে আবির্ভূত হয়েছে, যা এটি সংগ্রহ করে এমন ব্যক্তিগত তথ্যের পরিমাণ এবং বৈচিত্র্যের দিক থেকে তার প্রতিযোগীদেরকে ছাড়িয়ে গেছে। অ্যাপ্লিকেশনটি ৩৫টি সম্ভাব্য ব্যবহারকারী ডেটা প্রকারের মধ্যে ২২টি সংগ্রহ করে। এর মধ্যে অত্যন্ত সংবেদনশীল ডেটা রয়েছে যেমন:

  • সুনির্দিষ্ট অবস্থানের ডেটা: ব্যবহারকারীর সঠিক ভৌগলিক অবস্থান চিহ্নিত করা।
  • ব্যবহারকারীর কন্টেন্ট: অ্যাপের মধ্যে ব্যবহারকারীর ইন্টারঅ্যাকশনের কন্টেন্ট ক্যাপচার করা।
  • কন্ট্যাক্ট তালিকা: ব্যবহারকারীর ডিভাইসের কন্ট্যাক্ট অ্যাক্সেস করা।
  • ব্রাউজিং হিস্টরি: ব্যবহারকারীর ওয়েব ব্রাউজিং কার্যকলাপ ট্র্যাকিং।

এই বিস্তৃত ডেটা সংগ্রহ অধ্যয়নে পরীক্ষা করা অন্যান্য জনপ্রিয় চ্যাটবটগুলির তুলনায় অনেক বেশি। ডিপসিক, যা অনেক বিতর্কের বিষয়, দশটি অ্যাপ্লিকেশনের মধ্যে পঞ্চম স্থানে রয়েছে, তুলনামূলকভাবে মাঝারি ১১টি অনন্য ডেটাটাইপ সংগ্রহ করে।

অবস্থানের ডেটা এবং তৃতীয় পক্ষের সাথে শেয়ার করা: একটি গভীর পর্যবেক্ষণ

গবেষণায় অবস্থানের ডেটা এবং তৃতীয় পক্ষের সাথে ডেটা শেয়ার করার বিষয়ে উদ্বেগজনক প্রবণতাও উন্মোচিত হয়েছে। শুধুমাত্র Gemini, Copilot, এবং Perplexity সুনির্দিষ্ট অবস্থানের ডেটা সংগ্রহ করতে দেখা গেছে, যা একটি অত্যন্ত সংবেদনশীল তথ্য যা ব্যবহারকারীর গতিবিধি এবং অভ্যাস সম্পর্কে অনেক কিছু প্রকাশ করতে পারে।

আরও বিস্তৃতভাবে, প্রায় ৩০% বিশ্লেষিত চ্যাটবট সংবেদনশীল ব্যবহারকারীর ডেটা শেয়ার করতে দেখা গেছে, যার মধ্যে অবস্থানের ডেটা এবং ব্রাউজিং হিস্টরি রয়েছে, ডেটা ব্রোকারদের মতো বাইরের সংস্থাগুলির সাথে। এই অনুশীলনটি উল্লেখযোগ্য গোপনীয়তা উদ্বেগ বাড়ায়, কারণ এটি ব্যবহারকারীর তথ্যকে একটি বিস্তৃত নেটওয়ার্কের কাছে প্রকাশ করে, সম্ভাব্যভাবে ব্যবহারকারীর জ্ঞান বা নিয়ন্ত্রণের বাইরের উদ্দেশ্যে।

ব্যবহারকারীর ডেটা ট্র্যাকিং: টার্গেটেড বিজ্ঞাপন এবং তার বাইরে

আরেকটি উদ্বেগজনক বিষয় হল টার্গেটেড বিজ্ঞাপন এবং অন্যান্য উদ্দেশ্যে ব্যবহারকারীর ডেটা ট্র্যাকিং করার অনুশীলন। ৩০ শতাংশ চ্যাটবট, বিশেষ করে Copilot, Poe এবং Jasper, তাদের ব্যবহারকারীদের ট্র্যাক করার জন্য ডেটা সংগ্রহ করতে দেখা গেছে। এর মানে হল যে অ্যাপ থেকে সংগৃহীত ব্যবহারকারীর ডেটা তৃতীয় পক্ষের ডেটার সাথে লিঙ্ক করা হয়েছে, যা টার্গেটেড বিজ্ঞাপন বা বিজ্ঞাপনের কার্যকারিতা পরিমাপ করতে সক্ষম করে।

Copilot এবং Poe এই উদ্দেশ্যে ডিভাইসের ID সংগ্রহ করতে দেখা গেছে, যেখানে Jasper আরও এগিয়ে গেছে, Surfshark-এর বিশেষজ্ঞদের মতে, কেবল ডিভাইসের ID নয়, পণ্যের ইন্টারঅ্যাকশন ডেটা, বিজ্ঞাপনের ডেটা এবং ‘অ্যাপে ব্যবহারকারীর কার্যকলাপ সম্পর্কে অন্য কোনো ডেটা’ সংগ্রহ করে।

ডিপসিক: সেরা নয়, খারাপও নয়

বিতর্কিত DeepSeek R1 মডেল, যদিও তীব্র যাচাই-বাছাইয়ের শিকার, ডেটা সংগ্রহের ক্ষেত্রে একটি মধ্যম স্থল দখল করে। এটি গড়ে ১১টি অনন্য ডেটা প্রকার সংগ্রহ করে, প্রাথমিকভাবে এর উপর দৃষ্টি নিবদ্ধ করে:

  • যোগাযোগের তথ্য: নাম, ইমেল ঠিকানা, ফোন নম্বর ইত্যাদি।
  • ব্যবহারকারীর কন্টেন্ট: অ্যাপের মধ্যে ব্যবহারকারীদের দ্বারা তৈরি কন্টেন্ট।
  • ডায়াগনস্টিকস: অ্যাপের পারফরম্যান্স এবং সমস্যা সমাধানের সাথে সম্পর্কিত ডেটা।

সবচেয়ে বেশি গোপনীয়তা-সম্মানজনক চ্যাটবট না হলেও, ডিপসিকের ডেটা সংগ্রহের অনুশীলনগুলি এর কিছু মার্কিন-ভিত্তিক প্রতিপক্ষের তুলনায় কম বিস্তৃত, বিশেষ করে জেমিনির তুলনায়।

চ্যাটজিপিটি (ChatGPT): একটি তুলনামূলক দৃষ্টিকোণ

তুলনার জন্য, ChatGPT, সর্বাধিক ব্যবহৃত AI চ্যাটবটগুলির মধ্যে একটি, ১০টি অনন্য ধরণের ডেটা সংগ্রহ করে। এর মধ্যে রয়েছে:

  • যোগাযোগের তথ্য
  • ব্যবহারকারীর কন্টেন্ট
  • শনাক্তকারী
  • ব্যবহারের ডেটা
  • ডায়াগনস্টিকস

এটি লক্ষ করা গুরুত্বপূর্ণ যে ChatGPT চ্যাট হিস্টরিও সংগ্রহ করে। তবে, ব্যবহারকারীদের কাছে ‘Temporary chat’ ব্যবহারের বিকল্প রয়েছে, যা কথোপকথনের হিস্টরি সংরক্ষণ না করে এটি প্রশমিত করার জন্য ডিজাইন করা হয়েছে।

ডিপসিকের গোপনীয়তা নীতি: ব্যবহারকারীর নিয়ন্ত্রণ এবং ডেটা মুছে ফেলা

ডিপসিকের গোপনীয়তা নীতি, কারো কারো জন্য উদ্বেগের কারণ হলেও, চ্যাট হিস্টরির উপর ব্যবহারকারীর নিয়ন্ত্রণের বিধান অন্তর্ভুক্ত করে। নীতিতে বলা হয়েছে যে ব্যবহারকারীরা তাদের চ্যাট হিস্টরি পরিচালনা করতে পারে এবং তাদের সেটিংসের মাধ্যমে এটি মুছে ফেলার বিকল্প রয়েছে। এটি নিয়ন্ত্রণের একটি মাত্রা সরবরাহ করে যা অন্যান্য চ্যাটবট অ্যাপ্লিকেশনগুলিতে সর্বদা উপস্থিত থাকে না।

বৃহত্তর প্রেক্ষাপট: AI উন্নয়ন এবং মার্কিন-চীন গতিশীলতা

ডিপসিককে ঘিরে উদ্বেগ এবং AI ডেটা গোপনীয়তা সম্পর্কে বিস্তৃত বিতর্ক, বিশ্বব্যাপী AI-এর দ্রুত বিকাশ এবং মার্কিন যুক্তরাষ্ট্র ও চীনের মধ্যে অনুভূত AI অস্ত্র প্রতিযোগিতার সাথে অবিচ্ছেদ্যভাবে জড়িত। এই ভূ-রাজনৈতিক প্রেক্ষাপট এই ইস্যুতে জটিলতার আরেকটি স্তর যুক্ত করেছে, যা জাতীয় নিরাপত্তা এবং AI প্রযুক্তির অপব্যবহারের সম্ভাবনা সম্পর্কে উদ্বেগ বাড়িয়ে তুলেছে।

Surfshark অধ্যয়নের ফলাফলগুলি, একটি গুরুত্বপূর্ণ অনুস্মারক হিসাবে কাজ করে যে ডেটা গোপনীয়তার উদ্বেগগুলি নির্দিষ্ট দেশে বিকশিত AI মডেলগুলির মধ্যে সীমাবদ্ধ নয়। জনপ্রিয় চ্যাটবটগুলির মধ্যে সবচেয়ে বেশি ডেটা সংগ্রহকারী হল, প্রকৃতপক্ষে, একটি মার্কিন-ভিত্তিক অ্যাপ্লিকেশন। এটি AI ডেটা গোপনীয়তার জন্য আরও সূক্ষ্ম এবং ব্যাপক পদ্ধতির প্রয়োজনীয়তাকে তুলে ধরে, যা জাতীয় সীমানা অতিক্রম করে এবং পৃথক কোম্পানিগুলির অনুশীলন এবং তারা যে সুরক্ষা ব্যবস্থাগুলি প্রয়োগ করে তার উপর দৃষ্টি নিবদ্ধ করে। এটি অপরিহার্য যে ব্যবহারকারীরা তাদের ব্যবহৃত AI সরঞ্জামগুলির ডেটা সংগ্রহ অনুশীলন সম্পর্কে অবগত থাকুক, তাদের উৎস নির্বিশেষে, এবং দ্রুত বিকশিত AI ল্যান্ডস্কেপে ব্যবহারকারীর গোপনীয়তা রক্ষার জন্য শক্তিশালী প্রবিধান স্থাপন করা হোক। ডেটা সংগ্রহ, ব্যবহার এবং ভাগ করে নেওয়ার জন্য স্পষ্ট মান স্থাপন, স্বচ্ছতা এবং ব্যবহারকারীর নিয়ন্ত্রণ নিশ্চিত করা এবং কোম্পানিগুলিকে তাদের ডেটা অনুশীলনের জন্য দায়বদ্ধ রাখার উপর ফোকাস করা উচিত।