এনএইচএস ডেটা নিয়ে এআই মডেলে গোপনীয়তার উদ্বেগ

ফোরসাইট, একটি কৃত্রিম বুদ্ধিমত্তা (এআই) মডেল, যা ইংল্যান্ডের ন্যাশনাল হেলথ সার্ভিস (এনএইচএস) থেকে সংগৃহীত ৫.৭ কোটি মেডিকেল রেকর্ডের বিশাল ডেটাসেটের উপর নির্ভরশীল, তার উন্নয়ন রোগী গোপনীয়তা এবং ডেটা সুরক্ষা নিয়ে গুরুতর উদ্বেগের জন্ম দিয়েছে এবং এটি নিয়ে যথেষ্ট বিতর্ক সৃষ্টি হয়েছে। যদিও এর সমর্থকরা রোগ নির্ণয় এবং হাসপাতালে ভর্তির পূর্বাভাস দেওয়ার মাধ্যমে স্বাস্থ্যসেবার ক্ষেত্রে বৈপ্লবিক পরিবর্তন আনার সম্ভাবনা তুলে ধরেন, সমালোচকরা রোগী গোপনীয়তা এবং ডেটা সুরক্ষা নিয়ে গুরুতর উদ্বেগ প্রকাশ করেছেন। এই নিবন্ধটি ফোরসাইটের জটিলতা, এর সক্ষমতা, এটি যে নৈতিক দ্বিধা তৈরি করে এবং সম্ভাব্য ঝুঁকি প্রশমিত করার জন্য সুরক্ষা ব্যবস্থা নিয়ে আলোচনা করে।

ফোরসাইট: একটি জাতীয়-স্কেল জেনারেটিভ এআই মডেল

২০২৩ সালে পরিকল্পিত ফোরসাইট প্রাথমিকভাবে ওপেনএআই-এর জিপিটি-3 ব্যবহার করে, যা চ্যাটজিপিটির প্রথম সংস্করণের প্রযুক্তি ছিল এবং লন্ডনের দুটি হাসপাতাল থেকে ১৫ লক্ষ রোগীর রেকর্ডের উপর ভিত্তি করে প্রশিক্ষিত হয়েছিল। ইউনিভার্সিটি কলেজ লন্ডনের ক্রিস টমলিনসন এবং তার দল ফোরসাইটকে সম্প্রসারিত করেছেন, এটিকে বিশ্বের প্রথম "জাতীয়-স্কেল জেনারেটিভ এআই মডেল অফ হেলথ ডেটা" হিসাবে ব্র্যান্ডিং করেছেন। এই উন্নত সংস্করণটি মেটার ওপেন-সোর্স এলএলএম লামা ২ (Meta’s open-source LLM Llama 2) ব্যবহার করে এবং নভেম্বর ২০১৮ থেকে ডিসেম্বর ২০২৩ পর্যন্ত ইংল্যান্ডের এনএইচএস দ্বারা নিয়মিতভাবে সংগৃহীত আটটি স্বতন্ত্র ডেটাসেট অন্তর্ভুক্ত করে। এই ডেটাসেটগুলির মধ্যে রয়েছে বহির্বিভাগের অ্যাপয়েন্টমেন্ট, হাসপাতালে ভর্তি, টিকাকরণের রেকর্ড এবং অন্যান্য স্বাস্থ্য সম্পর্কিত ঘটনা, যা ৫.৭ কোটি মানুষের মধ্যে ১০ বিলিয়ন ডেটা পয়েন্ট নিয়ে গঠিত – যা মূলত ইংল্যান্ডের সমগ্র জনসংখ্যা।

চলমান পরীক্ষার কারণে প্রকাশ্যে উপলব্ধ কর্মক্ষমতা মেট্রিকের অভাব সত্ত্বেও, টমলিনসন দাবি করেন যে ফোরসাইট শেষ পর্যন্ত পৃথক রোগ নির্ণয় করতে এবং বৃহত্তর স্বাস্থ্য প্রবণতা, যেমন হাসপাতালে ভর্তি বা হার্ট অ্যাটাকের পূর্বাভাস দিতে সক্ষম হবে। তিনি ৬ মে এক প্রেস কনফারেন্সে রোগের জটিলতা আগে থেকে অনুমান করার ক্ষেত্রে মডেলটির সম্ভাবনা, প্রাথমিক হস্তক্ষেপ সক্ষম করা এবং ব্যাপক পরিসরে প্রতিরোধমূলক স্বাস্থ্যসেবার দিকে পরিবর্তনের উপর জোর দেন।

গোপনীয়তা এবং ডেটা সুরক্ষা সংক্রান্ত উদ্বেগ

একটি এআই মডেলে এত বিশাল চিকিৎসা ডেটা সরবরাহ করার সম্ভাবনা গোপনীয়তা নিয়ে উদ্বেগ সৃষ্টি করেছে। যদিও গবেষকরা দাবি করেন যে এআইকে প্রশিক্ষণ দেওয়ার আগে সমস্ত রেকর্ড "ডি-আইডেন্টিফাইড" করা হয়েছিল, ডেটা প্যাটার্ন বিশ্লেষণের মাধ্যমে পুনরায় সনাক্তকরণের ঝুঁকি রয়ে গেছে, বিশেষ করে বৃহৎ ডেটাসেটের ক্ষেত্রে।

অক্সফোর্ড বিশ্ববিদ্যালয়ের লুক রচার শক্তিশালী জেনারেটিভ এআই মডেল তৈরি করার সময় রোগীর গোপনীয়তা রক্ষার অন্তর্নিহিত চ্যালেঞ্জ তুলে ধরেন। ডেটার সমৃদ্ধি এআই উদ্দেশ্যে ডেটাকে মূল্যবান করে তোলে, তবে এটিকে বেনামী করা অবিশ্বাস্যভাবে কঠিন করে তোলে। রচার নিরাপদ ব্যবহার নিশ্চিত করতে এই মডেলগুলির উপর কঠোর এনএইচএস নিয়ন্ত্রণের পক্ষে কথা বলেন।

এনএইচএস ডিজিটালের মাইকেল চ্যাপম্যান ডি-আইডেন্টিফাইড ডেটার ক্ষেত্রেও পুনরায় সনাক্তকরণের অন্তর্নিহিত ঝুঁকি স্বীকার করেন। যদিও সরাসরি শনাক্তকারীগুলি সরানো হয়েছে, স্বাস্থ্য ডেটার সমৃদ্ধি সম্পূর্ণ পরিচয় গোপন রাখার নিশ্চয়তা দেওয়া কঠিন করে তোলে।

এই ঝুঁকি মোকাবেলার জন্য, চ্যাপম্যান বলেছেন যে এআই একটি "সুরক্ষিত" এনএইচএস ডেটা পরিবেশে কাজ করে, তথ্যের সুরক্ষার নিশ্চয়তা দেয় এবং শুধুমাত্র অনুমোদিত গবেষকদের অ্যাক্সেস নিশ্চিত করে। অ্যামাজন ওয়েব সার্ভিসেস এবং ডেটা ব্রিকস গণনা পরিকাঠামো সরবরাহ করে কিন্তু ডেটা অ্যাক্সেস করতে পারে না।

ইম্পেরিয়াল কলেজ লন্ডনের ইভেস-আলেকজান্ডার ডি মন্টজোয়ে সম্ভাব্য তথ্য ফাঁস শনাক্ত করতে প্রশিক্ষণ ডেটা মুখস্থ করার জন্য একটি মডেলের ক্ষমতা যাচাই করার পরামর্শ দেন। নিউ সায়েন্টিস্টের জিজ্ঞাসাবাদের জবাবে টমলিনসন স্বীকার করেছেন যে ফোরসাইট দল এখনও এই পরীক্ষাগুলো করেনি তবে ভবিষ্যতে করার পরিকল্পনা রয়েছে।

জনসাধারণের আস্থা এবং ডেটা ব্যবহার

অক্সফোর্ড বিশ্ববিদ্যালয়ের ক্যারোলিন গ্রিন আস্থা বজায় রাখার জন্য ডেটা ব্যবহার সম্পর্কে জনসাধারণকে জানানোর গুরুত্বের উপর জোর দেন। বেনামী করার প্রচেষ্টা সত্ত্বেও, মানুষ সাধারণত তাদের ডেটা নিয়ন্ত্রণ করতে চায় এবং এর গন্তব্য বুঝতে চায়, যা তাদের এই ডেটার নৈতিকতা সম্পর্কে খুব বেশি সংবেদনশীল করে তোলে।

ফোরসাইট দ্বারা ডেটা ব্যবহার থেকে অপ্ট আউট করার জন্য বর্তমান নিয়ন্ত্রণগুলি সীমিত বিকল্প সরবরাহ করে। জাতীয়ভাবে সংগৃহীত এনএইচএস ডেটাসেট থেকে ডেটা মডেলটিকে প্রশিক্ষণ দেওয়ার জন্য ব্যবহৃত হয় এবং বিদ্যমান অপ্ট-আউট প্রক্রিয়াগুলি প্রযোজ্য নয় কারণ এনএইচএস ইংল্যান্ডের একজন মুখপাত্রের মতে, ডেটা "ডি-আইডেন্টিফাইড" করা হয়েছে। যাইহোক, যে ব্যক্তিরা তাদের পারিবারিক ডাক্তারের কাছ থেকে ডেটা শেয়ার করা থেকে অপ্ট আউট করেছেন তাদের ডেটা মডেলে অন্তর্ভুক্ত করা হবে না।

জিডিপিআর এবং ডেটা বেনামীকরণ

জেনারেল ডেটা প্রোটেকশন রেগুলেশন (জিডিপিআর) অনুসারে, ব্যক্তিদের তাদের ব্যক্তিগত ডেটা ব্যবহারের জন্য সম্মতি প্রত্যাহারের বিকল্প থাকতে হবে। যাইহোক, ফোরসাইটের মতো এলএলএমগুলির প্রশিক্ষণ প্রক্রিয়া এআই সরঞ্জাম থেকে একটি একক রেকর্ড সরানো অসম্ভব করে তোলে। এনএইচএস ইংল্যান্ডের মুখপাত্র জোর দিয়ে বলেন যে জিডিপিআর প্রযোজ্য নয় কারণ মডেলটিকে প্রশিক্ষণ দেওয়ার জন্য ব্যবহৃত ডেটা বেনামী করা হয়েছে এবং এটি ব্যক্তিগত ডেটা গঠন করে না।

ইউকে ইনফরমেশন কমিশনারের অফিসের ওয়েবসাইট স্পষ্ট করে যে "ডি-আইডেন্টিফাইড" ডেটা বেনামী ডেটার সাথে বিনিময়যোগ্যভাবে ব্যবহার করা উচিত নয়, কারণ ইউকে ডেটা সুরক্ষা আইন শব্দটি সংজ্ঞায়িত করে না এবং এর ব্যবহার বিভ্রান্তির সৃষ্টি করতে পারে।

মেডকনফিডেনশিয়ালের স্যাম স্মিথের মতে, কোভিড-১৯ সম্পর্কিত গবেষণার জন্য ফোরসাইটের বর্তমান ব্যবহারের কারণে আইনি অবস্থান আরও জটিল, যা মহামারী চলাকালীন প্রণীত ডেটা সুরক্ষা আইনের ব্যতিক্রমের অনুমতি দেয়। স্মিথ দাবি করেন যে কোভিড-শুধুমাত্র এআই সম্ভবত এমবেডেড রোগীর ডেটা ধারণ করে যা পরীক্ষাগার ত্যাগ করা উচিত নয় এবং রোগীদের তাদের ডেটা ব্যবহারের উপর নিয়ন্ত্রণ থাকা উচিত।

নৈতিক বিবেচনা

এআই উন্নয়নের জন্য চিকিৎসা ডেটা ব্যবহারের আশেপাশের নৈতিক বিবেচনাগুলি ফোরসাইটকে একটি অনিশ্চিত অবস্থানে ফেলেছে। গ্রিন যুক্তি দেন যে এআই উন্নয়নের জন্য নৈতিকতা এবং মানবিক বিবেচনাগুলি একটি অনুস্মারক হওয়ার পরিবর্তে প্রারম্ভিক বিন্দু হওয়া উচিত।

উদ্বেগের আরও গভীরে অনুসন্ধান

এনএইচএস মেডিকেল রেকর্ড ব্যবহারে ফোরসাইটের আশেপাশের উদ্বেগ কেবল ডেটা গোপনীয়তার বাইরেও বিস্তৃত। এটি ব্যক্তিগত স্বাস্থ্য তথ্যের মালিকানা, অ্যালগরিদমিক পক্ষপাতিত্বের সম্ভাবনা এবং ডাক্তার-রোগীর সম্পর্কের উপর এআই-এর দীর্ঘমেয়াদী প্রভাব সম্পর্কে মৌলিক প্রশ্নগুলোর উপর আলোকপাত করে।

স্বাস্থ্য ডেটার মালিকানা এবং নিয়ন্ত্রণ

একটি মূল নৈতিক দ্বিধা হলো ব্যক্তি তাদের নিজস্ব স্বাস্থ্য ডেটার উপর কতটা নিয়ন্ত্রণ রাখতে পারবে। এনএইচএসকে কার্যকর পরিচর্যা প্রদানের জন্য রোগীর তথ্যে প্রবেশাধিকারের প্রয়োজনীয়তা অনস্বীকার্য, তবে এআই প্রশিক্ষণের জন্য এই ডেটার ব্যবহার সম্পর্কে প্রশ্ন উঠছে যে ব্যক্তিদের পর্যাপ্তভাবে জানানো হয়েছে কিনা এবং এই ধরনের সেকেন্ডারি ব্যবহারের জন্য সম্মতি জানাতে তারা ক্ষমতাপ্রাপ্ত কিনা।

বর্তমান অপ্ট-আউট প্রক্রিয়াগুলি অপর্যাপ্ত, কারণ তারা এআই প্রশিক্ষণের জটিলতাগুলোকে সম্পূর্ণরূপে মোকাবিলা করে না। ডি-আইডেন্টিফাইড ডেটা জিডিপিআর-এর অধীনে আর ব্যক্তিগত ডেটা নয় – এই যুক্তিটি একটি আইনি ব্যাখ্যা যা এই বাস্তবতাকে উপেক্ষা করে যে এমনকি বেনামী ডেটাও পুনরায় সনাক্ত করা যেতে পারে বা ব্যক্তিদের সম্পর্কে ধারণা তৈরি করতে ব্যবহার করা যেতে পারে।

আরও শক্তিশালী পদ্ধতির মধ্যে অবহিত সম্মতির একটি সিস্টেম বাস্তবায়ন করা উচিত যা স্পষ্টভাবে উল্লেখ করে যে কীভাবে রোগীর ডেটা এআই গবেষণা এবং উন্নয়নের জন্য ব্যবহার করা যেতে পারে। এর জন্য এই ধরনের ব্যবহারের সম্ভাব্য সুবিধা এবং ঝুঁকিগুলোর স্পষ্ট এবং সহজবোধ্য ব্যাখ্যার প্রয়োজন হবে, সেইসাথে ব্যক্তিদের অপ্ট-ইন বা অপ্ট-আউট করার একটি অর্থপূর্ণ সুযোগ প্রদান করতে হবে।

অ্যালগরিদমিক পক্ষপাতিত্ব

আরেকটি গুরুত্বপূর্ণ উদ্বেগ হলো বৃহৎ ডেটাসেটের উপর প্রশিক্ষিত এআই মডেলগুলোতে অ্যালগরিদমিক পক্ষপাতিত্বের সম্ভাবনা। যদি ফোরসাইটকে প্রশিক্ষণ দেওয়ার জন্য ব্যবহৃত ডেটা বিদ্যমান স্বাস্থ্য বৈষম্যগুলোকে প্রতিফলিত করে, তাহলে মডেলটি এই বৈষম্যগুলোকে স্থায়ী করতে এবং এমনকি বাড়িয়ে তুলতে পারে।

উদাহরণস্বরূপ, যদি নির্দিষ্ট জনমিতিক গোষ্ঠী ডেটাসেটে কম প্রতিনিধিত্ব করে বা তাদের চিকিৎসা পরিস্থিতির ভুল নির্ণয় বা অপর্যাপ্ত চিকিৎসা করা হয়, তবে এআই এই গোষ্ঠীগুলোর জন্য রোগ বা হাসপাতালে ভর্তির পূর্বাভাস দিতে কম নির্ভুল হতে পারে। এটি স্বাস্থ্যসেবা সংস্থানগুলোতে অসম প্রবেশাধিকারের দিকে পরিচালিত করতে পারে এবং সম্ভবত বিদ্যমান স্বাস্থ্য বৈষম্যগুলোকে আরও বাড়িয়ে তুলতে পারে।

অ্যালগরিদমিক পক্ষপাতিত্বের ঝুঁকি কমাতে ফোরসাইটকে প্রশিক্ষণ দেওয়ার জন্য ব্যবহৃত ডেটা সাবধানে বিশ্লেষণ করা এবং কোনো সম্ভাব্য পক্ষপাতিত্ব চিহ্নিত করে তা মোকাবিলা করা অপরিহার্য। এর মধ্যে কম প্রতিনিধিত্ব করা গোষ্ঠীগুলোর অতিরিক্ত নমুনা নেওয়া, ডেটার ভুলগুলো সংশোধন করা এবং অ্যালগরিদম তৈরি করা অন্তর্ভুক্ত থাকতে পারে যা বিশেষভাবে ন্যায্য এবং ন্যায়সঙ্গত হওয়ার জন্য ডিজাইন করা হয়েছে।

ডাক্তার-রোগীর সম্পর্কের উপর প্রভাব

স্বাস্থ্যসেবায় এআই-এর ক্রমবর্ধমান ব্যবহারের কারণে ঐতিহ্যবাহী ডাক্তার-রোগীর সম্পর্কের গভীর পরিবর্তন হওয়ার সম্ভাবনা রয়েছে। এআই নিঃসন্দেহে ডাক্তারদের আরও সচেতন সিদ্ধান্ত নিতে সহায়তা করতে পারে, তবে এটি নিশ্চিত করা জরুরি যে এটি যত্নের মানবিক উপাদানকে প্রতিস্থাপন না করে।

রোগীদের আত্মবিশ্বাসী হওয়া দরকার যে তাদের ডাক্তাররা তাদের ক্লিনিকাল বিচারবুদ্ধিকে উন্নত করার জন্য একটি সরঞ্জাম হিসাবে এআই ব্যবহার করছেন, এটির বিকল্প হিসাবে নয়। ডাক্তার-রোগীর সম্পর্ক আস্থা, সহানুভূতি এবং অংশীদারিত্বের ভিত্তিতে সিদ্ধান্ত গ্রহণের একটি সম্পর্ক হিসাবে থাকা উচিত।

ডাক্তার-রোগীর সম্পর্ক রক্ষার জন্য স্বাস্থ্যসেবায় মানবিক মিথস্ক্রিয়া এবং যোগাযোগের গুরুত্বের উপর জোর দেওয়া গুরুত্বপূর্ণ। ডাক্তারদের তাদের সিদ্ধান্ত গ্রহণ প্রক্রিয়ায় এআই-এর ভূমিকা কার্যকরভাবে জানাতে এবং রোগীদের যেকোনো উদ্বেগের সমাধান করতে প্রশিক্ষণ দেওয়া উচিত।

সামনের দিকে একটি পথ খুঁজে বের করা

স্বাস্থ্যসেবায় এআই সম্পর্কিত জটিল নৈতিক এবং আইনি প্রেক্ষাপট পরিচালনা করার জন্য একটি বহুমাত্রিক পদ্ধতির প্রয়োজন।

  • স্বচ্ছতা এবং জনসম্পৃক্তি: রোগীর ডেটা কীভাবে ব্যবহার করা হয় তা স্পষ্টভাবে জানানো এবং স্বাস্থ্যসেবায় এআই-এর নৈতিক প্রভাব সম্পর্কে আলোচনায় জনসাধারণকে জড়িত করা।
  • ডেটা সুরক্ষা জোরদার করা: পুনরায় সনাক্তকরণের ঝুঁকি কমাতে এবং ব্যক্তিরা যাতে তাদের স্বাস্থ্য ডেটার উপর আরও বেশি নিয়ন্ত্রণ রাখতে পারে তা নিশ্চিত করতে কঠোর ডেটা সুরক্ষা ব্যবস্থা বাস্তবায়ন করা।
  • অ্যালগরিদমিক পক্ষপাতিত্ব মোকাবেলা করা: সকলের জন্য স্বাস্থ্যসেবার ক্ষেত্রে ন্যায়সঙ্গত প্রবেশাধিকার নিশ্চিত করতে এআই মডেলগুলোতে সক্রিয়ভাবে অ্যালগরিদমিক পক্ষপাতিত্ব চিহ্নিত করা এবং তা প্রশমিত করা।
  • মানব-কেন্দ্রিক পরিচর্যাকে অগ্রাধিকার দেওয়া: ডাক্তার-রোগীর সম্পর্কের গুরুত্বের উপর জোর দেওয়া এবং নিশ্চিত করা যে এআই মানবিক মিথস্ক্রিয়াকে প্রতিস্থাপন না করে উন্নত করার জন্য একটি সরঞ্জাম হিসাবে ব্যবহৃত হয়।

এই উদ্বেগগুলো মোকাবেলা করে আমরা রোগী গোপনীয়তা রক্ষা, ন্যায্যতা প্রচার এবং যত্নের মানবিক উপাদান সংরক্ষণ করার সাথে সাথে স্বাস্থ্যসেবায় এআই-এর পরিবর্তনশীল সম্ভাবনাকে কাজে লাগাতে পারি। স্বাস্থ্যসেবার ভবিষ্যৎ আমাদের দায়িত্বশীল এবং নৈতিকভাবে এই চ্যালেঞ্জগুলো মোকাবেলা করার ক্ষমতার উপর নির্ভর করে। তবেই আমরা নিশ্চিত করতে পারি যে এআই সত্যিকার অর্থে রোগী এবং সমাজের সামগ্রিকভাবে সর্বোত্তম স্বার্থে কাজ করে।