উন্মুক্ততার ক্ষয়: 'ওপেন সোর্স' AI কেন প্রায়শই তা নয়

প্রযুক্তি বিশ্বে ‘ওপেন সোর্স’ শব্দটি একটি শক্তিশালী অনুরণন বহন করে। এটি সহযোগিতামূলক উদ্ভাবন, জ্ঞান ভাগাভাগি এবং স্বচ্ছতার প্রতি মৌলিক বিশ্বাসের চিত্র তুলে ধরে। অর্ধ শতাব্দী আগে ক্যালিফোর্নিয়ার Menlo Park-এ Homebrew Computer Club গঠনের মাধ্যমে এই চেতনা স্পষ্টভাবে মূর্ত হয়েছিল। এই উত্সাহী এবং উদ্ভাবকদের দলটি কেবল মেশিন তৈরি করেনি; তারা অবাধে ধারণা এবং সফটওয়্যার বিনিময়ের উপর ভিত্তি করে একটি সংস্কৃতি তৈরি করেছিল, যা ওপেন-সোর্স আন্দোলনের ভিত্তি স্থাপন করেছিল এবং কম্পিউটিং জগতে বিপ্লব এনেছিল। তবুও, আজ, এই কষ্টার্জিত উত্তরাধিকার এবং উন্মুক্ততার সংজ্ঞা একটি সূক্ষ্ম কিন্তু উল্লেখযোগ্য চ্যালেঞ্জের মুখোমুখি হচ্ছে, বিশেষ করে কৃত্রিম বুদ্ধিমত্তার দ্রুত প্রসারিত ক্ষেত্রে। অত্যাধুনিক AI মডেল তৈরি করা ক্রমবর্ধমান সংখ্যক কোম্পানি তাদের সৃষ্টিকে ‘ওপেন সোর্স’ হিসাবে চিহ্নিত করতে আগ্রহী, কিন্তু ঘনিষ্ঠভাবে দেখলে বোঝা যায় যে এই লেবেলটি প্রায়শই বাহ্যিকভাবে প্রয়োগ করা হয়, যা আন্দোলনের মূল নীতিগুলির থেকে কম বাস্তবতাকে আড়াল করে। অর্থের এই অবক্ষয় কেবল একটি শব্দার্থিক বিতর্ক নয়; এটি স্বচ্ছতা এবং পুনরাবৃত্তিযোগ্যতার নীতিগুলির জন্য একটি প্রকৃত হুমকি সৃষ্টি করে, যা বিশেষ করে বৈজ্ঞানিক সম্প্রদায়ের মধ্যে অত্যন্ত গুরুত্বপূর্ণ।

প্রকৃত উন্মুক্ত সহযোগিতার চেতনা বোঝা

বর্তমান সংকট উপলব্ধি করার জন্য, প্রথমে ‘ওপেন সোর্স’ আসলে কী বোঝায় তা উপলব্ধি করতে হবে। এটি কেবল বিনামূল্যে সফটওয়্যারের চেয়ে বেশি কিছু; এটি সম্মিলিত অগ্রগতি এবং যাচাইযোগ্য বিশ্বাসের উপর ভিত্তি করে একটি দর্শন। এই দর্শনের ভিত্তি চারটি অপরিহার্য স্বাধীনতার উপর নির্ভর করে:

  1. যেকোনো উদ্দেশ্যে প্রোগ্রাম চালানোর স্বাধীনতা
  2. প্রোগ্রামটি কীভাবে কাজ করে তা অধ্যয়ন করার এবং আপনার ইচ্ছামত কম্পিউটিং করার জন্য এটি পরিবর্তন করার স্বাধীনতা। এর জন্য সোর্স কোডে অ্যাক্সেস একটি পূর্বশর্ত।
  3. অন্যদের সাহায্য করার জন্য কপি পুনরায় বিতরণ করার স্বাধীনতা
  4. আপনার পরিবর্তিত সংস্করণগুলির কপি অন্যদের বিতরণ করার স্বাধীনতা। এটি করার মাধ্যমে আপনি আপনার পরিবর্তনগুলি থেকে পুরো সম্প্রদায়কে উপকৃত হওয়ার সুযোগ দিতে পারেন। এর জন্য সোর্স কোডে অ্যাক্সেস একটি পূর্বশর্ত।

এই স্বাধীনতাগুলি, সাধারণত GNU General Public License (GPL), MIT License, বা Apache License-এর মতো লাইসেন্সগুলিতে অন্তর্ভুক্ত থাকে, ঐতিহাসিকভাবে সোর্স কোড-কে কেন্দ্র করে। সোর্স কোড – প্রোগ্রামারদের দ্বারা লিখিত মানুষের পাঠযোগ্য নির্দেশাবলী – ঐতিহ্যগত সফটওয়্যারের নীলনকশা। এই কোডটি প্রকাশ্যে উপলব্ধ করা যে কাউকে এটি পরিদর্শন করতে, এর যুক্তি বুঝতে, সম্ভাব্য ত্রুটিগুলি সনাক্ত করতে, নতুন প্রয়োজনের সাথে খাপ খাইয়ে নিতে এবং সেই উন্নতিগুলি ভাগ করতে দেয়।

এই মডেলটি উদ্ভাবন এবং বৈজ্ঞানিক অগ্রগতির জন্য একটি অসাধারণ অনুঘটক হয়েছে। বিশ্বজুড়ে গবেষকদের জন্য সহজলভ্য সরঞ্জামগুলির প্রভাব বিবেচনা করুন:

  • পরিসংখ্যানগত বিশ্লেষণ: R Studio-এর মতো সফটওয়্যার পরিসংখ্যানগত কম্পিউটিং এবং গ্রাফিক্সের জন্য একটি শক্তিশালী, স্বচ্ছ এবং প্রসারণযোগ্য পরিবেশ সরবরাহ করে, যা অগণিত বৈজ্ঞানিক ক্ষেত্রে ডেটা বিশ্লেষণের ভিত্তি হয়ে উঠেছে। এর উন্মুক্ততা পদ্ধতিগুলির পিয়ার রিভিউ এবং বিশেষায়িত প্যাকেজগুলির বিকাশের অনুমতি দেয়।
  • কম্পিউটেশনাল ফ্লুইড ডাইনামিক্স: OpenFOAM ফ্লুইড প্রবাহ সিমুলেট করার জন্য একটি অত্যাধুনিক লাইব্রেরি সরবরাহ করে, যা মহাকাশ প্রকৌশল থেকে পরিবেশ বিজ্ঞান পর্যন্ত ক্ষেত্রগুলিতে অত্যন্ত গুরুত্বপূর্ণ। এর উন্মুক্ত প্রকৃতি জটিল সিমুলেশনগুলির কাস্টমাইজেশন এবং যাচাইকরণ সক্ষম করে।
  • অপারেটিং সিস্টেম: Linux এবং অন্যান্য ওপেন-সোর্স অপারেটিং সিস্টেমগুলি বিশ্বের কম্পিউটিং পরিকাঠামোর একটি বড় অংশ গঠন করে, যার মধ্যে বৈজ্ঞানিক উচ্চ-কার্যকারিতা কম্পিউটিং ক্লাস্টারগুলিও রয়েছে, যা তাদের স্থিতিশীলতা, নমনীয়তা এবং স্বচ্ছতার জন্য মূল্যবান।

সুবিধাগুলি কেবল খরচ সাশ্রয়ের বাইরেও প্রসারিত। ওপেন সোর্স পুনরুৎপাদনযোগ্যতা (reproducibility) বৃদ্ধি করে, যা বৈজ্ঞানিক পদ্ধতির একটি ভিত্তি। যখন গবেষণায় ব্যবহৃত সরঞ্জাম এবং কোড উন্মুক্ত থাকে, তখন অন্যান্য বিজ্ঞানীরা পরীক্ষাগুলি প্রতিলিপি করতে, ফলাফলগুলি যাচাই করতে এবং আত্মবিশ্বাসের সাথে কাজের উপর ভিত্তি করে গড়ে তুলতে পারেন। এটি বিশ্বব্যাপী সহযোগিতা বৃদ্ধি করে, বাধাগুলি ভেঙে দেয় এবং বিভিন্ন পটভূমি এবং প্রতিষ্ঠানের গবেষকদের সাধারণ চ্যালেঞ্জগুলিতে অবদান রাখতে দেয়। এটি দীর্ঘায়ু নিশ্চিত করে এবং ভেন্ডর লক-ইন এড়ায়, মালিকানাধীন সফটওয়্যার কোম্পানিগুলির খামখেয়ালিপনা থেকে গবেষণা বিনিয়োগকে রক্ষা করে। এটি নতুন ধারণা এবং কৌশলগুলির দ্রুত প্রচার এবং পুনরাবৃত্তির মাধ্যমে আবিষ্কারকে ত্বরান্বিত করে। ওপেন-সোর্স নীতিটি স্বচ্ছতা, পুঙ্খানুপুঙ্খ পরীক্ষা এবং ভাগ করা অগ্রগতির মাধ্যমে জ্ঞানের বৈজ্ঞানিক অনুসন্ধানের সাথে মৌলিকভাবে সামঞ্জস্যপূর্ণ।

কৃত্রিম বুদ্ধিমত্তা: সম্পূর্ণ ভিন্ন একটি ক্ষেত্র

প্রতিষ্ঠিত ওপেন-সোর্স প্যারাডাইম, যা সোর্স কোডের অ্যাক্সেসযোগ্যতার উপর নিরাপদে নির্মিত, কৃত্রিম বুদ্ধিমত্তার ক্ষেত্রে, বিশেষ করে ফাউন্ডেশনাল লার্জ ল্যাঙ্গুয়েজ মডেল (LLMs)-এর মতো বৃহৎ আকারের মডেলগুলিতে প্রয়োগ করার সময় উল্লেখযোগ্য বাধার সম্মুখীন হয়। যদিও এই AI সিস্টেমগুলিতে অবশ্যই কোড জড়িত থাকে, তাদের কার্যকারিতা এবং আচরণ অনেক বেশি জটিল এবং প্রায়শই অস্পষ্ট উপাদান দ্বারা গঠিত হয়। একটি নিউরাল নেটওয়ার্কের জন্য কেবল আর্কিটেকচারাল কোড প্রকাশ করা ঐতিহ্যগত সফটওয়্যারের মতো প্রকৃত উন্মুক্ততার সমতুল্য নয়।

একটি AI মডেল, বিশেষ করে একটি ডিপ লার্নিং মডেল, সাধারণত কয়েকটি মূল উপাদান নিয়ে গঠিত:

  1. মডেল আর্কিটেকচার: এটি নিউরাল নেটওয়ার্কের কাঠামোগত নকশা – স্তর, নিউরন এবং সংযোগগুলির বিন্যাস। কোম্পানিগুলি প্রায়শই এই তথ্য প্রকাশ করে, এটিকে উন্মুক্ততার প্রমাণ হিসাবে উপস্থাপন করে। এটি একটি ইঞ্জিনের নীলনকশা ভাগ করার মতো।
  2. মডেল ওয়েটস (প্যারামিটার): এগুলি হল নেটওয়ার্কের মধ্যে থাকা সংখ্যাসূচক মান, প্রায়শই বিলিয়ন সংখ্যক, যা প্রশিক্ষণ প্রক্রিয়ার সময় সামঞ্জস্য করা হয়েছে। তারা প্রশিক্ষণ ডেটা থেকে শেখা প্যাটার্ন এবং জ্ঞান উপস্থাপন করে। ওয়েটস প্রকাশ করা অন্যদের প্রাক-প্রশিক্ষিত মডেল ব্যবহার করতে দেয়। এটি সম্পূর্ণরূপে একত্রিত ইঞ্জিন সরবরাহ করার মতো, যা চালানোর জন্য প্রস্তুত।
  3. ট্রেনিং ডেটা: এটি সম্ভবত সবচেয়ে গুরুত্বপূর্ণ এবং প্রায়শই অস্পষ্ট উপাদান। ফাউন্ডেশনাল মডেলগুলি বিশাল ডেটাসেটের উপর প্রশিক্ষিত হয়, যা প্রায়শই ইন্টারনেট থেকে স্ক্র্যাপ করা হয় বা মালিকানাধীন বা ব্যক্তিগত সংগ্রহ থেকে সংগ্রহ করা হয় (যেমন মেডিকেল রেকর্ড, যা উল্লেখযোগ্য গোপনীয়তার উদ্বেগ উত্থাপন করে)। এই ডেটার গঠন, কিউরেশন, ফিল্টারিং এবং সম্ভাব্য পক্ষপাতগুলি মডেলের ক্ষমতা, সীমাবদ্ধতা এবং নৈতিক আচরণকে গভীরভাবে প্রভাবিত করে। ট্রেনিং ডেটা সম্পর্কে বিস্তারিত তথ্য ছাড়া, একটি মডেল কেন এমন আচরণ করে তা বোঝা, বা নির্দিষ্ট অ্যাপ্লিকেশনের জন্য এর উপযুক্ততা এবং নিরাপত্তা মূল্যায়ন করা অবিশ্বাস্যভাবে কঠিন হয়ে পড়ে। এটি হল গোপন জ্বালানী মিশ্রণ এবং সেই সুনির্দিষ্ট শর্তাবলী যার অধীনে ইঞ্জিনটি চালানো হয়েছিল।
  4. ট্রেনিং কোড এবং প্রক্রিয়া: এর মধ্যে প্রশিক্ষণের জন্য ব্যবহৃত নির্দিষ্ট অ্যালগরিদম, অপ্টিমাইজেশান কৌশল, নির্বাচিত হাইপারপ্যারামিটার (সেটিংস যা শেখার প্রক্রিয়া নিয়ন্ত্রণ করে), ব্যবহৃত কম্পিউটেশনাল পরিকাঠামো এবং ব্যবহৃত উল্লেখযোগ্য শক্তি অন্তর্ভুক্ত। প্রশিক্ষণ প্রক্রিয়ার সামান্য ভিন্নতা বিভিন্ন মডেল আচরণের দিকে নিয়ে যেতে পারে, যা আর্কিটেকচার এবং ডেটা জানা থাকলেও পুনরুৎপাদনযোগ্যতাকে চ্যালেঞ্জিং করে তোলে। এটি ইঞ্জিন তৈরি এবং টিউন করার জন্য ব্যবহৃত বিস্তারিত ইঞ্জিনিয়ারিং স্পেসিফিকেশন, টুলিং এবং কারখানার শর্তাবলী উপস্থাপন করে।

বর্তমানে ‘ওপেন সোর্স’ AI হিসাবে বাজারজাত করা অনেক সিস্টেম প্রাথমিকভাবে মডেল আর্কিটেকচার এবং প্রাক-প্রশিক্ষিত ওয়েটস-এ অ্যাক্সেস সরবরাহ করে। যদিও এটি ব্যবহারকারীদের মডেল চালাতে এবং সম্ভবত ছোট ডেটাসেটে এটিকে ফাইন-টিউন করতে দেয়, এটি ট্রেনিং ডেটা এবং প্রক্রিয়া সম্পর্কিত প্রয়োজনীয় স্বচ্ছতা প্রদানে গুরুতরভাবে ব্যর্থ হয়। এটি মডেলের মৌলিক বৈশিষ্ট্যগুলি সত্যিকার অর্থে অধ্যয়ন করার বা এটিকে এমন গভীর অর্থপূর্ণ উপায়ে পরিবর্তন করার ক্ষমতাকে মারাত্মকভাবে হ্রাস করে যার জন্য পুনরায় প্রশিক্ষণ বা এর উৎস বোঝার প্রয়োজন হয়। অধ্যয়ন এবং পরিবর্তন করার স্বাধীনতা, যা ওপেন-সোর্স সংজ্ঞার কেন্দ্রবিন্দু, যখন ডেটা এবং প্রশিক্ষণ পদ্ধতির গুরুত্বপূর্ণ উপাদানগুলি লুকানো থাকে তখন উল্লেখযোগ্যভাবে বাধাগ্রস্ত হয়। মডেলের সৃষ্টি স্ক্র্যাচ থেকে প্রতিলিপি করা – বৈজ্ঞানিক বোঝাপড়া এবং যাচাইকরণের একটি মূল পরীক্ষা – কার্যত অসম্ভব হয়ে পড়ে।

AI-তে ‘ওপেনওয়াশিং’-এর উদ্বেগজনক প্রবণতা

লেবেল এবং বাস্তবতার মধ্যে এই ব্যবধান ‘ওপেনওয়াশিং’ নামে পরিচিত একটি অনুশীলনের জন্ম দিয়েছে। এই শব্দটি সেই কাজকে বর্ণনা করে যেখানে কোম্পানিগুলি বিপণন এবং কৌশলগত সুবিধার জন্য ‘ওপেন সোর্স’-এর ইতিবাচক খ্যাতি এবং অনুভূত সুবিধাগুলি ব্যবহার করে, একই সাথে বিস্তারিত ট্রেনিং ডেটা তথ্য বা প্রশিক্ষণের জন্য ব্যবহৃত কোডের মতো গুরুত্বপূর্ণ উপাদানগুলিতে অ্যাক্সেস আটকে রাখে। তারা তাদের সিস্টেমগুলিকে উন্মুক্ততার ভাষায় আবৃত করে কিন্তু স্বচ্ছতা এবং কমিউনিটি অ্যাক্সেসের দাবিদার নীতিগুলি সম্পূর্ণরূপে গ্রহণ করে না।

বেশ কয়েকটি বিশিষ্ট AI মডেল, ব্যাপকভাবে ব্যবহৃত হওয়া সত্ত্বেও এবং কখনও কখনও একটি ‘ওপেন’ উপাধি বহন করা সত্ত্বেও, Open Source Initiative (OSI)-এর মতো সংস্থাগুলির দ্বারা সমর্থিত ওপেন সোর্সের ব্যাপক সংজ্ঞার বিপরীতে পরিমাপ করলে কম পড়ে। OSI-এর একটি বিশ্লেষণ, যা ২০২২ সাল থেকে AI প্রসঙ্গে ওপেন সোর্সের অর্থ স্পষ্ট করার জন্য অধ্যবসায়ের সাথে কাজ করছে, বেশ কয়েকটি জনপ্রিয় মডেল নিয়ে উদ্বেগ তুলে ধরেছে:

  • Llama 2 & Llama 3.x (Meta): যদিও মডেল ওয়েটস এবং আর্কিটেকচার উপলব্ধ, ব্যবহারের উপর বিধিনিষেধ এবং সম্পূর্ণ ট্রেনিং ডেটাসেট এবং প্রক্রিয়া সম্পর্কিত অসম্পূর্ণ স্বচ্ছতা ঐতিহ্যগত ওপেন-সোর্স মানগুলির সাথে তাদের সারিবদ্ধতাকে সীমিত করে।
  • Grok (X): একইভাবে, উপলব্ধ করা হলেও, এর ট্রেনিং ডেটা এবং পদ্ধতি সম্পর্কে ব্যাপক তথ্যের অভাব এর প্রকৃত উন্মুক্ততা নিয়ে প্রশ্ন তোলে।
  • Phi-2 (Microsoft): প্রায়শই একটি ‘ওপেন মডেল’ হিসাবে বর্ণনা করা হয়, এর সৃষ্টি প্রক্রিয়া এবং ডেটা সম্পর্কিত সম্পূর্ণ স্বচ্ছতা সীমিত থাকে।
  • Mixtral (Mistral AI): যদিও অংশগুলি প্রকাশ করা হয়েছে, এটি অধ্যয়ন এবং পরিবর্তনের জন্য প্রয়োজনীয় সমস্ত উপাদানগুলিতে অ্যাক্সেসের সীমাবদ্ধতার কারণে ওপেন সোর্সের সম্পূর্ণ মানদণ্ড পূরণ করে না।

এই উদাহরণগুলি সেই প্রচেষ্টাগুলির বিপরীতে দাঁড়িয়েছে যা ওপেন-সোর্স নীতিগুলির প্রতি বৃহত্তর আনুগত্যের জন্য সচেষ্ট:

  • OLMo (Allen Institute for AI): একটি অলাভজনক গবেষণা ইনস্টিটিউট দ্বারা বিকশিত, OLMo স্পষ্টভাবে উন্মুক্ততার কথা মাথায় রেখে ডিজাইন করা হয়েছিল, কেবল ওয়েটসই নয়, ট্রেনিং কোড এবং ব্যবহৃত ডেটা সম্পর্কে বিস্তারিতও প্রকাশ করেছে।
  • LLM360’s CrystalCoder: একটি কমিউনিটি-চালিত প্রকল্প যা মডেলের জীবনচক্র জুড়ে সম্পূর্ণ স্বচ্ছতার লক্ষ্যে কাজ করছে, যার মধ্যে ডেটা, প্রশিক্ষণ পদ্ধতি এবং মূল্যায়ন মেট্রিক্স অন্তর্ভুক্ত রয়েছে।

কেন ওপেনওয়াশিং-এ জড়িত হওয়া? এর প্রেরণা বহুমুখী:

  1. বিপণন এবং উপলব্ধি: ‘ওপেন সোর্স’ লেবেলটি উল্লেখযোগ্য সদিচ্ছা বহন করে। এটি সহযোগিতা, নৈতিক অনুশীলন এবং বৃহত্তর সম্প্রদায়ের প্রতি অঙ্গীকারের ইঙ্গিত দেয়, যা ব্যবহারকারী, ডেভেলপার এবং ইতিবাচক প্রেস আকর্ষণ করতে পারে।
  2. ইকোসিস্টেম তৈরি: সম্পূর্ণ স্বচ্ছতা ছাড়াই মডেল ওয়েটস প্রকাশ করা ডেভেলপারদের AI সিস্টেমের উপর অ্যাপ্লিকেশন তৈরি করতে উৎসাহিত করে, যা সম্ভাব্যভাবে একটি নির্ভরশীল ইকোসিস্টেম তৈরি করে যা মূল কোম্পানির উপকার করে।
  3. নিয়ন্ত্রক সালিশ (Regulatory Arbitrage): এটি একটি বিশেষভাবে উদ্বেগজনক চালক। আসন্ন প্রবিধান, যেমন European Union’s AI Act (2024), নির্দিষ্ট উচ্চ-ঝুঁকিপূর্ণ AI সিস্টেমগুলির উপর কঠোর প্রয়োজনীয়তা আরোপ করবে বলে আশা করা হচ্ছে। যাইহোক, ‘ফ্রি এবং ওপেন-সোর্স সফটওয়্যার’-এর জন্য প্রায়শই ছাড় বা হালকা যাচাই-বাছাইয়ের প্রস্তাব করা হয়। ‘ওপেন সোর্স’ লেবেল প্রয়োগ করে – এমনকি যদি প্রতিষ্ঠিত সংজ্ঞা অনুসারে ভুলভাবেও হয় – কোম্পানিগুলি এই প্রবিধানগুলি আরও সহজে নেভিগেট করার আশা করতে পারে, মালিকানাধীন, উচ্চ-ঝুঁকিপূর্ণ সিস্টেমগুলির সাথে সম্পর্কিত সম্ভাব্য ব্যয়বহুল সম্মতি বোঝা এড়িয়ে। এই কৌশলগত লেবেলিং একটি সম্ভাব্য ফাঁকফোকরকে কাজে লাগায়, নিরাপত্তা এবং স্বচ্ছতা নিশ্চিত করার জন্য প্রবিধানের উদ্দেশ্যকে দুর্বল করে।

এই অনুশীলন শেষ পর্যন্ত ‘ওপেন সোর্স’ শব্দটিকে অবমূল্যায়ন করে এবং বিভ্রান্তি তৈরি করে, যা ব্যবহারকারী, ডেভেলপার এবং গবেষকদের জন্য বোঝা কঠিন করে তোলে যে কোন AI সিস্টেমগুলি প্রকৃতপক্ষে সেই স্বচ্ছতা এবং স্বাধীনতা প্রদান করে যা লেবেলটি বোঝায়।

বিজ্ঞানের জন্য কেন প্রকৃত উন্মুক্ততা জরুরি

বৈজ্ঞানিক সম্প্রদায়ের জন্য, এই বিতর্কের ঝুঁকি অত্যন্ত বেশি। বিজ্ঞান স্বচ্ছতা, পুনরুৎপাদনযোগ্যতা এবং স্বাধীন যাচাইকরণের ক্ষমতার উপর নির্ভর করে। গবেষণায় AI-এর ক্রমবর্ধমান একীকরণ – জিনোমিক ডেটা বিশ্লেষণ এবং জলবায়ু পরিবর্তন মডেলিং থেকে শুরু করে নতুন উপকরণ আবিষ্কার এবং জটিল জৈবিক সিস্টেম বোঝা পর্যন্ত – এই AI সরঞ্জামগুলির প্রকৃতিকে অত্যন্ত গুরুত্বপূর্ণ করে তোলে। ‘ব্ল্যাক বক্স’ AI সিস্টেমের উপর নির্ভর করা, বা যারা প্রকৃত স্বচ্ছতা প্রদান না করে উন্মুক্ততার ভান করে, তা গভীর ঝুঁকি তৈরি করে:

  • প্রতিবন্ধী পুনরুৎপাদনযোগ্যতা: যদি গবেষকরা একটি গবেষণায় ব্যবহৃত AI মডেলের ট্রেনিং ডেটা এবং পদ্ধতি অ্যাক্সেস বা বুঝতে না পারেন, তবে ফলাফলগুলি প্রতিলিপি করা অসম্ভব হয়ে পড়ে। এটি মৌলিকভাবে বৈজ্ঞানিক পদ্ধতির একটি মূল স্তম্ভকে দুর্বল করে। যদি ফলাফলগুলি স্বাধীনভাবে যাচাই করা না যায় তবে কীভাবে সেগুলিকে বিশ্বাস করা বা তার উপর ভিত্তি করে কাজ করা যেতে পারে?
  • লুকানো পক্ষপাত এবং সীমাবদ্ধতা: সমস্ত AI মডেল তাদের ট্রেনিং ডেটা এবং ডিজাইন পছন্দ থেকে পক্ষপাত উত্তরাধিকার সূত্রে পায়। স্বচ্ছতা ছাড়া, গবেষকরা এই পক্ষপাতগুলি পর্যাপ্তভাবে মূল্যায়ন করতে বা মডেলের সীমাবদ্ধতাগুলি বুঝতে পারে না। অজান্তে একটি পক্ষপাতদুষ্ট মডেল ব্যবহার করলে তা বিকৃত ফলাফল, ত্রুটিপূর্ণ উপসংহার এবং সম্ভাব্য ক্ষতিকারক বাস্তব-বিশ্বের পরিণতির দিকে নিয়ে যেতে পারে, বিশেষ করে চিকিৎসা গবেষণা বা সামাজিক বিজ্ঞানের মতো সংবেদনশীল ক্ষেত্রগুলিতে।
  • যাচাই-বাছাইয়ের অভাব: অস্পষ্ট মডেলগুলি কঠোর পিয়ার রিভিউ এড়িয়ে যায়। বৈজ্ঞানিক সম্প্রদায় মডেলের অভ্যন্তরীণ কার্যকারিতা সম্পূর্ণরূপে জিজ্ঞাসাবাদ করতে, এর যুক্তিতে সম্ভাব্য ত্রুটিগুলি সনাক্ত করতে বা এর ভবিষ্যদ্বাণীগুলির সাথে সম্পর্কিত অনিশ্চয়তাগুলি বুঝতে পারে না। এটি বৈজ্ঞানিক অনুসন্ধানের স্ব-সংশোধনকারী প্রকৃতিকে বাধাগ্রস্ত করে।
  • কর্পোরেট সিস্টেমের উপর নির্ভরতা: কর্পোরেশন দ্বারা নিয়ন্ত্রিত বন্ধ বা আধা-বন্ধ AI সিস্টেমের উপর নির্ভরতা নির্ভরতা তৈরি করে। গবেষণা এজেন্ডাগুলি উপলব্ধ কর্পোরেট সরঞ্জামগুলির ক্ষমতা এবং সীমাবদ্ধতা দ্বারা সূক্ষ্মভাবে প্রভাবিত হতে পারে এবং অ্যাক্সেস সীমাবদ্ধ বা ব্যয়বহুল হয়ে উঠতে পারে, যা সম্ভাব্যভাবে স্বাধীন গবেষণার দিকনির্দেশনাগুলিকে বাধাগ্রস্ত করে এবং ভাল অর্থায়িত প্রতিষ্ঠান এবং অন্যদের মধ্যে ব্যবধান বাড়িয়ে তোলে।
  • উদ্ভাবন বাধাগ্রস্ত: প্রকৃত ওপেন সোর্স গবেষকদের কেবল সরঞ্জাম ব্যবহার করতে দেয় না, বরং সেগুলিকে ব্যবচ্ছেদ করতে, পরিবর্তন করতে, উন্নত করতে এবং পুনরায় ব্যবহার করতে দেয়। যদি AI মডেলগুলির মূল উপাদানগুলি অ্যাক্সেসযোগ্য না থাকে, তবে উদ্ভাবনের এই গুরুত্বপূর্ণ পথটি অবরুদ্ধ হয়ে যায়। বিজ্ঞানীরা নতুন প্রশিক্ষণ কৌশল নিয়ে পরীক্ষা করা, বিভিন্ন ডেটা সংমিশ্রণ অন্বেষণ করা, বা নির্দিষ্ট, সূক্ষ্ম গবেষণা প্রশ্নগুলির জন্য মডেলগুলিকে অভিযোজিত করা থেকে বিরত থাকেন যা মূল ডেভেলপাররা অনুমান করেননি।

বৈজ্ঞানিক সম্প্রদায় ‘ওপেন সোর্স’ শব্দটির অবক্ষয়কে নিষ্ক্রিয়ভাবে গ্রহণ করতে পারে না। এটিকে সক্রিয়ভাবে স্বচ্ছতার জন্য ওকালতি করতে হবে এবং AI ডেভেলপারদের কাছ থেকে প্রকৃত স্বচ্ছতার দাবি করতে হবে, বিশেষ করে যখন এই সরঞ্জামগুলি গবেষণা প্রসঙ্গে নিযুক্ত করা হয়। এর মধ্যে রয়েছে:

  • স্পষ্ট মান প্রচার করা: OSI-এর মতো প্রচেষ্টাগুলিকে সমর্থন করা, যা ‘ওপেন-সোর্স AI’ কী গঠন করে তার জন্য স্পষ্ট, কঠোর সংজ্ঞা প্রতিষ্ঠা করে, এমন সংজ্ঞা যা আর্কিটেকচার, ওয়েটস, ট্রেনিং ডেটা এবং প্রশিক্ষণ প্রক্রিয়া সম্পর্কিত স্বচ্ছতা অন্তর্ভুক্ত করে।
  • যাচাইযোগ্য সরঞ্জামকে অগ্রাধিকার দেওয়া: সেই AI মডেল এবং প্ল্যাটফর্মগুলির ব্যবহারকে সমর্থন করা যা স্বচ্ছতার এই উচ্চ মানগুলি পূরণ করে, এমনকি যদি সেগুলি প্রাথমিকভাবে কম কর্মক্ষম হয় বা সহজলভ্য অস্পষ্ট বিকল্পগুলির চেয়ে বেশি প্রচেষ্টার প্রয়োজন হয়।
  • স্বচ্ছতার দাবি: জোর দেওয়া যে AI জড়িত প্রকাশনাগুলিতে ব্যবহৃত মডেলগুলি সম্পর্কে বিস্তারিত প্রকাশ অন্তর্ভুক্ত করা উচিত, যার মধ্যে ট্রেনিং ডেটার উৎস, প্রক্রিয়াকরণ এবং সম্ভাব্য পক্ষপাত সম্পর্কে ব্যাপক তথ্য, সেইসাথে প্রশিক্ষণ পদ্ধতি অন্তর্ভুক্ত রয়েছে।
  • সত্যিকারের উন্মুক্ত প্রকল্পগুলিকে সমর্থন করা: AI বিকাশে প্রকৃত উন্মুক্ততার প্রতি প্রতিশ্রুতিবদ্ধ প্রতিষ্ঠানগুলির কমিউনিটি-চালিত প্রকল্প এবং উদ্যোগগুলিতে অবদান রাখা এবং ব্যবহার করা।

Homebrew Computer Club-এর চেতনা – ভাগ করা জ্ঞান এবং সহযোগিতামূলক নির্মাণের – AI যুগের জটিলতাগুলিকে দায়িত্বের সাথে নেভিগেট করার জন্য অপরিহার্য। কৃত্রিম বুদ্ধিমত্তার জন্য ‘ওপেন সোর্স’-এর প্রকৃত অর্থ পুনরুদ্ধার এবং রক্ষা করা কেবল পরিভাষাগত বিশুদ্ধতার বিষয় নয়; এটি ক্রমবর্ধমান AI-চালিত বিশ্বে বিজ্ঞানের অখণ্ডতা, পুনরুৎপাদনযোগ্যতা এবং অব্যাহত অগ্রগতি রক্ষা করার বিষয়। সামনের পথের জন্য সতর্কতা এবং একটি সম্মিলিত অঙ্গীকার প্রয়োজন যাতে নিশ্চিত করা যায় যে AI-এর শক্তিশালী সরঞ্জামগুলি উন্মুক্ত অনুসন্ধানের নীতিগুলির সাথে সামঞ্জস্যপূর্ণভাবে বিকশিত এবং স্থাপন করা হয় যা শতাব্দী ধরে বিজ্ঞানকে এত ভালভাবে পরিবেশন করেছে।