চীনের সাম্প্রতিক কৃত্রিম বুদ্ধিমত্তার অগ্রগতি, বিশেষ করে DeepSeek-R1 এর আত্মপ্রকাশ বিশ্বব্যাপী মনোযোগ আকর্ষণ করেছে। তবে তাইওয়ান একটি ভিন্ন পথে চলছে। তাইওয়ানের এই পথ তাদের নিজস্ব সংস্কৃতি এবং গণতান্ত্রিক মূল্যবোধের প্রতিফলন ঘটিয়ে ভাষা মডেল তৈরিকে অগ্রাধিকার দেয়। এই প্রচেষ্টা কর্তৃত্ববাদী শাসনের দ্বারা প্রভাবিত এআই সিস্টেমগুলোর একটি বিকল্প তৈরি করার লক্ষ্যে কাজ করে।
ডিপসিক চ্যালেঞ্জ
জানুয়ারিতে DeepSeek-R1 এর উন্মোচন প্রযুক্তি বিশ্বে যথেষ্ট আগ্রহ তৈরি করে। পূর্বে চীনের ভাষা মডেল যেমন Baidu এর Ernie এবং ByteDance এর Doubao চীনা ভাষার অ্যাপ্লিকেশন, গণিত এবং কোডিংয়ে প্রতিশ্রুতি দেখালেও ইংরেজি ভাষায় দুর্বলতা এবং সীমিত অ্যাক্সেসযোগ্যতা ছিল। DeepSeek-R1 একটি গুরুত্বপূর্ণ মাইলফলক হিসেবে চিহ্নিত হয়েছে। এটি প্রথম চীনা LLM যা আন্তর্জাতিক স্বীকৃতি লাভ করেছে।
DeepSeek-R1 এর সবচেয়ে আকর্ষণীয় দিকগুলোর মধ্যে অন্যতম হলো এর কম উন্নয়ন খরচ। OpenAI এর GPT-4o তৈরি করতে যেখানে প্রায় ১০ কোটি মার্কিন ডলার খরচ হয়েছে বলে ধারণা করা হয়, সেখানে DeepSeek এর গবেষকরা দাবি করেছেন যে তাদের চ্যাটবট তৈরি করতে মাত্র ৫৬ লক্ষ মার্কিন ডলার খরচ হয়েছে। দক্ষতার প্রমাণ দিতে গিয়ে DeepSeek এর প্রকৌশলীরা GPT-4o বা Anthropic’s Claude এর মতো মডেলগুলোতে ব্যবহৃত শীর্ষ-স্তরের চিপের পরিবর্তে Nvidia H800 এর মতো মধ্য-স্তরের CPU ব্যবহার করে R1 মডেলটিকে প্রশিক্ষণ দিয়েছেন। মার্কিন যুক্তরাষ্ট্রের উচ্চ-ক্ষমতাসম্পন্ন চিপ চীনে রপ্তানির ওপর নিষেধাজ্ঞা থাকা সত্ত্বেও DeepSeek-R1 মাত্র ২৫৬টি সার্ভারে ছড়িয়ে থাকা ২০৪৮টি প্রসেসর ব্যবহার করে অন্যান্য শীর্ষস্থানীয় বটগুলোকে ছাড়িয়ে গেছে।
এই উল্লেখযোগ্য দক্ষতা এবং কম উন্নয়ন খরচ মূলত অত্যাধুনিক প্রোগ্রামিং কৌশলগুলোর জন্য সম্ভব হয়েছে। এর মধ্যে PTX অন্যতম। এটি অ্যাসেম্বলি-সদৃশ একটি ভাষা, যা ডেভেলপারদের কর্মক্ষমতা সূক্ষ্মভাবে টিউন করতে এবং হার্ডওয়্যারের ব্যবহার সর্বাধিক করতে সক্ষম করে।
প্রকাশের পরপরই DeepSeek-R1 অ্যাপটি মার্কিন যুক্তরাষ্ট্রের অ্যাপল অ্যাপ স্টোরের ফ্রি ডাউনলোড তালিকায় শীর্ষে উঠে আসে এবং ChatGPT, TikTok এবং Meta-র সামাজিক মাধ্যম প্ল্যাটফর্মগুলোকে ছাড়িয়ে যায়। DeepSeek-R1 আত্মপ্রকাশের পর Nasdaq-এর পতন হয় এবং Nvidia-এর শেয়ারের দাম কমে যায়।
ডিপসিকের দাবি নিয়ে প্রশ্ন
প্রাথমিক উৎসাহ সত্ত্বেও অনেক পর্যবেক্ষক DeepSeek এর LLM সম্পর্কিত দাবিগুলোর বৈধতা নিয়ে প্রশ্ন তুলেছেন। বিশ্লেষকরা মনে করেন যে উল্লেখিত সংখ্যাগুলো সম্ভবত শুধুমাত্র কম্পিউটেশনাল খরচকে অন্তর্ভুক্ত করে। অবকাঠামো, হার্ডওয়্যার এবং মানব সম্পদ খরচ এতে অন্তর্ভুক্ত নাও থাকতে পারে বা কম করে দেখানো হতে পারে।
তাইপেই-ভিত্তিক জেনারেটিভ এআই এবং ক্লাউড গেমিং পরিষেবা প্রদানকারী Ubitus-এর প্রতিষ্ঠাতা ও সিইও ওয়েসলি কুও এই উদ্বেগগুলোর প্রতিধ্বনি করেছেন। তিনি বলেন, প্রকৃত খরচ সম্ভবত রিপোর্টিং করা খরচের চেয়ে অনেক বেশি। Nvidia-এর সমর্থন নিয়ে Ubitus Project TAME সমর্থন করেছে। এটি ঐতিহ্যবাহী চীনা অক্ষর ব্যবহার করে একটি স্থানীয় LLM। তারা H100 CPU এবং গেমিং ডেটা সরবরাহ করেছে। Ubitus, Foxlink এবং Shinfox Energy-এর সাথে Ubilink.AI প্রতিষ্ঠা করার জন্য সহযোগিতা করেছে। Asus-এর সাথে তাইওয়ানের বৃহত্তম গ্রিন এনার্জি-চালিত এআই সুপারকম্পিউটিং পরিষেবা কেন্দ্র তৈরি করছে।
কুও সরকারি মডেলগুলোর জন্য LLM অ্যাপ্লিকেশন এবং মডেল তৈরিতে কোম্পানির জড়িত থাকার ওপর জোর দেন। এর মধ্যে জাপানি সরকারও রয়েছে। এই মডেলগুলো গেমিং, পর্যটন এবং খুচরা খাতের মতো ক্ষেত্রগুলোতে শ্রম সংকট এবং বয়স্ক জনসংখ্যার সমস্যা সমাধানে এআই-এর সম্ভাবনা তুলে ধরে।
ডেটা অখণ্ডতা নিয়ে উদ্বেগ
কুও OpenAI এবং Microsoft এর সাথে একমত হয়ে মনে করেন যে DeepSeek মডেল ডিস্টিলেশনের মাধ্যমে ডেটা সংগ্রহ করেছে। এই প্রক্রিয়ার মাধ্যমে ছোট ভাষা মডেলগুলোকে বড় মডেলের আউটপুটগুলোর অনুকরণ করার জন্য প্রশিক্ষণ দেওয়া হয়। OpenAI এবং Microsoft অভিযোগ করেছে যে DeepSeek তাদের উন্নয়নকে সহজ করার জন্য OpenAI-এর অ্যাপ্লিকেশন প্রোগ্রামিং ইন্টারফেস ব্যবহার করেছে।
কুও দাবি করেন যে DeepSeek OpenAI থেকে ডেটা নিয়েছে এবং কোম্পানির দক্ষতা সম্পর্কিত দাবিগুলো নিয়ে ভুল বোঝাবুঝি রয়েছে। তিনি উল্লেখ করেন যে DeepSeek-R1 এর ৬৭০ বিলিয়ন প্যারামিটার রয়েছে, যা Meta AI এর Llama 3.1 405B থেকে উল্লেখযোগ্যভাবে বড়। প্যারামিটারগুলো হলো অভ্যন্তরীণ সংখ্যাগত মান, যা একটি মডেল ভবিষ্যদ্বাণী করার জন্য প্রশিক্ষণের সময় শিখে থাকে। কুও আরও মনে করেন যে DeepSeek এর মডেলগুলো Llama 3.1 থেকে ডিস্টিল করা হয়েছে।
এইসব যুক্তির বাইরেও DeepSeek-R1 এর সক্ষমতা নিয়ে উদ্বেগ দেখা দিয়েছে। বিশেষজ্ঞদের মতে, R1 বিশেষায়িত এবং টাস্ক-স্পেসিফিক ফাংশনে ভালো পারফর্ম করলেও সাধারণ উদ্দেশ্যে GPT-4o এর থেকে পিছিয়ে আছে।
DeepSeek এর মডেলগুলোর একটি বড় সীমাবদ্ধতা হলো তথ্যের অবাধ প্রবাহের ওপর নিষেধাজ্ঞা। ব্যবহারকারীরা জানতে পেরেছেন যে সংবেদনশীল রাজনৈতিক বিষয় সম্পর্কে জানতে চাওয়া হলে তারা কৌশলী উত্তর দেয়। জিনজিয়াংয়ের উইঘুর সংখ্যালঘু এবং তাইওয়ানের মতো বিষয়গুলোতে DeepSeek এর প্রতিক্রিয়া চীনা কমিউনিস্ট পার্টির সরকারি অবস্থানের প্রতিফলন ঘটায়। গবেষণা বলছে যে DeepSeek এর আউটপুটগুলোর একটি উল্লেখযোগ্য অংশ গণতন্ত্র, মানবাধিকার এবং চীনের বিতর্কিত সার্বভৌমত্বের দাবি সম্পর্কিত তথ্য প্রকাশে বাধা দেয়।
তাইওয়ানের বিকল্প: TAIDE এবং অন্যান্য
এর প্রতিক্রিয়ায় তাইওয়ানে তৈরি LLM, যেমন TAME সিনোস্ফিয়ারের মধ্যে DeepSeek এর বিকল্প হিসেবে আত্মপ্রকাশ করেছে। ২০২৩ সালের জুনে ন্যাশনাল ইনস্টিটিউট অফ অ্যাপ্লাইড রিসার্চ কর্তৃক চালু হওয়া ট্রাস্টওয়ার্থি এআই ডায়ালগ ইঞ্জিন (TAIDE)-এর লক্ষ্য হলো তাইওয়ানের সামাজিক, সাংস্কৃতিক এবং ভাষাগত রীতিনীতির সাথে সঙ্গতি রেখে একটি মডেল তৈরি করা।
TAIDE-এর কাজ থমকে গেলেও এটি Project TAME-এর জন্য একটি গুরুত্বপূর্ণ মানদণ্ড হিসেবে কাজ করেছে। TAME ন্যাশনাল তাইওয়ান ইউনিভার্সিটির মেশিন ইন্টেলিজেন্স অ্যান্ড আন্ডারস্ট্যান্ডিং ল্যাবরেটরি (MiuLab) কর্তৃক বিভিন্ন সংস্থার তহবিল দ্বারা তৈরি করা হয়েছে। এটি ৫০০ বিলিয়ন টোকেনের ওপর প্রশিক্ষণপ্রাপ্ত। এটি ৩৯টি মূল্যায়নে GPT-4o সহ প্রতিযোগীদের ছাড়িয়ে গেছে। বিশ্ববিদ্যালয় ভর্তি, বার এবং ঐতিহ্যবাহী চীনা মেডিসিন পরীক্ষায় উচ্চ স্কোর করেছে।
TAME এর অন্যতম উদ্দেশ্য হলো স্থানীয় সংস্কৃতিকে তুলে ধরা। স্থানীয় ভাষার সক্ষমতা আনলক করা একটি গুরুত্বপূর্ণ পদক্ষেপ। কুও হুইস্পারের ওপর ভিত্তি করে একটি তাইওয়ানিজ ভয়েস LLM তৈরির কথা উল্লেখ করেছেন, যা মৌখিক তাইওয়ানিজ বুঝতে ইতিবাচক ফলাফল দিয়েছে। হাক্কা ভাষা শনাক্তকরণের জন্য প্রচেষ্টা চলছে।
এই প্রচেষ্টাগুলো সেসব অঞ্চলের প্রতিষ্ঠানগুলো থেকে ভালো সাড়া পেয়েছে, যেখানে এই ভাষাগুলো প্রচলিত। আদিবাসী ভাষা শনাক্তকরণে মডেলটিকে প্রশিক্ষণ দেওয়ার জন্য প্রচেষ্টা চলছে, তবে সীমিত ডেটা একটি বাধা। এআইকে একটি নতুন ভাষা শেখানোর জন্য পাঠ্যের সাথে যুক্ত প্রচুর পরিমাণে ভয়েস রেকর্ডিং প্রয়োজন।
সরকারি সংরক্ষণাগারে থাকা ঐতিহাসিক ডেটা অ্যাক্সেস করা আরেকটি সুযোগ। তবে কিছু ডেটা কপিরাইট দ্বারা সুরক্ষিত। কৃত্রিম সাধারণ বুদ্ধিমত্তার উত্থান বিপন্ন এবং বিলুপ্ত ভাষাগুলোকে পুনরুজ্জীবিত করতে সহায়তা করার সম্ভাবনা তৈরি করে।
এআই সার্বভৌমত্বের সাধনা
ভাষা এবং সংস্কৃতির সংযোগ তাইওয়ানের পরিচয়কে শক্তিশালী করার, তাইওয়ানের গল্প জানানোর এবং এর তথ্য পরিবেশ সুরক্ষার উপায় হিসেবে এআই সার্বভৌমত্বের গুরুত্বকে তুলে ধরে।
মার্কেট ইন্টেলিজেন্স অ্যান্ড কনসাল্টিং ইনস্টিটিউট (MIC)-এর শিল্প পরামর্শক এবং পরিচালক জুলিয়ান চু LLM মডেল এবং প্রশিক্ষণ ডেটাতে পক্ষপাতিত্বের সম্ভাবনার ওপর জোর দেন। তিনি উল্লেখ করেন যে ঐতিহ্যবাহী অক্ষর ব্যবহার করার সময়ও LLM আউটপুটগুলো গণপ্রজাতন্ত্রী চীনের শৈলীকে প্রতিফলিত করতে পারে এবং তাইওয়ানের সংস্কৃতিকে ধারণ করতে ব্যর্থ হতে পারে। তাইওয়ানের কোম্পানিগুলোর লক্ষ্য হলো তাইওয়ানের ভাষা বা ডেটা ব্যবহার করে LLM-কে প্রশিক্ষণ দেওয়া এবং এআই সার্বভৌমত্ব তৈরি করা।
চু তাইওয়ানের আরেকটি সম্ভাবনাময় LLM হিসেবে ফর্মোসা ফাউন্ডেশন মডেল (FFM-Llama2) এর কথা উল্লেখ করেন। তাইওয়ান ওয়েব সার্ভিস ২০২৩ সালের সেপ্টেম্বরে এটি প্রকাশ করে। এর লক্ষ্য ছিল এআইকে গণতান্ত্রিক করা। ফক্সকন মার্চ মাসে তার LLM, FoxBrain চালু করেছে। তবে কিছু সমালোচক LLM-এ বড় কর্পোরেশনগুলোর উদ্যোগ নিয়ে সন্দিহান।
TAME তৈরি করা MiuLab দলের সদস্য লিন ইয়েন-টিং তাইওয়ান সম্পর্কিত তথ্যের পরিবেশের ব্যবধান দূর করার প্রয়োজনীয়তার ওপর জোর দেন। তিনি উল্লেখ করেন যে DeepSeek-R1 এবং অন্যান্য চীনা LLM তাইওয়ানের একটি বিকৃত চিত্র উপস্থাপন করে। মার্কিন যুক্তরাষ্ট্রে তৈরি মডেলগুলোও মাঝে মাঝে তাইওয়ানকে ভুলভাবে উপস্থাপন করতে পারে। ওপেন-সোর্স মডেলগুলো তাইওয়ানকে অগ্রাধিকার নাও দিতে পারে এবং প্রশিক্ষণ ডেটাতে চীনের আধিপত্য রয়েছে।
অতএব, তাইওয়ানের বিষয়বস্তু নির্বাচন করে অন্তর্ভুক্ত করা এবং মডেলটিকে পুনরায় প্রশিক্ষণ দেওয়া গুরুত্বপূর্ণ। এই সক্রিয় পদ্ধতি নিশ্চিত করে যে তাইওয়ানের অনন্য সাংস্কৃতিক এবং ভাষাগত ল্যান্ডস্কেপ ডিজিটাল ক্ষেত্রে সঠিকভাবে উপস্থাপিত হয়েছে। এটি জাতীয় পরিচয়কে উৎসাহিত করে এবং বিশ্বব্যাপী এআই উন্নয়নের মুখে তার স্বতন্ত্র ঐতিহ্যকে সংরক্ষণ করে। তাইওয়ানের পরিচয় রক্ষার এই নিষ্ঠা নিশ্চিত করে যে দ্বীপ রাষ্ট্রটির অনন্য সংস্কৃতি এবং মূল্যবোধ যেন প্রভাবশালী আখ্যানগুলোর দ্বারা আচ্ছন্ন না হয়।
এই প্রচেষ্টার অন্তর্নিহিত চ্যালেঞ্জগুলো যথেষ্ট। একটি সত্যিকারের প্রতিনিধিত্বমূলক এআই মডেল তৈরি করতে স্থানীয় বিষয়বস্তুর বিশাল ডেটাসেট এবং প্রাকৃতিক ভাষা প্রক্রিয়াকরণে দক্ষতা সহ প্রচুর সম্পদের বিনিয়োগ প্রয়োজন। তাছাড়া ভুল তথ্য এবং পক্ষপাতদুষ্ট তথ্যের মোকাবিলা করার জন্য ক্রমাগত পরিমার্জন এবং অভিযোজন প্রয়োজন।
এই চ্যালেঞ্জগুলো সত্ত্বেও এআই সার্বভৌমত্বের প্রতি তাইওয়ানের প্রতিশ্রুতি অটল। TAME এবং অন্যান্য স্থানীয় LLM-এর উন্নয়ন নিশ্চিত করার দিকে একটি গুরুত্বপূর্ণ পদক্ষেপ। এটি নিশ্চিত করে কৃত্রিম বুদ্ধিমত্তার ভবিষ্যৎ দ্বীপটির অনন্য সাংস্কৃতিক পরিচয়, গণতান্ত্রিক মূল্যবোধ এবং বিশ্বে তার স্বতন্ত্র স্থান সংরক্ষণের অটল প্রতিশ্রুতিকে প্রতিফলিত করে। এআই সার্বভৌমত্বকে অগ্রাধিকার দেওয়ার মাধ্যমে তাইওয়ান কেবল তার সাংস্কৃতিক ঐতিহ্য রক্ষা করছে না, বরং বৈশ্বিক এআই ল্যান্ডস্কেপে একটি গুরুত্বপূর্ণ খেলোয়াড় হিসেবে নিজেকে প্রতিষ্ঠিত করছে। এটি প্রমাণ করে যে প্রযুক্তিগত অগ্রগতি সাংস্কৃতিক পরিচয় এবং গণতান্ত্রিক নীতিগুলোর সাথে সামঞ্জস্যপূর্ণ হতে পারে।
যাত্রা অব্যাহত
পূর্ণাঙ্গ এআই সার্বভৌমত্বের দিকে যাত্রা এখনও চলছে। চ্যালেঞ্জগুলো মোকাবিলা করতে এবং এই উদ্যোগগুলোর দীর্ঘমেয়াদী সাফল্য নিশ্চিত করতে আরও গবেষণা, উন্নয়ন এবং সহযোগিতা অত্যন্ত গুরুত্বপূর্ণ। এআই সার্বভৌমত্বকে অগ্রাধিকার দেওয়া অব্যাহত রাখার মাধ্যমে তাইওয়ান একটি ডিজিটাল ল্যান্ডস্কেপ তৈরি করতে পারে, যা তার অনন্য সাংস্কৃতিক পরিচয় এবং গণতান্ত্রিক মূল্যবোধগুলোকে সত্যিকার অর্থে প্রতিফলিত করে। এটি অন্যান্য দেশগুলোর জন্য একটি উদাহরণ স্থাপন করবে, যারা ক্রমবর্ধমান আন্তঃসংযুক্ত বিশ্বে তাদের স্বতন্ত্র স্থান বজায় রাখার চেষ্টা করছে।