ডিপসিক ছাড়িয়ে: চীনের ওপেন সোর্স 'বাহিনী'

চীনের ওপেন সোর্স আন্দোলন দ্রুত একটি শক্তিশালী শক্তিতে পরিণত হচ্ছে। ডিপসিক (DeepSeek) এবং আলিবাবার কোয়েন (Qwen)-এর মতো মডেলগুলো চীনা ওপেন সোর্স সক্ষমতার জন্য নতুন মানদণ্ড স্থাপন করেছে। ক্রমবর্ধমান সংখ্যক ছোট ও মাঝারি আকারের উদ্যোগ (SME) এই অগ্রগতিকে কাজে লাগিয়ে ছোট, কিন্তু আরও শক্তিশালী, উল্লম্ব মডেল তৈরি করছে। এই উদ্ভাবনের ঢেউ চীনের বৃহৎ মডেলগুলোর আপডেটের গতি বাড়িয়ে দিয়েছে, যা ধারাবাহিকভাবে নতুন এবং উত্তেজনাপূর্ণ উন্নয়ন সরবরাহ করছে। মার্কিন যুক্তরাষ্ট্রে প্রচলিত প্রধানত ক্লোজড-সোর্স পদ্ধতির বিপরীতে, চীনা কোম্পানিগুলো ওপেন সোর্সকে গ্রহণ করছে, তাদের প্রযুক্তিগত আত্মবিশ্বাস প্রদর্শন করছে এবং প্রযুক্তিগত অন্তর্ভুক্তি ও বৈশ্বিক সহযোগিতার দিকে একটি নতুন পথের সূচনা করছে, ক্রমাগত বিদেশী বাজারে প্রসারিত হচ্ছে এবং বিশ্বব্যাপী এআই ল্যান্ডস্কেপকে একটি ‘এককেন্দ্রিক আধিপত্য’ থেকে ‘বহুকেন্দ্রিক সহাবস্থান’-এর দিকে পরিবর্তন করছে।

চীনা ওপেন সোর্সের একত্রীকরণ

ফেব্রুয়ারির শুরুতে, যখন চীনা ওপেন সোর্স লার্জ মডেল ডিপসিক বিশ্বব্যাপী ১৪০টি দেশ এবং অঞ্চলে অ্যাপ্লিকেশন মার্কেট ডাউনলোডের তালিকায় শীর্ষে ছিল, তখন ওপেনএআই (OpenAI) প্রকাশ্যে ডিপসিকের বিরুদ্ধে অনুমতি ছাড়া চ্যাটজিপিটি (ChatGPT) থেকে ডিস্টিলড ডেটা ব্যবহারের অভিযোগ করেছিল।

ওপেনএআই-এর খ্যাতি পুনরুদ্ধারের পরিবর্তে, এই অভিযোগ বিশ্বজুড়ে গবেষকদের কাছ থেকে ব্যাপক উপহাসের শিকার হয়েছিল।

এখন, আরেকটি প্রতিযোগী, সম্পূর্ণরূপে ‘ডিস্টিলেশন’ বাফকে গ্রহণ করে আবির্ভূত হয়েছে।

১৩ই এপ্রিল, কুনলুন ওয়ানউই (Kunlun Wanwei) স্কাইওয়ার্ক-ওআর১ (Skywork-OR1) (ওপেন রিজনার ১) সিরিজের মডেল চালু করেছে, যা একই স্কেলে আলিবাবার কোয়েন-৩২বি (Qwen-32B)-কে ছাড়িয়ে গেছে এবং ডিপসিক-আর১ (DeepSeek-R1)-এর সঙ্গে সঙ্গতিপূর্ণ।

কুনলুন ওয়ানউই, সীমিত আর্থিক সংস্থান থাকা সত্ত্বেও, কীভাবে একটি এসওটিএ (SOTA)-স্তরের বৃহৎ মডেল তৈরি করতে পারে? আনুষ্ঠানিক ব্যাখ্যা হল তাদের মডেলগুলো ডিপসিক-আর১-ডিস্টিল-কোয়েন-৭বি (DeepSeek-R1-Distill-Qwen-7B) এবং ডিপসিক-আর১-ডিস্টিল-কোয়েন-৩২বি (DeepSeek-R1-Distill-Qwen-32B) এর উপর ভিত্তি করে তৈরি।

নাম থেকেই বোঝা যায়, ডিপসিকের মডেলগুলো আলিবাবার কোয়েন সিরিজের মডেলগুলোকে ডিস্টিল করেছে।

চমৎকার ওপেন সোর্স মডেলগুলোকে কাজে লাগানোর পাশাপাশি, কুনলুন ওয়ানউই ওপেন সোর্স কমিউনিটিতে অবদান রাখছে। ডিপসিকের বিপরীতে, যা শুধুমাত্র মডেল ওয়েট ওপেন সোর্স করেছে, কুনলুন ওয়ানউই তার ডেটাসেট এবং প্রশিক্ষণ কোডও ওপেন সোর্স করেছে, যা ‘সত্যিকারের ওপেন সোর্স’-এর ধারণার সাথে আরও ঘনিষ্ঠভাবে সঙ্গতিপূর্ণ। এর মানে হল যে কোনও ব্যবহারকারী তাদের মডেল প্রশিক্ষণ প্রক্রিয়াটি প্রতিলিপি করার চেষ্টা করতে পারে।

কুনলুন ওয়ানউই-এর কৃতিত্ব ওপেন সোর্সের সবচেয়ে গুরুত্বপূর্ণ দিকটি প্রদর্শন করে: এটি শুধুমাত্র ব্যবহারকারীদের জন্য একটি বিনামূল্যে এবং সহজে উপলব্ধ পণ্য সরবরাহ করে না, বরং আরও বেশি ডেভেলপারকে পূর্বসূরিদের কাঁধে দাঁড়াতে, দ্রুত এবং সাশ্রয়ীভাবে প্রযুক্তিকে এগিয়ে নিতে সক্ষম করে।

প্রকৃতপক্ষে, গত বছরের বৃহৎ মডেল প্রি-ট্রেনিংয়ের সীমাবদ্ধতা নিয়ে আলোচনার মধ্যে, এই বছর চীনা বৃহৎ মডেলগুলোর পুনরাবৃত্তির গতি বেড়েছে, যেখানে আরও বেশি সংখ্যক কোম্পানি ওপেন সোর্সে বিনিয়োগ করছে।

আলিবাবা ক্লাউডের টংয়ি কিয়ানওয়েন (Tongyi Qianwen) চীনা নববর্ষের প্রাক্কালে তার নতুন ভিজ্যুয়াল মডেল কোয়েন২.৫-ভিএল (Qwen2.5-VL) ওপেন সোর্স করেছে এবং মার্চের শুরুতে তার নতুন রিজনিং মডেল QwQ-32B প্রকাশ ও ওপেন সোর্স করেছে, যা ওপেন সোর্স করার দিনেই বিশ্বব্যাপী মূলধারার এআই ওপেন সোর্স কমিউনিটি হাগিং ফেসের (Hugging Face) ট্রেন্ডিং তালিকায় শীর্ষে ছিল।

স্টেপওয়াইজ (Stepwise) প্রায় এক মাসের মধ্যে তিনটি মাল্টিমোডাল লার্জ মডেল ওপেন সোর্স করেছে, যার মধ্যে সর্বশেষটি হল ইমেজ-টু-ভিডিও মডেল স্টেপ-ভিডিও-টিআই২ভি (Step-Video-TI2V), যা নিয়ন্ত্রণযোগ্য মোশন অ্যামপ্লিচিউড এবং লেন্স মুভমেন্টের সাথে ভিডিও তৈরি করা সমর্থন করে এবং কিছু বিশেষ প্রভাব তৈরি করার ক্ষমতাও রয়েছে।

জিপু (Zhipu) এপ্রিলে ঘোষণা করেছে যে তারা ৩২বি/৯বি সিরিজের জিএলএম (GLM) মডেল ওপেন সোর্স করবে, যার মধ্যে বেস, রিজনিং এবং কন্টেম্প্লেটিভ মডেলগুলো অন্তর্ভুক্ত থাকবে, যা সবই এমআইটি (MIT) লাইসেন্স চুক্তির অধীনে থাকবে।

এমনকি বাইদু (Baidu), যা একসময় ক্লোজড সোর্স ছিল, ঘোষণা করেছে যে তারা ৩০শে জুন থেকে ওয়েনসিন (Wenxin) লার্জ মডেল সম্পূর্ণরূপে ওপেন সোর্স করবে।

দেশীয় ওপেন সোর্স ইকোসিস্টেমের ক্রমবর্ধমান সমৃদ্ধির তুলনায়, আমেরিকান লার্জ মডেল কোম্পানিগুলো এখনও প্রধানত ক্লোজড সোর্সের উপর দৃষ্টি নিবদ্ধ করে, যা চীনা লার্জ মডেলগুলোকে বিদেশে যাওয়ার একটি বিরল সুযোগ দিয়েছে। ডিপসিক ইন্দোনেশিয়ার শিক্ষা কোম্পানি রুয়াংগুরুকে (Ruangguru) কম খরচে তাদের শিক্ষণ মডেল অপ্টিমাইজ করতে দিয়েছে; সিঙ্গাপুরের বি২বি (B2B) ট্র্যাভেল টেকনোলজি কোম্পানি অ্যাটলাস (Atlas) চব্বিশ ঘন্টা বহুভাষিক সহায়তা অর্জনের জন্য তার বুদ্ধিমান গ্রাহক পরিষেবা সিস্টেমে কোয়েনকে সংহত করেছে।

কেন মার্কিন যুক্তরাষ্ট্রে ক্লোজড সোর্স, চীনে ওপেন সোর্স?

মার্কিন এআই ইন্ডাস্ট্রিতে ক্লোজড সোর্সের প্রবণতা এবং চীনা এআই-এর ক্রমবর্ধমান উন্মুক্ততা দুটি দেশের ভিন্ন এআই উন্নয়ন পরিবেশের অনিবার্য ফলাফল।

মার্কিন এআই শিল্প প্রধানত টেক জায়ান্ট এবং ভিসি (ভেঞ্চার ক্যাপিটালিস্ট) দ্বারা পরিচালিত, যারা এআই থেকে পুঁজি ফেরতের বিশাল প্রত্যাশা রাখেন। অতএব, মার্কিন এআই মডেল কোম্পানিগুলোর সাধারণত প্রযুক্তির প্রতি একটি দৃঢ় বিশ্বাস থাকে, অর্থাৎ প্রযুক্তিগত নেতৃত্ব অনুসরণ করা, একটি নির্দিষ্ট স্তরের বাজারের আধিপত্য অর্জন করা এবং তারপরে বিশাল মুনাফা তৈরি করা এবং তাদের ইকোসিস্টেম স্বাভাবিকভাবেই ক্লোজড সোর্সের দিকে ঝুঁকে থাকে।

ওপেনএআই-এর উন্নয়ন ইতিহাসকে উদাহরণ হিসেবে নিলে দেখা যায়, এটি প্রতিষ্ঠার সময় একটি অলাভজনক সত্তা হিসেবে শুরু হয়েছিল, কিন্তু তারপর থেকে ক্রমশ বন্ধ হয়ে গেছে। জিপিটি-১ (GPT-1) সম্পূর্ণরূপে ওপেন সোর্স ছিল, জিপিটি-২ (GPT-2) আংশিকভাবে ওপেন সোর্স ছিল এবং সম্পূর্ণরূপে ওপেন সোর্স হওয়ার আগে বিরোধিতার সম্মুখীন হয়েছিল, জিপিটি-৩ (GPT-3) আনুষ্ঠানিকভাবে ক্লোজড সোর্স হয়ে যায় এবং তারপরে জিপিটি-৪ (GPT-4) ক্লোজড-সোর্স কৌশলকে আরও শক্তিশালী করে, মডেল আর্কিটেকচার এবং প্রশিক্ষণ ডেটা সম্পূর্ণরূপে গোপন রাখা হয় এবং এমনকি কর্পোরেট ব্যবহারকারীদের এপিআই (API) কলিং ফ্রিকোয়েন্সি সীমিত করা হয়।

যদিও ওপেনএআই বলেছে যে ক্লোজিং সোর্স সম্মতির ভিত্তিতে এবং প্রযুক্তির অপব্যবহার নিয়ন্ত্রণ করার জন্য, বাজার সাধারণত বিশ্বাস করে যে ওপেনএআই-এর ক্লোজড সোর্সে স্থানান্তরের ল্যান্ডমার্ক ঘটনাটি ছিল মাইক্রোসফটের (Microsoft) সাথে শত বিলিয়ন ডলারের সহযোগিতা, অ্যাজুর (Azure) ক্লাউড পরিষেবাগুলোতে জিপিটি-৩ এম্বেড করে একটি ‘প্রযুক্তি-পুঁজি’ ক্লোজড লুপ তৈরি করা।

গত বছর অক্টোবরে মাইক্রোসফট যখন প্রথম তার আর্থিক প্রতিবেদনে ওপেনএআই-এ বিনিয়োগের কথা জানায়, তখন তারা বলেছিল: ‘আমরা ওপেনএআইগ্লোবাল, এলএলসিতে (OpenAIGlobal, LLC) বিনিয়োগ করেছি, যার মোট বিনিয়োগ প্রতিশ্রুতি ১৩ বিলিয়ন ডলার এবং এই বিনিয়োগ ইক্যুইটি পদ্ধতির মাধ্যমে হিসাব করা হয়।’

ইক্যুইটি পদ্ধতিকে এভাবেও বোঝা যেতে পারে যে ওপেনএআই-এ মাইক্রোসফটের বিনিয়োগ বিশুদ্ধ দাতব্য গবেষণার পরিবর্তে রিটার্ন পাওয়ার লক্ষ্যে করা হয়েছে। স্পষ্টতই, ক্লোজড-সোর্স ইকোসিস্টেমের মাধ্যমে উচ্চ মূল্যের এপিআই বিক্রি করা ওপেনএআই-এর বর্তমান বৃহত্তম আয়ের উৎস এবং ওপেন সোর্স করতে অনিচ্ছুক হওয়ার সবচেয়ে বড় বাধা হয়ে দাঁড়িয়েছে।

অ্যানথ্রোপিক (Anthropic), যা ওপেনএআই-এর ‘বিভাজন’ থেকে প্রতিষ্ঠিত হয়েছে, শুরু থেকেই ক্লোজড-সোর্স রুট নেওয়ার জন্য দৃঢ়প্রতিজ্ঞ ছিল এবং এর বৃহৎ মডেল পণ্য ক্লড (Claude) সম্পূর্ণরূপে ক্লোজড-সোর্স মডেল গ্রহণ করেছে।

এমনকি মেটার (META) লামা (Llama), মার্কিন যুক্তরাষ্ট্রের একমাত্র ওপেন-সোর্স লিডার, ওপেন সোর্স করার সময় দুটি অ্যান্টি-ফ্রেন্ড ক্লজ যুক্ত করেছে:

১. মেটা কর্তৃক অনুমোদিত হওয়ার আগে ওপেন-সোর্স মডেলগুলো ৭০ কোটির বেশি মাসিক সক্রিয় ব্যবহারকারী রয়েছে এমন পণ্য এবং পরিষেবাগুলোর জন্য ব্যবহার করা যাবে না।
২. লামা মডেলগুলোর আউটপুট কন্টেন্ট অন্য বৃহৎ ভাষা মডেলগুলোকে প্রশিক্ষণ এবং উন্নত করতে ব্যবহার করা যাবে না।

দেখা যাচ্ছে যে ওপেন-সোর্স মডেলগুলোর ক্ষেত্রেও, মেটার মূল উদ্দেশ্য এখনও প্রযুক্তিগত অন্তর্ভূক্তির পরিবর্তে নিজস্ব এআই ইকোসিস্টেম তৈরি করা।

মার্কিন যুক্তরাষ্ট্র পুঁজি স্তরে ওপেন সোর্সকে পরিপূরক হিসেবে রেখে ক্লোজড সোর্সের উপর ভিত্তি করে একটি এআই কৌশল বেছে নিয়েছে, যা সম্পূর্ণরূপে বাণিজ্যিক বিবেচনা বলা যেতে পারে। বিপরীতে, চীনের শীর্ষ-থেকে-নীচের শীর্ষ-স্তরের নকশা শুরু থেকেই ওপেন সোর্সকে গুরুত্ব দিয়েছে, যা স্বাধীন নিয়ন্ত্রণের ধারণার অধীনে একটি শিল্প-প্রথম পথ প্রতিফলিত করে।

২০১৭ সালের প্রথম দিকে, চীনা সরকার ‘নতুন প্রজন্ম কৃত্রিম বুদ্ধিমত্তা উন্নয়ন পরিকল্পনা’ প্রকাশ করেছিল, যেখানে স্পষ্টভাবে অর্থনীতি ও সমাজের সাথে এআই-এর গভীর সংহতকরণকে ত্বরান্বিত করার প্রস্তাব করা হয়েছিল এবং এআই উন্নয়নের প্রথম দিকের সুবিধা তৈরির জন্য মোতায়েন করা হয়েছিল। ২০২১ সালে, ওপেন-সোর্স সম্পর্কিত বিষয়বস্তু স্পষ্টভাবে চীনের ‘১৪তম পঞ্চবার্ষিকী পরিকল্পনা’-তে অন্তর্ভুক্ত করা হয়েছিল, যা স্থানীয় সরকারগুলোর দ্বারা প্রযুক্তিগত উদ্ভাবনের সক্রিয় প্রচার শুরু করে।

চীনা বিজ্ঞান একাডেমীর একজন শিক্ষাবিদ মেই হং (Mei Hong) একবার বলেছিলেন যে ভাষা মডেলগুলোর ভবিষ্যতের উন্নয়ন অবশ্যই ওপেন-সোর্স প্ল্যাটফর্মগুলোর উপর নির্ভর করতে হবে। শুধুমাত্র একটি উন্মুক্ত পরিবেশে বিভিন্ন শিল্পের ব্যবহারকারীদের জন্য ডেটা আপলোড এবং ব্যবসায়িক সংহতকরণের নিরাপত্তা এবং বিশ্বাসযোগ্যতা নিশ্চিত করা যেতে পারে।

গত বছর ডিসেম্বরে শিল্প ও তথ্য প্রযুক্তি মন্ত্রণালয় এবং অন্যান্য চারটি বিভাগ কর্তৃক জারি করা ‘ছোট ও মাঝারি আকারের উদ্যোগের ডিজিটাল ক্ষমতায়নের জন্য বিশেষ কর্মপরিকল্পনা (২০২৫-২০২৭)’ স্পষ্টভাবে ওপেন অ্যাটম ওপেন সোর্স ফাউন্ডেশনকে (Open Atom Open Source Foundation) একটি ‘ছোট ও মাঝারি আকারের উদ্যোগ এআই ওপেন সোর্স বিশেষ প্রকল্প’ প্রতিষ্ঠার জন্য সমর্থন করে, যাতে উদ্যোগগুলোর জন্য প্রযুক্তিগত সীমা কমিয়ে আনতে পুনরুৎপাদনযোগ্য এবং সহজে প্রচারযোগ্য প্রশিক্ষণ কাঠামো, পরীক্ষার সরঞ্জাম এবং অন্যান্য সম্পদ সরবরাহ করা যায়।

আরও বাস্তবসম্মত সমস্যা হল মার্কিন যুক্তরাষ্ট্রের সম্ভাব্য প্রযুক্তিগত অবরোধের কারণে, চীন কেবল এআই ক্ষেত্রে অনুসরণকারী হতে পারে না, বরং একটি স্বাধীন দেশীয় ইকোসিস্টেম তৈরি করতে হবে। মার্কিন যুক্তরাষ্ট্র ইতিমধ্যে ক্লোজড সোর্সকে প্রধান ফোকাস করে যে ইকোসিস্টেম তৈরি করেছে, তার অধীনে আরেকটি ক্লোজড-সোর্স ইকোসিস্টেম তৈরি করা মানে বন্ধ দরজার পিছনে গাড়ি তৈরি করার মতো। শুধুমাত্র একটি ওপেন-সোর্স ইকোসিস্টেম দ্রুত এআই শিল্পের উন্নয়নে সাহায্য করতে পারে।

শীর্ষ-স্তরের সমর্থন ছাড়াও, বিভিন্ন স্থানীয় সরকার ওপেন-সোর্স ইকোসিস্টেমে প্রকৃত অর্থ বিনিয়োগ করেছে।

জিপু এবং বেইজিং স্টেট-ওউন্ড অ্যাসেটস (Beijing State-owned Assets) যৌথভাবে প্রতিষ্ঠিত জেড ফান্ড (Z Fund), যা বৃহৎ মডেল ইকোসিস্টেম বিনিয়োগের উপর দৃষ্টি নিবদ্ধ করে, ঘোষণা করেছে যে এটি বিশ্বব্যাপী এআই ওপেন-সোর্স কমিউনিটির উন্নয়নে সহায়তা করার জন্য ৩০০ মিলিয়ন ইউয়ান বিনিয়োগ করবে। ওপেন-সোর্স মডেলের উপর ভিত্তি করে যেকোনো স্টার্টআপ প্রকল্প (জিপু ওপেন-সোর্স মডেলের মধ্যে সীমাবদ্ধ নয়) আবেদন করতে পারে।

এআই শিল্পের জন্য চীন এবং মার্কিন যুক্তরাষ্ট্রের ওপেন-সোর্স এবং ক্লোজড-সোর্স কৌশলের মধ্যে পার্থক্য মূলত উন্নয়ন যুক্তির একটি মৌলিক পার্থক্য। মার্কিন যুক্তরাষ্ট্র পুঁজি দ্বারা চালিত, এবং টেক জায়ান্ট ও ভিসিগুলোর মুনাফা-সন্ধানী চাহিদা ‘প্রযুক্তি একচেটিয়া-উচ্চ মূল্যে উপলব্ধি’-এর একটি ক্লোজড-সোর্স ইকোসিস্টেম তৈরি করেছে। এমনকি মেটা ওপেন সোর্স করার চেষ্টা করলেও বাণিজ্যিক বাধার শৃঙ্খল থেকে মুক্তি পাওয়া কঠিন। চীন শীর্ষ-স্তরের নকশার উপর নির্ভর করে, যেখানে ‘প্রযুক্তি ইক্যুইটি + শিল্প সহযোগিতা’ এর মূল ধারণা এবং নীতিগত ক্ষমতায়নের মাধ্যমে একটি উন্মুক্ত ইকোসিস্টেম তৈরি করে, যা প্রযুক্তিগত সীমা কমিয়ে বাস্তব অর্থনীতির সংহতকরণকে উৎসাহিত করার জন্য ওপেন সোর্সকে একটি মৌলিক অবকাঠামোতে পরিণত করে। এই কৌশলগত পছন্দ শুধুমাত্র দুটি দেশের এআই শিল্পের বিভিন্ন পথ তৈরি করে না, বরং ‘একচেটিয়া প্রতিযোগিতা’ থেকে ‘উন্মুক্ত এবং উইন-উইন’-এর দিকে বিশ্বব্যাপী এআই ইকোসিস্টেমের ত্বরণের পূর্বাভাস দেয়।

যথেষ্ট ভাল হলেই যথেষ্ট

চীনের এআই ওপেন-সোর্স ইকোসিস্টেম শুধুমাত্র চীন এবং বিশ্বে এআই শিল্পায়নের উন্নয়নকে ত্বরান্বিত করছে না, বরং প্রযুক্তিতে প্রথম বিশ্বাসের মার্কিন বিশ্বাসকে একটি অদ্ভুত ফাঁদে ফেলছে।

ডিপসিক প্রভাবের ক্রমবর্ধমান চাপের মুখে, মেটা ৫ই এপ্রিল লামা৪ (Llama4) প্রকাশ করেছে, যা ইতিহাসে শক্তিশালী মাল্টিমোডাল বৃহৎ মডেল হওয়ার দাবি করেছে।

তবে, প্রকৃত পরীক্ষার পর, এটি একটি হতাশাজনক মডেল। ১০ মিলিয়ন টোকেনের প্রেক্ষাপট দৈর্ঘ্য প্রায়শই ভুল হয়ে যায়, প্রাথমিক বল পরীক্ষাটি সম্পূর্ণ করা কঠিন এবং ৯.১১ > ৯.৯ তুলনার আকারের ত্রুটি ঘটে। মডেলটি চালু হওয়ার কয়েক দিনের মধ্যে, নির্বাহী পদত্যাগ এবং পরীক্ষা জালিয়াতির মতো কেলেঙ্কারিগুলো অভ্যন্তরীণ কর্মীদের দ্বারা নিশ্চিত করা হয়েছে।

আরও খবর প্রমাণ করে যে লামা৪ একটি পণ্য যা জুকারবার্গ (Zuckerberg) তাড়াহুড়ো করে তাকগুলিতে রেখেছিলেন বলা যেতে পারে। সুতরাং প্রশ্ন হল, কেন জুকারবার্গকে এটি এপ্রিলে চালু করতে হয়েছিল?

যেমনটি আগে উল্লেখ করা হয়েছে, মার্কিন এআই শিল্পের প্রযুক্তির প্রতি একটি বিভ্রান্তিকর বিশ্বাস রয়েছে, বিশ্বাস করে যে তাদের পণ্যগুলো অবশ্যই শক্তিশালী এবং সবচেয়ে উন্নত হতে হবে, তাই তারা একটি অস্ত্র প্রতিযোগিতা শুরু করেছে। তবে, এআই প্রশিক্ষণের প্রান্তিক প্রভাব হ্রাস পাওয়ায় বড় নির্মাতারা প্রচুর পরিমাণে খরচ করে ফেলেছে এবং শুধুমাত্র প্রযুক্তিগত সীমা তৈরি করা হয়নি, তবে তারা কম্পিউটিং পাওয়ার সীমাবদ্ধতার চোরাবালিতে পড়েছে।

ওপেনএআই জিপিটি-৪ও (GPT-4o)-এর চিত্র তৈরি করার ফাংশন প্রকাশ করার পরে, অল্টম্যান (Altman) কয়েক দিন পরে টুইট করেছিলেন যে তাদের জিপিইউ (GPU) ‘পুড়ে যাচ্ছে’। জেমিনি২.৫ (Gemini2.5) প্রকাশের এক সপ্তাহেরও কম সময়ের মধ্যে, গুগলএআইস্টুডিওর (GoogleAIStudio) প্রধান বলেছিলেন যে তারা এখনও ‘রেট লিমিট’ দ্বারা জর্জরিত এবং ডেভেলপাররা প্রতি মিনিটে কেবল ২০টি অনুরোধ পাঠাতে পারে। দেখে মনে হচ্ছে কোনও সংস্থা সুপার-লার্জ মডেলগুলোর অনুমানের চাহিদা মোকাবেলা করতে সক্ষম নয়।

আসলে, মার্কিন যুক্তরাষ্ট্র একটি ভুল বোঝাবুঝিতে পড়ছে। ঝিইউয়ান রিসার্চ ইনস্টিটিউটের (Zhiyuan Research Institute) দায়িত্বপ্রাপ্ত ব্যক্তি বলেছেন: ‘যদি কোনও নতুন মডেল ১০০ গুণ বেশি খরচ ব্যবহার করে ১০-পয়েন্টের বেঞ্চমার্ক স্কোর বৃদ্ধি করতে পারে, তবে এই নতুন মডেলটি ৮০% এর বেশি অ্যাপ্লিকেশন পরিস্থিতির জন্য অর্থহীন কারণ কোনও ব্যয় কার্যকারিতা নেই।’

চীনা লার্জ মডেল কোম্পানিগুলো ওপেন-সোর্স ইকোসিস্টেমকে ত্বরান্বিত করছে। দেখে মনে হচ্ছে তারা আর শীর্ষস্থানের জন্য প্রতিযোগিতা করছে না, তবে পরিবর্তে তাদের ‘যথেষ্ট ভালো’ পদ্ধতির মাধ্যমে আরও বেশি গ্রাহক, বিশেষত শিল্প গ্রাহকদের জিতেছে।

সরকার ও এন্টারপ্রাইজ গ্রাহকদের জন্য কয়েক মিলিয়ন বাজেটের তুলনায়, অনেক সংস্থা এবং প্রতিষ্ঠানের জরুরি এআই প্রয়োজন রয়েছে তবে তাদের কাছে এত বিদ্যমান সমাধান নেই। ওপেন-সোর্স মডেলগুলো ব্যবহার করে তাদের নিজস্ব সমাধান তৈরি করা প্রায় তাদের একমাত্র পছন্দ হয়ে দাঁড়িয়েছে:

  • বাওস্টিল (Baosteel) উৎপাদন সরঞ্জামের বুদ্ধিমান প্রাথমিক সতর্কতার জন্য মূল ধাতুবিদ্যা প্রকৌশল প্রক্রিয়াগুলোর জন্য ‘লার্জ মডেল + স্মল মডেল’ ব্যবহার করে।
  • চীন কয়লা বিজ্ঞান ও শিল্প গ্রুপের (China Coal Science and Industry Group) ‘কয়লা বিজ্ঞান অভিভাবক লার্জ মডেল চিনামজেপিটি (Coal Science Guardian Large Model ChinamjGPT)’ সরঞ্জামের ডাউনটাইম এবং রক্ষণাবেক্ষণের খরচ যথাক্রমে ৩০% এবং ২০% হ্রাস করে।
  • সাংহাই মেংবো ইন্টেলিজেন্ট ইন্টারনেট অফ থিংস টেকনোলজি (Shanghai Mengbo Intelligent Internet of Things Technology) একটি হালকা ওজনের লার্জ মডেলের উপর ভিত্তি করে একটি এজ-কাটিং সনাক্তকরণ এবং ক্রমাগত অ্যানিলিং ফার্নেস প্রক্রিয়া অপ্টিমাইজেশন অ্যাপ্লিকেশন প্ল্যাটফর্ম তৈরি করেছে।
  • মিফেই টেকনোলজি (Mifei Technology) লার্জ মডেল প্রযুক্তির উপর ভিত্তি করে সেমিকন্ডাক্টর ওয়েফার ফ্যাবগুলিতে স্বয়ংক্রিয় উপাদান হ্যান্ডলিং সিস্টেমগুলোর বুদ্ধিমান পূর্বাভাস, রক্ষণাবেক্ষণ এবং পরিচালনা উপলব্ধি করেছে।

এগুলো সবই শিল্প পরিস্থিতিতে ওপেন-সোর্স মডেল বাস্তবায়নের প্রতিনিধিত্বকারী ঘটনা।

শিল্প ব্যবহারের পাশাপাশি, ওপেন-সোর্স ইকোসিস্টেম আরও বেশি জনকল্যাণমূলক উদ্যোগে সহায়তা করতে পারে।

শানশুই নেচার কনজারভেশন সেন্টার (Shanshui Nature Conservation Center) স্নো লেপার্ড এবং মালভূমি ইকোসিস্টেমের সুরক্ষার জন্য প্রতিশ্রুতিবদ্ধ। এটি যে ইনফ্রারেড ক্যামেরা স্থাপন করে, তা প্রতি ত্রৈমাসিকে প্রচুর সংখ্যক ছবি বা ভিডিও তোলে। তুষার চিতা ট্রেসগুলোর ম্যানুয়াল সনাক্তকরণের উপর নির্ভর করা অত্যন্ত অদক্ষ এবং সময় সাপেক্ষ। হুয়াওয়ে অ্যাসেন্ড (Huawei Ascend) সানজিয়াংইউয়ানে (Sanjiangyuan) তুষার চিতা ট্রেসগুলো সনাক্ত করতে শানশুই নেচার কনজারভেশন সেন্টারের সাথে সহযোগিতা করছে। হুয়াওয়ে সানজিয়াংইউয়ানে ইনফ্রারেড ইমেজ প্রজাতি সনাক্তকরণের জন্য প্রাসঙ্গিক মডেল এবং সরঞ্জামগুলো ওপেন সোর্স করেছে, এআই উন্নয়নে অংশগ্রহণের সীমা কমিয়েছে এবং মডেল ব্যবহার করে আরও বেশি গবেষণা এবং সুরক্ষা প্রতিষ্ঠানকে উপকৃত হতে দিয়েছে। ডেটাসেট, ডেটা প্রসেসিং এবং ডেটা পরিষ্কারের ক্ষেত্রে লোকেরা একত্রে মডেলটি অপ্টিমাইজ করতে কাজ করতে পারে।

ওপেন সোর্সের ‘বাজার’ প্রভাব

ওপেন-সোর্স সফ্টওয়্যার আন্দোলনের পতাকাবাহক এরিক রেমন্ড (Eric Raymond) ১৯৯৯ সালে তার বই ‘দ্য ক্যাথেড্রাল অ্যান্ড দ্য বাজার (The Cathedral and the Bazaar)’-এ একটি রূপক প্রস্তাব করেছিলেন: ঐতিহ্যবাহী, ক্লোজড-সোর্স সফ্টওয়্যার উন্নয়ন মডেলটি একটি ক্যাথেড্রাল নির্মাণের মতো। সফ্টওয়্যারটি সাবধানে ডিজাইন করা হয়েছে এবং কয়েকজন বিশেষজ্ঞ (স্থপতি) একটি বিচ্ছিন্ন পরিবেশে তৈরি করেছেন এবং অবশেষে সম্পন্ন হওয়ার পরেই ব্যবহারকারীদের কাছে প্রকাশ করা হয়; ওপেন-সোর্স উন্নয়ন মডেলটি একটি কোলাহলপূর্ণ, আপাতদৃষ্টিতে বিশৃঙ্খল তবে প্রাণবন্ত বাজারের মতো। সফ্টওয়্যার উন্নয়ন উন্মুক্ত, বিকেন্দ্রীভূত এবং বিবর্তনীয়।

বইটি বিশ্বাস করে যে অনেক ধরণের সফ্টওয়্যার প্রকল্পের জন্য, বিশেষত জটিল সিস্টেম-স্তরের সফ্টওয়্যার (যেমন অপারেটিং সিস্টেম কার্নেল), উন্মুক্ত, সহযোগী এবং বিকেন্দ্রীভূত ‘বাজার’ উন্নয়ন মডেল, যদিও এটি বিশৃঙ্খল মনে হতে পারে, তবে এটি আসলে আরও দক্ষ, উচ্চ মানের এবং ঐতিহ্যবাহী, ক্লোজড এবং কেন্দ্রীভূত ‘ক্যাথেড্রাল’ মডেলের চেয়ে শক্তিশালী সফ্টওয়্যার তৈরি করে। এটি দ্রুত ত্রুটি খুঁজে বের করে এবং ঠিক করে এবং ‘আর্লি রিলিজ, অফেন রিলিজ’ এবং বৃহৎ আকারের পিয়ার রিভিউ (‘যথেষ্ট সংখ্যক চোখ’) এর মতো পদ্ধতির মাধ্যমে ব্যবহারকারীর প্রতিক্রিয়া এবং কমিউনিটির অবদানগুলোকে আরও ভালভাবে শোষণ করতে পারে, যার ফলে সফ্টওয়্যারের দ্রুত পুনরাবৃত্তি এবং উদ্ভাবন বৃদ্ধি পায়।

লিনাক্সের (Linux) মতো ওপেন-সোর্স প্রকল্পগুলোর বিশাল সাফল্য রেমন্ডের (Raymond) পয়েন্টটি প্রমাণ করেছে।

ওপেন-সোর্স আন্দোলন মার্কিন যুক্তরাষ্ট্র এবং বিশ্বকে তার নিজস্ব বিনিয়োগের চেয়ে অনেক বেশি মূল্য এনে দিয়েছে। হার্ভার্ড বিশ্ববিদ্যালয়ের (Harvard University) ২০২৪ সালের একটি গবেষণা প্রতিবেদনে বলা হয়েছে: ‘ওপেন-সোর্স ৪.১৫ বিলিয়ন ডলার বিনিয়োগ করেছে এবং সংস্থাগুলোর জন্য ৮.৮ ট্রিলিয়ন ডলারের মূল্য তৈরি করেছে (অর্থাৎ, বিনিয়োগ করা প্রতিটি ১ ডলার ২,০০০ ডলারের মূল্য তৈরি করে)। ওপেন সোর্স ছাড়া, সফ্টওয়্যারের উপর কর্পোরেট ব্যয় এখন যা আছে তার চেয়ে ৩.৫ গুণ বেশি হত।’

আজ, চীনা সংস্থাগুলো এটি শিখেছে। আমেরিকান এআই সংস্থাগুলো এটি ভুলে গেছে বলে মনে হচ্ছে।

আসলে, চীনা লার্জ মডেল সংস্থাগুলোর জন্য, এমনকি যদি তারা সামাজিক সুবিধাগুলো বিবেচনা না করে, ওপেন-সোর্স ইকোসিস্টেমকে আলিঙ্গন করা সংস্থাগুলোর জন্য অলাভজনক নয়।

অনেক লার্জ মডেল সংস্থা অবজারভার.কমকে (Observer.com) জানিয়েছে যে ওপেন সোর্সের অর্থ বাণিজ্যিকীকরণ ত্যাগ করা নয়। ওপেন সোর্সের এখনও ওপেন সোর্সের লাভের যুক্তি রয়েছে। এটি ওপেন সোর্স কিনা তার তুলনায়, প্রযুক্তিগতভাবে গ্রাহকদের আরও ভালভাবে পরিবেশন করা মূল বিষয়।

জিপু এআইকে (Zhipu AI) উদাহরণ হিসেবে নিলে, এটি চীনের একমাত্র সংস্থা যা সম্পূর্ণরূপে ওপেনএআইকে বেঞ্চমার্ক করে, তবে ওপেনএআই-এর ক্লোজড-সোর্স কৌশলের তুলনায়, এটি শিল্পের ওপেন-সোর্স কৌশলের সবচেয়ে দৃঢ় অনুশীলনকারীদের মধ্যে অন্যতম।

জিপু ২০২৩ সালে চীনের প্রথম চ্যাট লার্জ মডেল চ্যাটজিএলএম-৬বি (ChatGLM-6B) ওপেন সোর্স করার নেতৃত্ব দিয়েছিল। প্রায় ছয় বছর আগে প্রতিষ্ঠার পর থেকে, জিপু ৫৫টিরও বেশি মডেল ওপেন সোর্স করেছে, যার আন্তর্জাতিক ওপেন-সোর্স কমিউনিটিতে প্রায় ৪ কোটি ডাউনলোড হয়েছে।

জিপু অবজারভার.কমকে বলেছে যে জিপু আশা করে যে এর ওপেন-সোর্স কৌশল বেইজিংকে কৃত্রিম বুদ্ধিমত্তার জন্য একটি ‘বৈশ্বিক ওপেন-সোর্স রাজধানী’ হিসাবে গড়ে তুলতে অবদান রাখবে।

বিশেষত, বাণিজ্যিক স্তরে, জিপু ওপেন সোর্সের মাধ্যমে একটি ডেভেলপার ইকোসিস্টেম আকর্ষণ করতে এবং বি-এন্ড (B-end) এবং জি-এন্ড (G-end) গ্রাহকদের জন্য অর্থ প্রদানকৃত কাস্টমাইজড সমাধান সরবরাহ করতে বেছে নিয়েছে।

সমাধান বিক্রির পাশাপাশি, এপিআই বিক্রি করাও একটি গুরুত্বপূর্ণ লাভের লিঙ্ক।

ডিপসিককে উদাহরণ হিসেবে নিলে, ওপেন-সোর্স মডেলের প্রথম ব্যবসাটি হল উচ্চ-পারফরম্যান্স এপিআই বিক্রি করা। যদিও বেসিক পরিষেবাগুলো বিনামূল্যে, সংস্থাগুলো উচ্চ-পারফরম্যান্স এপিআই পরিষেবা সরবরাহ করতে পারে এবং ব্যবহারের উপর ভিত্তি করে চার্জ নিতে পারে। ডিপসিক-আর১ (DeepSeek-R1) এর জন্য এপিআই মূল্য প্রতি মিলিয়ন ইনপুট টোকেনের জন্য ১ ইউয়ান এবং প্রতি মিলিয়ন আউটপুট টোকেনের জন্য ১৬ ইউয়ান। যদি ফ্রি টোকেন কোটা শেষ হয়ে যায় বা বেসিক এপিআই প্রয়োজনগুলো পূরণ করতে না পারে, তবে ব্যবহারকারীরা ব্যবসায়ের প্রক্রিয়াগুলোর স্থিতিশীলতা বজায় রাখার জন্য অর্থ প্রদানকৃত সংস্করণটি ব্যবহার করতে ঝোঁক।

যে সংস্থাগুলোর কাছে কেবল মডেল পরিষেবা রয়েছে, আলিবাবা আরেকটি ওপেন-সোর্স নগদীকরণ মডেল বেছে নিয়েছে: ইকোসিস্টেম বান্ডিলিং।

আলিবাবার কোয়েন সিরিজ (Qwen series), একটি ওপেন-সোর্স অগ্রণী হিসাবে, সম্পূর্ণ মোডাল ওপেন সোর্সের মাধ্যমে ক্লাউড কম্পিউটিং এবং অন্যান্য অবকাঠামো ব্যবহার করতে ডেভেলপারদের আকর্ষণ করে, একটি ক্লোজড-লুপ পরিস্থিতি তৈরি করে। তাদের মডেলটি প্রথম দিকে কেবল একটি ভূমিকা এবং চিহ্নিত দামযুক্ত পণ্যগুলো আসলে ক্লাউড পরিষেবা।

চীনা ওপেন-সোর্স লার্জ মডেলগুলোর বিশ্বায়ন অ্যাপ্লিকেশন ‘প্রযুক্তি অনুসরণ’ থেকে ‘ইকোসিস্টেম আধিপত্য’-এ স্থানান্তরিত হয়েছে। যখন মার্কিন যুক্তরাষ্ট্র ‘ক্লোজড-সোর্স একচেটিয়া’ এবং ‘ওপেন-সোর্স নিয়ন্ত্রণের বাইরে’ এর দ্বিধায় ধরা পড়েছে, তখন চীন ‘চুক্তি উদ্ভাবন + পরিস্থিতি চাষ’ এর মাধ্যমে বিশ্বব্যাপী এআই ওপেন-সোর্স ইকোসিস্টেমের অন্তর্নিহিত যুক্তি পুনর্গঠন করছে। এই গেমের চূড়ান্ত যুদ্ধক্ষেত্র প্যারামিটার স্কেলের প্রতিযোগিতায় নয়, বরং এআই প্রযুক্তি এবং বাস্তব অর্থনীতির গভীর সংহতকরণের ট্রিলিয়ন ডলারের বাজারে।