বৈশ্বিক AI হার্ডওয়্যার প্রতিযোগিতায় উচ্চ ঝুঁকি
কৃত্রিম বুদ্ধিমত্তার (AI) বিকাশের ক্ষেত্রটি কেবল অ্যালগরিদমিক সাফল্যের দ্বারাই সংজ্ঞায়িত হচ্ছে না, বরং বিশাল মডেলগুলিকে প্রশিক্ষণ এবং চালানোর জন্য প্রয়োজনীয় অত্যাধুনিক হার্ডওয়্যারের অ্যাক্সেসের উপরও ক্রমবর্ধমানভাবে নির্ভরশীল হয়ে পড়ছে। এই হার্ডওয়্যার সমীকরণের কেন্দ্রে রয়েছে গ্রাফিক্স প্রসেসিং ইউনিট (GPU), যা প্রাথমিকভাবে ছবি রেন্ডার করার জন্য ডিজাইন করা হলেও এখন AI-এর সমান্তরাল প্রক্রিয়াকরণের চাহিদার জন্য অপরিহার্য। বছরের পর বছর ধরে, Nvidia Corporation এই ক্ষেত্রে অবিসংবাদিতভাবে শীর্ষস্থান ধরে রেখেছে, তাদের উন্নত GPU গুলি Silicon Valley এবং তার বাইরেও উদ্ভাবনের চালিকাশক্তি হিসেবে মানদণ্ডে পরিণত হয়েছে। তবে, এই আধিপত্য কোম্পানিটিকে এবং এর গ্রাহকদের ভূ-রাজনৈতিক উত্তেজনার কেন্দ্রবিন্দুতে নিয়ে এসেছে।
চীনের অত্যাধুনিক সেমিকন্ডাক্টর প্রযুক্তিতে প্রবেশাধিকার রোধ করার লক্ষ্যে Washington-এর কঠোর রপ্তানি নিয়ন্ত্রণ আরোপ বাজারকে মৌলিকভাবে পুনর্গঠিত করেছে। এই বিধিনিষেধগুলি বিশেষভাবে উচ্চ-কার্যক্ষমতাসম্পন্ন GPU গুলিকে লক্ষ্য করে, যেমন Nvidia দ্বারা উৎপাদিত, যা উন্নত AI অ্যাপ্লিকেশনগুলির জন্য গুরুত্বপূর্ণ বলে মনে করা হয়, যার মধ্যে সম্ভাব্য সামরিক ব্যবহারের অ্যাপ্লিকেশনও অন্তর্ভুক্ত। এর তাৎক্ষণিক প্রভাব ছিল চীনের ক্রমবর্ধমান প্রযুক্তি খাতের মধ্যে একটি তাড়াহুড়ো। AI-তে ব্যাপকভাবে বিনিয়োগকারী সংস্থাগুলি, প্রতিষ্ঠিত বৃহৎ সংস্থা থেকে উচ্চাকাঙ্ক্ষী স্টার্ট-আপ পর্যন্ত, প্রযুক্তিগত অগ্রগতির পরবর্তী তরঙ্গ চালনাকারী অপরিহার্য সরঞ্জামগুলি থেকে বিচ্ছিন্ন হওয়ার আকস্মিক সম্ভাবনার মুখোমুখি হয়েছিল। এটি একটি জরুরি প্রয়োজন তৈরি করেছিল: কার্যকর বিকল্প খুঁজে বের করা অথবা বিশ্বব্যাপী প্রতিযোগিতামূলক ক্ষেত্রে পিছিয়ে পড়ার ঝুঁকি নেওয়া। চ্যালেঞ্জটি কেবল একটি চিপকে অন্যটি দিয়ে প্রতিস্থাপন করার মধ্যেই সীমাবদ্ধ ছিল না; এতে কর্মক্ষমতার পার্থক্য, সফ্টওয়্যার সামঞ্জস্যতার সমস্যা এবং শত শত বিলিয়ন বা এমনকি ট্রিলিয়ন প্যারামিটার সহ মডেল প্রশিক্ষণের জন্য প্রয়োজনীয় বিশাল স্কেলের একটি জটিল জাল নেভিগেট করা জড়িত ছিল।
Ant Group কম্পিউট স্বাধীনতার দিকে একটি পথ তৈরি করছে
সরবরাহ শৃঙ্খলের অনিশ্চয়তা এবং ক্রমবর্ধমান প্রযুক্তিগত প্রতিদ্বন্দ্বিতার এই পটভূমিতে, Alibaba Group Holding-এর সাথে যুক্ত ফিনটেক জায়ান্ট Ant Group, বৃহত্তর কম্পিউটেশনাল স্বয়ংসম্পূর্ণতার দিকে একটি উল্লেখযোগ্য পদক্ষেপের ইঙ্গিত দিয়েছে। কোম্পানির Ling টিমের (যে বিভাগটি তার বৃহৎ ভাষা মডেল (LLM) উদ্যোগগুলির নেতৃত্ব দিচ্ছে) একটি গবেষণা পত্রে সাম্প্রতিক প্রকাশনাগুলি Nvidia-কেন্দ্রিক পথ থেকে একটি সফল বিচ্যুতির ইঙ্গিত দেয়। এই সাফল্যের মূল ভিত্তি হল তাদের দেশীয়ভাবে উৎপাদিত GPU ব্যবহার করে একটি অত্যাধুনিক AI মডেলকে কার্যকরভাবে প্রশিক্ষণ দেওয়ার ক্ষমতা।
আলোচ্য মডেলটির নাম Ling-Plus-Base, এটি কোনো হালকা মডেল নয়। এটি একটি Mixture-of-Experts (MoE) আর্কিটেকচার ব্যবহার করে ডিজাইন করা হয়েছে, যা LLM স্কেলিং-এর ক্ষেত্রে দক্ষতার জন্য জনপ্রিয়তা অর্জন করছে। একটি উল্লেখযোগ্য ৩০০ বিলিয়ন প্যারামিটার নিয়ে গর্ব করা Ling-Plus-Base অন্যান্য বিশিষ্ট বৈশ্বিক মডেলগুলির সাথে তুলনীয় একটি লীগে কাজ করে। তবে, মূল পার্থক্যকারী হল এর প্রশিক্ষণের ভিত্তি স্থাপনকারী হার্ডওয়্যার। গবেষণার ফলাফল অনুসারে,এই শক্তিশালী মডেলটিকে দলটি যা ‘নিম্ন-কার্যক্ষমতার ডিভাইস’ (lower-performance devices) হিসাবে বর্ণনা করেছে, তার উপর পরিপক্কতায় লালন করা যেতে পারে। এই সাবধানে নির্বাচিত শব্দগুচ্ছটি সরাসরি মার্কিন রপ্তানি বিধিনিষেধের আওতার বাইরে থাকা প্রসেসিং ইউনিটগুলির ব্যবহারের দিকে নির্দেশ করে, যা দৃঢ়ভাবে চীন තුළ ডিজাইন এবং নির্মিত চিপগুলির ব্যবহারের ইঙ্গিত দেয়।
এই উন্নয়নটি কেবল একটি প্রযুক্তিগত সমাধান নয়; এটি একটি সম্ভাব্য কৌশলগত পরিবর্তনের প্রতিনিধিত্ব করে। সর্বোচ্চ স্তরের, সীমাবদ্ধ বিদেশী হার্ডওয়্যারের উপর একচেটিয়াভাবে নির্ভর না করে অত্যাধুনিক মডেলগুলিকে প্রশিক্ষণ দেওয়ার ক্ষমতা প্রদর্শন করে, Ant Group কেবল সরবরাহ শৃঙ্খলের ঝুঁকিই হ্রাস করছে না, বরং সম্ভাব্যভাবে উল্লেখযোগ্য ব্যয় সাশ্রয়ের পথও খুলে দিচ্ছে।
অর্থনৈতিক সমীকরণ: প্রশিক্ষণের খরচ কমানো
Ling টিমের গবেষণা থেকে উঠে আসা সবচেয়ে আকর্ষণীয় পরিসংখ্যানগুলির মধ্যে একটি হল Ling-Plus-Base মডেলের গুরুত্বপূর্ণ প্রি-ট্রেনিং পর্যায়ে কম্পিউটিং খরচে ২০ শতাংশ হ্রাস। প্রি-ট্রেনিং কুখ্যাতভাবে সম্পদ-নিবিড়, এতে মডেলকে ভাষার ধরণ, প্রসঙ্গ এবং জ্ঞান শেখার জন্য বিশাল ডেটাসেট খাওয়ানো জড়িত। এটি ভিত্তিগত LLM বিকাশের সাথে যুক্ত সামগ্রিক ব্যয়ের একটি বড় অংশ গঠন করে। অতএব, এই পর্যায়ে এক-পঞ্চমাংশ খরচ হ্রাস করা মানে যথেষ্ট সঞ্চয়, যা সম্ভাব্যভাবে আরও গবেষণা, উন্নয়ন বা বৃহৎ পরিসরে স্থাপনার জন্য মূলধন মুক্ত করতে পারে।
এই খরচ সাশ্রয় কিভাবে অর্জিত হয়? যদিও গবেষণাপত্রটি খরচের সঠিক বিভাজন বিস্তারিতভাবে জানায়নি, বেশ কয়েকটি কারণ সম্ভবত অবদান রেখেছে:
- হার্ডওয়্যার সংগ্রহ: দেশীয়ভাবে উৎপাদিত GPU গুলি, যদিও Nvidia-র শীর্ষ অফারগুলির চেয়ে স্বতন্ত্রভাবে কম শক্তিশালী হতে পারে, তবে চীনা বাজারে কম ক্রয়মূল্যে আসতে পারে বা আরও অনুকূল ভলিউম ডিসকাউন্ট অফার করতে পারে, বিশেষ করে উচ্চ-প্রান্তের Nvidia চিপগুলির সীমিত সরবরাহের বিবেচনায়।
- শক্তি দক্ষতা: যদিও স্পষ্টভাবে বলা হয়নি, সম্ভাব্য কম শক্তি-ক্ষুধার্ত (যদিও সম্ভবত প্রতি ইউনিটে কম কর্মক্ষম) দেশীয় চিপগুলির জন্য প্রশিক্ষণ অপ্টিমাইজ করা নিম্ন পরিচালন শক্তি খরচে অবদান রাখতে পারে, যা বড় ডেটা সেন্টার চালানোর ক্ষেত্রে একটি গুরুত্বপূর্ণ কারণ।
- অ্যালগরিদমিক এবং আর্কিটেকচারাল অপ্টিমাইজেশন: MoE আর্কিটেকচারের ব্যবহার নিজেই মূল চাবিকাঠি। MoE মডেলগুলি একটি প্রদত্ত ইনপুটের জন্য কেবল নির্দিষ্ট ‘বিশেষজ্ঞ’ (expert) সাব-নেটওয়ার্কগুলিকে সক্রিয় করে, ঘন আর্কিটেকচারের মতো পুরো মডেলটিকে নিযুক্ত করার পরিবর্তে। এই অন্তর্নিহিত স্পারসিটি (sparsity) প্রশিক্ষণ এবং ইনফারেন্স উভয় সময়েই কম্পিউটেশনাল লোডকে উল্লেখযোগ্যভাবে হ্রাস করতে পারে, যা প্রতি চিপে কম কাঁচা প্রক্রিয়াকরণ শক্তি দিয়েও ভাল ফলাফল অর্জন করা সম্ভব করে তোলে। Ant-এর সাফল্য উপলব্ধ দেশীয় হার্ডওয়্যারের কার্যকারিতা সর্বাধিক করার জন্য অত্যাধুনিক সফ্টওয়্যার এবং অ্যালগরিদমিক টিউনিংয়ের পরামর্শ দেয়।
এই খরচ হ্রাস কেবল একটি অ্যাকাউন্টিং সুবিধা নয়; এটি বড় আকারের মডেল বিকাশের জন্য প্রবেশের বাধা কমিয়ে দেয় এবং কোম্পানির মধ্যে এবং সম্ভাব্যভাবে বৃহত্তর চীনা প্রযুক্তি ইকোসিস্টেম জুড়ে AI উদ্ভাবনের গতি ত্বরান্বিত করতে পারে যদি পদ্ধতিগুলি প্রতিলিপিযোগ্য প্রমাণিত হয়।
কর্মক্ষমতার সমতা: হার্ডওয়্যার ব্যবধান পূরণ?
খরচ সাশ্রয় আকর্ষণীয়, কিন্তু যদি ফলস্বরূপ AI মডেল উল্লেখযোগ্যভাবে কম পারফর্ম করে তবে এর অর্থ সামান্যই। Ant-এর Ling টিম সরাসরি এই বিষয়টি সম্বোধন করে, দাবি করে যে Ling-Plus-Base ক্ষেত্রের অন্যান্য সুপরিচিত মডেলগুলির সাথে তুলনীয় কর্মক্ষমতা অর্জন করে। বিশেষত, তারা তাদের সৃষ্টিকে Qwen2.5-72B-Instruct (মূল কোম্পানি Alibaba দ্বারা বিকশিত) এবং DeepSeek-V2.5-1210-Chat (আরেকটি বিশিষ্ট চীনা LLM) এর মতো মডেলগুলির বিরুদ্ধে বেঞ্চমার্ক করেছে।
‘নিম্ন-কার্যক্ষমতার ডিভাইস’ ব্যবহার করা সত্ত্বেও ‘তুলনীয় কর্মক্ষমতা’র দাবিটি উল্লেখযোগ্য। এটি পরামর্শ দেয় যে Ant সম্ভাব্যভাবে কাঁচা কম্পিউটেশনাল ঘাটতি পূরণের কার্যকর উপায় খুঁজে পেয়েছে যার মাধ্যমে:
- উন্নত মডেল আর্কিটেকচার: MoE ডিজাইন এখানে সহায়ক, কার্যকরভাবে কাজের চাপ বিতরণ করে।
- সফ্টওয়্যার অপ্টিমাইজেশন: ব্যবহৃত দেশীয় GPU গুলির আর্কিটেকচারের জন্য বিশেষভাবে প্রশিক্ষণ সফ্টওয়্যার স্ট্যাক (যেমন সমান্তরালকরণ ফ্রেমওয়ার্ক এবং সংখ্যাসূচক লাইব্রেরি) তৈরি করা অত্যন্ত গুরুত্বপূর্ণ। এতে প্রায়শই উল্লেখযোগ্য ইঞ্জিনিয়ারিং প্রচেষ্টা জড়িত থাকে।
- ডেটা কিউরেশন এবং প্রশিক্ষণ কৌশল: প্রশিক্ষণ ডেটা নির্বাচন এবং প্রশিক্ষণ প্রক্রিয়া নিজেই পরিমার্জন করার জন্য অত্যাধুনিক পদ্ধতিগুলি চূড়ান্ত মডেলের গুণমানকে উল্লেখযোগ্যভাবে প্রভাবিত করতে পারে, কখনও কখনও হার্ডওয়্যার সীমাবদ্ধতার জন্য ক্ষতিপূরণ দেয়।
কর্মক্ষমতার দাবিগুলিকে সূক্ষ্মতার সাথে বিবেচনা করা গুরুত্বপূর্ণ। ‘তুলনীয়’ বিভিন্ন বেঞ্চমার্ক জুড়ে ফলাফলের একটি পরিসীমা অন্তর্ভুক্ত করতে পারে (যেমন, ভাষা বোঝা, যুক্তি, প্রজন্ম, কোডিং)। একাধিক মানসম্মত পরীক্ষা জুড়ে বিস্তারিত বেঞ্চমার্ক ফলাফলের অ্যাক্সেস ছাড়া, একটি সুনির্দিষ্ট তুলনা চ্যালেঞ্জিং থেকে যায়। যাইহোক, এই দাবিটিই Ant-এর আত্মবিশ্বাসকে নির্দেশ করে যে তাদের পদ্ধতি খরচ/অ্যাক্সেসযোগ্যতা এবং ক্ষমতার মধ্যে একটি পঙ্গুকারী ট্রেড-অফের প্রয়োজন হয় না। এটি হার্ডওয়্যার বিধিনিষেধ দ্বারা আরোপিত সীমাবদ্ধতার মধ্যেও প্রতিযোগিতা বজায় রাখার একটি পথ প্রদর্শন করে।
গবেষকরা নিজেরাই বৃহত্তর প্রভাবগুলি তুলে ধরেছেন: “এই ফলাফলগুলি কম শক্তিশালী হার্ডওয়্যারে অত্যাধুনিক বৃহৎ-স্কেল MoE মডেল প্রশিক্ষণের সম্ভাব্যতা প্রদর্শন করে, যা কম্পিউটিং রিসোর্স নির্বাচনের ক্ষেত্রে ভিত্তিগত মডেল বিকাশের জন্য আরও নমনীয় এবং সাশ্রয়ী পদ্ধতির সক্ষমতা প্রদান করে।” এটি এক ধরণের গণতন্ত্রীকরণের দিকে নির্দেশ করে, যা প্রক্রিয়াকরণ শক্তির পরম শিখরে অ্যাক্সেস সীমিত থাকলেও অত্যাধুনিক AI বিকাশকে এগিয়ে যাওয়ার অনুমতি দেয়।
Mixture-of-Experts (MoE) সুবিধার উপলব্ধি
Mixture-of-Experts আর্কিটেকচার Ant Group-এর রিপোর্ট করা সাফল্যের কেন্দ্রবিন্দুতে রয়েছে। এটি ঐতিহ্যবাহী ‘ঘন’ (dense) নিউরাল নেটওয়ার্ক মডেল থেকে একটি প্রস্থান যেখানে প্রতিটি ইনপুট প্রতিটি প্যারামিটারকে সক্রিয় করে। একটি MoE মডেলে:
- মডেলটি অসংখ্য ছোট, বিশেষায়িত ‘বিশেষজ্ঞ’ (expert) নেটওয়ার্ক দ্বারা গঠিত।
- একটি ‘গেটিং নেটওয়ার্ক’ (gating network) বা ‘রাউটার’ (router) মেকানিজম আগত ডেটা (LLM-এর ক্ষেত্রে টোকেন) প্রক্রিয়াকরণের জন্য সবচেয়ে প্রাসঙ্গিক বিশেষজ্ঞ(দের) কাছে নির্দেশ করতে শেখে।
- শুধুমাত্র নির্বাচিত বিশেষজ্ঞ(রা) – প্রায়শই সম্ভাব্য শত শত এর মধ্যে মাত্র এক বা দুইজন – সেই নির্দিষ্ট ডেটার জন্য গণনা সম্পাদন করে।
এই পদ্ধতিটি বেশ কয়েকটি মূল সুবিধা প্রদান করে, বিশেষ করে হার্ডওয়্যার সীমাবদ্ধতার প্রেক্ষাপটে প্রাসঙ্গিক:
- স্কেলেবিলিটি: MoE মডেলগুলিকে বিশাল প্যারামিটার সংখ্যায় (ট্রিলিয়ন সম্ভব হয়ে উঠছে) বৃদ্ধি করার অনুমতি দেয় ইনফারেন্স বা এমনকি প্রশিক্ষণ ধাপগুলির সময় প্রতিটি ইনপুট টোকেন প্রক্রিয়াকরণের জন্য আনুপাতিক কম্পিউটেশনাল খরচ বৃদ্ধি ছাড়াই। এর কারণ হল মোট প্যারামিটারের কেবল একটি ভগ্নাংশ যেকোনো নির্দিষ্ট সময়ে সক্রিয় থাকে।
- প্রশিক্ষণ দক্ষতা: যদিও MoE মডেল প্রশিক্ষণের নিজস্ব জটিলতা রয়েছে (যেমন বিশেষজ্ঞদের মধ্যে লোড ব্যালেন্সিং), প্রতি টোকেনে হ্রাসকৃত গণনা দ্রুত প্রশিক্ষণের সময় বা, যেমন Ant প্রদর্শন করে, যুক্তিসঙ্গত সময়সীমার মধ্যে কম শক্তিশালী হার্ডওয়্যারে কার্যকরভাবে প্রশিক্ষণ দেওয়ার ক্ষমতাতে রূপান্তরিত হতে পারে।
- বিশেষীকরণ: প্রতিটি বিশেষজ্ঞ সম্ভাব্যভাবে বিভিন্ন ধরণের ডেটা, কাজ বা জ্ঞানের ডোমেনে বিশেষীকরণ করতে পারে, যা নির্দিষ্ট ক্ষেত্রে সম্ভাব্যভাবে উচ্চ মানের আউটপুটের দিকে পরিচালিত করে।
Google (GShard, Switch Transformer), Mistral AI (Mixtral মডেল) সহ বিশ্বব্যাপী শীর্ষস্থানীয় AI ল্যাবগুলি MoE গ্রহণ করেছে এবং চীনের মধ্যে DeepSeek এবং Alibaba (যার Qwen মডেলগুলিতে MoE উপাদান অন্তর্ভুক্ত) এর মতো সংস্থাগুলিও এটি ব্যবহার করছে। Ant-এর Ling-Plus-Base এটিকে দৃঢ়ভাবে এই অগ্রগামী দলটির মধ্যে স্থান দিয়েছে, হার্ডওয়্যার বাস্তবতা নেভিগেট করার জন্য আর্কিটেকচারাল উদ্ভাবনকে কাজে লাগিয়েছে।
দেশীয় হার্ডওয়্যার ইকোসিস্টেম: Nvidia শূন্যস্থান পূরণ
যদিও Ant গবেষণা পত্রে ব্যবহৃত হার্ডওয়্যারের নাম স্পষ্টভাবে উল্লেখ করা থেকে বিরত থেকেছে, পরবর্তী রিপোর্টিং, বিশেষ করে Bloomberg দ্বারা, ইঙ্গিত দিয়েছে যে এই কৃতিত্বে দেশীয়ভাবে ডিজাইন করা চিপ জড়িত ছিল। এর মধ্যে সম্ভাব্যভাবে Ant-এর অ্যাফিলিয়েট Alibaba থেকে উদ্ভূত প্রসেসর অন্তর্ভুক্ত রয়েছে, যার নিজস্ব চিপ ডিজাইন ইউনিট T-Head রয়েছে (Yitian 710 এর মতো CPU উৎপাদন করে এবং পূর্বে AI অ্যাক্সিলারেটর অন্বেষণ করেছে), এবং গুরুত্বপূর্ণভাবে, Huawei Technologies।
Huawei, নিজে তীব্র মার্কিন নিষেধাজ্ঞার সম্মুখীন হওয়া সত্ত্বেও, চীনা বাজারে Nvidia-র অফারগুলির সরাসরি বিকল্প হিসাবে তার Ascend সিরিজের AI অ্যাক্সিলারেটর (যেমন Ascend 910B) আক্রমনাত্মকভাবে বিকাশ করছে। এই চিপগুলি প্রধান চীনা প্রযুক্তি সংস্থাগুলি দ্বারা গৃহীত হচ্ছে বলে জানা গেছে। Ling-Plus-Base-এর মতো বড় একটি মডেলের জন্য Ant Group-এর এই ধরনের হার্ডওয়্যার কার্যকরভাবে ব্যবহার করার ক্ষমতা এই দেশীয় বিকল্পগুলির একটি উল্লেখযোগ্য বৈধতা উপস্থাপন করবে।
এটা মনে রাখা গুরুত্বপূর্ণ যে Ant Group সম্পূর্ণরূপে Nvidia ত্যাগ করেনি। রিপোর্টগুলি পরামর্শ দেয় যে Nvidia চিপগুলি Ant-এর AI ডেভেলপমেন্ট টুলকিটের অংশ হিসাবে রয়ে গেছে, সম্ভবত এমন কাজের জন্য ব্যবহৃত হয় যেখানে তাদের নির্দিষ্ট কর্মক্ষমতা বৈশিষ্ট্য বা পরিপক্ক সফ্টওয়্যার ইকোসিস্টেম (যেমন CUDA) সুবিধা প্রদান করে, বা লিগ্যাসি সিস্টেমের জন্য। এই পদক্ষেপটি রাতারাতি সম্পূর্ণ প্রতিস্থাপনের বিষয়ে অগত্যা নয়, বরং কার্যকর, সমান্তরাল পথ তৈরি করা যা কৌশলগত দুর্বলতা হ্রাস করে এবং খরচ নিয়ন্ত্রণ করে। এই হাইব্রিড পদ্ধতি কোম্পানিটিকে স্বাধীনতা চাষ করার সময় সেরা উপলব্ধ সরঞ্জামগুলি ব্যবহার করার অনুমতি দেয়। Ant Group নিজেই কর্পোরেট বিচক্ষণতার একটি মাত্রা বজায় রেখেছে, ব্যবহৃত নির্দিষ্ট চিপগুলির বিষয়ে আনুষ্ঠানিকভাবে মন্তব্য করতে অস্বীকার করেছে।
একটি বিস্তৃত প্রবণতা: AI স্বনির্ভরতার জন্য চীনের সম্মিলিত প্রচেষ্টা
Ant Group-এর উদ্যোগ বিচ্ছিন্নভাবে ঘটছে না। এটি মার্কিন রপ্তানি নিয়ন্ত্রণ দ্বারা আরোপিত সীমাবদ্ধতাগুলির চারপাশে উদ্ভাবনের জন্য চীনের প্রযুক্তি খাত জুড়ে একটি বৃহত্তর কৌশলগত প্রচেষ্টার প্রতিফলন ঘটায়। ‘টেক ওয়ার’ (tech war) গুরুত্বপূর্ণ প্রযুক্তি, বিশেষ করে সেমিকন্ডাক্টর এবং AI-তে বৃহত্তর স্বয়ংসম্পূর্ণতা অর্জনের প্রচেষ্টাকে অনুঘটক করেছে।
অন্যান্য প্রধান খেলোয়াড়রা অনুরূপ লক্ষ্য অনুসরণ করছে:
- ByteDance: TikTok-এর মূল কোম্পানিও তার AI উচ্চাকাঙ্ক্ষার জন্য বিকল্প চিপ, যার মধ্যে দেশীয় বিকল্পগুলিও রয়েছে, সুরক্ষিত এবং ব্যবহার করার জন্য কাজ করছে বলে জানা গেছে, যা সুপারিশ অ্যালগরিদম, জেনারেটিভ AI এবং আরও অনেক কিছু জুড়ে বিস্তৃত।
- DeepSeek: এই AI স্টার্ট-আপ, তার শক্তিশালী ওপেন-সোর্স মডেলগুলির জন্য পরিচিত, স্পষ্টভাবে প্রশিক্ষণের দক্ষতার উল্লেখ করে এবং MoE আর্কিটেকচার ব্যবহার করে মডেল তৈরি করেছে, যা কৌশলগুলির সাথে সামঞ্জস্যপূর্ণ যা শুধুমাত্র সবচেয়ে শক্তিশালী GPU-গুলির বিশাল ফ্লিটের উপর কম নির্ভরশীল।
- Baidu, Tencent, এবং অন্যরা: সমস্ত প্রধান চীনা ক্লাউড এবং প্রযুক্তি সংস্থাগুলি AI-তে প্রচুর বিনিয়োগ করছে এবং অনিবার্যভাবে হার্ডওয়্যার বৈচিত্র্যকরণের কৌশলগুলি অন্বেষণ করছে, যার মধ্যে দেশীয় চিপগুলির জন্য অপ্টিমাইজ করা এবং সম্ভাব্যভাবে তাদের নিজস্ব কাস্টম সিলিকন বিকাশ করা অন্তর্ভুক্ত।
সম্মিলিত বার্তাটি স্পষ্ট: যদিও Nvidia-র শীর্ষ-স্তরের পণ্যগুলিতে অ্যাক্সেস কাঙ্ক্ষিত থেকে যায়, চীনা প্রযুক্তি শিল্প সক্রিয়ভাবে বিকল্প সমাধানগুলি বিকাশ এবং বৈধতা দিচ্ছে। এর মধ্যে একটি বহু-মাত্রিক পদ্ধতি জড়িত: MoE-এর মতো দক্ষ মডেল আর্কিটেকচার গ্রহণ করা, বিভিন্ন হার্ডওয়্যার ব্যাকএন্ডের জন্য নিবিড় সফ্টওয়্যার অপ্টিমাইজেশন, এবং দেশীয়ভাবে উৎপাদিত চিপগুলির বিকাশ এবং গ্রহণকে সমর্থন করা।
ভাষা মডেলের বাইরে: স্বাস্থ্যসেবায় Ant-এর AI সম্প্রসারণ
Ant Group-এর AI প্রচেষ্টা ভিত্তিগত LLM-এর বাইরেও প্রসারিত। এর প্রশিক্ষণ দক্ষতার খবরের সাথে সাথে, কোম্পানিটি স্বাস্থ্যসেবা খাতের জন্য তৈরি তার AI সমাধানগুলির স্যুটে উল্লেখযোগ্য আপগ্রেড উন্মোচন করেছে। এই উদ্যোগটি একটি স্বতন্ত্র, স্ব-উন্নত স্বাস্থ্যসেবা-কেন্দ্রিক AI মডেলকে কাজে লাগায়।
আপগ্রেড করা সমাধানগুলিতে মাল্টিমোডাল ক্ষমতা (বিভিন্ন ডেটা প্রকার যেমন পাঠ্য, চিত্র এবং সম্ভাব্য অন্যান্য চিকিৎসা ডেটা প্রক্রিয়াকরণ) এবং অত্যাধুনিক চিকিৎসা যুক্তি অন্তর্ভুক্ত রয়েছে। এগুলি Ant যা ‘অল-ইন-ওয়ান মেশিন’ (all-in-one machines) হিসাবে বর্ণনা করে, সম্ভবত ক্লিনিকাল সেটিংস বা স্বাস্থ্য ব্যবস্থাপনার জন্য ডিজাইন করা ডিভাইস বা প্ল্যাটফর্মগুলিতে একত্রিত করা হয়েছে।
যদিও Ling-Plus-Base LLM খবর থেকে আপাতদৃষ্টিতে পৃথক, একটি সম্ভাব্য অন্তর্নিহিত সংযোগ রয়েছে। দেশীয় বিকল্প সহ হার্ডওয়্যারের মিশ্রণ ব্যবহার করে আরও সাশ্রয়ীভাবে শক্তিশালী AI মডেলগুলিকে প্রশিক্ষণ দেওয়ার ক্ষমতা, স্বাস্থ্যসেবার মতো খাতের জন্য বিশেষায়িত মডেলগুলির বিকাশ এবং স্থাপনার অর্থনৈতিক কার্যকারিতার ভিত্তি হতে পারে। AI বিকাশের ভিত্তিগত খরচ কমানো সম্পদগুলিকে ডোমেন-নির্দিষ্ট অ্যাপ্লিকেশনগুলিতে চালিত করার অনুমতি দেয়, সম্ভাব্যভাবে গুরুত্বপূর্ণ শিল্পগুলিতে ব্যবহারিক AI সরঞ্জামগুলির রোলআউটকে ত্বরান্বিত করে। এই স্বাস্থ্যসেবা উদ্যোগটি Ant-এর ফিনটেক মূলের বাইরে গিয়ে তার AI দক্ষতাকে ব্যাপকভাবে প্রয়োগ করার উচ্চাকাঙ্ক্ষাকে তুলে ধরে।
ভবিষ্যতের জন্য প্রভাব: AI পথে একটি বিভাজন?
Ant Group-এর নন-Nvidia, সম্ভবত দেশীয়, GPU ব্যবহার করে একটি বৃহৎ-স্কেল MoE মডেলের সফল প্রশিক্ষণ উল্লেখযোগ্য প্রভাব বহন করে:
- দেশীয় চিপগুলির জন্য বৈধতা: এটি Huawei-এর Ascend-এর মতো চীনা-ডিজাইন করা AI অ্যাক্সিলারেটরগুলির কার্যকারিতার জন্য একটি গুরুত্বপূর্ণ প্রমাণ বিন্দু হিসাবে কাজ করে, যা সম্ভাব্যভাবে চীনের মধ্যে তাদের গ্রহণকে বাড়িয়ে তুলবে।
- প্রতিযোগিতামূলক ল্যান্ডস্কেপ: এটি দেখায় যে চীনা কোম্পানিগুলি বিধিনিষেধ সত্ত্বেও অত্যাধুনিক AI বিকাশে প্রতিযোগিতামূলক থাকতে পারে, আর্কিটেকচারাল এবং সফ্টওয়্যার উদ্ভাবনকে কাজে লাগিয়ে।
- খরচের গতিশীলতা: ২০% খরচ হ্রাস বিকল্প হার্ডওয়্যার কার্যকরভাবে ব্যবহার করতে সক্ষম সংস্থাগুলির জন্য একটি সম্ভাব্য প্রতিযোগিতামূলক সুবিধার উপর আলোকপাত করে, যা সম্ভাব্যভাবে বিশ্বব্যাপী AI মূল্য নির্ধারণ এবং অ্যাক্সেসযোগ্যতাকে প্রভাবিত করে।
- Nvidia-র অবস্থান: যদিও Nvidia বিশ্বব্যাপী প্রভাবশালী রয়ে গেছে, এই প্রবণতাটি প্রবিধান এবং স্থানীয় প্রতিযোগীদের উত্থানের কারণে উল্লেখযোগ্য চীনা বাজারে এটির মুখোমুখি হওয়া চ্যালেঞ্জগুলিকে তুলে ধরে। এটি চীনের জন্য তৈরি রপ্তানি-সম্মত চিপগুলির Nvidia-র বিকাশকে ত্বরান্বিত করতে পারে, তবে বিকল্প পথটিকেও বৈধতা দেয়।
- প্রযুক্তিগত বিভাজন?: দীর্ঘমেয়াদে, হার্ডওয়্যার অ্যাক্সেস এবং সফ্টওয়্যার অপ্টিমাইজেশনে ক্রমাগত ভিন্নতা আংশিকভাবে স্বতন্ত্র AI ইকোসিস্টেমের দিকে নিয়ে যেতে পারে, যেখানে মডেল এবং সরঞ্জামগুলি বিভিন্ন অন্তর্নিহিত সিলিকনের জন্য অপ্টিমাইজ করা হয়।
Ant Group-এর Ling টিমের দ্বারা গৃহীত যাত্রাটি ভূ-রাজনৈতিক সীমাবদ্ধতার দ্বারা উৎসাহিত সম্পদশীলতার প্রতীক। MoE-এর মতো উন্নত মডেল আর্কিটেকচারগুলিকে উপলব্ধ দেশীয় হার্ডওয়্যারের জন্য অপ্টিমাইজ এবং ব্যবহার করার ইচ্ছার সাথে চতুরভাবে একত্রিত করে, তারা কৃত্রিম বুদ্ধিমত্তার গুরুত্বপূর্ণ ক্ষেত্রে ক্রমাগত অগ্রগতি নিশ্চিত করার একটি পথ তৈরি করেছে, যা সম্ভাব্যভাবে শিল্পের সংজ্ঞায়িত খরচ কাঠামো এবং কৌশলগত নির্ভরতাগুলিকে পুনর্নির্মাণ করছে। এটি এই ধারণার একটি প্রমাণ যে উদ্ভাবন প্রায়শই চাপের মধ্যে সবচেয়ে প্রাণবন্তভাবে বিকশিত হয়।