AI মডেল প্রশিক্ষণে Ant-এর উদ্ভাবনী পদ্ধতি
জ্যাক মা-সমর্থিত ফিনটেক জায়ান্ট Ant Group চীনা-নির্মিত সেমিকন্ডাক্টর ব্যবহার করে কৃত্রিম বুদ্ধিমত্তার (AI) ক্ষেত্রে একটি উল্লেখযোগ্য অগ্রগতি অর্জন করেছে। এই উদ্ভাবনী পদ্ধতি কোম্পানিটিকে AI মডেল প্রশিক্ষণের জন্য কৌশল তৈরি করতে সক্ষম করেছে, যার ফলে খরচে ২০% উল্লেখযোগ্য হ্রাস ঘটেছে। এই বিষয়ে পরিচিত সূত্রগুলি প্রকাশ করেছে যে Ant দেশীয় চিপ ব্যবহার করেছে, যার মধ্যে রয়েছে এর সহযোগী সংস্থা Alibaba Group Holding Ltd. এবং Huawei Technologies Co.-এর চিপ। এই চিপগুলি Mixture of Experts (MoE) মেশিন লার্নিং পদ্ধতি ব্যবহার করে মডেলগুলিকে প্রশিক্ষণ দেওয়ার জন্য ব্যবহৃত হয়েছিল।
Ant দ্বারা অর্জিত ফলাফলগুলি Nvidia Corp.-এর চিপগুলি ব্যবহার করে প্রাপ্ত ফলাফলের সাথে তুলনীয় ছিল, যেমন H800, একটি শক্তিশালী প্রসেসর যা মার্কিন যুক্তরাষ্ট্র দ্বারা চীনে রপ্তানি করা নিষিদ্ধ। যদিও Ant AI উন্নয়নের জন্য Nvidia ব্যবহার করা চালিয়ে যাচ্ছে, এটি ক্রমবর্ধমানভাবে বিকল্পগুলির উপর নির্ভর করছে, যার মধ্যে রয়েছে Advanced Micro Devices Inc. (AMD) এবং চীনা চিপ, তার সর্বশেষ মডেলগুলির জন্য।
AI প্রতিযোগিতায় প্রবেশ: চীন বনাম মার্কিন যুক্তরাষ্ট্র
AI মডেল উন্নয়নে Ant-এর প্রবেশ এটিকে চীনা এবং মার্কিন কোম্পানিগুলির মধ্যে একটি উত্তপ্ত প্রতিযোগিতার মধ্যে স্থাপন করে। এই প্রতিযোগিতাটি আরও তীব্র হয়েছে যখন DeepSeek দেখিয়েছে যে OpenAI এবং Alphabet Inc.-এর Google-এর মতো শিল্প জায়ান্টদের তুলনায় অনেক কম খরচে অত্যন্ত সক্ষম মডেল প্রশিক্ষণের সম্ভাবনা রয়েছে, যারা বিলিয়ন বিলিয়ন ডলার বিনিয়োগ করেছে। Ant-এর এই সাফল্য সবচেয়ে উন্নত Nvidia সেমিকন্ডাক্টরের স্থানীয়ভাবে উৎপাদিত বিকল্পগুলি ব্যবহার করার জন্য চীনা কোম্পানিগুলির দৃঢ় সংকল্পকে তুলে ধরে।
সাশ্রয়ী AI Inferencing-এর প্রতিশ্রুতি
এই মাসে প্রকাশিত Ant-এর গবেষণা পত্রটি তার মডেলগুলির সম্ভাব্যতা তুলে ধরেছে, Meta Platforms Inc.-এর তুলনায় নির্দিষ্ট মানদণ্ডে উন্নত কর্মক্ষমতা দাবি করেছে, যদিও এই দাবিগুলি Bloomberg News দ্বারা স্বাধীনভাবে যাচাই করা হয়নি। তবুও, যদি Ant-এর প্ল্যাটফর্মগুলি বিজ্ঞাপিত হিসাবে কাজ করে, তবে তারা চীনা কৃত্রিম বুদ্ধিমত্তা উন্নয়নে একটি উল্লেখযোগ্য অগ্রগতির প্রতিনিধিত্ব করতে পারে। এটি প্রাথমিকভাবে তাদের inferencing-এর খরচ কমানোর ক্ষমতার কারণে, যা AI পরিষেবাগুলিকে সমর্থন করার প্রক্রিয়া।
Mixture of Experts: AI-তে একটি গেম-চেঞ্জার
যেহেতু কোম্পানিগুলি AI-তে প্রচুর পরিমাণে সম্পদ ঢেলে দিচ্ছে, MoE মডেলগুলি একটি জনপ্রিয় এবং দক্ষ পদ্ধতি হিসাবে প্রাধান্য পেয়েছে। এই কৌশলটি, Google এবং Hangzhou-ভিত্তিক স্টার্টআপ DeepSeek-এর মতো কোম্পানিগুলি দ্বারা নিযুক্ত, কাজগুলিকে ছোট ছোট ডেটা সেটে বিভক্ত করে। এটি একটি বিশেষজ্ঞদের দলের মতো, যারা প্রত্যেকে একটি কাজের নির্দিষ্ট অংশে মনোযোগ দেয়, যার ফলে সামগ্রিক প্রক্রিয়াটি অপ্টিমাইজ করা হয়।
GPU-এর সীমাবদ্ধতা অতিক্রম করা
ঐতিহ্যগতভাবে, MoE মডেলগুলির প্রশিক্ষণ উচ্চ-পারফরম্যান্স চিপগুলির উপর ব্যাপকভাবে নির্ভরশীল, যেমন Nvidia দ্বারা নির্মিত গ্রাফিক্স প্রসেসিং ইউনিট (GPU)। এই চিপগুলির অত্যধিক খরচ অনেক ছোট ফার্মের জন্য একটি প্রধান বাধা হয়ে দাঁড়িয়েছে, MoE মডেলগুলির ব্যাপক গ্রহণকে সীমিত করেছে। তবে, Ant বৃহৎ ভাষা মডেল (LLM) গুলিকে আরও দক্ষতার সাথে প্রশিক্ষণ দেওয়ার পদ্ধতি নিয়ে অধ্যবসায়ের সাথে কাজ করে চলেছে, কার্যকরভাবে এই সীমাবদ্ধতা দূর করছে। তাদের গবেষণা পত্রের শিরোনাম, যা ‘প্রিমিয়াম GPU ছাড়াই’ একটি মডেল স্কেল করার লক্ষ্য নির্ধারণ করে, এই উদ্দেশ্যটিকে স্পষ্টভাবে প্রতিফলিত করে।
Nvidia-র আধিপত্যকে চ্যালেঞ্জ
Ant-এর পদ্ধতি সরাসরি Nvidia-র CEO, Jensen Huang-এর প্রচারিত কৌশলকে চ্যালেঞ্জ করে। Huang ক্রমাগত যুক্তি দিয়েছেন যে DeepSeek-এর R1-এর মতো আরও দক্ষ মডেলের উত্থান সত্ত্বেও কম্পিউটেশনাল চাহিদা বাড়তে থাকবে। তিনি বিশ্বাস করেন যে কোম্পানিগুলির খরচ কমানোর জন্য সস্তা চিপের পরিবর্তে উচ্চতর আয় তৈরি করতে আরও ভাল চিপের প্রয়োজন হবে। ফলস্বরূপ, Nvidia উন্নত প্রসেসিং কোর, ট্রানজিস্টর এবং বর্ধিত মেমরি ক্ষমতা সহ বৃহৎ GPU তৈরির উপর তার মনোযোগ বজায় রেখেছে।
খরচের সাশ্রয়ের পরিমাণ নির্ধারণ
Ant তার অপ্টিমাইজ করা পদ্ধতির খরচ-কার্যকারিতা প্রদর্শনের জন্য কংক্রিট পরিসংখ্যান সরবরাহ করেছে। কোম্পানি জানিয়েছে যে উচ্চ-পারফরম্যান্স হার্ডওয়্যার ব্যবহার করে ১ ট্রিলিয়ন টোকেন প্রশিক্ষণের জন্য প্রায় ৬.৩৫ মিলিয়ন ইউয়ান ($৮৮০,০০০) খরচ হবে। যাইহোক, নিম্ন-স্পেসিফিকেশন হার্ডওয়্যার এবং এর অপ্টিমাইজ করা কৌশলগুলি ব্যবহার করে, Ant এই খরচ কমিয়ে ৫.১ মিলিয়ন ইউয়ান করতে পারে। টোকেনগুলি তথ্যের এককগুলিকে উপস্থাপন করে যা একটি মডেল বিশ্ব সম্পর্কে জানতে এবং ব্যবহারকারীর প্রশ্নের প্রাসঙ্গিক প্রতিক্রিয়া সরবরাহ করতে প্রক্রিয়া করে।
শিল্প সমাধানের জন্য AI সাফল্যের ব্যবহার
Ant স্বাস্থ্যসেবা এবং ফিনান্সের মতো সেক্টরের জন্য শিল্প AI সমাধান তৈরি করতে বৃহৎ ভাষা মডেল, বিশেষ করে Ling-Plus এবং Ling-Lite-এ তার সাম্প্রতিক অগ্রগতিগুলিকে কাজে লাগানোর পরিকল্পনা করেছে। এই মডেলগুলি নির্দিষ্ট শিল্পের চাহিদা মেটাতে এবং উপযুক্ত সমাধান প্রদানের জন্য ডিজাইন করা হয়েছে।
স্বাস্থ্যসেবায় AI অ্যাপ্লিকেশনের প্রসার
Ant-এর স্বাস্থ্যসেবার প্রতিশ্রুতির প্রমাণ পাওয়া যায় চীনা অনলাইন প্ল্যাটফর্ম Haodf.com-কে তার কৃত্রিম বুদ্ধিমত্তা পরিষেবাগুলিতে একীভূত করার মাধ্যমে। AI Doctor Assistant তৈরির মাধ্যমে, Ant-এর লক্ষ্য হল Haodf-এর ২৯০,০০০ ডাক্তারের বিস্তৃত নেটওয়ার্ককে মেডিকেল রেকর্ড পরিচালনার মতো কাজে সহায়তা করা। AI-এর এই প্রয়োগ স্বাস্থ্যসেবা সরবরাহে দক্ষতা এবং নির্ভুলতা উন্নত করার সম্ভাবনা রাখে।
দৈনন্দিন জীবনের জন্য AI-চালিত সহায়তা
স্বাস্থ্যসেবার বাইরে, Ant Zhixiaobao নামে একটি AI ‘লাইফ অ্যাসিস্ট্যান্ট’ অ্যাপ এবং Maxiaocai নামে একটি আর্থিক উপদেষ্টা AI পরিষেবা তৈরি করেছে। এই অ্যাপ্লিকেশনগুলি দৈনন্দিন জীবনের বিভিন্ন ক্ষেত্রে AI-কে একীভূত করার জন্য Ant-এর উচ্চাকাঙ্ক্ষাকে প্রদর্শন করে, ব্যবহারকারীদের ব্যক্তিগতকৃত এবং বুদ্ধিমান সহায়তা প্রদান করে।
বেঞ্চমার্কিং পারফরম্যান্স: Ling মডেল বনাম প্রতিযোগী
তার গবেষণা পত্রে, Ant দাবি করেছে যে Ling-Lite মডেলটি ইংরেজি-ভাষা বোঝার জন্য একটি মূল মানদণ্ডে Meta-র একটি Llama মডেলকে ছাড়িয়ে গেছে। উপরন্তু, Ling-Lite এবং Ling-Plus উভয় মডেলই চীনা-ভাষার মানদণ্ডে DeepSeek-এর সমতুল্যগুলির তুলনায় উন্নত কর্মক্ষমতা প্রদর্শন করেছে। এটি AI ল্যান্ডস্কেপে Ant-এর প্রতিযোগিতামূলক অবস্থানকে তুলে ধরে।
যেমন রবিন ইউ, বেইজিং-ভিত্তিক AI সমাধান প্রদানকারী Shengshang Tech Co.-এর চিফ টেকনোলজি অফিসার, উপযুক্তভাবে বলেছেন, ‘যদি আপনি বিশ্বের সেরা কুংফু মাস্টারকে পরাজিত করার জন্য একটি আক্রমণের পয়েন্ট খুঁজে পান, আপনি এখনও বলতে পারেন যে আপনি তাদের পরাজিত করেছেন, যে কারণে বাস্তব-বিশ্বের প্রয়োগ গুরুত্বপূর্ণ।’
সহযোগিতা এবং উদ্ভাবনের জন্য ওপেন-সোর্সিং
Ant Ling মডেলগুলিকে ওপেন সোর্স করেছে, AI সম্প্রদায়ের মধ্যে সহযোগিতা এবং উদ্ভাবনকে উৎসাহিত করেছে। Ling-Lite-এ ১৬.৮ বিলিয়ন প্যারামিটার রয়েছে, যা সামঞ্জস্যযোগ্য সেটিংস যা মডেলের কর্মক্ষমতা নিয়ন্ত্রণ করে। অন্যদিকে, Ling-Plus-এ উল্লেখযোগ্যভাবে বৃহত্তর ২৯০ বিলিয়ন প্যারামিটার রয়েছে, যা এটিকে বৃহত্তর ভাষা মডেলগুলির মধ্যে স্থাপন করে। প্রসঙ্গ সরবরাহ করার জন্য, বিশেষজ্ঞরা অনুমান করেন যে ChatGPT-র GPT-4.5-এর প্রায় ১.৮ ট্রিলিয়ন প্যারামিটার রয়েছে, যেখানে DeepSeek-R1-এর ৬৭১ বিলিয়ন রয়েছে।
মডেল প্রশিক্ষণে চ্যালেঞ্জ মোকাবেলা
এই মডেলগুলি বিকাশে Ant-এর যাত্রা চ্যালেঞ্জ ছাড়া ছিল না। কোম্পানি প্রশিক্ষণের নির্দিষ্ট ক্ষেত্রে, বিশেষ করে স্থিতিশীলতা সংক্রান্ত ক্ষেত্রে অসুবিধার সম্মুখীন হয়েছিল। হার্ডওয়্যার বা মডেলের গঠনে সামান্য পরিবর্তনও সমস্যার কারণ হতে পারে, যার মধ্যে মডেলগুলির ত্রুটির হারে ওঠানামা অন্তর্ভুক্ত। এটি উন্নত AI মডেল প্রশিক্ষণে জড়িত জটিলতা এবং সংবেদনশীলতাকে তুলে ধরে।
স্বাস্থ্যসেবায় বাস্তব-বিশ্বের স্থাপনা
Ant-এর ব্যবহারিক প্রয়োগের প্রতিশ্রুতি আরও প্রমাণিত হয় স্বাস্থ্যসেবা-কেন্দ্রিক বৃহৎ মডেল মেশিন স্থাপনের মাধ্যমে। এই মেশিনগুলি বর্তমানে বেইজিং এবং সাংহাইয়ের মতো প্রধান শহরগুলিতে সাতটি হাসপাতাল এবং স্বাস্থ্যসেবা প্রদানকারী ব্যবহার করছে। বৃহৎ মডেলটি চিকিৎসা পরামর্শ পরিষেবা প্রদানের জন্য DeepSeek R1, Alibaba-র Qwen এবং Ant-এর নিজস্ব LLM ব্যবহার করে।
উন্নত স্বাস্থ্যসেবা পরিষেবার জন্য AI এজেন্ট
বৃহৎ মডেল মেশিনগুলি ছাড়াও, Ant দুটি মেডিকেল AI এজেন্ট চালু করেছে: Angel এবং Yibaoer। Angel ইতিমধ্যেই ১,০০০ টিরও বেশি চিকিৎসা সুবিধায় পরিষেবা দিয়েছে, যেখানে Yibaoer চিকিৎসা বীমা পরিষেবাগুলির জন্য সহায়তা প্রদান করে। উপরন্তু, পূর্ববর্তী বছরের সেপ্টেম্বরে, Ant তার Alipay পেমেন্ট অ্যাপের মধ্যে AI Healthcare Manager পরিষেবা চালু করেছে, স্বাস্থ্যসেবা খাতে তার নাগাল আরও প্রসারিত করেছে। এই উদ্যোগগুলি স্বাস্থ্যসেবা সরবরাহকে রূপান্তর এবং উন্নত করতে AI ব্যবহার করার জন্য Ant-এর উৎসর্গকে প্রদর্শন করে।