আর্ম ক্লিয়াইডাই (Arm Kleidi): আর্ম সিপিইউতে AI ইনফারেন্স অপ্টিমাইজ করা
আর্ম ক্লিয়াইডাই (Arm Kleidi) বিশেষভাবে এই চ্যালেঞ্জ মোকাবেলার জন্য ডিজাইন করা হয়েছে, আর্ম সিপিইউতে চলা সমস্ত AI ইনফারেন্স ওয়ার্কলোডের জন্য নির্বিঘ্ন পারফরম্যান্স অপ্টিমাইজেশন প্রদান করে। ক্লিয়াইডাই-এর কেন্দ্রে রয়েছে ক্লিয়াইডাইএআই (KleidiAI), যা AI কে ত্বরান্বিত করার জন্য নির্মিত অত্যন্ত দক্ষ, ওপেন-সোর্স আর্ম রুটিনের একটি সুবিন্যস্ত স্যুট।
ক্লিয়াইডাইএআই (KleidiAI) ইতিমধ্যেই এজ ডিভাইসের জন্য ব্যাপকভাবে ব্যবহৃত AI ফ্রেমওয়ার্কের সর্বশেষ সংস্করণগুলিতে একত্রিত হয়েছে। এর মধ্যে রয়েছে ExecuTorch, Llama.cpp, XNNPACK-এর মাধ্যমে LiteRT এবং MediaPipe। এই ব্যাপক ইন্টিগ্রেশন লক্ষ লক্ষ ডেভেলপারদের জন্য একটি উল্লেখযোগ্য সুবিধা প্রদান করে, যারা এখন কোনো অতিরিক্ত প্রচেষ্টা ছাড়াই স্বয়ংক্রিয়ভাবে AI পারফরম্যান্স অপ্টিমাইজেশন থেকে উপকৃত হতে পারে।
আলিবাবার সাথে অংশীদারিত্ব: Qwen2-VL-2B-Instruct মডেল
MNN-এর সাথে ঘনিষ্ঠ সহযোগিতার মাধ্যমে এজ ডিভাইসে মাল্টিমোডাল AI-এর অগ্রগতিতে একটি নতুন মাইলফলক অর্জিত হয়েছে। MNN হল আলিবাবা দ্বারা তৈরি এবং রক্ষণাবেক্ষণ করা একটি লাইটওয়েট, ওপেন সোর্স ডিপ লার্নিং ফ্রেমওয়ার্ক। এই অংশীদারিত্বের ফলে ক্লিয়াইডাইএআই (KleidiAI)-এর সফল ইন্টিগ্রেশন হয়েছে, যা আর্ম সিপিইউ ব্যবহার করে মোবাইল ডিভাইসে মাল্টিমোডাল AI ওয়ার্কলোডকে দক্ষতার সাথে চালাতে সক্ষম করে। এই সাফল্যের মূল চাবিকাঠি হল আলিবাবার নির্দেশ-টিউনড 2B প্যারামিটার Qwen2-VL-2B-Instruct মডেল। এই মডেলটি বিশেষভাবে ইমেজ বোঝা, টেক্সট-টু-ইমেজ যুক্তি এবং একাধিক ভাষা জুড়ে মাল্টিমোডাল প্রজন্মের জন্য ডিজাইন করা হয়েছে, যা এজ ডিভাইসের সীমাবদ্ধতার জন্য তৈরি।
পরিমাপযোগ্য কর্মক্ষমতা লাভ
MNN-এর সাথে ক্লিয়াইডাইএআই (KleidiAI)-এর ইন্টিগ্রেশন Qwen2-VL-2B-Instruct মডেলের জন্য উল্লেখযোগ্য, পরিমাপযোগ্য কর্মক্ষমতা উন্নতি করেছে। এজ-এ গুরুত্বপূর্ণ AI মাল্টিমোডাল ব্যবহারের ক্ষেত্রে দ্রুত প্রতিক্রিয়ার সময় পরিলক্ষিত হয়েছে। এই উন্নতিগুলি বিভিন্ন গ্রাহক-কেন্দ্রিক আলিবাবা অ্যাপ্লিকেশনগুলিতে উন্নত ব্যবহারকারীর অভিজ্ঞতা আনলক করে। উদাহরণগুলির মধ্যে রয়েছে:
- গ্রাহক পরিষেবার জন্য চ্যাটবট: গ্রাহকের জিজ্ঞাসার দ্রুত এবং আরও কার্যকর প্রতিক্রিয়া প্রদান করা।
- ই-শপিং অ্যাপ্লিকেশন: ফটো-টু-গুডস অনুসন্ধানের সুবিধা, গ্রাহকদের শুধুমাত্র একটি ছবি আপলোড করে তারা যে আইটেমগুলি খুঁজছেন তা দ্রুত খুঁজে পেতে অনুমতি দেয়৷
এই অ্যাপ্লিকেশনগুলিতে বর্ধিত গতি সরাসরি কর্মক্ষমতা লাভের ফলাফল:
- প্রি-ফিল উন্নতি: প্রি-ফিলে একটি উল্লেখযোগ্য ৫৭ শতাংশ কর্মক্ষমতা উন্নতি অর্জন করা হয়েছে। এটি সেই গুরুত্বপূর্ণ পর্যায়কে বোঝায় যেখানে AI মডেলগুলি প্রতিক্রিয়া তৈরি করার আগে বহু-উৎস প্রম্পট ইনপুটগুলি পরিচালনা করে।
- ডিকোড বর্ধিতকরণ: ডিকোডে ২৮ শতাংশ কর্মক্ষমতা উন্নতি পরিলক্ষিত হয়েছে। এটি সেই প্রক্রিয়া যেখানে AI মডেল একটি প্রম্পট প্রক্রিয়া করার পরে টেক্সট তৈরি করে।
গতির বাইরে, ক্লিয়াইডাইএআই (KleidiAI) ইন্টিগ্রেশন এজ-এ AI ওয়ার্কলোডগুলির আরও দক্ষ প্রক্রিয়াকরণে অবদান রাখে। এটি মাল্টিমোডাল ওয়ার্কলোডগুলির সাথে যুক্ত সামগ্রিক গণনামূলক খরচ কমিয়ে এটি অর্জন করে। এই কর্মক্ষমতা এবং দক্ষতার লাভ লক্ষ লক্ষ ডেভেলপারদের কাছে সহজেই অ্যাক্সেসযোগ্য। MNN ফ্রেমওয়ার্কে এবং অন্যান্য জনপ্রিয় AI ফ্রেমওয়ার্কগুলিতে যেখানে ক্লিয়াইডাইএআই (KleidiAI) একত্রিত হয়েছে সেখানে অ্যাপ্লিকেশন এবং ওয়ার্কলোড চালানো যেকোনো ডেভেলপার অবিলম্বে উপকৃত হতে পারে।
বাস্তব-বিশ্ব প্রদর্শন: MWC শোকেস
Qwen2-VL-2B-Instruct মডেলের ব্যবহারিক ক্ষমতা, MNN-এর সাথে নতুন ক্লিয়াইডাইএআই (KleidiAI) ইন্টিগ্রেশন দ্বারা চালিত, মোবাইল ওয়ার্ল্ড কংগ্রেসে (MWC) প্রদর্শিত হয়েছিল। আর্ম বুথে একটি প্রদর্শনীতে ভিজ্যুয়াল এবং টেক্সট ইনপুটগুলির বিভিন্ন সমন্বয় বোঝার জন্য মডেলটির ক্ষমতা তুলে ধরা হয়েছিল। মডেলটি তখন চিত্রের বিষয়বস্তুর একটি সংক্ষিপ্ত সারসংক্ষেপ সহ প্রতিক্রিয়া জানায়। এই সম্পূর্ণ প্রক্রিয়াটি স্মার্টফোনের আর্ম সিপিইউতে সম্পাদিত হয়েছিল, যা সমাধানের শক্তি এবং দক্ষতা প্রদর্শন করে। এই স্মার্টফোনগুলি MediaTek-এর আর্ম-চালিত Dimensity 9400 মোবাইল সিস্টেম-অন-চিপ (SoC) এর উপর নির্মিত হয়েছিল, যার মধ্যে vivo X200 সিরিজ অন্তর্ভুক্ত ছিল।
ব্যবহারকারীর অভিজ্ঞতায় একটি উল্লেখযোগ্য পদক্ষেপ
আর্মের ক্লিয়াইডাইএআই (KleidiAI)-এর সাথে আলিবাবার Qwen2-VL-2B-Instruct মডেলের জন্য MNN ফ্রেমওয়ার্কের ইন্টিগ্রেশন মাল্টিমোডাল AI ওয়ার্কলোডগুলির জন্য ব্যবহারকারীর অভিজ্ঞতায় একটি উল্লেখযোগ্য অগ্রগতি উপস্থাপন করে। এই অগ্রগতি এই উন্নত অভিজ্ঞতাগুলিকে সরাসরি এজ-এ সরবরাহ করে, যা সমস্ত আর্ম সিপিইউ দ্বারা চালিত। এই ক্ষমতাগুলি মোবাইল ডিভাইসে সহজেই উপলব্ধ, যেখানে শীর্ষস্থানীয় গ্রাহক-মুখী অ্যাপ্লিকেশনগুলি ইতিমধ্যেই ক্লিয়াইডাইএআই (KleidiAI)-এর সুবিধাগুলি ব্যবহার করছে।
এজ ডিভাইসে মাল্টিমোডাল AI-এর ভবিষ্যত
সামনের দিকে তাকালে, AI ওয়ার্কলোডগুলির জন্য ক্লিয়াইডাইএআই (KleidiAI)-এর নির্বিঘ্ন অপ্টিমাইজেশন লক্ষ লক্ষ ডেভেলপারদের ক্ষমতায়ন করতে থাকবে। তারা এজ ডিভাইসে ক্রমবর্ধমান অত্যাধুনিক মাল্টিমোডাল অভিজ্ঞতা তৈরি করতে সক্ষম হবে। এই ক্রমাগত উদ্ভাবন AI-এর চলমান বিবর্তনে একটি উল্লেখযোগ্য পদক্ষেপ চিহ্নিত করে, বুদ্ধিমান কম্পিউটিংয়ের পরবর্তী তরঙ্গের পথ প্রশস্ত করবে।
আলিবাবা নেতৃত্বের উদ্ধৃতি
“আমরা আলিবাবা ক্লাউডের বৃহৎ ভাষা মডেল Qwen, আর্ম ক্লিয়াইডাইএআই (Arm KleidiAI) এবং MNN-এর মধ্যে সহযোগিতা দেখে আনন্দিত। আর্ম ক্লিয়াইডাইএআই (Arm KleidiAI)-এর সাথে MNN-এর অন-ডিভাইস ইনফারেন্স ফ্রেমওয়ার্ককে একীভূত করা Qwen-এর বিলম্ব এবং শক্তি দক্ষতাকে উল্লেখযোগ্যভাবে উন্নত করেছে। এই অংশীদারিত্ব মোবাইল ডিভাইসে LLM-এর সম্ভাবনাকে বৈধতা দেয় এবং AI ব্যবহারকারীর অভিজ্ঞতা বাড়ায়। আমরা অন-ডিভাইস AI কম্পিউটিংকে এগিয়ে নেওয়ার জন্য ক্রমাগত প্রচেষ্টার জন্য উন্মুখ।” - ডং জু, জিএম অফ টংগি লার্জ মডেল বিজনেস, আলিবাবা ক্লাউড।
“MNN ইনফারেন্স ফ্রেমওয়ার্ক এবং আর্ম ক্লিয়াইডাইএআই (Arm KleidiAI)-এর মধ্যে প্রযুক্তিগত ইন্টিগ্রেশন অন-ডিভাইস ত্বরণে একটি বড় অগ্রগতি চিহ্নিত করে। আর্কিটেকচারের যৌথ অপ্টিমাইজেশনের মাধ্যমে, আমরা টংগি এলএলএম (Tongyi LLM)-এর অন-ডিভাইস ইনফারেন্স দক্ষতা ব্যাপকভাবে উন্নত করেছি, সীমিত মোবাইল কম্পিউটিং পাওয়ার এবং উন্নত AI ক্ষমতার মধ্যে ব্যবধান কমিয়েছি। এই অর্জন আমাদের প্রযুক্তিগত দক্ষতা এবং ক্রস-ইন্ডাস্ট্রি সহযোগিতাকে তুলে ধরে। আমরা অন-ডিভাইস কম্পিউটিং ইকোসিস্টেমকে উন্নত করতে, মোবাইলে মসৃণ এবং আরও দক্ষ AI অভিজ্ঞতা প্রদানের জন্য এই অংশীদারিত্ব চালিয়ে যাওয়ার জন্য উন্মুখ।” - জিয়াওটাং জিয়াং, MNN-এর প্রধান, তাওবাও এবং টিমল গ্রুপ, আলিবাবা।
প্রযুক্তিগত দিকগুলির গভীরে অনুসন্ধান
এই সহযোগিতার তাৎপর্য সম্পূর্ণরূপে উপলব্ধি করার জন্য, কিছু অন্তর্নিহিত প্রযুক্তিগত বিবরণ পরীক্ষা করা সহায়ক।
MNN এর ভূমিকা
MNN এর ডিজাইন দর্শন দক্ষতা এবং বহনযোগ্যতার উপর কেন্দ্র করে। এটি বিভিন্ন মূল বৈশিষ্ট্যের মাধ্যমে এটি অর্জন করে:
- লাইটওয়েট আর্কিটেকচার: MNN কে একটি ছোট ফুটপ্রিন্ট রাখার জন্য ডিজাইন করা হয়েছে, এজ ডিভাইসে স্টোরেজ এবং মেমরির প্রয়োজনীয়তা কমিয়ে আনা হয়েছে।
- অপ্টিমাইজড অপারেশন: ফ্রেমওয়ার্কটিতে আর্ম সিপিইউ-এর জন্য বিশেষভাবে তৈরি করা অত্যন্ত অপ্টিমাইজ করা গাণিতিক অপারেশনগুলিকে অন্তর্ভুক্ত করা হয়েছে, যা কর্মক্ষমতা সর্বাধিক করে।
- ক্রস-প্ল্যাটফর্ম সামঞ্জস্যতা: MNN অপারেটিং সিস্টেম এবং হার্ডওয়্যার প্ল্যাটফর্মের বিস্তৃত পরিসরকে সমর্থন করে, এটি ডেভেলপারদের জন্য একটি বহুমুখী পছন্দ করে তোলে।
ক্লিয়াইডাইএআই (KleidiAI) এর অবদান
ক্লিয়াইডাইএআই (KleidiAI), MNN এর শক্তির পরিপূরক, বিশেষায়িত রুটিনগুলির একটি সেট সরবরাহ করে যা AI ইনফারেন্সকে আরও ত্বরান্বিত করে। এই রুটিনগুলি আর্মের সিপিইউ আর্কিটেকচারের ব্যাপক অভিজ্ঞতাকে কাজে লাগিয়ে পারফরম্যান্স লাভ করে যা অন্যথায় অর্জন করা কঠিন হবে। ক্লিয়াইডাইএআই (KleidiAI) এর অবদানের মূল দিকগুলির মধ্যে রয়েছে:
- অত্যন্ত অপ্টিমাইজ করা কার্নেল: ক্লিয়াইডাইএআই (KleidiAI) সাধারণ AI অপারেশন, যেমন ম্যাট্রিক্স গুণ এবং কনভোলিউশনের জন্য অত্যন্ত অপ্টিমাইজ করা কার্নেল সরবরাহ করে। এই কার্নেলগুলি আর্ম সিপিইউ-এর নির্দিষ্ট বৈশিষ্ট্যগুলির সুবিধা নেওয়ার জন্য সতর্কতার সাথে টিউন করা হয়।
- স্বয়ংক্রিয় ইন্টিগ্রেশন: জনপ্রিয় AI ফ্রেমওয়ার্কগুলিতে ক্লিয়াইডাইএআই (KleidiAI)-এর নির্বিঘ্ন ইন্টিগ্রেশনের অর্থ হল ডেভেলপারদের ম্যানুয়ালি এই অপ্টিমাইজেশনগুলিকে অন্তর্ভুক্ত করার প্রয়োজন নেই। পারফরম্যান্সের সুবিধাগুলি স্বয়ংক্রিয়ভাবে প্রয়োগ করা হয়, যা বিকাশের প্রক্রিয়াটিকে সহজ করে।
- ক্রমাগত উন্নতি: আর্ম ক্লিয়াইডাইএআই (KleidiAI)-কে ক্রমাগত আপডেট এবং উন্নত করতে প্রতিশ্রুতিবদ্ধ, এটি নিশ্চিত করে যে এটি AI ত্বরণ প্রযুক্তির অগ্রভাগে রয়েছে।
Qwen2-VL-2B-Instruct: একটি শক্তিশালী মাল্টিমোডাল মডেল
Qwen2-VL-2B-Instruct মডেলটি বৃহৎ ভাষা মডেল এবং মাল্টিমোডাল AI-তে আলিবাবার দক্ষতার একটি প্রমাণ। এর মূল বৈশিষ্ট্যগুলির মধ্যে রয়েছে:
- নির্দেশনা টিউনিং: মডেলটি বিশেষভাবে নির্দেশাবলী অনুসরণ করার জন্য টিউন করা হয়েছে, এটি বিভিন্ন ধরণের কাজের সাথে অত্যন্ত অভিযোজিত করে তোলে।
- মাল্টিমোডাল ক্ষমতা: এটি ভিজ্যুয়াল এবং টেক্সচুয়াল উভয় তথ্য বোঝা এবং প্রক্রিয়াকরণে পারদর্শী, ইমেজ ক্যাপশনিং এবং ভিজ্যুয়াল প্রশ্ন উত্তরের মতো অ্যাপ্লিকেশনগুলিকে সক্ষম করে।
- বহুভাষিক সমর্থন: মডেলটি একাধিক ভাষার সাথে কাজ করার জন্য ডিজাইন করা হয়েছে, বিভিন্ন অঞ্চল এবং ব্যবহারকারীর ভিত্তিতে এর প্রযোজ্যতা প্রসারিত করে।
- এজ ডিভাইসের জন্য অপ্টিমাইজ করা: এর শক্তিশালী ক্ষমতা থাকা সত্ত্বেও, মডেলটি এজ ডিভাইসের সম্পদের সীমাবদ্ধতার মধ্যে কাজ করার জন্য সতর্কতার সাথে ডিজাইন করা হয়েছে।
মাল্টিমোডাল AI এর সুযোগ প্রসারিত করা
এখানে আলোচিত অগ্রগতিগুলি কেবল স্মার্টফোনের মধ্যে সীমাবদ্ধ নয়। একই নীতি এবং প্রযুক্তিগুলি বিভিন্ন এজ ডিভাইসে প্রয়োগ করা যেতে পারে, যার মধ্যে রয়েছে:
- স্মার্ট হোম ডিভাইস: ভয়েস অ্যাসিস্ট্যান্ট, সিকিউরিটি ক্যামেরার জন্য ইমেজ রিকগনিশন এবং অন্যান্য বুদ্ধিমান বৈশিষ্ট্যগুলিকে সক্ষম করা।
- পরিধানযোগ্য ডিভাইস: স্বাস্থ্য পর্যবেক্ষণ, ফিটনেস ট্র্যাকিং এবং অগমেন্টেড রিয়েলিটি অ্যাপ্লিকেশনগুলিকে শক্তিশালী করা।
- শিল্প IoT: ভবিষ্যদ্বাণীমূলক রক্ষণাবেক্ষণ, গুণমান নিয়ন্ত্রণ এবং উত্পাদন সেটিংসে অটোমেশন সহজতর করা।
- অটোমোটিভ: ড্রাইভার সহায়তা সিস্টেম, ইন-ক্যাবিন বিনোদন এবং স্বায়ত্তশাসিত ড্রাইভিং ক্ষমতা বৃদ্ধি করা।
এজ-এ মাল্টিমোডাল AI-এর সম্ভাব্য অ্যাপ্লিকেশনগুলি বিশাল এবং ক্রমাগত প্রসারিত হচ্ছে। মডেলগুলি আরও অত্যাধুনিক হওয়ার সাথে সাথে এবং হার্ডওয়্যার আরও শক্তিশালী হওয়ার সাথে সাথে, আমরা আরও উদ্ভাবনী এবং প্রভাবশালী ব্যবহারের ক্ষেত্রগুলি আবির্ভূত হতে দেখতে আশা করতে পারি। আর্ম এবং আলিবাবার মধ্যে এই সহযোগিতা সেই দিকে একটি উল্লেখযোগ্য পদক্ষেপ, মাল্টিমোডাল AI-এর শক্তিকে বৃহত্তর দর্শকদের কাছে নিয়ে আসে এবং বুদ্ধিমান ডিভাইসগুলির একটি নতুন প্রজন্মকে সক্ষম করে। দক্ষতা, কর্মক্ষমতা এবং ডেভেলপারদের অ্যাক্সেসযোগ্যতার উপর ফোকাস নিশ্চিত করে যে এই অগ্রগতিগুলির প্রযুক্তির ভবিষ্যতের উপর একটি বিস্তৃত এবং স্থায়ী প্রভাব থাকবে।