এআই চিপস ও অবকাঠামো: নতুন ভাবনা

ডিপসিক (DeepSeek) যুগের পরে এআই চিপস এবং অবকাঠামো নিয়ে নতুন করে চিন্তা করা

ডিপসিকের (DeepSeek) অগ্রগতির দ্বারা প্রমাণিত এআই প্রযুক্তির দ্রুত উদ্ভাবনের গতি ডেটা সেন্টার, চিপস এবং প্রয়োজনীয় কম্পিউটিং ক্ষমতা প্রদানের জন্য আমরা যেভাবে সিস্টেম তৈরি করি তার একটি মৌলিক পুনর্মূল্যায়ন প্রয়োজন। ডিপসিকের প্রকৌশল উদ্ভাবনগুলি এআই কম্পিউটিংয়ের খরচ উল্লেখযোগ্যভাবে হ্রাস করেছে, যা এআই অবকাঠামোর ভবিষ্যৎ নিয়ে একটি বৃহত্তর আলোচনার জন্ম দিয়েছে।

ডিপসিক (DeepSeek) হয়তো এআই প্রযুক্তির সীমানা খুব বেশি প্রসারিত করেনি, তবে এআই বাজারে এর প্রভাব গভীর। মিক্সচার অফ এক্সপার্টস (Mixture of Experts - MoE), মাল্টি-লেয়ার অ্যাটেনশন (Multi-Layer Attention - MLA), এবং মাল্টি-টোকেন প্রেডিকশন (Multi-Token Prediction - MTP) এর মতো প্রযুক্তিগুলি ডিপসিকের পাশাপাশি প্রাধান্য পেয়েছে। যদিও এই প্রযুক্তিগুলির সবকটি ডিপসিক দ্বারা সূচিত হয়নি, তবে তাদের সফল বাস্তবায়ন ব্যাপক গ্রহণকে উৎসাহিত করেছে। বিশেষ করে MLA, প্রান্ত ডিভাইস থেকে শুরু করে ক্লাউড কম্পিউটিং পর্যন্ত বিভিন্ন প্ল্যাটফর্মে আলোচনার কেন্দ্রবিন্দুতে পরিণত হয়েছে।

MLA এবং অ্যালগরিদম উদ্ভাবনের চ্যালেঞ্জ

নেক্সটসিলিকনের (NextSilicon) সিইও এলাদ রাজ (Elad Raz) সম্প্রতি উল্লেখ করেছেন যে MLA মেমরি দক্ষতা উন্নত করলেও এটি ডেভেলপারদের জন্য কাজের চাপ বাড়াতে পারে এবং উৎপাদন পরিবেশে এআই-এর প্রয়োগকে জটিল করতে পারে। জিপিইউ (GPU) ব্যবহারকারীদের MLA-এর জন্য ‘হ্যান্ড-কোড’ অপটিমাইজেশনে নিযুক্ত হতে হতে পারে। এই উদাহরণটি ডিপসিক (DeepSeek) পরবর্তী যুগে এআই চিপস এবং অবকাঠামো আর্কিটেকচারের বাস্তবায়ন পুনর্বিবেচনা করার প্রয়োজনীয়তার উপর জোর দেয়।

MLA-এর তাৎপর্য বুঝতে হলে লার্জ ল্যাঙ্গুয়েজ মডেলের (Large Language Models - LLMs) অন্তর্নিহিত ধারণাগুলিবোঝা অপরিহার্য। ব্যবহারকারীর ইনপুটের প্রতিক্রিয়া তৈরি করার সময় LLM গুলি KV ভেক্টর - কী (keys) এবং ভ্যালুগুলির (values) উপর অনেক বেশি নির্ভর করে, যা মডেলটিকে প্রাসঙ্গিক ডেটার উপর মনোযোগ দিতে সক্ষম করে। অ্যাটেনশন মেকানিজমে, মডেলটি সবচেয়ে প্রাসঙ্গিক বিষয়বস্তু নির্ধারণ করতে কীগুলির সাথে নতুন অনুরোধের তুলনা করে।

এলাদ রাজ (Elad Raz) একটি বইয়ের উপমা ব্যবহার করেছেন, যেখানে কী হল ‘একটি বইয়ের অধ্যায়ের শিরোনামের মতো, যা নির্দেশ করে প্রতিটি অংশ কী সম্পর্কে, যেখানে মান হল সেই শিরোনামগুলির অধীনে আরও বিস্তারিত সারসংক্ষেপ। সুতরাং একজন ব্যবহারকারী যখন অনুরোধ করে, তখন এটি উত্তর তৈরি করতে একটি অনুসন্ধানের শব্দ চায়। এটি জিজ্ঞাসা করছে, ‘এই গল্পের অধীনে, কোন অধ্যায়টি সবচেয়ে প্রাসঙ্গিক?’

MLA এই অধ্যায়ের শিরোনাম (কী) এবং সারসংক্ষেপ (ভ্যালু) সংকুচিত করে, উত্তর খোঁজার প্রক্রিয়াটিকে ত্বরান্বিত করে এবং দক্ষতা বৃদ্ধি করে। পরিশেষে, MLA ডিপসিককে (DeepSeek) মেমরি ব্যবহার ৫-১৩% কমাতে সাহায্য করে। ডিপসিকের (DeepSeek) অফিসিয়াল পেপারে আরও বিস্তারিত তথ্য পাওয়া যাবে। মিডিয়াটেকের (MediaTek) ডেভেলপার সম্মেলনে তাদের ডাইমেনসিটি (Dimensity) মোবাইল চিপগুলিতে MLA-এর জন্য সমর্থন নিয়ে আলোচনা করা হয়েছে, যা ডিপসিকের (DeepSeek) ব্যাপক প্রভাবকে তুলে ধরে।

MLA-এর মতো প্রযুক্তিগুলি এআই যুগে সাধারণ অ্যালগরিদমিক উদ্ভাবনের প্রতিনিধিত্ব করে। যাইহোক, এআই প্রযুক্তি বিকাশের দ্রুত গতি উদ্ভাবনের একটি ধারাবাহিক প্রবাহের দিকে পরিচালিত করে, যা পরবর্তীতে নতুন চ্যালেঞ্জ তৈরি করে, বিশেষ করে যখন এই উদ্ভাবনগুলি নির্দিষ্ট প্ল্যাটফর্মের জন্য তৈরি করা হয়। MLA-এর ক্ষেত্রে, নন-এনভিডিয়া (non-NVIDIA) জিপিইউ (GPU) ব্যবহারকারীদের প্রযুক্তিটি ব্যবহার করার জন্য অতিরিক্ত ম্যানুয়াল কোডিংয়ের প্রয়োজন হয়।

ডিপসিকের (DeepSeek) প্রযুক্তিগুলি এআই যুগের উদ্ভাবন এবং মূল্য প্রদর্শন করে, তবে হার্ডওয়্যার এবং সফ্টওয়্যারকে এই উদ্ভাবনগুলির সাথে খাপ খাইয়ে নিতে হবে। এলাদ রাজের (Elad Raz) মতে, এই ধরনের অভিযোজন ডেভেলপার এবং উৎপাদন পরিবেশের জন্য জটিলতা কমাতে হবে। অন্যথায়, প্রতিটি উদ্ভাবনের খরচ অনেক বেশি হয়ে যাবে।

তাহলে প্রশ্ন হল: ‘যদি পরবর্তী অ্যালগরিদম উদ্ভাবন বিদ্যমান আর্কিটেকচারের সাথে সহজে এবং সরলভাবে অনুবাদ না হয় তবে কী হবে?’

চিপ ডিজাইন এবং অ্যালগরিদম উদ্ভাবনের মধ্যে দ্বন্দ্ব

গত কয়েক বছরে, এআই চিপ প্রস্তুতকারকরা ধারাবাহিকভাবে জানিয়েছেন যে বড় এআই চিপ ডিজাইন করতে কমপক্ষে ১-২ বছর সময় লাগে। এর মানে হল যে চিপের বাজারের মুক্তির অনেক আগে চিপ ডিজাইন শুরু করতে হবে। এআই প্রযুক্তির দ্রুত অগ্রগতির কারণে, এআই চিপ ডিজাইনকে ভবিষ্যতের দিকে লক্ষ্য রাখতে হবে। শুধুমাত্র বর্তমানের চাহিদার উপর মনোযোগ দিলে পুরানো এআই চিপ তৈরি হবে যা সর্বশেষ অ্যাপ্লিকেশন উদ্ভাবনের সাথে খাপ খাইয়ে নিতে পারবে না।

এআই অ্যাপ্লিকেশন অ্যালগরিদম উদ্ভাবন এখন সাপ্তাহিক ভিত্তিতে ঘটে। পূর্ববর্তী নিবন্ধগুলিতে যেমন উল্লেখ করা হয়েছে, এআই মডেলগুলির একই ক্ষমতা অর্জনের জন্য প্রয়োজনীয় কম্পিউটিং ক্ষমতা বার্ষিক ৪-১০ গুণ কমে যায়। GPT-3 এর মতো একই গুণমান অর্জনের জন্য এআই মডেলগুলির অনুমানের খরচ গত তিন বছরে ১২০০ গুণ কমেছে। বর্তমানে, 2B প্যারামিটারযুক্ত মডেলগুলি আগের বছরের 170B প্যারামিটার GPT-3 এর সমান স্তরে পৌঁছাতে পারে। এআই প্রযুক্তি স্ট্যাকের উপরের স্তরগুলিতে এই দ্রুত উদ্ভাবন ঐতিহ্যবাহী চিপ আর্কিটেকচার পরিকল্পনা এবং ডিজাইনের জন্য উল্লেখযোগ্য চ্যালেঞ্জ তৈরি করে।

এলাদ রাজ (Elad Raz) বিশ্বাস করেন যে শিল্পের ডিপসিক MLA-এর (DeepSeek MLA) মতো উদ্ভাবনগুলিকে এআই প্রযুক্তির নিয়ম হিসাবে স্বীকৃতি দেওয়া উচিত। ‘পরবর্তী প্রজন্মের কম্পিউটিংকে শুধুমাত্র আজকের কাজের চাপগুলির জন্য অপ্টিমাইজ করা উচিত নয়, ভবিষ্যতের সাফল্যের জন্যও জায়গা রাখা উচিত।’ এই দৃষ্টিভঙ্গি শুধুমাত্র চিপ শিল্পের জন্যই নয়, এআই প্রযুক্তি স্ট্যাকের পুরো মধ্য থেকে নিম্ন স্তরের অবকাঠামোর জন্যও প্রযোজ্য।

এলাদ রাজ (Elad Raz) বলেন, ‘ডিপসিক (DeepSeek) এবং অন্যান্য উদ্ভাবনগুলি অ্যালগরিদম উদ্ভাবনের দ্রুত অগ্রগতি প্রদর্শন করেছে। গবেষক এবং ডেটা বিজ্ঞানীদের নতুন অন্তর্দৃষ্টি এবং আবিষ্কার চালনার জন্য আরও বহুমুখী, স্থিতিস্থাপক সরঞ্জামগুলির প্রয়োজন। বাজারের বুদ্ধিমান, সফ্টওয়্যার-সংজ্ঞায়িত হার্ডওয়্যার কম্পিউটিং প্ল্যাটফর্মগুলির প্রয়োজন যা গ্রাহকদের বিদ্যমান অ্যাক্সিলারেটর সমাধানগুলিকে ‘ড্রপ-ইন রিপ্লেস’ করতে দেয়, একই সাথে ডেভেলপারদের তাদের কাজকে সহজে পোর্ট করতে সক্ষম করে।’

এই পরিস্থিতি মোকাবিলার জন্য, শিল্পকে আরও বুদ্ধিমান, অভিযোজনযোগ্য এবং নমনীয় কম্পিউটিং অবকাঠামো ডিজাইন করতে হবে।

নমনীয়তা এবং দক্ষতা প্রায়শই পরস্পরবিরোধী লক্ষ্য। সিপিইউ (CPUs) অত্যন্ত নমনীয় তবে জিপিইউগুলির (GPUs) তুলনায় তাদের সমান্তরাল কম্পিউটিং দক্ষতা উল্লেখযোগ্যভাবে কম। জিপিইউগুলি (GPUs), তাদের প্রোগ্রামযোগ্যতার সাথে, ডেডিকেটেড এআই এএসআইসি (AI ASIC) চিপগুলির চেয়ে কম দক্ষ হতে পারে।

এলাদ রাজ (Elad Raz) উল্লেখ করেছেন যে এনভিডিয়া (NVIDIA) আশা করে যে এআই ডেটা সেন্টার র্যাকগুলি শীঘ্রই ৬০০ কিলোওয়াট বিদ্যুতের ব্যবহার পৌঁছাবে। প্রসঙ্গত, স্ট্যান্ডার্ড এন্টারপ্রাইজ ডেটা সেন্টারগুলির ৭৫% প্রতি র্যাকে (Rack) শুধুমাত্র ১৫-২০ কিলোওয়াট বিদ্যুতের ব্যবহার করে। এআই-তে সম্ভাব্য দক্ষতা অর্জন যাই হোক না কেন, এটি কম্পিউটিং অবকাঠামো সিস্টেম তৈরির ডেটা সেন্টারগুলির জন্য একটি উল্লেখযোগ্য চ্যালেঞ্জ তৈরি করে।

এলাদ রাজের (Elad Raz) মতে, বর্তমান জিপিইউ (GPUs) এবং এআই অ্যাক্সিলারেটরগুলি এআই এবং উচ্চ-কার্যকারিতা কম্পিউটিংয়ের (High-Performance Computing - HPC) সম্ভাব্য চাহিদা মেটাতে যথেষ্ট নাও হতে পারে। ‘যদি আমরা কম্পিউটিং দক্ষতা কীভাবে উন্নত করা যায় তা নিয়ে মৌলিকভাবে পুনর্বিবেচনা না করি, তবে শিল্প শারীরিক এবং অর্থনৈতিক সীমাবদ্ধতায় পৌঁছানোর ঝুঁকিতে পড়বে। এই দেওয়ালটির পার্শ্ব প্রতিক্রিয়াও থাকবে, যা আরও বেশি সংস্থার জন্য এআই এবং এইচপিসি-র (HPC) অ্যাক্সেসকে সীমিত করবে, অ্যালগরিদম বা ঐতিহ্যবাহী জিপিইউ (GPU) আর্কিটেকচারের অগ্রগতি সত্ত্বেও উদ্ভাবনকে বাধা দেবে।’

পরবর্তী প্রজন্মের কম্পিউটিং অবকাঠামোর জন্য প্রস্তাবনা এবং প্রয়োজনীয়তা

এই পর্যবেক্ষণগুলির উপর ভিত্তি করে, এলাদ রাজ (Elad Raz) পরবর্তী প্রজন্মের কম্পিউটিং অবকাঠামো সংজ্ঞায়িত করার জন্য ‘চারটি স্তম্ভ’ প্রস্তাব করেছেন:

(১) প্লাগ-এন্ড-প্লে প্রতিস্থাপনযোগ্যতা (Plug-and-Play Replaceability): ‘ইতিহাসে দেখা গেছে যে জটিল আর্কিটেকচার পরিবর্তন, যেমন সিপিইউ (CPU) থেকে জিপিইউতে (GPU) স্থানান্তর সম্পূর্ণরূপে বাস্তবায়ন করতে কয়েক দশক সময় লাগতে পারে। অতএব, পরবর্তী প্রজন্মের কম্পিউটিং আর্কিটেকচারগুলির মসৃণ স্থানান্তরকে সমর্থন করা উচিত।’ ‘প্লাগ-এন্ড-প্লে’ প্রতিস্থাপনযোগ্যতার জন্য, এলাদ রাজ (Elad Raz) পরামর্শ দেন যে নতুন কম্পিউটিং আর্কিটেকচারগুলি x86 এবং Arm ইকোসিস্টেম থেকে শিখতে পারে, পিছনের দিকে সামঞ্জস্যের মাধ্যমে বৃহত্তর গ্রহণ অর্জন করতে পারে।

আধুনিক ডিজাইনগুলির ডেভেলপারদের প্রচুর পরিমাণে কোড পুনরায় লিখতে বা নির্দিষ্ট বিক্রেতাদের উপর নির্ভরতা তৈরি করার প্রয়োজন এড়ানো উচিত। ‘উদাহরণস্বরূপ, MLA-এর মতো উদীয়মান প্রযুক্তিগুলির জন্য সমর্থনকে স্ট্যান্ডার্ডাইজ করা উচিত, যেমনটি নন-এনভিডিয়া (non-NVIDIA) জিপিইউগুলির (GPUs) ক্ষেত্রে অতিরিক্ত ম্যানুয়াল অ্যাডজাস্টমেন্টের প্রয়োজন হয়। পরবর্তী প্রজন্মের সিস্টেমগুলিকে ম্যানুয়াল কোড পরিবর্তন বা উল্লেখযোগ্য API অ্যাডজাস্টমেন্টের প্রয়োজন ছাড়াই নতুন কাজের চাপগুলি বুঝতে এবং অপ্টিমাইজ করতে হবে।’

(২) অভিযোজনযোগ্য, রিয়েল-টাইম পারফরম্যান্স অপটিমাইজেশন (Adaptable, Real-Time Performance Optimization): এলাদ রাজ (Elad Raz) বিশ্বাস করেন যে শিল্পের ফিক্সড-ফাংশন অ্যাক্সিলারেটর থেকে দূরে সরে যাওয়া উচিত। ‘শিল্পকে বুদ্ধিমান, সফ্টওয়্যার-সংজ্ঞায়িত হার্ডওয়্যার ভিত্তির উপর তৈরি করতে হবে যা রানটাইমে গতিশীলভাবে স্ব-অপ্টিমাইজ করতে পারে।’

‘কাজের চাপ থেকে ক্রমাগত শেখার মাধ্যমে, ভবিষ্যতের সিস্টেমগুলি রিয়েল-টাইমে নিজেদের সামঞ্জস্য করতে পারে, ব্যবহার এবং স্থিতিশীল কর্মক্ষমতা সর্বাধিক করতে পারে, নির্দিষ্ট অ্যাপ্লিকেশন কাজের চাপ নির্বিশেষে। এই গতিশীল অভিযোজনযোগ্যতার অর্থ হল অবকাঠামো বাস্তব-বিশ্বের পরিস্থিতিতে ধারাবাহিক দক্ষতা প্রদান করতে পারে, তা এইচপিসি (HPC) সিমুলেশন, জটিল এআই মডেল বা ভেক্টর ডেটাবেস অপারেশনই হোক না কেন।’

(৩) স্কেলেবল দক্ষতা (Scalable Efficiency): ‘হার্ডওয়্যার এবং সফ্টওয়্যারকে আলাদা করে এবং বুদ্ধিমান রিয়েল-টাইম অপটিমাইজেশনের উপর মনোযোগ কেন্দ্রীভূত করে, ভবিষ্যতের সিস্টেমগুলির উচ্চতর ব্যবহার এবং সামগ্রিক শক্তি খরচ কম করা উচিত। এটি নতুন কাজের চাপের ক্রমবর্ধমান চাহিদা মেটাতে অবকাঠামোকে আরও সাশ্রয়ী এবং স্কেলেবল করে তুলবে।’

(৪) ভবিষ্যত-ডিজাইন (Future-Design): এই পয়েন্টটি এআই অবকাঠামোর জন্য দূরদর্শী প্রয়োজনীয়তার সাথে সঙ্গতিপূর্ণ, বিশেষ করে চিপ ডিজাইনের ক্ষেত্রে। ‘আজকের অত্যাধুনিক অ্যালগরিদম আগামীকাল পুরনো হয়ে যেতে পারে।’ ‘এআই নিউরাল নেটওয়ার্ক বা ট্রান্সফরমার-ভিত্তিক এলএলএম (LLM) মডেলই হোক না কেন, পরবর্তী প্রজন্মের কম্পিউটিং অবকাঠামোকে অভিযোজনযোগ্য হতে হবে, যা নিশ্চিত করে যে উদ্যোগগুলির প্রযুক্তি বিনিয়োগ বছরের পর বছর ধরে স্থিতিশীল থাকবে।’

এই প্রস্তাবনাগুলি একটি অপেক্ষাকৃত আদর্শবাদী কিন্তু চিন্তামূলক দৃষ্টিকোণ সরবরাহ করে। এআই এবং এইচপিসি (HPC) প্রযুক্তির ভবিষ্যতের উন্নয়নের জন্য এই নির্দেশিকা পদ্ধতি বিবেচনা করা উচিত, এমনকি যদি কিছু অন্তর্নিহিত দ্বন্দ্ব শিল্পে দীর্ঘস্থায়ী সমস্যা হিসাবে রয়ে যায়। ‘এআই, এইচপিসি (HPC) এবং অন্যান্য ভবিষ্যতের কম্পিউটিং এবং ডেটা-ইনটেনসিভ কাজের চাপগুলির সম্ভাবনা উন্মোচন করতে, আমাদের অবশ্যই অবকাঠামো পুনর্বিবেচনা করতে হবে এবং উদ্ভাবন এবং অগ্রগামীদের সমর্থন করার জন্য গতিশীল এবং বুদ্ধিমান সমাধান গ্রহণ করতে হবে।’