গুগলের আয়রনউড টিপিইউ: এআই কম্পিউটে নতুন দিগন্ত

কৃত্রিম বুদ্ধিমত্তার (এআই) জগৎ ক্রমাগত বিকশিত হচ্ছে, এবং হার্ডওয়্যারের অগ্রগতি নতুন সম্ভাবনা উন্মোচনে একটি গুরুত্বপূর্ণ ভূমিকা পালন করছে। গুগল, এআই উদ্ভাবনের অগ্রদূত, সম্প্রতি তাদের সপ্তম প্রজন্মের টেনসর প্রসেসিং ইউনিট (টিপিইউ) উন্মোচন করেছে, যার কোডনাম আয়রনউড, যা এআই গণনার ক্ষমতার ক্ষেত্রে একটি গুরুত্বপূর্ণ পদক্ষেপ। এই অত্যাধুনিক এআই অ্যাক্সিলারেটর বৃহৎ আকারের স্থাপনায় বিশ্বের দ্রুততম সুপারকম্পিউটারকেও ২৪ গুণ ছাড়িয়ে যাওয়ার ক্ষমতা রাখে।

গুগল ক্লাউড নেক্সট ‘২৫ সম্মেলনে ঘোষিত আয়রনউড, গুগলের দশ বছরের এআই চিপ বিকাশের যাত্রায় একটি কৌশলগত পরিবর্তন। এর পূর্বসূরিদের বিপরীতে, যা মূলত এআই প্রশিক্ষণ এবং ইনফারেন্স ওয়ার্কলোডের জন্য ডিজাইন করা হয়েছিল, আয়রনউড বিশেষভাবে ইনফারেন্স কার্যগুলিতে দক্ষতা অর্জনের জন্য তৈরি করা হয়েছে, যা এআই-চালিত অ্যাপ্লিকেশনগুলির একটি নতুন যুগের সূচনা করছে।

গুগলের মেশিন লার্নিং, সিস্টেমস এবং ক্লাউড এআই-এর ভাইস প্রেসিডেন্ট এবং জেনারেল ম্যানেজার আমিন ভাহদাতের মতে, ‘আয়রনউড জেনারেটিভ এআই এবং এর বিশাল গণনা এবং যোগাযোগ চাহিদা সমর্থন করার জন্য ডিজাইন করা হয়েছে। এটিকে আমরা ‘ইনফারেন্স যুগ’ বলি, যেখানে এআই এজেন্টরা ডেটা পুনরুদ্ধার এবং তৈরি করতে সক্রিয়ভাবে কাজ করবে, কেবল ডেটা নয়, অন্তর্দৃষ্টি এবং উত্তরও সরবরাহ করবে।’

আয়রনউডের অভূতপূর্ব ক্ষমতা উন্মোচন

আয়রনউডের প্রযুক্তিগত বৈশিষ্ট্য অসাধারণ। যখন ৯,২16 টি চিপের একটি পডে স্কেল করা হয়, তখন এটি ৪২.৫ এক্সাফ্লপস এআই গণনা ক্ষমতা সরবরাহ করতে পারে। এই সংখ্যাটি এল ক্যাপিটানের ১.৭ এক্সাফ্লপস থেকে অনেক বেশি, যা বর্তমানে বিশ্বের দ্রুততম সুপারকম্পিউটারের শিরোপাধারী। প্রতিটি পৃথক আয়রনউড চিপের ৪,৬১৪ টিএফএলওপিএস এর শীর্ষ গণনা ক্ষমতা রয়েছে।

কেবলমাত্র প্রক্রিয়াকরণ ক্ষমতা নয়, আয়রনউড মেমরি এবং ব্যান্ডউইথের ক্ষেত্রেও উল্লেখযোগ্য উন্নতি দেখিয়েছে। প্রতিটি চিপ ১৯২ জিবি উচ্চ-ব্যান্ডউইথ মেমরি (এইচবিএম) দিয়ে সজ্জিত, যা পূর্ববর্তী প্রজন্মের টিপিইউ, ট্রিলিয়ামের তুলনায় ছয়গুণ বেশি, যা গত বছর প্রকাশিত হয়েছিল। উপরন্তু, প্রতি চিপের মেমরি ব্যান্ডউইথ ৭.২ টেরাবিট/সেকেন্ডে পৌঁছেছে, যা ট্রিলিয়ামের তুলনায় ৪.৫ গুণ উন্নতি।

এমন একটি যুগে যেখানে ডেটা সেন্টারগুলি প্রসারিত হচ্ছে এবং বিদ্যুতের ব্যবহার একটি গুরুত্বপূর্ণ উদ্বেগের বিষয় হয়ে দাঁড়িয়েছে, আয়রনউড তার শক্তি দক্ষতার জন্যও উল্লেখযোগ্য। এর কর্মক্ষমতা প্রতি ওয়াটে ট্রিলিয়ামের চেয়ে দ্বিগুণ এবং ২০১৮ সালে প্রবর্তিত প্রথম টিপিইউর তুলনায় প্রায় ৩০ গুণ বেশি।

ইনফারেন্স অপ্টিমাইজেশনের উপর জোর এআই ল্যান্ডস্কেপে একটি গুরুত্বপূর্ণ পরিবর্তনের ইঙ্গিত দেয়। সাম্প্রতিক বছরগুলোতে, নেতৃস্থানীয় এআই ল্যাবগুলি ক্রমবর্ধমান প্যারামিটার গণনা সহ আরও বড় ভিত্তি মডেল তৈরির উপর বেশি মনোযোগ দিয়েছে। গুগলের ইনফারেন্স অপ্টিমাইজেশনের উপর মনোযোগ সম্ভবত স্থাপন দক্ষতা এবং ইনফারেন্স ক্ষমতার উপর দৃষ্টি নিবদ্ধ করে একটি নতুন পর্যায়ের দিকে পরিবর্তনের ইঙ্গিত দেয়।

মডেল প্রশিক্ষণ গুরুত্বপূর্ণ থাকলেও, প্রশিক্ষণের পুনরাবৃত্তির সংখ্যা সীমিত। বিপরীতে, যেহেতু এআই প্রযুক্তিগুলি ক্রমবর্ধমানভাবে বিভিন্ন অ্যাপ্লিকেশনে একত্রিত হচ্ছে, তাই ইনফারেন্স অপারেশনগুলি প্রতিদিন বিলিয়ন বার ঘটবে বলে আশা করা হচ্ছে। মডেলগুলি জটিল হওয়ার সাথে সাথে এই অ্যাপ্লিকেশনগুলির অর্থনৈতিক কার্যকারিতা ইনফারেন্স খরচের সাথে অবিচ্ছেদ্যভাবে জড়িত হয়ে যায়।

গত আট বছরে, গুগলের এআই গণনার চাহিদা দশগুণ বেড়েছে, যা ১০০ মিলিয়নে পৌঁছেছে। আয়রনউডের মতো বিশেষ আর্কিটেকচার ছাড়া, মুর’স ল-এর নিরলস অগ্রগতিও এই উল্লম্ফনশীল বৃদ্ধির সাথে তাল মিলিয়ে চলতে সংগ্রাম করত।

বিশেষত, গুগলের ঘোষণা সাধারণ প্যাটার্ন recognition এর চেয়ে জটিল যুক্তিমূলক কাজগুলি সম্পাদন করতে সক্ষম ‘মানসিক মডেল’-এর উপর তাদের মনোযোগকে তুলে ধরে। এটি ইঙ্গিত দেয় যে গুগল এমন একটি ভবিষ্যতের পরিকল্পনা করছে যেখানে এআই বৃহত্তর মডেল ছাড়িয়ে এমন মডেলগুলিকে অন্তর্ভুক্ত করে যা সমস্যাগুলিকে ভেঙে দিতে, বহু-পদক্ষেপ যুক্তির প্রয়োগ করতে এবং মানুষের মতো চিন্তাভাবনার প্রক্রিয়া অনুকরণ করতে পারে।

বৃহৎ মডেলের পরবর্তী প্রজন্মকে চালিত করা

গুগল আয়রনউডকে তাদের সবচেয়ে উন্নত এআই মডেলগুলির ভিত্তি হিসাবে স্থান দিয়েছে, যার মধ্যে জেমিনি ২.৫ রয়েছে, যা সহজাতভাবে অন্তর্নির্মিত যুক্তিমূলক ক্ষমতা নিয়ে আসে।

গুগল সম্প্রতি জেমিনি ২.৫ ফ্ল্যাশ চালু করেছে, যা তাদের ফ্ল্যাগশিপ মডেলের একটি ছোট সংস্করণ যা ল্যাটেন্সি-সংবেদনশীল, দৈনন্দিন অ্যাপ্লিকেশনগুলির জন্য ডিজাইন করা হয়েছে। জেমিনি ২.৫ ফ্ল্যাশ প্রম্পটের জটিলতার উপর ভিত্তি করে তার যুক্তির গভীরতা গতিশীলভাবে সামঞ্জস্য করতে পারে।

গুগল তাদের মাল্টিমোডাল জেনারেটিভ মডেলগুলির বিস্তৃত স্যুটও প্রদর্শন করেছে, যার মধ্যে টেক্সট-টু-ইমেজ, টেক্সট-টু-ভিডিও এবং নতুন উন্মোচিত টেক্সট-টু-মিউজিক বৈশিষ্ট্য, লিরিয়া অন্তর্ভুক্ত রয়েছে। একটি ডেমো দেখিয়েছে কিভাবে এই সরঞ্জামগুলিকে একটি কনসার্টের জন্য সম্পূর্ণ প্রচারণামূলক ভিডিও তৈরি করতে একত্রিত করা যেতে পারে।

আয়রনউড গুগলের বৃহত্তর এআই অবকাঠামো কৌশলের একটি উপাদান মাত্র। গুগল ক্লাউড ওয়্যানও ঘোষণা করেছে, একটি পরিচালিত ওয়াইড এরিয়া নেটওয়ার্ক পরিষেবা যা এন্টারপ্রাইজগুলিকে গুগলের গ্লোবাল-স্কেল প্রাইভেট নেটওয়ার্ক অবকাঠামোতে অ্যাক্সেস করতে সক্ষম করে।

উপরন্তু, গুগল তাদের এআই ওয়ার্কলোডের জন্য সফটওয়্যার অফারগুলি প্রসারিত করছে, যার মধ্যে রয়েছে পাথওয়েজ, গুগল ডিপমাইন্ড দ্বারা তৈরি একটি মেশিন লার্নিং রানটাইম। পাথওয়েজ এখন গ্রাহকদের শত শত টিপিইউতে মডেল সার্ভিং স্কেল করতে দেয়।

এ২এ-এর সাথে এআই এজেন্ট সহযোগিতা বৃদ্ধি

হার্ডওয়্যার উন্নয়নের বাইরেও, গুগল মাল্টি-এজেন্ট সিস্টেমের উপর ভিত্তি করে একটি এআই ইকোসিস্টেমের জন্য তাদের দৃষ্টিভঙ্গি তুলে ধরেছে। বুদ্ধিমান এজেন্টদের উন্নয়ন সহজ করার জন্য, গুগল এজেন্ট-টু-এজেন্ট (এ২এ) প্রোটোকল চালু করেছে, যা বিভিন্ন এআই এজেন্টের মধ্যে নিরাপদ এবং স্ট্যান্ডার্ডাইজড যোগাযোগ সক্ষম করার জন্য ডিজাইন করা হয়েছে।

গুগল বিশ্বাস করে যে ২০২৫ সাল এআই-এর জন্য একটি পরিবর্তনশীল বছর হবে, যেখানে জেনারেটিভ এআই অ্যাপ্লিকেশনগুলি একক প্রশ্নের উত্তর দেওয়া থেকে শুরু করে এজেন্ট সিস্টেমের মাধ্যমে জটিল সমস্যা সমাধানে বিবর্তিত হবে।

এ২এ প্রোটোকল বিভিন্ন প্ল্যাটফর্ম এবং ফ্রেমওয়ার্কের এজেন্টদের মধ্যে আন্তঃকার্যকারিতা সক্ষম করে, তাদের একটি সাধারণ ‘ভাষা’ এবং সুরক্ষিত যোগাযোগ চ্যানেল সরবরাহ করে। এই প্রোটোকলটিকে বুদ্ধিমান এজেন্টদের জন্য একটি নেটওয়ার্ক স্তর হিসাবে দেখা যেতে পারে, যার লক্ষ্য জটিল ওয়ার্কফ্লোতে এজেন্ট সহযোগিতাকে সহজ করা। বিভিন্ন জটিলতা এবং সময়কালের কাজগুলিতে একসাথে কাজ করার জন্য বিশেষায়িত এআই এজেন্টদের সক্ষম করার মাধ্যমে, এ২এ সহযোগিতার মাধ্যমে সামগ্রিক ক্ষমতা বাড়াতে চায়।

এ২এ এজেন্টদের অন্তর্নিহিত কোড বা ডেটা স্ট্রাকচার শেয়ার করার প্রয়োজন ছাড়াই তথ্য আদান-প্রদান এবং কার্যক্রম সমন্বিত করার জন্য একটি স্ট্যান্ডার্ডাইজড উপায় প্রতিষ্ঠার মাধ্যমে কাজ করে। এটি আরও মডুলার এবং নমনীয় এআই সিস্টেম তৈরির সুযোগ দেয়, যেখানে প্রয়োজন অনুযায়ী এজেন্টদের সহজেই যুক্ত, সরানো বা পুনর্গঠন করা যেতে পারে।

গুগল একটি ব্লগ পোস্টে এমসিপি এবং এ২এ প্রোটোকলের মধ্যে তুলনা করেছে।

  • এমসিপি (মডেল কন্টেক্সট প্রোটোকল) সরঞ্জাম এবং সম্পদ ব্যবস্থাপনার জন্য ডিজাইন করা হয়েছে।
    • এটি কাঠামোগত ইনপুট/আউটপুটের মাধ্যমে এজেন্টদের সরঞ্জাম, এপিআই এবং সম্পদের সাথে সংযুক্ত করে।
    • গুগল এডিকে এমসিপি সরঞ্জামগুলিকে সমর্থন করে, যা বিভিন্ন এমসিপি সার্ভারকে এজেন্টদের সাথে কাজ করতে সক্ষম করে।
  • এ২এ (এজেন্ট২এজেন্ট প্রোটোকল) এজেন্টদের মধ্যে সহযোগিতার জন্য ডিজাইন করা হয়েছে।
    • এটি মেমরি, সম্পদ বা সরঞ্জাম শেয়ার না করে এজেন্টদের মধ্যে গতিশীল, মাল্টি-মোডাল যোগাযোগ সক্ষম করে।
    • এটি সম্প্রদায় কর্তৃক চালিত একটি উন্মুক্ত মান।
    • গুগল এডিকে, ল্যাংগ্রাফ, ক্রু.এআই এবং অন্যান্য সরঞ্জাম ব্যবহার করে উদাহরণ দেখা যেতে পারে।

সংক্ষেপে, এ২এ এবং এমসিপি একে অপরের পরিপূরক: এমসিপি এজেন্টদের সরঞ্জাম সমর্থন সরবরাহ করে, যেখানে এ২এ এই সরঞ্জাম-সজ্জিত এজেন্টদের একে অপরের সাথে যোগাযোগ এবং সহযোগিতা করতে সক্ষম করে।

প্রাথমিক অংশীদারদের দেখে মনে হচ্ছে, এ২এ এমসিপির মতোই মনোযোগ আকর্ষণ করতে প্রস্তুত। শীর্ষ প্রযুক্তি সংস্থা এবং শীর্ষস্থানীয় গ্লোবাল কনসাল্টিং এবং সিস্টেম ইন্টিগ্রেশন পরিষেবা প্রদানকারীসহ ৫০টিরও বেশি কোম্পানি প্রাথমিক সহযোগিতায় যোগ দিয়েছে।

গুগল প্রোটোকলের উন্মুক্ততার উপর জোর দেয়, এটিকে অন্তর্নিহিত প্রযুক্তি ফ্রেমওয়ার্ক বা পরিষেবা প্রদানকারী নির্বিশেষে এজেন্টদের সহযোগিতার একটি আদর্শ উপায় হিসাবে স্থাপন করে। গুগল তার অংশীদারদের সাথে সহযোগিতায় প্রোটোকলের নকশা প্রণয়নে পরিচালিত পাঁচটি মূল নীতি তুলে ধরেছে:

  1. এজেন্ট সক্ষমতা আলিঙ্গন করা: এ২এ এজেন্টদের তাদের স্বাভাবিক, অসংগঠিত উপায়ে সহযোগিতা করতে সক্ষম করার উপর দৃষ্টি নিবদ্ধ করে, এমনকি যদি তারা মেমরি, সরঞ্জাম এবং প্রেক্ষাপট শেয়ার না করে। প্রোটোকলটির লক্ষ্য এজেন্টদের কেবল ‘সরঞ্জাম’ হিসাবে সীমাবদ্ধ না করে সত্যিকারের মাল্টি-এজেন্ট পরিস্থিতি সক্ষম করা।
  2. বিদ্যমান মানের উপর ভিত্তি করে তৈরি করা: প্রোটোকলটি HTTP, SSE এবং JSON-RPC সহ বিদ্যমান জনপ্রিয় মানের উপর ভিত্তি করে তৈরি করা হয়েছে, যা এন্টারপ্রাইজগুলি দ্বারা সাধারণত ব্যবহৃত বিদ্যমান আইটি স্ট্যাকের সাথে একত্রিত করা সহজ করে তোলে।
  3. ডিফল্টরূপে সুরক্ষিত: এ২এ এন্টারপ্রাইজ-গ্রেড প্রমাণীকরণ এবং অনুমোদন সমর্থন করার জন্য ডিজাইন করা হয়েছে, যা লঞ্চের সময় OpenAPI-এর প্রমাণীকরণ স্কিমগুলির সাথে তুলনীয়।
  4. দীর্ঘমেয়াদী কাজ সমর্থন করা: এ২এ নমনীয় হওয়ার জন্য ডিজাইন করা হয়েছে, দ্রুত কাজ থেকে শুরু করে গভীর গবেষণা পর্যন্ত বিস্তৃত পরিস্থিতি সমর্থন করে যা ঘন্টা বা এমনকি দিনও লাগতে পারে (যখন মানুষ জড়িত থাকে)। পুরো প্রক্রিয়া জুড়ে, এ২এ ব্যবহারকারীদের রিয়েল-টাইম ফিডব্যাক, নোটিফিকেশন এবং স্ট্যাটাস আপডেট সরবরাহ করতে পারে।
  5. মোডালিটি অ্যাগনস্টিক: এজেন্টদের জগৎ কেবল পাঠ্যের মধ্যে সীমাবদ্ধ নয়, এই কারণেই এ২এ অডিও এবং ভিডিও স্ট্রিমসহ বিভিন্ন মোডালিটি সমর্থন করার জন্য ডিজাইন করা হয়েছে।

গুগল একটি উদাহরণ দিয়েছে কিভাবে এ২এ নিয়োগ প্রক্রিয়াকে উল্লেখযোগ্যভাবে সুগম করতে পারে।

এজেন্টস্পেসের মতো একটি ইউনিফাইড ইন্টারফেসে, একজন নিয়োগ ব্যবস্থাপক কাজের প্রয়োজনীয়তার ভিত্তিতে উপযুক্ত প্রার্থী খুঁজে বের করার জন্য একজন এজেন্টকে নিয়োগ করতে পারেন। এই এজেন্ট বিশেষায়িত এজেন্টদের সাথে যোগাযোগ করে প্রার্থী সংগ্রহ করতে, সাক্ষাৎকারের সময় নির্ধারণ করতে এবং এমনকি ব্যাকগ্রাউন্ড চেক করার জন্য অন্যান্য বিশেষায়িত এজেন্টদের সাথে যোগাযোগ করতে পারে, যা বিভিন্ন সিস্টেমে পুরো নিয়োগ প্রক্রিয়াটিকে বুদ্ধিদীপ্তভাবে স্বয়ংক্রিয় করতে সক্ষম করে।

মডেল কন্টেক্সট প্রোটোকল (এমসিপি) গ্রহণ

এ২এ উন্নয়নে তাদের প্রচেষ্টার পাশাপাশি, গুগল মডেল কন্টেক্সট প্রোটোকল (এমসিপি)-ও গ্রহণ করছে। ওপেনএআই এমসিপি গ্রহণের ঘোষণা দেওয়ার কয়েক সপ্তাহ পরেই গুগল একই পথে হেঁটেছে।

গুগল ডিপমাইন্ডের সিইও ডেমিস হাসাবিস সম্প্রতি X-এ ঘোষণা করেছেন যে গুগল তাদের জেমিনি মডেল এবং SDK-তে MCP-এর জন্য সমর্থন যুক্ত করবে। তবে, তিনি কোনো নির্দিষ্ট সময়সীমা জানাননি।

হাসাবিস বলেছেন যে ‘এমসিপি একটি চমৎকার প্রোটোকল যা দ্রুত এআই এজেন্ট যুগের জন্য উন্মুক্ত মান হয়ে উঠছে। আমি এমসিপি দল এবং শিল্পের অন্যান্য অংশীদারদের সাথে এই প্রযুক্তির উন্নয়নে কাজ করার জন্য উন্মুখ।’

নভেম্বর ২০২৪-এ প্রকাশের পর থেকে, এমসিপি দ্রুত জনপ্রিয়তা লাভ করেছে, যা ভাষা মডেলগুলিকে সরঞ্জাম এবং ডেটার সাথে সংযোগ করার একটি সহজ এবং স্ট্যান্ডার্ডাইজড উপায় হয়ে উঠেছে।

এমসিপি এআই মডেলগুলিকে কাজ সম্পূর্ণ করার জন্য এন্টারপ্রাইজ সরঞ্জাম এবং সফটওয়্যার থেকে ডেটা অ্যাক্সেস করতে, সেইসাথে সামগ্রী লাইব্রেরি এবং অ্যাপ্লিকেশন ডেভেলপমেন্ট এনভায়রনমেন্ট অ্যাক্সেস করতে সক্ষম করে। প্রোটোকলটি ডেভেলপারদের ডেটা উৎস এবং এআই-চালিত অ্যাপ্লিকেশনগুলির মধ্যে দ্বি-মুখী সংযোগ স্থাপন করতে দেয়, যেমন চ্যাটবট।

ডেভেলপাররা এমসিপি সার্ভারের মাধ্যমে ডেটা ইন্টারফেস প্রকাশ করতে পারে এবং এই সার্ভারগুলির সাথে সংযোগ স্থাপনের জন্য এমসিপি ক্লায়েন্ট (যেমন অ্যাপ্লিকেশন এবং ওয়ার্কফ্লো) তৈরি করতে পারে। অ্যানথ্রোপিক এমসিপিকে ওপেন সোর্স করার পর থেকে, একাধিক কোম্পানি তাদের প্ল্যাটফর্মে এমসিপি সমর্থনকে একত্রিত করেছে।