কৃত্রিম বুদ্ধিমত্তার (Artificial intelligence) জগতে গুগল তাদের সপ্তম প্রজন্মের টেনসর প্রসেসিং ইউনিট (Tensor Processing Unit) বা টিপিইউ উন্মোচন করে এক নতুন দিগন্ত উন্মোচন করেছে। এই অত্যাধুনিক এআই (AI) অ্যাক্সিলারেটরের নাম দেওয়া হয়েছে আয়রনউড (Ironwood)। এর কম্পিউটেশনাল ক্ষমতা এতটাই বেশি যে এটি বিশ্বের সবচেয়ে শক্তিশালী সুপারকম্পিউটারকেও ছাড়িয়ে যেতে সক্ষম। বৃহৎ পরিসরে ব্যবহার করার সময় আয়রনউডের ক্ষমতা দ্রুততম সুপারকম্পিউটারের চেয়ে প্রায় ২৪ গুণ বেশি।
গুগল ক্লাউড নেক্সট ‘২৫ (Google Cloud Next ‘25) অনুষ্ঠানে আয়রনউডের আত্মপ্রকাশ গুগলের দশ বছরের এআই চিপ উদ্ভাবনের যাত্রায় একটি গুরুত্বপূর্ণ মুহূর্ত। পূর্ববর্তী টিপিইউ সংস্করণগুলো মূলত এআই মডেলের প্রশিক্ষণ এবং ইনফারেন্স ওয়ার্কলোডের (inference workloads) জন্য তৈরি করা হলেও, আয়রনউড বিশেষভাবে ইনফারেন্স কাজের জন্য তৈরি এবং অপ্টিমাইজ করা প্রথম চিপ।
গুগলের মেশিন লার্নিং, সিস্টেম এবং ক্লাউড এআই-এর ভাইস প্রেসিডেন্ট এবং জেনারেল ম্যানেজার আমিন ভাহদাত (Amin Vahdat) বলেন, ‘আয়রনউড জেনারেটিভ এআই-এর (generative AI) পরবর্তী পর্যায়কে এগিয়ে নিয়ে যেতে তৈরি করা হয়েছে, যা এর বিশাল কম্পিউটেশনাল এবং যোগাযোগ চাহিদাগুলো পূরণ করবে। আমরা এখন ‘ইনফারেন্স যুগে’ প্রবেশ করছি, যেখানে এআই এজেন্টরা (AI agents) সক্রিয়ভাবে ডেটা পুনরুদ্ধার এবং তৈরি করবে এবং ডেটা প্রক্রিয়াকরণের ক্ষমতাকে ছাড়িয়ে গিয়ে সম্মিলিতভাবে অন্তর্দৃষ্টি এবং উত্তর প্রদান করবে।’
অভাবনীয় কম্পিউটেশনাল ক্ষমতা: আয়রনউডের সক্ষমতা
আয়রনউডের কারিগরি বৈশিষ্ট্যগুলো এআই গবেষক এবং ডেভেলপারদের জন্য একটি আকাঙ্ক্ষিত তালিকা। ৯,২1৬টি চিপের একটি পড (pod) নিয়ে গঠিত আয়রনউড ৪২.৫ এক্সাফ্লপস (exaflops) এআই কম্পিউট প্রদান করে। বিষয়টি আরও ভালোভাবে বুঝতে হলে, এটি বর্তমান বিশ্বের সবচেয়ে শক্তিশালী সুপারকম্পিউটার এল ক্যাপিটানের (El Capitan) ক্ষমতাকেও ছাড়িয়ে যায়, যার ক্ষমতা ১.৭ এক্সাফ্লপস। প্রতিটি আয়রনউড চিপের সর্বোচ্চ কম্পিউট ক্ষমতা ৪৬১৪ টেরাফ্লপস (TFLOPs)।
শুধু প্রক্রিয়াকরণ ক্ষমতাই নয়, আয়রনউড মেমোরি (memory) এবং ব্যান্ডউইথের (bandwidth) ক্ষেত্রেও উল্লেখযোগ্য উন্নতি নিয়ে এসেছে। প্রতিটি চিপ ১৯২ গিগাবাইট হাই ব্যান্ডউইথ মেমোরি (High Bandwidth Memory) বা এইচবিএম (HBM) যুক্ত, যা আগের প্রজন্মের টিপিইউ ট্রিলিয়ামের (Trillium) চেয়ে ছয় গুণ বেশি। মেমোরি ব্যান্ডউইথও নাটকীয়ভাবে উন্নত করা হয়েছে, যা প্রতি চিপে ৭.২ টেরাবিট/ সেকেন্ডে (terabits/s) পৌঁছেছে, যা ট্রিলিয়ামের চেয়ে ৪.৫ গুণ বেশি।
যেখানে ডেটা সেন্টারগুলো (data centers) বাড়ছে এবং বিদ্যুতের ব্যবহার একটি গুরুত্বপূর্ণ বিষয় হয়ে দাঁড়াচ্ছে, সেখানে আয়রনউড উল্লেখযোগ্যভাবে শক্তি সাশ্রয়ী। এর কর্মক্ষমতা ট্রিলিয়ামের চেয়ে ওয়াট প্রতি দ্বিগুণ এবং ২০১৮ সালে প্রবর্তিত প্রথম টিপিইউর চেয়ে প্রায় ৩০ গুণ ভালো।
ইনফারেন্স অপ্টিমাইজেশনের (inference optimization) দিকে এই পরিবর্তন এআই-এর বিবর্তনে একটি গুরুত্বপূর্ণ মাইলফলক। সাম্প্রতিক বছরগুলোতে, முன்னணி এআই ল্যাবগুলো (AI labs) ক্রমবর্ধমান প্যারামিটার সংখ্যার (parameter counts) সঙ্গে ফাউন্ডেশন মডেল (foundation model) তৈরিতে মনোনিবেশ করেছে। গুগলের ইনফারেন্স অপ্টিমাইজেশনের উপর জোর দেওয়া মূলত বাস্তব-বিশ্বের প্রয়োগ দক্ষতা এবং ইনফারেন্স ক্ষমতার দিকে মনোযোগ দেওয়ার একটি ইঙ্গিত।
এআই মডেল প্রশিক্ষণ একটি তুলনামূলকভাবে কম ঘটা বিষয় হলেও, এআই প্রযুক্তি আরও বেশি বিস্তৃত হওয়ার সাথে সাথে ইনফারেন্স কার্যক্রম প্রতিদিন বিলিয়ন বার ঘটে। এআই-চালিত ব্যবসার অর্থনৈতিক কার্যকারিতা মূলত ইনফারেন্স খরচের সাথে সম্পর্কিত, বিশেষ করে যখন মডেলগুলো ক্রমশ জটিল হয়ে ওঠে।
গত আট বছরে, গুগলের এআই কম্পিউটের চাহিদা দ্রুত বৃদ্ধি পেয়েছে, যা দশগুণ বেড়ে ১০ কোটিতে পৌঁছেছে। আয়রনউডের মতো বিশেষায়িত আর্কিটেকচার (architectures) ছাড়া, শুধুমাত্র মুর’স ল (Moore’s Law) এই প্রবৃদ্ধিকে ধরে রাখতে পারবে না।
গুগলের ‘রিজনিং মডেল’-এর (reasoning models) উপর জোর দেওয়া বিশেষভাবে উল্লেখযোগ্য, যা জটিল ইনফারেন্স কাজগুলো করতে সক্ষম, শুধু সাধারণ প্যাটার্ন (pattern) চেনার মধ্যে সীমাবদ্ধ নয়। এটি ইঙ্গিত দেয় যে গুগল এমন একটি ভবিষ্যতের পরিকল্পনা করছে যেখানে এআই শুধু বড় মডেলের মাধ্যমেই নয়, সমস্যাগুলো ভেঙে, বহু-ধাপের রিজনিং সম্পাদন করে এবং মানুষের মতো চিন্তা প্রক্রিয়া অনুকরণ করতে সক্ষম হবে।
বৃহৎ ভাষা মডেলের পরবর্তী প্রজন্মকে শক্তিশালী করা
গুগল আয়রনউডকে তাদের সবচেয়ে উন্নত এআই মডেলগুলোর ভিত্তি হিসেবে বিবেচনা করে, যার মধ্যে জেমিনি ২.৫ (Gemini 2.5) অন্তর্ভুক্ত, যা ‘জন্মগত রিজনিং ক্ষমতা’ (native reasoning capabilities) সম্পন্ন।
আয়রনউডের পাশাপাশি, গুগল জেমিনি ২.৫ ফ্ল্যাশ (Gemini 2.5 Flash) উন্মোচন করেছে, যা তাদের প্রধান মডেলের একটি সরল সংস্করণ এবং এটি দৈনন্দিন অ্যাপ্লিকেশনগুলোর জন্য ডিজাইন করা হয়েছে। জেমিনি ২.৫ ফ্ল্যাশ প্রম্পটের (prompt) জটিলতার উপর ভিত্তি করে তার রিজনিং গভীরতা গতিশীলভাবে সামঞ্জস্য করতে পারে।
গুগল তাদের মাল্টিমোডাল জেনারেটিভ মডেলের (multimodal generative models) স্যুট প্রদর্শন করেছে, যার মধ্যে টেক্সট-টু-ইমেজ (text-to-image), টেক্সট-টু-ভিডিও (text-to-video) এবং নতুন প্রবর্তিত টেক্সট-টু-মিউজিক (text-to-music) কার্যকারিতা লিরিয়া (Lyria) অন্তর্ভুক্ত। একটি আকর্ষণীয় ডেমোতে (demo) দেখানো হয়েছে কিভাবে এই সরঞ্জামগুলো একটি কনসার্টের জন্য সম্পূর্ণ প্রচারণামূলক ভিডিও তৈরি করতে ব্যবহার করা যেতে পারে।
আয়রনউড গুগলের বিস্তৃত এআই অবকাঠামো কৌশলের (AI infrastructure strategy) একটি উপাদান মাত্র। কোম্পানিটি ক্লাউড ওয়ান (Cloud WAN) চালু করেছে, যা একটি পরিচালিত ওয়াইড এরিয়া নেটওয়ার্ক পরিষেবা (managed wide area network service)। এর মাধ্যমে ব্যবসাগুলো গুগলের বিশ্বব্যাপী প্রাইভেট নেটওয়ার্ক অবকাঠামোতে (private network infrastructure) যুক্ত হতে পারবে।
গুগল তাদের এআই ওয়ার্কলোডের জন্য সফটওয়্যার অফারগুলোও প্রসারিত করছে, যার মধ্যে পাথওয়েজ (Pathways) অন্তর্ভুক্ত, যা গুগল ডিপমাইন্ড (Google DeepMind) দ্বারা তৈরি একটি মেশিন লার্নিং রানটাইম (machine learning runtime) এবং এটি গ্রাহকদের শত শত টিপিইউতে মডেল সার্ভিং স্কেল (model serving scale) করতে দেয়।
সহযোগী বুদ্ধিমত্তার স্বপ্ন: এ২এ এবং এমসিপি সমর্থন
হার্ডওয়্যারের উন্নতির পাশাপাশি, গুগল মাল্টি-এজেন্ট সিস্টেমের (multi-agent systems) উপর ভিত্তি করে এআইয়ের জন্য তাদের দৃষ্টিভঙ্গি প্রকাশ করেছে এবং বিভিন্ন এআই এজেন্টের মধ্যে সুরক্ষিত এবং স্ট্যান্ডার্ডাইজড (standardized) যোগাযোগের জন্য ডিজাইন করা এজেন্ট-টু-এজেন্ট (Agent-to-Agent) বা এ২এ (A2A) প্রোটোকল (protocol) চালু করেছে।
গুগল ২০২৫ সালকে এআইয়ের জন্য একটি পরিবর্তনমূলক বছর হিসেবে দেখে, যেখানে জেনারেটিভ এআই অ্যাপ্লিকেশনগুলো একটি প্রশ্নের উত্তর দেওয়ার পরিবর্তে আন্তঃসংযুক্ত এজেন্ট সিস্টেমের মাধ্যমে জটিল সমস্যাগুলো সমাধান করবে।
এ২এ প্রোটোকল বিভিন্ন প্ল্যাটফর্ম এবং ফ্রেমওয়ার্কের মধ্যে আন্তঃকার্যকারিতা (interoperability) সক্ষম করে, যা এআই এজেন্টদের একটি সাধারণ ‘ভাষা’ এবং সুরক্ষিত যোগাযোগ চ্যানেল সরবরাহ করে। এটিকে এআই এজেন্টদের জন্য একটি নেটওয়ার্ক লেয়ার (network layer) হিসেবে ভাবা যেতে পারে, যা জটিল ওয়ার্কফ্লোতে (workflows) সহযোগিতা সহজ করে এবং বিশেষায়িত এআই এজেন্টদের বিভিন্ন জটিলতা এবং সময়কালের কাজগুলো সম্মিলিতভাবে মোকাবেলা করতে সক্ষম করে, যার ফলে সহযোগিতার মাধ্যমে সামগ্রিক ক্ষমতা বৃদ্ধি পায়।
এ২এ কিভাবে কাজ করে
গুগল এমসিপি এবং এ২এ প্রোটোকলের একটি তুলনামূলক ওভারভিউ (overview) দিয়েছে:
- এমসিপি (মডেল কনটেক্সট প্রোটোকল): সরঞ্জাম এবং রিসোর্স ব্যবস্থাপনার উপর দৃষ্টি নিবদ্ধ করে।
- সংগঠিত ইনপুট/আউটপুটের (input/output) মাধ্যমে এজেন্টদের সরঞ্জাম, এপিআই (APIs) এবং রিসোর্সের সাথে সংযুক্ত করে।
- গুগল এডিকে (Google ADK) এমসিপি সরঞ্জাম সমর্থন করে, যা এমসিপি সার্ভার এবং এজেন্টদের মধ্যে নিরবচ্ছিন্ন মিথস্ক্রিয়া (interaction) সহজতর করে।
- এ২এ (এজেন্ট২এজেন্ট প্রোটোকল): এজেন্টদের মধ্যে সহযোগিতা সহজতর করে।
- শেয়ার্ড মেমরি (shared memory), রিসোর্স বা সরঞ্জামগুলোর প্রয়োজন ছাড়াই এজেন্টদের মধ্যে গতিশীল, মাল্টি-মোডাল (multi-modal) যোগাযোগ সক্ষম করে।
- এটি কমিউনিটি (community) দ্বারা চালিত একটি উন্মুক্ত স্ট্যান্ডার্ড (open standard)।
- গুগল এডিকে, ল্যাংগ্রাফ (LangGraph) এবং ক্রু.এআইয়ের (Crew.AI) মতো সরঞ্জাম ব্যবহার করে উদাহরণগুলো অনুসন্ধান করা যেতে পারে।
এ২এ এবং এমসিপি একে অপরের পরিপূরক। এমসিপি এজেন্টদের সরঞ্জাম সরবরাহ করে, যেখানে এ২এ এই সরঞ্জামযুক্ত এজেন্টদের কথোপকথন এবং সহযোগিতা করতে সক্ষম করে।
গুগলের অংশীদারদের প্রাথমিক তালিকা থেকে বোঝা যায় যে এ২এ এমসিপির মতোই মনোযোগ পেতে চলেছে। এই উদ্যোগটি ইতিমধ্যে ৫০টিরও বেশি সংস্থাকে আকৃষ্ট করেছে, যার মধ্যে রয়েছে শীর্ষস্থানীয় প্রযুক্তি সংস্থা এবং বিশ্বব্যাপী পরামর্শক এবং সিস্টেম ইন্টিগ্রেশন (system integration) প্রদানকারী প্রতিষ্ঠান।
গুগল প্রোটোকলের উন্মুক্ততার উপর জোর দেয় এবং এটিকে আন্তঃ-এজেন্ট সহযোগিতার (inter-agent collaboration) জন্য একটি স্ট্যান্ডার্ড হিসেবে উপস্থাপন করে, যা অন্তর্নিহিত প্রযুক্তি ফ্রেমওয়ার্ক বা পরিষেবা প্রদানকারীদের ছাড়িয়ে যায়। গুগল পাঁচটি নির্দেশক নীতি তুলে ধরেছে যা প্রোটোকলের নকশাকে রূপ দিয়েছে:
- এজেন্ট সক্ষমতা গ্রহণ করুন: এ২এ এজেন্টদের স্বাভাবিকভাবে সহযোগিতা করতে সক্ষম করার উপর জোর দেয়, এমনকি মেমরি, সরঞ্জাম বা প্রেক্ষাপট শেয়ার না করেও। এর লক্ষ্য হল সত্যিকারের মাল্টি-এজেন্ট পরিস্থিতি তৈরি করা, শুধু এজেন্টদেরকে ‘সরঞ্জাম’ হিসেবে কাজ করার মধ্যে সীমাবদ্ধ না রাখা।
- বিদ্যমান স্ট্যান্ডার্ডের উপর ভিত্তি করে তৈরি করুন: প্রোটোকলটি বিদ্যমান, বহুল ব্যবহৃত স্ট্যান্ডার্ডগুলো ব্যবহার করে, যার মধ্যে এইচটিটিপি (HTTP), এসএসই (SSE) এবং জেএসওএন-আরপিসি (JSON-RPC) অন্তর্ভুক্ত, যা বিদ্যমান আইটি স্ট্যাকের (IT stacks) সাথে ইন্টিগ্রেশন সহজ করে।
- ডিফল্টরূপে সুরক্ষিত: এ২এ এন্টারপ্রাইজ-গ্রেড (enterprise-grade) প্রমাণীকরণ (authentication) এবং অনুমোদনের (authorization) সমর্থন করার জন্য ডিজাইন করা হয়েছে, যা ওপেনএপিআইয়ের (OpenAPI) প্রমাণীকরণ স্কিমের (authentication schemes) সাথে তুলনীয়।
- দীর্ঘ-মেয়াদী কাজগুলোর সমর্থন: এ২এ-এর নমনীয়তা এটিকে দ্রুত কাজ থেকে শুরু করে গভীর গবেষণা পর্যন্ত বিভিন্ন পরিস্থিতিতে সমর্থন করতে দেয়, যা কয়েক ঘণ্টা বা এমনকি দিনও নিতে পারে (বিশেষ করে যখন মানুষের সম্পৃক্ততা প্রয়োজন হয়)। পুরো প্রক্রিয়া জুড়ে, এ২এ ব্যবহারকারীদের রিয়েল-টাইম (real-time) প্রতিক্রিয়া, বিজ্ঞপ্তি এবং স্ট্যাটাস আপডেট (status updates) সরবরাহ করতে পারে।
- মোডালিটি অ্যাগনস্টিক (Modality Agnostic): যেহেতু এজেন্টদের জগৎ শুধু টেক্সটের (text) মধ্যে সীমাবদ্ধ নয়, তাই এ২এ অডিও (audio) এবং ভিডিও স্ট্রিমিংয়ের (video streaming) মতো বিভিন্ন মোডালিটি (modalities) সমর্থন করে।
গুগল একটি উদাহরণ দিয়েছে কিভাবে এ২এ নিয়োগ প্রক্রিয়াকে সহজ করে তোলে।
এজেন্টস্পেসের (Agentspace) মতো একটি ইউনিফাইড ইন্টারফেসের (unified interface) মাধ্যমে, একজন নিয়োগ ব্যবস্থাপক (hiring manager) কাজের প্রয়োজনীয়তার ভিত্তিতে উপযুক্ত প্রার্থী সনাক্ত করার জন্য একজন এজেন্টকে নিয়োগ করতে পারেন। এই এজেন্ট প্রার্থীদের খুঁজে বের করার জন্য বিশেষায়িত এজেন্টদের সাথে যোগাযোগ করতে পারে। ব্যবহারকারীরা এজেন্টদের ইন্টারভিউয়ের (interview) সময়সূচী তৈরি করতে এবং ব্যাকগ্রাউন্ড (background) যাচাই করতে অন্যান্য বিশেষায়িত এজেন্টদের সাথে যুক্ত হতেও নির্দেশ দিতে পারেন, যা সিস্টেমজুড়ে সম্পূর্ণরূপে স্বয়ংক্রিয় এবং বুদ্ধিমান নিয়োগ সক্ষম করে।
মডেল কনটেক্সট প্রোটোকল (এমসিপি) গ্রহণ
গুগল এমসিপিকেও গ্রহণ করছে। ওপেনএআই (OpenAI) অ্যানথ্রোপিকের (Anthropic) মডেল কনটেক্সট প্রোটোকল (এমসিপি) গ্রহণের ঘোষণা করার পরপরই গুগলও একই পথে হেঁটেছে।
গুগল ডিপমাইন্ডের সিইও (CEO) ডেমিস হাসাবিস (Demis Hassabis) এক্স-এ (X) (পূর্বে টুইটার) ঘোষণা করেছেন যে গুগল তার জেমিনি মডেল এবং এসডিকেতে (SDK) এমসিপির সমর্থন যোগ করবে, যদিও তিনি কোনো নির্দিষ্ট সময়সীমা জানাননি।
হাসাবিস বলেছেন যে ‘এমসিপি একটি চমৎকার প্রোটোকল যা দ্রুত এআই এজেন্টদের যুগের জন্য একটি উন্মুক্ত স্ট্যান্ডার্ডে পরিণত হচ্ছে। আমরা এমসিপি টিম এবং শিল্পের অন্যান্য অংশীদারদের সাথে এই প্রযুক্তিকে এগিয়ে নিয়ে যেতে কাজ করার জন্য উন্মুখ।’
২০২৪ সালের নভেম্বরে প্রকাশের পর থেকে, এমসিপি ভাষা মডেলগুলোকে সরঞ্জাম এবং ডেটার (data) সাথে সংযুক্ত করার একটি সহজ, স্ট্যান্ডার্ডাইজড উপায় হিসেবে উল্লেখযোগ্য জনপ্রিয়তা অর্জন করেছে।
এমসিপি এআই মডেলগুলোকে কাজ সম্পূর্ণ করতে এবং কন্টেন্ট লাইব্রেরি (content libraries) এবং অ্যাপ্লিকেশন ডেভেলপমেন্ট এনভায়রনমেন্টে (application development environment) অ্যাক্সেস করতে এন্টারপ্রাইজ সরঞ্জাম এবং সফ্টওয়্যার থেকে ডেটা অ্যাক্সেস করতে সক্ষম করে। প্রোটোকলটি ডেভেলপারদের ডেটা উৎস এবং চ্যাটবটের (chatbots) মতো এআই-চালিত অ্যাপ্লিকেশনগুলোর মধ্যে দ্বি-মুখী সংযোগ স্থাপন করতে দেয়।
ডেভেলপাররা এমসিপি সার্ভারের (MCP servers) মাধ্যমে ডেটা ইন্টারফেস (data interface) উন্মোচন করতে পারেন এবং এই সার্ভারগুলোর সাথে সংযোগ স্থাপনের জন্য এমসিপি ক্লায়েন্ট (MCP client) (যেমন অ্যাপ্লিকেশন এবং ওয়ার্কফ্লো) তৈরি করতে পারেন। যেহেতু অ্যানথ্রোপিক এমসিপিকে ওপেন-সোর্স (open-source) করেছে, তাই বেশ কয়েকটি কোম্পানি তাদের প্ল্যাটফর্মে এমসিপি সমর্থন যুক্ত করেছে।
আয়রনউড: এআই-এর এক নতুন যুগের সূচনা
গুগলের আয়রনউড টিপিইউ এআই কম্পিউটিংয়ে একটি গুরুত্বপূর্ণ অগ্রগতি। এর অভূতপূর্ব কর্মক্ষমতা, অপ্টিমাইজড আর্কিটেকচার এবং এ২এ এবং এমসিপির মতো নতুন প্রোটোকলের সমর্থন এটিকে এআই উদ্ভাবনের পরবর্তী তরঙ্গের একটি গুরুত্বপূর্ণ সক্ষমতা হিসেবে প্রতিষ্ঠিত করেছে। এআই মডেলগুলো যত জটিল এবং চাহিদাপূর্ণ হবে, আয়রনউড নতুন সম্ভাবনা উন্মোচন এবং বিশ্বজুড়ে শিল্পগুলোকে রূপান্তরিত করার জন্য প্রয়োজনীয় শক্তি এবং নমনীয়তা প্রদান করবে। এটি কেবল একটি নতুন চিপ নয়; এটি বুদ্ধিমান মেশিনের (intelligent machines) দ্বারা চালিত একটি ভবিষ্যতের ভিত্তি, যা জটিল সমস্যাগুলো সমাধান করতে এবং আমাদের জীবনকে উন্নত করতে সম্মিলিতভাবে কাজ করবে।