آیرنوود TPU گوگل: جهش کوانتومی در قدرت محاسباتی هوش مصنوعی
با رونمایی از هفتمین نسل واحد پردازش تانسور (TPU) گوگل با نام آیرنوود (Ironwood)، چشمانداز هوش مصنوعی دوباره تعریف شده است. این شتابدهنده هوش مصنوعی پیشرفته از توانایی محاسباتی برخوردار است که حتی قدرتمندترین ابررایانههای جهان را نیز تحتالشعاع قرار میدهد. در یک استقرار در مقیاس بزرگ، تواناییهای آیرنوود از سریعترین ابررایانه موجود، ۲۴ برابر فراتر میرود.
رونمایی از آیرنوود در رویداد Google Cloud Next ‘25، نقطه عطفی در پیگیری یک دههای گوگل در نوآوری تراشههای هوش مصنوعی محسوب میشود. در حالی که نسخههای قبلی TPU عمدتاً به حجم کاری آموزش و استنتاج مدلهای هوش مصنوعی پاسخ میدادند، آیرنوود به عنوان اولین تراشه با دقت طراحی و برای وظایف استنتاج بهینه شده، متمایز است.
به گفته امین وحدت، معاون رئیس و مدیر کل بخش یادگیری ماشینی، سیستمها و هوش مصنوعی ابری در گوگل، ‘آیرنوود به منظور پیشبرد مرحله بعدی هوش مصنوعی مولد طراحی شده است و نیازهای محاسباتی و ارتباطی عظیم آن را برآورده میکند. ما وارد دورانی میشویم که آن را ‘عصر استنتاج’ مینامیم، جایی که Agentهای هوش مصنوعی بهطور فعال دادهها را بازیابی و تولید میکنند تا بهطور مشترک بینشها و پاسخهایی ارائه دهند که از قابلیتهای صرف پردازش داده فراتر میروند.’
گشایش قدرت محاسباتی بیسابقه: غوطهوری در قابلیتهای آیرنوود
مشخصات فنی آیرنوود مانند لیست آرزوهای محققان و توسعهدهندگان هوش مصنوعی به نظر میرسد. آیرنوود که به یک پاد با ۹۲۱۶ تراشه مقیاسبندی میشود، ۴۲٫۵ اگزافلاپ از محاسبات هوش مصنوعی را ارائه میدهد. برای درک بهتر این موضوع، باید گفت که این میزان به طور چشمگیری از تواناییهای قهرمان فعلی ابررایانه، ال کاپیتان (El Capitan) که حداکثر به ۱٫۷ اگزافلاپ میرسد، فراتر میرود. به طور جداگانه، هر تراشه آیرنوود دارای حداکثر ظرفیت محاسباتی ۴۶۱۴ ترافلاپس است.
فراتر از قدرت پردازش خام، آیرنوود پیشرفتهای چشمگیری در حافظه و پهنای باند ارائه میدهد. هر تراشه مجهز به ۱۹۲ گیگابایت حافظه با پهنای باند بالا (HBM) است که در مقایسه با نسل قبلی TPU، تریلیوم (Trillium)، یک افزایش شش برابری را نشان میدهد. پهنای باند حافظه نیز به طور چشمگیری بهبود یافته و به ۷٫۲ ترابیت در ثانیه در هر تراشه رسیده است که ۴٫۵ برابر بیشتر از تریلیوم است.
در عصری که مراکز داده در حال گسترش هستند و مصرف انرژی به یک عامل فزاینده مهم تبدیل شده است، آیرنوود بهرهوری انرژی قابل توجهی را نشان میدهد. عملکرد آن در هر وات دو برابر تریلیوم و تقریبا ۳۰ برابر بهتر از اولین TPU معرفی شده در سال ۲۰۱۸ است.
این تغییر به سمت بهینهسازی استنتاج، نشاندهنده نقطه عطف مهمی در تکامل هوش مصنوعی است. در سالهای اخیر، آزمایشگاههای پیشرو هوش مصنوعی بر ساخت مدلهای پایه با تعداد پارامترهای رو به گسترش تمرکز کردهاند. تاکید گوگل بر بهینهسازی استنتاج، نشاندهنده تغییری به سمت اولویتبندی کارایی استقرار و قابلیتهای استنتاج دنیای واقعی است.
در حالی که آموزش مدل هوش مصنوعی یک فعالیت نسبتاً نادر است، عملیات استنتاج به دلیل فراگیرتر شدن فناوریهای هوش مصنوعی، میلیاردها بار در روز رخ میدهند. دوام اقتصادی مشاغل مبتنی بر هوش مصنوعی به طور ذاتی با هزینههای استنتاج مرتبط است، به ویژه با پیچیدهتر شدن مدلها.
در طول هشت سال گذشته، تقاضای گوگل برای محاسبات هوش مصنوعی به طور تصاعدی رشد کرده است، به طوری که ده برابر افزایش یافته و به رقم شگفتانگیز ۱۰۰ میلیون رسیده است. بدون معماریهای تخصصی مانند آیرنوود، قانون مور به تنهایی نمیتواند این روند رو به رشد را حفظ کند.
تاکید گوگل بر ‘مدلهای استدلالی’ که قادر به انجام وظایف استنتاج پیچیده هستند، به جای تشخیص الگوهای ساده، به ویژه قابل توجه است. این نشان میدهد که گوگل آیندهای را متصور است که در آن هوش مصنوعی نه تنها از طریق مدلهای بزرگتر، بلکه از طریق مدلهایی که قادر به شکستن مشکلات، انجام استدلالهای چند مرحلهای و تقلید از فرآیندهای فکری انسانمانند هستند، برتری مییابد.
توانمندسازی نسل بعدی مدلهای زبان بزرگ
گوگل، آیرنوود را به عنوان زیرساخت اصلی برای پیشرفتهترین مدلهای هوش مصنوعی خود، از جمله جمینی ۲٫۵ (Gemini 2.5) که دارای ‘قابلیتهای استدلال بومی’ است، معرفی میکند.
در کنار آیرنوود، گوگل از جمینی ۲٫۵ فلش (Gemini 2.5 Flash)، نسخه سادهشده مدل پرچمدار خود که برای برنامههای کاربردی روزمره و حساس به تأخیر طراحی شده است، رونمایی کرد. جمینی ۲٫۵ فلش میتواند به صورت پویا عمق استدلال خود را بر اساس پیچیدگی درخواست تنظیم کند.
گوگل همچنین مجموعه مدلهای مولد چندوجهی خود را به نمایش گذاشت که شامل تبدیل متن به تصویر، تبدیل متن به ویدئو و عملکرد جدید تبدیل متن به موسیقی، لیریا (Lyria) میشود. یک دمو قانعکننده نشان داد که چگونه میتوان این ابزارها را برای تولید یک ویدئوی تبلیغاتی کامل برای یک کنسرت ترکیب کرد.
آیرنوود تنها یکی از اجزای استراتژی زیرساخت جامع هوش مصنوعی گوگل است. این شرکت همچنین Cloud WAN را معرفی کرد، یک سرویس شبکه گسترده مدیریتشده که به کسبوکارها امکان میدهد از زیرساخت شبکه خصوصی در مقیاس جهانی گوگل بهره ببرند.
گوگل همچنین در حال گسترش پیشنهادات نرمافزاری خود برای حجم کاری هوش مصنوعی است، از جمله Pathways، یک زمان اجرای یادگیری ماشینی که توسط Google DeepMind توسعه یافته و به مشتریان امکان میدهد مقیاسبندی مدلها را در صدها TPU انجام دهند.
دیدگاهی از هوش مشارکتی: معرفی پشتیبانی از A2A و MCP
فراتر از پیشرفتهای سختافزاری، گوگل دیدگاه خود را برای هوش مصنوعی متمرکز بر سیستمهای چند Agent بیان کرد و پروتکل Agent-to-Agent (A2A) را معرفی کرد که برای تقویت ارتباطات امن و استاندارد بین Agentهای مختلف هوش مصنوعی طراحی شده است.
گوگل پیشبینی میکند که سال ۲۰۲۵ سالی متحولکننده برای هوش مصنوعی باشد و برنامههای هوش مصنوعی مولد از پاسخ دادن به سؤالات واحد به حل مشکلات پیچیده از طریق سیستمهای Agent به هم پیوسته، تکامل یابند.
پروتکل A2A قابلیت همکاری بین پلتفرمها و چارچوبها را فراهم میکند و به Agentهای هوش مصنوعی یک ‘زبان’ مشترک و کانالهای ارتباطی امن ارائه میدهد. این پروتکل را به عنوان یک لایه شبکه برای Agentهای هوش مصنوعی در نظر بگیرید که همکاری را در گردش کار پیچیده ساده میکند و Agentهای هوش مصنوعی تخصصی را قادر میسازد تا به طور جمعی وظایفی با پیچیدگی و مدت زمان متفاوت را انجام دهند و در نتیجه از طریق همکاری، قابلیتهای کلی را افزایش دهند.
نحوه کار A2A
گوگل یک نمای کلی مقایسهای از پروتکلهای MCP و A2A ارائه کرده است:
- MCP (پروتکل زمینه مدل): بر مدیریت ابزار و منابع متمرکز است.
- Agentها را از طریق ورودی/خروجی ساختاریافته به ابزارها، APIها و منابع متصل میکند.
- Google ADK از ابزارهای MCP پشتیبانی میکند و تعامل یکپارچه بین سرورهای MCP و Agentها را تسهیل میکند.
- A2A (پروتکل Agent2Agent): همکاری بین Agentها را تسهیل میکند.
- ارتباط پویا و چندوجهی بین Agentها را بدون نیاز به حافظه، منابع یا ابزارهای مشترک امکانپذیر میکند.
- این یک استاندارد باز است که توسط جامعه هدایت میشود.
- مثالها را میتوان با استفاده از ابزارهایی مانند Google ADK، LangGraph و Crew.AI بررسی کرد.
A2A و MCP مکمل یکدیگر هستند. MCP Agentها را به ابزارها مجهز میکند، در حالی که A2A این Agentهای مجهز را قادر میسازد تا با یکدیگر صحبت و همکاری کنند.
لیست اولیه شرکای گوگل نشان میدهد که A2A قرار است توجهی مشابه MCP را دریافت کند. این ابتکار عمل در حال حاضر بیش از ۵۰ سازمان، از جمله شرکتهای فناوری پیشرو و ارائه دهندگان جهانی مشاوره و یکپارچهسازی سیستم را به خود جذب کرده است.
گوگل بر باز بودن پروتکل تاکید میکند و آن را به عنوان استانداردی برای همکاری بین Agentها معرفی میکند که از چارچوبهای فناوری یا ارائه دهندگان خدمات زیربنایی فراتر میرود. گوگل پنج اصل راهنما را برجسته کرد که طراحی پروتکل را شکل دادند:
- پذیرش قابلیتهای Agent: A2A اولویت را به توانمندسازی Agentها برای همکاری طبیعی، حتی بدون به اشتراک گذاشتن حافظه، ابزار یا زمینه میدهد. هدف این است که سناریوهای چند Agent واقعی را فعال کنیم، نه اینکه صرفاً Agentها را به عنوان ‘ابزار’ محدود کنیم.
- ساخت بر اساس استانداردهای موجود: این پروتکل از استانداردهای موجود و به طور گسترده پذیرفته شده، از جمله HTTP، SSE و JSON-RPC استفاده میکند و ادغام با پشتههای IT موجود را ساده میکند.
- امنیت به طور پیشفرض: A2A برای پشتیبانی از احراز هویت و مجوز درجه سازمانی، قابل مقایسه با طرحهای احراز هویت OpenAPI، طراحی شده است.
- پشتیبانی از وظایف طولانیمدت: انعطافپذیری A2A به آن اجازه میدهد تا از طیف گستردهای از سناریوها، از وظایف سریع گرفته تا تحقیقات عمیق که ممکن است ساعتها یا حتی روزها طول بکشد (به ویژه زمانی که دخالت انسانی مورد نیاز است) پشتیبانی کند. در طول فرآیند، A2A میتواند بازخورد، اعلانها و بهروزرسانیهای وضعیت را در زمان واقعی در اختیار کاربران قرار دهد.
- ناآگاهی از حالت: A2A با تشخیص اینکه دنیای Agentها فراتر از متن است، از حالتهای مختلف، از جمله جریانهای صوتی و تصویری پشتیبانی میکند.
گوگل مثالی از نحوه سادهسازی فرآیند استخدام توسط A2A ارائه کرد.
در یک رابط یکپارچه مانند Agentspace، یک مدیر استخدام میتواند یک Agent را برای شناسایی نامزدهای مناسب بر اساس الزامات شغلی تعیین کند. این Agent میتواند با Agentهای تخصصی برای یافتن نامزدها تعامل داشته باشد. کاربران همچنین میتوانند به Agentها دستور دهند تا مصاحبهها را برنامهریزی کنند و Agentهای تخصصی دیگر را برای کمک به بررسی سوابق درگیر کنند، و در نتیجه استخدام کاملاً خودکار و هوشمند را در سراسر سیستمها امکانپذیر سازند.
پذیرش پروتکل زمینه مدل (MCP)
گوگل همچنین در حال پذیرش MCP است. اندکی پس از اعلام OpenAI مبنی بر پذیرش پروتکل زمینه مدل (MCP) آنتروپیک (Anthropic)، گوگل نیز از آن پیروی کرد.
دمیس حسابی، مدیرعامل Google DeepMind، در X (توییتر سابق) اعلام کرد که گوگل پشتیبانی از MCP را در مدلها و SDK جمینی خود اضافه خواهد کرد، اگرچه جدول زمانی خاصی ارائه نکرد.
حسابی اظهار داشت که ‘MCP یک پروتکل عالی است که به سرعت در حال تبدیل شدن به یک استاندارد باز برای عصر Agentهای هوش مصنوعی است. ما مشتاقانه منتظر همکاری با تیم MCP و سایر شرکای صنعت برای پیشبرد این فناوری هستیم.’
MCP از زمان انتشار در نوامبر ۲۰۲۴، به عنوان یک روش ساده و استاندارد برای اتصال مدلهای زبان با ابزارها و دادهها، به طور قابل توجهی مورد توجه قرار گرفته است.
MCP مدلهای هوش مصنوعی را قادر میسازد تا به دادهها از ابزارها و نرمافزارهای سازمانی برای تکمیل وظایف و دسترسی به کتابخانههای محتوا و محیطهای توسعه برنامههای کاربردی دسترسی داشته باشند. این پروتکل به توسعهدهندگان اجازه میدهد تا اتصالات دوطرفه بین منابع داده و برنامههای کاربردی مبتنی بر هوش مصنوعی مانند چتباتها ایجاد کنند.
توسعهدهندگان میتوانند رابطهای داده را از طریق سرورهای MCP در معرض نمایش قرار دهند و کلاینتهای MCP (مانند برنامهها و گردش کار) را برای اتصال به این سرورها بسازند. از آنجایی که آنتروپیک MCP را منبع باز کرده است، چندین شرکت پشتیبانی MCP را در پلتفرمهای خود ادغام کردهاند.
آیرنوود: طلوع عصر جدیدی در هوش مصنوعی
TPU آیرنوود گوگل نشاندهنده یک جهش قابل توجه در محاسبات هوش مصنوعی است. عملکرد بیسابقه، معماری بهینه شده و پشتیبانی از پروتکلهای نوظهور مانند A2A و MCP آن را به عنوان یک فعالکننده کلیدی برای موج بعدی نوآوریهای هوش مصنوعی قرار میدهد. با پیچیدهتر و پرتقاضاتر شدن مدلهای هوش مصنوعی، آیرنوود قدرت و انعطافپذیری خام مورد نیاز برای باز کردن امکانات جدید و متحول کردن صنایع در سراسر جهان را فراهم میکند. این فقط یک تراشه جدید نیست؛ بلکه پایهای برای آیندهای است که توسط ماشینهای هوشمند که به طور مشترک برای حل مشکلات پیچیده و بهبود زندگی ما کار میکنند، تامین میشود.