آیرن‌وود TPU گوگل: جهش کوانتومی در هوش مصنوعی

آیرن‌وود TPU گوگل: جهش کوانتومی در قدرت محاسباتی هوش مصنوعی

با رونمایی از هفتمین نسل واحد پردازش تانسور (TPU) گوگل با نام آیرن‌وود (Ironwood)، چشم‌انداز هوش مصنوعی دوباره تعریف شده است. این شتاب‌دهنده هوش مصنوعی پیشرفته از توانایی محاسباتی برخوردار است که حتی قدرتمندترین ابررایانه‌های جهان را نیز تحت‌الشعاع قرار می‌دهد. در یک استقرار در مقیاس بزرگ، توانایی‌های آیرن‌وود از سریع‌ترین ابررایانه موجود، ۲۴ برابر فراتر می‌رود.

رونمایی از آیرن‌وود در رویداد Google Cloud Next ‘25، نقطه عطفی در پیگیری یک دهه‌ای گوگل در نوآوری تراشه‌های هوش مصنوعی محسوب می‌شود. در حالی که نسخه‌های قبلی TPU عمدتاً به حجم کاری آموزش و استنتاج مدل‌های هوش مصنوعی پاسخ می‌دادند، آیرن‌وود به عنوان اولین تراشه با دقت طراحی و برای وظایف استنتاج بهینه شده، متمایز است.

به گفته امین وحدت، معاون رئیس و مدیر کل بخش یادگیری ماشینی، سیستم‌ها و هوش مصنوعی ابری در گوگل، ‘آیرن‌وود به منظور پیشبرد مرحله بعدی هوش مصنوعی مولد طراحی شده است و نیازهای محاسباتی و ارتباطی عظیم آن را برآورده می‌کند. ما وارد دورانی می‌شویم که آن را ‘عصر استنتاج’ می‌نامیم، جایی که Agentهای هوش مصنوعی به‌طور فعال داده‌ها را بازیابی و تولید می‌کنند تا به‌طور مشترک بینش‌ها و پاسخ‌هایی ارائه دهند که از قابلیت‌های صرف پردازش داده فراتر می‌روند.’

گشایش قدرت محاسباتی بی‌سابقه: غوطه‌وری در قابلیت‌های آیرن‌وود

مشخصات فنی آیرن‌وود مانند لیست آرزوهای محققان و توسعه‌دهندگان هوش مصنوعی به نظر می‌رسد. آیرن‌وود که به یک پاد با ۹۲۱۶ تراشه مقیاس‌بندی می‌شود، ۴۲٫۵ اگزافلاپ از محاسبات هوش مصنوعی را ارائه می‌دهد. برای درک بهتر این موضوع، باید گفت که این میزان به طور چشمگیری از توانایی‌های قهرمان فعلی ابررایانه، ال کاپیتان (El Capitan) که حداکثر به ۱٫۷ اگزافلاپ می‌رسد، فراتر می‌رود. به طور جداگانه، هر تراشه آیرن‌وود دارای حداکثر ظرفیت محاسباتی ۴۶۱۴ ترافلاپس است.

فراتر از قدرت پردازش خام، آیرن‌وود پیشرفت‌های چشمگیری در حافظه و پهنای باند ارائه می‌دهد. هر تراشه مجهز به ۱۹۲ گیگابایت حافظه با پهنای باند بالا (HBM) است که در مقایسه با نسل قبلی TPU، تریلیوم (Trillium)، یک افزایش شش برابری را نشان می‌دهد. پهنای باند حافظه نیز به طور چشمگیری بهبود یافته و به ۷٫۲ ترابیت در ثانیه در هر تراشه رسیده است که ۴٫۵ برابر بیشتر از تریلیوم است.

در عصری که مراکز داده در حال گسترش هستند و مصرف انرژی به یک عامل فزاینده مهم تبدیل شده است، آیرن‌وود بهره‌وری انرژی قابل توجهی را نشان می‌دهد. عملکرد آن در هر وات دو برابر تریلیوم و تقریبا ۳۰ برابر بهتر از اولین TPU معرفی شده در سال ۲۰۱۸ است.

این تغییر به سمت بهینه‌سازی استنتاج، نشان‌دهنده نقطه عطف مهمی در تکامل هوش مصنوعی است. در سال‌های اخیر، آزمایشگاه‌های پیشرو هوش مصنوعی بر ساخت مدل‌های پایه با تعداد پارامترهای رو به گسترش تمرکز کرده‌اند. تاکید گوگل بر بهینه‌سازی استنتاج، نشان‌دهنده تغییری به سمت اولویت‌بندی کارایی استقرار و قابلیت‌های استنتاج دنیای واقعی است.

در حالی که آموزش مدل هوش مصنوعی یک فعالیت نسبتاً نادر است، عملیات استنتاج به دلیل فراگیرتر شدن فناوری‌های هوش مصنوعی، میلیاردها بار در روز رخ می‌دهند. دوام اقتصادی مشاغل مبتنی بر هوش مصنوعی به طور ذاتی با هزینه‌های استنتاج مرتبط است، به ویژه با پیچیده‌تر شدن مدل‌ها.

در طول هشت سال گذشته، تقاضای گوگل برای محاسبات هوش مصنوعی به طور تصاعدی رشد کرده است، به طوری که ده برابر افزایش یافته و به رقم شگفت‌انگیز ۱۰۰ میلیون رسیده است. بدون معماری‌های تخصصی مانند آیرن‌وود، قانون مور به تنهایی نمی‌تواند این روند رو به رشد را حفظ کند.

تاکید گوگل بر ‘مدل‌های استدلالی’ که قادر به انجام وظایف استنتاج پیچیده هستند، به جای تشخیص الگوهای ساده، به ویژه قابل توجه است. این نشان می‌دهد که گوگل آینده‌ای را متصور است که در آن هوش مصنوعی نه تنها از طریق مدل‌های بزرگ‌تر، بلکه از طریق مدل‌هایی که قادر به شکستن مشکلات، انجام استدلال‌های چند مرحله‌ای و تقلید از فرآیندهای فکری انسان‌مانند هستند، برتری می‌یابد.

توانمندسازی نسل بعدی مدل‌های زبان بزرگ

گوگل، آیرن‌وود را به عنوان زیرساخت اصلی برای پیشرفته‌ترین مدل‌های هوش مصنوعی خود، از جمله جمینی ۲٫۵ (Gemini 2.5) که دارای ‘قابلیت‌های استدلال بومی’ است، معرفی می‌کند.

در کنار آیرن‌وود، گوگل از جمینی ۲٫۵ فلش (Gemini 2.5 Flash)، نسخه ساده‌شده مدل پرچمدار خود که برای برنامه‌های کاربردی روزمره و حساس به تأخیر طراحی شده است، رونمایی کرد. جمینی ۲٫۵ فلش می‌تواند به صورت پویا عمق استدلال خود را بر اساس پیچیدگی درخواست تنظیم کند.

گوگل همچنین مجموعه مدل‌های مولد چندوجهی خود را به نمایش گذاشت که شامل تبدیل متن به تصویر، تبدیل متن به ویدئو و عملکرد جدید تبدیل متن به موسیقی، لیریا (Lyria) می‌شود. یک دمو قانع‌کننده نشان داد که چگونه می‌توان این ابزارها را برای تولید یک ویدئوی تبلیغاتی کامل برای یک کنسرت ترکیب کرد.

آیرن‌وود تنها یکی از اجزای استراتژی زیرساخت جامع هوش مصنوعی گوگل است. این شرکت همچنین Cloud WAN را معرفی کرد، یک سرویس شبکه گسترده مدیریت‌شده که به کسب‌وکارها امکان می‌دهد از زیرساخت شبکه خصوصی در مقیاس جهانی گوگل بهره ببرند.

گوگل همچنین در حال گسترش پیشنهادات نرم‌افزاری خود برای حجم کاری هوش مصنوعی است، از جمله Pathways، یک زمان اجرای یادگیری ماشینی که توسط Google DeepMind توسعه یافته و به مشتریان امکان می‌دهد مقیاس‌بندی مدل‌ها را در صدها TPU انجام دهند.

دیدگاهی از هوش مشارکتی: معرفی پشتیبانی از A2A و MCP

فراتر از پیشرفت‌های سخت‌افزاری، گوگل دیدگاه خود را برای هوش مصنوعی متمرکز بر سیستم‌های چند Agent بیان کرد و پروتکل Agent-to-Agent (A2A) را معرفی کرد که برای تقویت ارتباطات امن و استاندارد بین Agentهای مختلف هوش مصنوعی طراحی شده است.

گوگل پیش‌بینی می‌کند که سال ۲۰۲۵ سالی متحول‌کننده برای هوش مصنوعی باشد و برنامه‌های هوش مصنوعی مولد از پاسخ دادن به سؤالات واحد به حل مشکلات پیچیده از طریق سیستم‌های Agent به هم پیوسته، تکامل یابند.

پروتکل A2A قابلیت همکاری بین پلتفرم‌ها و چارچوب‌ها را فراهم می‌کند و به Agentهای هوش مصنوعی یک ‘زبان’ مشترک و کانال‌های ارتباطی امن ارائه می‌دهد. این پروتکل را به عنوان یک لایه شبکه برای Agentهای هوش مصنوعی در نظر بگیرید که همکاری را در گردش کار پیچیده ساده می‌کند و Agentهای هوش مصنوعی تخصصی را قادر می‌سازد تا به طور جمعی وظایفی با پیچیدگی و مدت زمان متفاوت را انجام دهند و در نتیجه از طریق همکاری، قابلیت‌های کلی را افزایش دهند.

نحوه کار A2A

گوگل یک نمای کلی مقایسه‌ای از پروتکل‌های MCP و A2A ارائه کرده است:

  • MCP (پروتکل زمینه مدل): بر مدیریت ابزار و منابع متمرکز است.
    • Agentها را از طریق ورودی/خروجی ساختاریافته به ابزارها، APIها و منابع متصل می‌کند.
    • Google ADK از ابزارهای MCP پشتیبانی می‌کند و تعامل یکپارچه بین سرورهای MCP و Agentها را تسهیل می‌کند.
  • A2A (پروتکل Agent2Agent): همکاری بین Agentها را تسهیل می‌کند.
    • ارتباط پویا و چندوجهی بین Agentها را بدون نیاز به حافظه، منابع یا ابزارهای مشترک امکان‌پذیر می‌کند.
    • این یک استاندارد باز است که توسط جامعه هدایت می‌شود.
    • مثال‌ها را می‌توان با استفاده از ابزارهایی مانند Google ADK، LangGraph و Crew.AI بررسی کرد.

A2A و MCP مکمل یکدیگر هستند. MCP Agentها را به ابزارها مجهز می‌کند، در حالی که A2A این Agentهای مجهز را قادر می‌سازد تا با یکدیگر صحبت و همکاری کنند.

لیست اولیه شرکای گوگل نشان می‌دهد که A2A قرار است توجهی مشابه MCP را دریافت کند. این ابتکار عمل در حال حاضر بیش از ۵۰ سازمان، از جمله شرکت‌های فناوری پیشرو و ارائه دهندگان جهانی مشاوره و یکپارچه‌سازی سیستم را به خود جذب کرده است.

گوگل بر باز بودن پروتکل تاکید می‌کند و آن را به عنوان استانداردی برای همکاری بین Agentها معرفی می‌کند که از چارچوب‌های فناوری یا ارائه دهندگان خدمات زیربنایی فراتر می‌رود. گوگل پنج اصل راهنما را برجسته کرد که طراحی پروتکل را شکل دادند:

  1. پذیرش قابلیت‌های Agent: A2A اولویت را به توانمندسازی Agentها برای همکاری طبیعی، حتی بدون به اشتراک گذاشتن حافظه، ابزار یا زمینه می‌دهد. هدف این است که سناریوهای چند Agent واقعی را فعال کنیم، نه اینکه صرفاً Agentها را به عنوان ‘ابزار’ محدود کنیم.
  2. ساخت بر اساس استانداردهای موجود: این پروتکل از استانداردهای موجود و به طور گسترده پذیرفته شده، از جمله HTTP، SSE و JSON-RPC استفاده می‌کند و ادغام با پشته‌های IT موجود را ساده می‌کند.
  3. امنیت به طور پیش‌فرض: A2A برای پشتیبانی از احراز هویت و مجوز درجه سازمانی، قابل مقایسه با طرح‌های احراز هویت OpenAPI، طراحی شده است.
  4. پشتیبانی از وظایف طولانی‌مدت: انعطاف‌پذیری A2A به آن اجازه می‌دهد تا از طیف گسترده‌ای از سناریوها، از وظایف سریع گرفته تا تحقیقات عمیق که ممکن است ساعت‌ها یا حتی روزها طول بکشد (به ویژه زمانی که دخالت انسانی مورد نیاز است) پشتیبانی کند. در طول فرآیند، A2A می‌تواند بازخورد، اعلان‌ها و به‌روزرسانی‌های وضعیت را در زمان واقعی در اختیار کاربران قرار دهد.
  5. ناآگاهی از حالت: A2A با تشخیص اینکه دنیای Agentها فراتر از متن است، از حالت‌های مختلف، از جمله جریان‌های صوتی و تصویری پشتیبانی می‌کند.

گوگل مثالی از نحوه ساده‌سازی فرآیند استخدام توسط A2A ارائه کرد.

در یک رابط یکپارچه مانند Agentspace، یک مدیر استخدام می‌تواند یک Agent را برای شناسایی نامزدهای مناسب بر اساس الزامات شغلی تعیین کند. این Agent می‌تواند با Agentهای تخصصی برای یافتن نامزدها تعامل داشته باشد. کاربران همچنین می‌توانند به Agentها دستور دهند تا مصاحبه‌ها را برنامه‌ریزی کنند و Agentهای تخصصی دیگر را برای کمک به بررسی سوابق درگیر کنند، و در نتیجه استخدام کاملاً خودکار و هوشمند را در سراسر سیستم‌ها امکان‌پذیر سازند.

پذیرش پروتکل زمینه مدل (MCP)

گوگل همچنین در حال پذیرش MCP است. اندکی پس از اعلام OpenAI مبنی بر پذیرش پروتکل زمینه مدل (MCP) آنتروپیک (Anthropic)، گوگل نیز از آن پیروی کرد.

دمیس حسابی، مدیرعامل Google DeepMind، در X (توییتر سابق) اعلام کرد که گوگل پشتیبانی از MCP را در مدل‌ها و SDK جمینی خود اضافه خواهد کرد، اگرچه جدول زمانی خاصی ارائه نکرد.

حسابی اظهار داشت که ‘MCP یک پروتکل عالی است که به سرعت در حال تبدیل شدن به یک استاندارد باز برای عصر Agentهای هوش مصنوعی است. ما مشتاقانه منتظر همکاری با تیم MCP و سایر شرکای صنعت برای پیشبرد این فناوری هستیم.’

MCP از زمان انتشار در نوامبر ۲۰۲۴، به عنوان یک روش ساده و استاندارد برای اتصال مدل‌های زبان با ابزارها و داده‌ها، به طور قابل توجهی مورد توجه قرار گرفته است.

MCP مدل‌های هوش مصنوعی را قادر می‌سازد تا به داده‌ها از ابزارها و نرم‌افزارهای سازمانی برای تکمیل وظایف و دسترسی به کتابخانه‌های محتوا و محیط‌های توسعه برنامه‌های کاربردی دسترسی داشته باشند. این پروتکل به توسعه‌دهندگان اجازه می‌دهد تا اتصالات دوطرفه بین منابع داده و برنامه‌های کاربردی مبتنی بر هوش مصنوعی مانند چت‌بات‌ها ایجاد کنند.

توسعه‌دهندگان می‌توانند رابط‌های داده را از طریق سرورهای MCP در معرض نمایش قرار دهند و کلاینت‌های MCP (مانند برنامه‌ها و گردش کار) را برای اتصال به این سرورها بسازند. از آنجایی که آنتروپیک MCP را منبع باز کرده است، چندین شرکت پشتیبانی MCP را در پلتفرم‌های خود ادغام کرده‌اند.

آیرن‌وود: طلوع عصر جدیدی در هوش مصنوعی

TPU آیرن‌وود گوگل نشان‌دهنده یک جهش قابل توجه در محاسبات هوش مصنوعی است. عملکرد بی‌سابقه، معماری بهینه شده و پشتیبانی از پروتکل‌های نوظهور مانند A2A و MCP آن را به عنوان یک فعال‌کننده کلیدی برای موج بعدی نوآوری‌های هوش مصنوعی قرار می‌دهد. با پیچیده‌تر و پرتقاضاتر شدن مدل‌های هوش مصنوعی، آیرن‌وود قدرت و انعطاف‌پذیری خام مورد نیاز برای باز کردن امکانات جدید و متحول کردن صنایع در سراسر جهان را فراهم می‌کند. این فقط یک تراشه جدید نیست؛ بلکه پایه‌ای برای آینده‌ای است که توسط ماشین‌های هوشمند که به طور مشترک برای حل مشکلات پیچیده و بهبود زندگی ما کار می‌کنند، تامین می‌شود.