رونمایی از پروتکل Agent2Agent گوگل

چشم‌انداز هوش مصنوعی به سرعت در حال تکامل است و Agentهای هوش مصنوعی به عنوان یک جزء محوری ظاهر می‌شوند. یک Agent هوش مصنوعی اساساً قدرت شناختی یک مدل زبان بزرگ (LLM) را با جعبه ابزاری ترکیب می‌کند که آن را قادر می‌سازد تا دستورات را اجرا کند، اطلاعات را بازیابی کند و وظایف را به طور مستقل انجام دهد. این Agentها به درخواست‌های کاربران پاسخ می‌دهند یا با Agentهای دیگر تعامل می‌کنند. پتانسیل Agentهای هوش مصنوعی در توانایی آنها برای مقیاس‌بندی عملیات، خودکارسازی فرآیندهای پیچیده و افزایش کارایی در سراسر عملکردهای مختلف تجاری نهفته است که به طور قابل توجهی بهره‌وری فردی را افزایش می‌دهد.

اجماع بر این است که یک Agent جهانی “مناسب برای همه” نمی‌تواند به طور موثر وظایف متنوع و پیچیده‌ای را که از Agentهای هوش مصنوعی انتظار می‌رود، انجام دهد. راه‌حل در گردش‌کارهای Agent محور نهفته است. اینها توسط شبکه‌هایی از Agentهای هوش مصنوعی خودمختار ایجاد می‌شوند که می‌توانند تصمیم بگیرند، اقدامات را اجرا کنند و وظایف را با حداقل نظارت انسانی هماهنگ کنند.

دیدگاه گوگل برای قابلیت همکاری Agent: پروتکل Agent2Agent (A2A)

گوگل در 9 آوریل 2025 پروتکل Agent2Agent (A2A) را معرفی کرد. این پروتکل برای تسهیل ارتباطات یکپارچه بین Agentهای هوش مصنوعی طراحی شده است و به آنها اجازه می‌دهد تا به طور ایمن داده‌ها را تبادل کنند و گردش‌کارهای تجاری پیچیده را خودکار کنند. این امر از طریق تعامل با سیستم‌های سازمانی و پلتفرم‌های شخص ثالث به دست می‌آید.

پروتکل A2A نتیجه همکاری بین گوگل و بیش از 50 شریک صنعتی است که همگی دیدگاه مشترکی برای آینده همکاری Agent هوش مصنوعی دارند. نکته مهم این است که این همکاری فراتر از فناوری‌های خاص است و بر اساس استانداردهای باز و ایمن بنا شده است.

اصول طراحی اصلی A2A

در طول توسعه پروتکل A2A، گوگل و شرکای آن توسط چندین اصل اساسی هدایت شدند:

  • باز و مستقل از فروشنده: پروتکل A2A باید باز باشد، به این معنی که مشخصات آن به طور عمومی در دسترس است. این امر تضمین می‌کند که هر توسعه‌دهنده یا سازمانی می‌تواند پروتکل را بدون محدودیت‌های اختصاصی پیاده‌سازی کند. مستقل از فروشنده به این معنی است که پروتکل به فناوری هیچ فروشنده خاصی وابسته نیست. این امر زمینه بازی برابر را برای همه شرکت‌کنندگان فراهم می‌کند.
  • روش‌های طبیعی برای همکاری: A2A به Agentها اجازه می‌دهد تا با استفاده از روش‌های ارتباطی ذاتی و غیرساخت‌یافته خود با هم همکاری کنند. این امر Agentها را از ابزارها متمایز می‌کند و A2A را از پروتکل زمینه مدل (MCP) متمایز می‌کند.
  • ساخته شده بر اساس استانداردهای موجود: برای ساده‌سازی ادغام با زیرساخت‌های فناوری اطلاعات موجود، پروتکل بر اساس استانداردهای تثبیت‌شده‌ای مانند HTTP، رویدادهای ارسال شده از سرور (SSE) و JSON-RPC ساخته شده است.
  • ایمن به طور پیش‌فرض: امنیت یک نگرانی اساسی است. A2A مکانیزم‌های احراز هویت و مجوز سازمانی را برای محافظت از داده‌های حساس و اطمینان از تعاملات ایمن ادغام می‌کند.
  • ناآگاهی از روش داده: A2A به ارتباطات متنی محدود نمی‌شود. این پروتکل می‌تواند انواع مختلف داده‌ها، از جمله تصاویر، صدا و جریان‌های ویدئویی را مدیریت کند.

قابلیت‌های A2A: توانمندسازی همکاری Agent

A2A طیف وسیعی از قابلیت‌های داخلی را برای ساده‌سازی تعاملات Agent ارائه می‌دهد:

  • کشف قابلیت: این به Agentها اجازه می‌دهد تا قابلیت‌های خود را تبلیغ کنند. مشتریان می‌توانند به راحتی تشخیص دهند که کدام Agent برای یک کار خاص مناسب‌تر است. آن را مانند یک بازار دیجیتال در نظر بگیرید که در آن Agentها مهارت‌ها و تخصص خود را به نمایش می‌گذارند.
  • مدیریت وظایف و حالت: ارتباط بین یک مشتری و یک Agent حول محور اجرای وظایف می‌چرخد. این وظایف توسط پروتکل تعریف شده‌اند و چرخه عمر مشخصی دارند. نتیجه یک کار به عنوان یک مصنوع نامیده می‌شود. مدیریت هم وظایف و هم حالت‌های آنها یک گردش کار قابل اعتماد و قابل ردیابی را تضمین می‌کند.
  • همکاری ایمن: Agentها می‌توانند به طور ایمن پیام‌ها را تبادل کنند تا زمینه را به اشتراک بگذارند، پاسخ ارائه دهند، مصنوعات را تحویل دهند یا دستورالعمل‌های کاربر را انتقال دهند. این امر یک محیط مشارکتی را تسهیل می‌کند که در آن Agentها می‌توانند به طور یکپارچه با هم کار کنند.
  • مذاکره تجربه کاربری: هر پیام شامل “بخش‌هایی” است که قطعات محتوای مستقل هستند، مانند یک تصویر تولید شده. هر بخش دارای یک نوع محتوا مشخص شده است که مشتری و Agent راه دور را قادر می‌سازد تا در مورد قالب مورد نیاز به توافق برسند. این ویژگی همچنین شامل مذاکره در مورد قابلیت‌های UI کاربر، مانند iframeها، ویدئو و فرم‌های وب است.

ویژگی‌های کشف قابلیت و مذاکره تجربه کاربری به ویژه قانع‌کننده هستند زیرا راه را برای ایجاد بازارهای Agent هموار می‌کنند. در این بازارها، ارائه‌دهندگان می‌توانند Agentهای خود را فهرست کنند و مشتریان می‌توانند مناسب‌ترین Agent را برای انجام وظایف خاص انتخاب کنند.

در حالی که این مفهوم بسیار امیدوارکننده و به طور بالقوه برای رشد بازار Agentهای هوش مصنوعی ضروری است، تحقق این دیدگاه به چیزی بیش از تعریف یک پروتکل تعامل نیاز دارد.

رمزگشایی مفاهیم پروتکل Agent2Agent

درک مفاهیم اصلی که زیربنای پروتکل هستند برای پیاده‌سازی و استفاده مؤثر از آن بسیار مهم است. این مفاهیم از قبل برای بسیاری از توسعه‌دهندگان Agentهای هوش مصنوعی آشنا خواهد بود:

  • کارت Agent: این یک فایل فراداده عمومی است که جزئیات قابلیت‌ها، مهارت‌ها، URL نقطه پایانی و الزامات احراز هویت یک Agent را شرح می‌دهد. کارت Agent نقش مهمی در مرحله کشف ایفا می‌کند و کاربران را قادر می‌سازد تا Agent مناسب را انتخاب کنند و نحوه تعامل با آن را درک کنند.
  • سرور: Agentای که روش‌های پروتکل A2A را همانطور که در مشخصات JSON تعریف شده است، پیاده‌سازی می‌کند. اساساً، سرور Agentای است که خدمات خود را از طریق پروتکل A2A ارائه می‌دهد.
  • مشتری: این می‌تواند یک برنامه یا Agent دیگری باشد که از خدمات A2A استفاده می‌کند. مشتری درخواست‌ها را آغاز می‌کند و از قابلیت‌های ارائه شده توسط سرور استفاده می‌کند.
  • وظیفه: واحد اصلی کار برای Agent. وظیفه توسط مشتری آغاز می‌شود و توسط سرور انجام می‌شود و در طول چرخه عمر خود در حالت‌های مختلف پیشرفت می‌کند.
  • پیام: نشان دهنده تبادلات ارتباطی بین مشتری و Agent است. هر پیام دارای یک نقش مشخص است و از بخش‌ها تشکیل شده است.
  • بخش: این واحد محتوای اساسی در یک پیام یا یک مصنوع است. یک بخش می‌تواند متن، یک فایل یا داده‌های ساخت‌یافته باشد. این امر امکان ارتباط انعطاف‌پذیر انواع مختلف داده‌ها را فراهم می‌کند.
  • مصنوع: نشان دهنده خروجی‌های تولید شده توسط Agent در هنگام تکمیل یک وظیفه است. مانند پیام‌ها، مصنوعات حاوی بخش‌ها هستند.
  • جریان: پروتکل از جریان پشتیبانی می‌کند و به سرور اجازه می‌دهد تا مشتری را در مورد وضعیت وظایف طولانی مدت در زمان واقعی به روز کند. این امر با ارائه بازخورد مداوم، تجربه کاربر را بهبود می‌بخشد.

چشم‌انداز فعلی پروژه Agent2Agent

A2A به تازگی به عموم معرفی شده است و مشخصات آن اکنون در GitHub در دسترس است. در حال حاضر، هیچ نقشه راه رسمی یا پیاده‌سازی آماده تولید از پروتکل وجود ندارد. با این حال، گوگل به طور فعال با شرکا برای راه‌اندازی نسخه آماده تولید در اواخر سال 2025 همکاری می‌کند.

مخزن A2A GitHub چندین نمونه کد در TypeScript و Python، همراه با یک برنامه آزمایشی جامع ارائه می‌دهد. این برنامه تعامل بین Agentهای توسعه یافته با استفاده از مجموعه‌های توسعه Agent (ADK) مختلف را نشان می‌دهد.

در حالی کهاین یک پایه برای آزمایش فراهم می‌کند، A2A باید در اکوسیستم موجود چارچوب‌ها و ابزارهای مورد استفاده برای استقرار گردش‌کارهای Agent محور ادغام شود تا بتواند در برنامه‌های کاربردی حیاتی مورد استفاده قرار گیرد.

حمایت از تعداد زیادی از بازیکنان اصلی (به ویژه، هیچ یک از شرکت‌هایی که مدل‌های پایه را ارائه می‌کنند حضور ندارند) که با گوگل در تعریف پروتکل کار می‌کنند، به شدت نشان می‌دهد که ابزارهای لازم به زودی در دسترس خواهند بود و A2A در چارچوب‌های Agent پیشرو ادغام خواهد شد.

A2A در مقابل پروتکل زمینه مدل (MCP): درک تفاوت

پروتکل زمینه مدل (MCP)، توسعه یافته توسط Anthropic، برنامه‌ها را قادر می‌سازد تا زمینه را برای مدل‌های زبان بزرگ فراهم کنند. Anthropic، MCP را “پورت USB-C برای برنامه‌های هوش مصنوعی” توصیف می‌کند و یک راه استاندارد برای اتصال LLMها به منابع داده و ابزارها ارائه می‌دهد، درست مانند USB که لوازم جانبی مختلف را به دستگاه‌ها متصل می‌کند.

به گفته گوگل، A2A قصد ندارد جایگزین MCP شود. همپوشانی کمی بین این دو پروتکل وجود دارد. آنها به مشکلات مختلف می‌پردازند و در سطوح مختلف انتزاع عمل می‌کنند. A2A تعامل بین Agentها را تسهیل می‌کند، در حالی که MCP مدل‌های زبان بزرگ را به ابزارها متصل می‌کند که به نوبه خود آنها را به خدمات و داده‌ها متصل می‌کند. بنابراین این دو پروتکل مکمل یکدیگر هستند.

Agent2Agent و Model Context Protocol دو قطعه از یک پازل هستند و هر دو برای تحقق چشم‌انداز آینده برای گردش‌کارهای Agent محور و هوش مصنوعی فراگیر مورد نیاز خواهند بود.