A2A от Google: будущее AI-агентов

В рамках шага, призванного переосмыслить ландшафт искусственного интеллекта, Google представила протокол Agent2Agent (A2A). Эта инициатива с открытым исходным кодом предназначена для содействия беспрепятственному и безопасному сотрудничеству между AI-агентами, работающими в различных экосистемах, освобождая их от ограничений конкретных фреймворков или поставщиков. Протокол A2A облегчает связь, обнаружение возможностей, согласование задач и совместные усилия на разных платформах, позволяя предприятиям создавать специализированные команды AI-агентов, способных управлять сложными рабочими процессами.

Раскрытие протокола Agent2Agent: новая парадигма AI-сотрудничества

Представление протокола A2A знаменует собой поворотный момент в эволюции AI, отвечая на растущую потребность во взаимодействии и сотрудничестве в мире, где AI-агенты все чаще развертываются на различных платформах и в различных средах. Создавая стандартизированную структуру для связи и взаимодействия между агентами, Google стремится раскрыть весь потенциал мультиагентных систем и стимулировать инновации в широком спектре отраслей.

Протокол A2A позволяет AI-агентам, построенным на разных платформах, эффективно общаться, обнаруживать возможности друг друга, согласовывать задачи и беспрепятственно сотрудничать. Эта совместимость позволяет предприятиям собирать команды специализированных агентов, которые могут обрабатывать сложные рабочие процессы с большей эффективностью и гибкостью.

Рассмотрим пример сценария найма. Используя унифицированный интерфейс Google Agentspace, менеджер по найму может делегировать задачи своему AI-агенту, поручив ему выявлять кандидатов, соответствующих указанному описанию вакансии, местоположению и требованиям к навыкам. Затем агент взаимодействует с другими специализированными агентами для поиска потенциальных кандидатов. Менеджер по найму получает отобранный список рекомендаций и может поручить своему агенту запланировать собеседования. После завершения собеседований можно привлечь другого агента для оказания помощи в проверке биографических данных.

Этот пример подчеркивает преобразующий потенциал протокола A2A в оптимизации и автоматизации сложных процессов, освобождая сотрудников для сосредоточения на более стратегических и творческих задачах.

Ключевые принципы проектирования протокола A2A

Протокол A2A построен на пяти основных принципах проектирования:

  • Использование возможностей агента: Протокол отдает приоритет предоставлению агентам возможности сотрудничать естественным, неструктурированным образом, даже если у них нет общей памяти, инструментов или контекстной информации. Этот подход способствует созданию истинных мультиагентных сценариев, избегая ограничения агентов статусом простого ‘инструмента’. Протокол A2A признает, что истинная сила AI заключается в способности агентов разумно работать вместе, используя свои индивидуальные сильные стороны для достижения общих целей.

  • Основываясь на существующих стандартах: Протокол построен на существующих, широко распространенных стандартах, таких как HTTP, SSE и JSON-RPC. Этот подход облегчает беспрепятственную интеграцию с существующей ИТ-инфраструктурой, упрощая предприятиям внедрение и реализацию протокола A2A без существенного нарушения их текущих систем.

  • Безопасность по умолчанию: Протокол включает в себя механизмы аутентификации и авторизации корпоративного уровня, гарантируя, что он изначально соответствует строгим стандартам безопасности. Функции безопасности протокола A2A соответствуют стандартам сертификации уровня OpenAPI, предоставляя предприятиям уверенность в том, что их данные и взаимодействия защищены.

  • Поддержка длительных задач: Протокол разработан для размещения широкого спектра задач, от быстрых, дискретных операций до углубленных исследовательских проектов, которые могут занимать часы или даже дни. На протяжении этих длительных задач протокол A2A предоставляет пользователям обратную связь в режиме реального времени, уведомления и обновления статуса, информируя их о ходе выполнения и любых соответствующих событиях.

  • Агностик модальности: Протокол поддерживает различные модальности, включая аудио и видео, позволяя агентам взаимодействовать и обмениваться информацией в наиболее подходящем формате для данной задачи. Эта гибкость гарантирует, что протокол A2A может применяться к широкому спектру вариантов использования, независимо от конкретных требований к вводу или выводу.

Широкое внедрение и поддержка A2A в отрасли

Протокол A2A получил значительную поддержку от ведущих технологических партнеров и поставщиков услуг, включая Atlassian, Box, Cohere, Intuit, Langchain, Accenture, BCG, Capgemini и Cognizant. Поддержка более чем 50 организаций подчеркивает признание отраслью потенциала протокола A2A для революции в сотрудничестве AI и стимулирования инноваций в различных секторах.

Широкое внедрение протокола A2A будет способствовать созданию динамичной экосистемы совместимых AI-агентов, позволяя предприятиям использовать коллективный интеллект нескольких агентов для решения сложных проблем и достижения своих стратегических целей.

Как работает протокол A2A: углубленное изучение

Протокол A2A облегчает связь между ‘клиентским’ агентом и ‘удаленным’ агентом. Клиентский агент инициирует и сообщает задачи, а удаленный агент выполняет эти задачи, предоставляет информацию или принимает соответствующие меры. Это взаимодействие включает в себя несколько ключевых возможностей:

  • Обнаружение возможностей: Агенты используют ‘Карты агентов’ в формате JSON для демонстрации своих возможностей. Это позволяет клиентским агентам определять наиболее подходящего агента для конкретной задачи и связываться с ним через протокол A2A. Карта агента предоставляет стандартизированный способ для агентов рекламировать свои навыки и опыт, облегчая другим агентам обнаружение и использование их услуг.

  • Управление задачами: Связь между клиентским и удаленным агентами ориентирована на задачи, при этом агенты сотрудничают для выполнения запросов конечных пользователей. Объект ‘задача’, определенный протоколом, имеет жизненный цикл. Он может быть выполнен немедленно или, для длительных задач, агенты могут общаться для поддержания синхронизации по последнему статусу. Результат задачи называется ‘артефактом’. Функции управления задачами протокола A2A гарантируют, что агенты сосредоточены на достижении конкретных целей и что их взаимодействия структурированы и эффективны.

  • Сотрудничество: Агенты могут отправлять сообщения друг другу, обмениваясь контекстом, ответами, артефактами или пользовательскими инструкциями. Эта возможность сотрудничества позволяет агентам обмениваться информацией, координировать свои усилия и работать вместе для достижения сложных целей.

  • Согласование пользовательского опыта: Каждое сообщение содержит ‘части’, которые представляют собой полные фрагменты контента, такие как сгенерированные изображения. Каждая часть имеет указанный тип контента, что позволяет клиентским и удаленным агентам согласовывать правильный формат. Это включает в себя согласование функций пользовательского интерфейса, таких как iframe, видео, веб-формы и многое другое. Функции согласования пользовательского опыта протокола A2A гарантируют, что взаимодействие между агентами будет беспрепятственным и удобным для пользователя.

A2A как дополнение к MCP

Google подчеркивает, что протокол A2A дополняет MCP (Meta-Config Protocol). В то время как MCP предоставляет агентам практические инструменты и контекстную информацию, протокол A2A решает проблемы, возникающие при развертывании крупномасштабных мультиагентных систем.

Протокол A2A предлагает стандартизированный подход к управлению агентами на различных платформах и в облачных средах. Эта универсальная совместимость имеет решающее значение для максимизации потенциала совместных AI-агентов.

Визуальное сравнение A2A и MCP

Визуальное представление эффективно иллюстрирует взаимосвязь между A2A и MCP. MCP облегчает подключение различных инструментов и ресурсов, а A2A обеспечивает связь между агентами.

Поддержка MCP со стороны Google DeepMind

Соучредитель и генеральный директор Google DeepMind Демис Хассабис публично поддержал MCP, заявив, что он быстро становится открытым стандартом для эпохи AI-агентов. DeepMind планирует поддерживать MCP для своих моделей Gemini и SDK, сигнализируя о твердой приверженности совместимости и стандартизации технологий AI-агентов.

Внедрение MCP облаком Alibaba

Облако Alibaba интегрировало полный жизненный цикл службы MCP в свою платформу Pailian. Платформа сочетает в себе возможности функциональных вычислений облака Alibaba с более чем 200 ведущими крупномасштабными моделями и 50+ основными службами MCP. Платформа предоставляет все вычислительные ресурсы, ресурсы больших моделей и цепочки инструментов приложений, необходимые для разработки агентов, позволяя пользователям быстро создавать свои собственные агенты MCP с минимальными усилиями.

Рассвет эпохи агентов

Последние разработки крупных технологических компаний подчеркивают наступление ‘Эпохи агентов’. Протокол A2A, наряду с другими инициативами, такими как MCP, прокладывают путь к будущему, в котором AI-агенты беспрепятственно сотрудничают для решения сложных проблем и расширения человеческих возможностей. Возможности огромны, и потенциальное влияние на различные отрасли значительно.