Недавно Google представила новый открытый протокол для агентов под названием Agent2Agent, или сокращенно A2A. Одновременно с этим, Bailian от Alibaba Cloud также объявила о своем вступлении в MCP. Давайте углубимся в то, что представляют собой A2A и MCP.
Чтобы понять эти протоколы, представьте аналогию с дипломатией между странами. Представьте себе каждого AI-агента как небольшую страну со своим языком и обычаями. Эти “страны” имеют посольства, расположенные в одном и том же здании, и пытаются общаться, торговать и обмениваться информацией.
В идеальном сценарии эти страны поддерживали бы дружеские отношения и придерживались четкого набора дипломатических правил, позволяющих им беспрепятственно взаимодействовать, подписывать соглашения и сотрудничать в международных проектах за круглым столом.
Однако реальность такова, что каждое посольство функционирует независимо с разрозненными протоколами. Следовательно, для заключения простого торгового соглашения со ‘Страной А’ необходимо выполнить множество требований, включая положения, сертификаты, переводы и специальные ключи. Взаимодействие со ‘Страной Б’ и ‘Страной В’ требует многократного повторения аналогичных процедур. Этот специальный, фрагментированный и многогранный подход увеличивает расходы на связь, при этом каждое взаимодействие влечет за собой дополнительный ‘информационный тариф’.
В прошлом AI-агенты сталкивались с аналогичными затруднениями при попытке сотрудничать.
Например, у вас может быть агент, который автоматически отвечает на электронные письма, и другой, интегрированный в приложение календаря для помощи в планировании. Однако эти AI-сущности с трудом общаются напрямую, что требует ручного копирования и вставки информации или использования пользовательских интерфейсов.
В результате AI-агенты работают изолированно, демонстрируя плохую функциональную совместимость. Эта фрагментация разочаровывает пользователей, которые должны перемещаться между несколькими AI-приложениями, и ограничивает потенциал AI. Сложные задачи, которые можно было бы выполнить посредством многоагентного сотрудничества, искусственно ограничены отдельными ячейками.
Эта ситуация отражает ситуацию после Второй мировой войны, когда каждый AI-агент действует автономно, не имея единых правил и сталкиваясь с коммуникационными барьерами. Нынешняя AI-экосистема напоминает послевоенную пустошь, требующую соблюдения определенных интерфейсов и протоколов для доступа к данным и функциям. Отсутствие стандартов налагает дополнительные ‘тарифы’ с каждым новым отношением сотрудничества, что приводит к разобщенной и неэффективной AI-экосистеме, характеризующейся изоляцией и корыстными интересами.
AI-индустрия изучает возможность установления общепринятого протокола для облегчения беспрепятственного взаимодействия между агентами и внешними инструментами. Google и Anthropic стали лидерами, предложив каждое свое решение: протокол A2A и протокол MCP.
Протокол A2A
Протокол A2A, сокращение от Agent2Agent, позволяет AI-агентам общаться и сотрудничать напрямую.
Основная цель протокола A2A – дать возможность агентам различного происхождения и от разных поставщиков понимать и сотрудничать друг с другом, подобно усилиям Всемирной торговой организации по снижению торговых барьеров.
Приняв A2A, агенты от разных поставщиков и из разных структур могут присоединиться к зоне свободной торговли, общаясь на общем языке и беспрепятственно сотрудничая для выполнения сложных задач, выходящих за рамки возможностей отдельных агентов.
Чтобы проиллюстрировать, как работает A2A, рассмотрим следующие аналогии:
1. Агент = Национальный дипломат
Каждый агент функционирует как дипломат, представляющий посольство страны. Протокол A2A направлен на установление единого дипломатического этикета и процедур связи. Ранее дипломаты из ‘Страны А’ общались исключительно на французском языке, а дипломаты из ‘Страны Б’ использовали кириллицу, а ‘Страна В’ требовала корреспонденции посредством древних писем на сусальном золоте. Протокол A2A гарантирует, что все участники могут общаться на предварительно согласованном языке, представлять документы в одном и том же формате и выполнять согласованные результаты.
2. Карточка агента = Дипломатические полномочия / Визитная карточка посла
В рамках A2A каждый агент должен опубликовать ‘Карточку агента’, аналогичную визитной карточке дипломата, содержащую такие детали, как имя агента, версия, возможности и поддерживаемые языки или форматы.
Подобно тому, как визитная карточка дипломата определяет его роль и принадлежность, Карточка агента перечисляет навыки агента, методы аутентификации и форматы ввода/вывода. Это позволяет другим дипломатам быстро идентифицировать и понимать возможности, сводя к минимуму коммуникационные барьеры.
3. Задача = Двусторонний или многосторонний дипломатический проект
Концепция задачи является центральной для A2A. Когда агент намерен делегировать задачу другому агенту, он выдает ‘письмо о намерениях по проекту сотрудничества’. После принятия обе стороны записывают идентификатор задачи для отслеживания прогресса и обмена информацией до завершения.
В дипломатических терминах страна может предложить другой: ‘Мы хотим сотрудничать в строительстве трансграничной высокоскоростной железнодорожной линии; пожалуйста, отправьте свою инженерную команду’. Это отражает задачу A2A, где инициирующая сторона излагает требования, удаленный агент принимает их, и обе стороны регулярно обновляют прогресс на протяжении всего проекта.
Сообщения представляют собой сообщения, которыми обмениваются на начальном или промежуточном этапах проекта, аналогичные дипломатическим телеграммам, заметкам и обменам посланниками.
4. Push-уведомления = Бюллетени дипломатического посольства
В A2A, если задача представляет собой долгосрочный проект, требующий длительного времени завершения, удаленный агент может обновлять информацию об инициирующей стороне посредством push-уведомлений, аналогично тому, как страна предоставляет периодические обновления по долгосрочному инфраструктурному проекту. Это расширяет возможности асинхронного сотрудничества.
5. Аутентификация и безопасность = Дипломатические привилегии и протоколы
A2A использует стратегии аутентификации корпоративного уровня, требуя, чтобы обе общающиеся стороны проверяли учетные данные для предотвращения выдачи себя за другое лицо или злонамеренного подслушивания. Этот механизм параллелен дипломатическим привилегиям и протоколам.
По сути, A2A отражает динамику международной дипломатии или делового сотрудничества, подчеркивая стандартизированную коммуникацию и безопасность.
Протокол MCP
Протокол MCP, или протокол контекста модели, – это стандарт, представленный и открытый Anthropic в ноябре 2024 года.
В то время как A2A решает проблему процесса коммуникации между AI-дипломатами, сохраняется постоянная проблема: отсутствие надежных источников информации. Даже самый красноречивый дипломат или бизнес-руководитель плохо подготовлен для эффективной работы без точной информации о международной обстановке и распределении ресурсов.
Современные дипломаты полагаются на внешние инструменты, такие как визовые системы, системы международных расчетов и базы данных разведывательной информации, для выполнения своих обязанностей. Аналогичным образом, агент, принимающий на себя сложные обязанности, должен подключаться к различным базам данных, системам документации, корпоративным приложениям и даже аппаратным устройствам.
Это можно сравнить с созданием всеобъемлющего разведывательного агентства для дипломатов и предоставлением им доступа к инструментам для облегчения их работы.
Ранее агентам приходилось разрабатывать пользовательские плагины и глубоко интегрироваться с различными инструментами, что было трудоемким и отнимало много времени. Однако теперь MCP доступен для оптимизации этого процесса.
MCP стандартизирует взаимодействие между большими языковыми моделями и внешними источниками данных и инструментами. Anthropic сравнивает MCP с портом USB-C для AI-приложений.
USB-C служит универсальным интерфейсом для устройств, обеспечивая зарядку и передачу данных через один порт. MCP стремится создать универсальный интерфейс в AI-домене, позволяющий различным моделям и внешним системам подключаться с использованием одного и того же протокола, а не разрабатывать пользовательские решения для интеграции каждый раз.
AI-модели, подключающиеся к базам данных, поисковым системам или сторонним приложениям, могут беспрепятственно общаться, если все они поддерживают MCP.
MCP использует клиент-серверную архитектуру:
1. Сервер MCP = Объединенное разведывательное управление
Организации или отдельные лица могут инкапсулировать базы данных, файловые системы, календари и сторонние сервисы в серверы MCP. Эти серверы придерживаются протокола MCP, предоставляя единообразно отформатированные точки доступа, позволяя любому агенту, соответствующему стандартам клиента MCP, отправлять запросы, извлекать информацию или выполнять операции.
2. Клиент MCP = Терминальное оборудование, используемое дипломатами
Агент-дипломат носит с собой специальное терминальное оборудование, позволяющее ему вводить команды, такие как ‘Получить данные инвентаризации из финансовой системы’, ‘Отправить запрос в API’ или ‘Получить PDF-документ’.
Без MCP интеграция с различными системами требует написания различных кодов доступа, что является обременительным. Однако с помощью MCP клиенты, поддерживающие протокол, могут легко переключаться между различными серверами MCP, извлекая информацию и выполняя бизнес-процессы.
По сути, MCP облегчает беспрепятственную интеграцию между AI-агентами и внешними ресурсами.
Различие между A2A и MCP
Чтобы прояснить различие между A2A и MCP, рассмотрим гипотетический международный саммит, где главы государств (представляющие AI-агентов компаний) собираются для сотрудничества над транснациональной задачей, такой как составление отчета о глобальном экономическом анализе.
Без универсального протокола такая встреча была бы практически невозможной, поскольку каждый представитель говорит на другом языке. Однако с протоколом A2A все представители подписывают ‘Венскую дипломатическую конвенцию A2A’ перед входом на встречу, соглашаясь общаться в едином формате, идентифицировать себя, излагать свои намерения и ссылаться на предыдущие идентификаторы发言 при ответе.
Это позволяет ‘Агенту G’ отправить сообщение ‘Агенту O’ в формате A2A, и ‘Агент O’ отвечает соответственно. Это знаменует собой первый случай беспрепятственной коммуникации между AI-агентами из разных компаний.
Во время обсуждений представителям AI необходимо консультироваться с данными или использовать инструменты для анализа. ‘Агент A’ от Anthropic предлагает использовать систему MCP для внешней поддержки данных или инструментов.
Наряду с конференц-залом создается ‘комната синхронного перевода MCP’, в которой работают эксперты, которые могут отвечать на едином языке через MCP после получения запросов.
Например, ‘Агенту Q’ необходимо получить доступ к своей облачной базе данных для расчетов. Вместо того чтобы отправлять кого-то обратно в страну, он отправляет запрос MCP на данные из базы данных X. Администратор базы данных MCP переводит запрос, извлекает результаты и отвечает ‘Агенту Q’ на языке MCP. Весь процесс прозрачен для других агентов, которые понимают данные, цитируемые ‘Агентом Q’, потому что перевод MCP выполнен в узнаваемом формате.
По мере продвижения написания отчета ‘Агент G’ и ‘Агент A’ понимают, что им необходимо интегрировать свои соответствующие вклады. ‘Агент G’ специализируется на численном анализе, а ‘Агент A’ преуспевает в обобщении языка.
‘Агент G’ передает данные о темпах роста ВВП через A2A, а ‘Агент A’ подключается к плагину электронной таблицы Excel через MCP, проверяет тенденции данных и отвечает обобщающим абзацем.
В этом сценарии A2A облегчает коммуникацию между агентами, а MCP позволяет агентам получать доступ к внешним инструментам и информации. Вместе протоколы создают индивидуальное коммуникационное соглашение для AI-версии Организации Объединенных Наций. С этими протоколами AI-агенты могут эффективно сотрудничать, формируя взаимосвязанную AI-экосистему.
A2A сродни выделенной горячей линии для дипломатической связи, адресованной прямой коммуникации агентов. MCP аналогичен системе синхронного перевода и обмена ресурсами, решающей проблему подключения интеллектуальных сущностей к внешней информации.
Появление A2A и MCP предвещает эволюцию AI-индустрии в направлении сотрудничества, а не конкуренции. Бесчисленные AI-агенты будут развернуты, как веб-сайты, обнаруживая и общаясь через A2A и получая доступ к ресурсам и обмениваясь знаниями через MCP.