Сущность MCP
Протокол MCP (Model Context Protocol) становится ключевым открытым стандартом, который коренным образом меняет способы взаимодействия инструментов, работающих на основе искусственного интеллекта (ИИ), с источниками данных. Способствуя безопасным двусторонним соединениям, MCP закладывает фундамент для быстрого развития агентной коммерции (a-commerce), трансформационного подхода, который использует ИИ-агентов для автоматизации и расширения возможностей коммерческих транзакций.
Изначально разработанный компанией Anthropic и теперь поддерживаемый также OpenAI, MCP предназначен для упрощения работы разработчиков по созданию ИИ-приложений, которые могут беспрепятственно получать доступ и использовать данные из различных источников. Архитектура протокола проста: она позволяет разработчикам предоставлять свои функции через MCP-серверы или создавать MCP-клиенты, которые могут подключаться к этим серверам для использования доступных функций.
С технической точки зрения, MCP-сервер служит шлюзом, через который разработчики предоставляют свои инструменты и функции. Затем ИИ-агенты могут использовать MCP-клиенты для подключения к этим серверам, обнаруживая и используя инструменты по мере необходимости. Когда агент запрашивает сервер для определения доступных инструментов, сервер предоставляет метаданные в стандартизированном формате JSON, что позволяет агенту понять, как использовать эти инструменты. Когда агент решает использовать инструмент, он отправляет запрос на вызов инструмента, обеспечивая беспрепятственное взаимодействие между сервером и клиентом.
Важность MCP: Обеспечение совместимости, координации и экосистемы
Важность MCP заключается в его способности предоставлять стандартизированный способ коммуникации между инструментами и агентами и обмена информацией о пользователях, задачах, данных и целях. Эта стандартизация дает множество преимуществ, в том числе:
- Совместимость: MCP позволяет различным ИИ-моделям, помощникам и внешним приложениям обмениваться контекстом, что упрощает интеграцию нескольких инструментов и служб на основе ИИ. Эта совместимость устраняет разрозненность между различными системами, позволяя им совместно работать для достижения общих целей.
- Координация: MCP помогает координировать задачи между различными ИИ-агентами и внешними приложениями, гарантируя, что они плавно работают вместе, не дублируя работу и не требуя повторного ввода данных пользователем. Благодаря координации задач MCP повышает эффективность и производительность, тем самым оптимизируя процессы на основе ИИ.
- Экосистема: Стандарты, такие как MCP, позволяют сторонним разработчикам создавать плагины или инструменты, которые могут легко ‘говорить на одном языке’ с ИИ-помощниками, что ускоряет рост экосистемы. Эта стандартизация способствует инновациям и сотрудничеству, что приводит к появлению большого количества расширяемых функций и приложений ИИ.
Например, MCP-сервер Google Maps предоставляет семь функций, включая преобразование адресов в координаты (и наоборот), поиск мест, получение подробной информации о местах, вычисление расстояния между местами (а также времени в пути), получение данных о высоте и получение маршрутов. Эти функции демонстрируют, как MCP может способствовать беспрепятственному доступу к различным службам и данным, поддерживая различные варианты использования в ИИ-приложениях.
Агентная коммерция: Трансформационное влияние MCP
Организации, заинтересованные в MCP, включают розничных продавцов, банки и другие организации, которые хотят разрабатывать свои собственные функции ИИ, чтобы их агенты могли взаимодействовать с агентами клиентов. Например, американское подразделение Walmart создает собственного агента для взаимодействия с агентами потребителей с целью предоставления рекомендаций или дополнительной информации о продуктах. В то же время агенты потребителей могут предоставлять агентам розничных продавцов информацию о предпочтениях и т.д.
Банки и розничные продавцы хотят, чтобы агенты клиентов взаимодействовали с агентами розничных продавцов, а не использовали веб-страницы или API для получения нужных им услуг. Фрэнк Янг (Frank Young) хорошо подытожил эту динамику, предложив организациям предоставлять API для поддержки простых процессов (например, подписки) с использованием существующей инфраструктуры, но для передовых возможностей агентной коммерции (переговоры, реагирование на мошенничество, оптимизация) реализовать MCP-серверы для захвата этих сложных и ценных сценариев.
Проблемы безопасности MCP
Хотя видение агентной коммерции привлекательно, необходимо решить проблемы безопасности, связанные с MCP, чтобы обеспечить его безопасное, надежное и экономически эффективное развертывание. MCP не определяет стандартного механизма аутентификации серверов и клиентов друг для друга, а также не определяет, как использовать делегирование аутентификации API. Эти лазейки в безопасности могут открыть двери для злонамеренных агентов, выдающих себя за законных лиц, несанкционированного доступа к конфиденциальным данным или инициирования вредоносных действий.
Одним из способов решения этих проблем безопасности является проверка учетных данных агента MCP-сервером на основе какой-либо формы реестра, что является базовым принципом KYC (Know Your Customer, знай своего клиента) для искусственного интеллекта, чтобы получить доступ могли только доверенные агенты. Это может быть предвестником более сложной инфраструктуры KYA (Know Your Agent, знай своего агента), которая обеспечит более надежные механизмы аутентификации и авторизации.
Поскольку MCP-серверы управляются независимыми разработчиками и участниками, не существует централизованной платформы для аудита, обеспечения соблюдения или проверки стандартов безопасности. Эта децентрализованная модель увеличивает вероятность несогласованности методов обеспечения безопасности, что затрудняет обеспечение соблюдения всеми MCP-серверами принципов безопасной разработки. Кроме того, MCP-серверы не имеют унифицированной системы управления пакетами, что усложняет процессы установки и обслуживания, увеличивая вероятность развертывания устаревших или неправильно настроенных версий. Использование неофициальных инструментов установки в различных MCP-клиентах еще больше усугубляет вариативность развертывания серверов, что затрудняет поддержание единых стандартов безопасности.
В MCP также отсутствует стандартная структура для обработки аутентификации и авторизации контрагентов, а также нет механизмов для проверки личности или регулирования доступа. Без этих механизмов трудно обеспечить соблюдение детальных разрешений. Поскольку MCP также не хватает модели разрешений и он полагается на OAuth, это означает, что сессия с инструментом либо доступна, либо полностью ограничена. Как отмечают в Andreessen Horowitz, по мере появления большего количества агентов и инструментов возникнут дополнительные сложности. Поэтому потребуется нечто большее, один из кандидатов – так называемая точка принятия решений по политике (Policy Decision Point, PDP). Это компонент, который оценивает политики контроля доступа. На основе таких входных данных, как идентификация актера, действие, ресурс и контекст, он решает, разрешить или запретить действие.
Майк Шварц (Mike Schwartz), основатель стартапа в области кибербезопасности Gluu, утверждает, что, хотя PDP когда-то была тяжеловесной инфраструктурой, работающей на серверах или мэйнфреймах, PDP с использованием языка политик Cedar с открытым исходным кодом достаточно мала и быстра, чтобы работать во встраиваемых мобильных приложениях, и должна развиться в важный компонент стека искусственного интеллекта агентов. AWS объявила о синтаксисе политик Cedar в 2024 году после обширных научных исследований по теме автоматизированных рассуждений. Важно отметить, что Cedar является детерминированным – при одинаковых входных данных вы всегда будете получать один и тот же ответ. Детерминизм в безопасности необходим для построения доверия, а для этого необходимо делать одно и то же снова и снова. Как говорит Майк, встраиваемая PDP на основе Cedar соответствует всем требованиям к агентам искусственного интеллекта.
Новое начало для MCP
Это больше, чем просто еще одна электронная коммерция. Как отмечает Джейми Смит (Jamie Smith), когда вы говорите своему агенту: ‘Найди в Париже отель стоимостью до 400 долларов с видом на Эйфелеву башню’, он не просто идет в Google и ищет. Он объединит запрос с вашими проверенными учетными данными (из вашего цифрового кошелька), предпочтениями по оплате, программами лояльности (и т. д.), а также ограничениями, такими как ценовой предел, диапазон дат и членство в программах. Это ‘структурированная контекстная полезная нагрузка’, отправляемая на различные туристические веб-сайты, которые могут отвечать и взаимодействовать с вашим агентом.
В отличие от электронной коммерции, построенной в интернете без уровня безопасности (и, следовательно, без цифровых валют и цифровой идентификации), агентная коммерция будет построена на безопасной инфраструктуре, предоставляемой участникам рынка. Внедрение этой безопасной инфраструктуры – отличная возможность для финтех-компаний и других стартапов, которые хотят предложить цифровые валюты и цифровую идентификацию в качестве основных компонентов. По мере стандартизации механизмов идентификации, аутентификациии авторизации вокруг MCP нет причин не ожидать быстрого ускорения агентной коммерции на массовом рынке.
По мере решения проблем безопасности MCP и завершения работ по стандартизации агентная коммерция сможет коренным образом изменить способы осуществления коммерческих транзакций. Используя возможности ИИ-агентов для автоматизации и расширения возможностей различных процессов, агентная коммерция обещает повышение эффективности, удобства и персонализации, создавая новые возможности для бизнеса и потребителей.
В конечном счете, MCP представляет собой переход к более безопасному, эффективному и ориентированному на ИИ будущему коммерции, который переопределит способы взаимодействия предприятий с клиентами и способы их работы.