Обещания и вызовы унификации
Главная цель MCP - унификация, но на этом пути возникают серьезные препятствия. По мнению многих разработчиков и исследователей, хотя MCP эффективен для доступа к локальным корпоративным данным, он сталкивается с трудностями при попытке интеграции с интернет-приложениями для таких задач, как бронирование авиабилетов, проверка цен и создание туристических путеводителей. Эти проблемы связаны с незрелостью процессов вызова ИИ и ограниченной доступностью интернет-инструментов, при этом многие платформы предлагают доступ только к периферийным функциям.
Не все интернет-платформы одинаково воодушевлены перспективой принятия этого общего стандарта и присоединения к сети поставщиков услуг MCP. Закрытый характер китайской интернет-экосистемы, в сочетании с повышенной чувствительностью к конфиденциальности данных, заставил многие платформы проявить осторожность. Они предпочитают оценить жизнеспособность и развитие экосистемы MCP, прежде чем полностью посвятить себя этому.
Ландшафт ИИ известен своей быстро меняющейся терминологией и концепциями. Когда Anthropic впервые представила протокол MCP с открытым исходным кодом в конце прошлого года, отрасль в основном заняла выжидательную позицию. Однако взрывная популярность Manus с тех пор подогрела интерес к MCP в Китае.
MCP как катализатор агентности ИИ
По словам Хоу Синьи из Хуачжунского университета науки и технологий, решающий шаг в преодолении ограничений ‘чат-ботов’ заключается в том, чтобы позволить ИИ взаимодействовать с внешними данными и инструментами, что и стремится облегчить MCP.
До MCP исследовались альтернативные подходы для решения проблемы отсутствия ‘агентности ИИ’. В конце 2023 года OpenAI представила концепцию магазина приложений (GPT Store), позволяющего ChatGPT использовать внешние инструменты через плагины на основе определенного набора стандартов. Аналогичные магазины приложений ИИ, такие как Kouzi от ByteDance, Qianfan от Baidu и Bailian от Alibaba, последовали этому примеру.
Однако эти подходы в конечном итоге достигли своих пределов. Плагины и магазины приложений имели общую проблему: изолированность. Каждый инструмент имел свою собственную уникальную документацию по разработке, форматы параметров и спецификации интерфейса. Это означало, что разработчикам приходилось заново изобретать колесо каждый раз, когда они интегрировали новый инструмент в ИИ, что приводило к неэффективности.
Со временем количество новых инструментов, добавляемых в магазины приложений, уменьшилось, а качество плагинов значительно варьировалось, что затрудняло решение сложных задач. Это указывало на то, что существующие подходы приближаются к своим пределам.
MCP как унифицирующее решение
MCP рассматривается как многообещающее решение благодаря акценту на унификации. В своей официальной документации Anthropic сравнивает MCP с универсальным интерфейсом USB-C для мира ИИ. Хоу Синьи предпочитает описывать его как ‘док-станцию’ - универсальный адаптер, который позволяет ИИ подключаться к нескольким внешним инструментам одновременно, устраняя необходимость преобразования форматов.
Многие ожидают, что MCP окажет преобразующее воздействие, подобное стандартизации мер и весов Цинь Шихуаном, которая облегчила торговлю и общение между ранее раздробленными государствами периода Весны и Осени.
По словам технического руководителя рабочей группы по интеллектуальному взаимодействию крупной технологической компании, MCP также оптимизирует языковое взаимодействие ИИ. Ранее ИИ требовал от пользователей точно указать ‘Я хочу перейти к навигации’, чтобы использовать API службы навигации. Даже небольшое отклонение могло привести к сбою ИИ. Теперь каждый инструмент должен предоставлять стандартизированные имена, параметры и функциональные описания. В результате ИИ нужно только понять намерение пользователя, а затем сопоставить его с наиболее подходящим сервером MCP на основе описаний.
Этот подход больше соответствует присущим возможностям больших языковых моделей, позволяя пользователям вызывать службы одним предложением, отходя от предыдущего требования прямого взаимодействия между интерфейсами.
Текущее внедрение и ограничения MCP
Несмотря на свой предполагаемый потенциал, MCP еще не получил широкого распространения, и его практическое применение остается ограниченным. В настоящее время MCP наиболее популярен среди корпоративных технических специалистов и независимых разработчиков.
Как фронтенд-инженер, Гонг Диан в значительной степени полагается на помощника по программированию ИИ Cursor. Однако Cursor изо всех сил пытался плавно интегрироваться с внутренними проектными системами его компании, требуя ручного вмешательства. Хотя плагины или вызовы функций можно было использовать ранее, внешний ИИ не мог получить доступ к внутренним системам компании, а вызов в режиме реального времени вызывал опасения по поводу безопасности. MCP, с другой стороны, можно инициировать во внутренней сети компании, что делает его более надежным и соответствующим требованиям.
Независимый разработчик Чжу Мама недавно поручил Cursor изучить документацию MCP и упаковать API Карт Google и Поиска в сервер MCP, который затем был использован для вызова большой языковой модели Gemini от Google. Оснащенный MCP Gemini был преобразован в помощника по туристическим путеводителям. Когда его спросили о маршрутах общественного транспорта от сингапурского аэропорта до различных достопримечательностей, помощник предоставил более подробную и точную информацию по сравнению с ответом Doubao.
В сообществе разработчиков появляются различные туристические помощники. Когда Kouzi Space от ByteDance запустила свою внутреннюю бета-версию 19 апреля, демонстрационным случаем также был туристический помощник ИИ, что побудило некоторых пошутить об одержимости отрасли путешествиями.
Чжу Мама откровенно признает, что акцент на туристических сценариях в первую очередь связан с их актуальностью для повседневных потребительских нужд. Другой причиной является ограниченная доступность интернет-программного обеспечения, совместимого с MCP, в Китае, что ограничивает потенциал рынка.
Согласно последней статистике платформы навигации MCP.so, в мире насчитывается более 11 028 поставщиков услуг MCP, и их число быстро растет. Однако в Китае только несколько крупных приложений для определения географического положения, таких как AutoNavi, Карты Baidu и Карты Tencent, в настоящее время функционируют в качестве крупномасштабных серверов MCP.
Это ограничение является причиной того, что план Чжу Мамы по созданию китайской версии туристического помощника быстро застопорился. Для разработки китайского путеводителя идеально было бы использовать отечественные картографические сервисы. Однако Чжу Мама обнаружила, что официальный сервер MCP, предоставленный AutoNavi, предлагал очень ограниченную информацию. Хотя он мог предоставлять запросы маршрутов между двумя местоположениями, ему не хватало подробной информации о достопримечательностях, отзывах, ценах на билеты в отели и других важных деталей.
Напротив, API Карт Google предоставляет подробные методы бронирования, цены на отели, отзывы об отелях, удобства в отелях и даже сравнение цен на нескольких платформах, уровень детализации, который трудно представить в китайской экосистеме.
В то время как продукты Tencent, Alibaba, ByteDance и Baidu принимают MCP, их высокочастотные приложения еще формально не присоединились к сети поставщиков услуг MCP. Такие платформы, как WeChat, Xiaohongshu и Douyin, а также платформы услуг образа жизни, такие как Ele.me, Meituan и Ctrip, явно отсутствуют.
Проблемы доступности инструментов и планирования ИИ
В дополнение к ограниченной доступности инструментов, возможности планирования ИИ также представляют собой ограничение. Чжу Мама упаковала 6-8 интерфейсов API, включая Google Hotels, Maps и Search, в один сервер MCP, что намного ниже максимального предела (Cursor допускает максимум 40 инструментов на агента). Однако ИИ уже изо всех сил пытался определить, какой инструмент вызвать. Столкнувшись со сложными запросами, ИИ не смог разбить процесс и вызвать MCP поэтапно, вместо этого пытаясь справиться со всем сразу.
По словам Гонг Диана, ценность MCP зависит от качества как клиентской, так и серверной сторон. Подобно тому, как порт USB не имеет присущих ему возможностей и зависит от услуг, стоящих за ним, MCP требует надежных услуг для реализации своего потенциала.
MCP закладывает основу для агентов ИИ, но он не решает все проблемы. Стандарт, который остается неиспользованным, - это всего лишь кусок бумаги.
Вышеупомянутый технический руководитель предполагает, что широкое распространение стандарта MCP от Anthropic связано с его открытым исходным кодом, некоммерческим характером и авторитетом его создателя. Другие организации готовы следовать стандарту, установленному авторитетной организацией.
В настоящее время малые и средние компании и крупные интернет-компании, стремящиеся диверсифицировать свои потоки доходов, являются основными сторонниками стандарта MCP.
Компания MiniMax, занимающаяся компаньонством ИИ, недавно запустила сервер MCP, и менеджер сообщества Цай Цзяжэнь заявил, что разработчики могут использовать MCP для вызова мультимодальных возможностей MiniMax для создания видео, создания голоса и клонирования голоса. MCP включает в себя строгие механизмы контроля доступа для обеспечения соответствия требованиям, когда предприятия получают доступ к внутренним данным. Общий процесс вызова также упрощен, без добавления дополнительных затрат на токены.
Решение MiniMax о запуске сервера MCP было продиктовано желанием позволить глобальным разработчикам легко использовать возможности модели MiniMax и разблокировать более гибкое и эффективное создание.
Другие стартапы разделяют схожие устремления. Biu Technology упомянула в интервью, что разработчики могут использовать AutoNavi MCP для получения транспортных данных, а затем использовать продукты Biu для создания PPT. MCP снижает барьер для входа, предоставляя доступ к интерфейсу AutoNavi, который в противном случае был бы им недоступен.
Вышеупомянутый технический руководитель считает, что MCP - это, по сути, история о поставщиках услуг. Инкапсулируя свои API в соответствии со стандартом MCP, поставщики услуг приложений могут сделать свои услуги доступными для всего ИИ.
Расхождения и опасения среди поставщиков услуг
Однако среди поставщиков услуг возникают разногласия. Многие компании не полностью привержены этой идее. В то время как крупные платформы, такие как AutoNavi и Карты Baidu, запустили серверы MCP, они в основном переупаковывают существующие интерфейсы API, предлагая обычные функциональные возможности, сохраняя при этом строгий контроль над основными разрешениями пользователей и данными транзакций.
В дополнение к службам определения местоположения на карте, автоматический публикатор Xiaohongshu от стороннего разработчика, который автоматизирует поиск и публикацию контента, в настоящее время является самым популярным элементом на MCP plaza сообщества Modeng. Хоу Синьи предполагает, что это может оказать ограниченное влияние на платформы социального контента, такие как Xiaohongshu, но данные и разрешения становятся особенно чувствительными в сценариях с интенсивными транзакциями, таких как платформы доставки еды.
Одной из основных проблем для поставщиков услуг является контроль пользовательского опыта.
Например, открытие полной службы доставки еды требует предоставления агентам ИИ доступа к конфиденциальным персональным данным, таким как цены, информация о магазине, адреса пользователей и контактная информация. Anthropic признала, что система безопасности MCP, включая управление разрешениями и аудит вызовов, все еще находится в стадии разработки. Следовательно, некоторые платформы обеспокоены риском несанкционированного вызова при подключении к MCP.
Некоторые платформы тестируют относительно безопасные транзакционные сценарии. Например, Alipay недавно запустила сервер MCP, заявив, что предоставляет агентам ИИ ‘доступ к платежным возможностям одним щелчком мыши’. Однако более внимательный взгляд показывает, что он в основном предлагает услуги сбора, а не платежей.
По словам Хоу Синьи, подход Alipay фокусируется на облегчении сбора платежей торговцами, а не на том, чтобы позволить ИИ совершать платежи от имени потребителей. Это жизнеспособный вариант, поскольку предоставление ИИ возможности контролировать кошельки и свободно размещать заказы еще недостаточно безопасно для комфорта каждого. Это также является ключевой причиной того, почему транзакционные услуги не могут быть широко продвинуты.
Более глубокая проблема заключается в том, что если ИИ свободно участвует в процессе транзакции - помогая пользователям сравнивать цены или рекомендуя наиболее экономичный ресторан, - это, несомненно, обеспечит значительное удобство для пользователей. Однако это также будет означать, что платформы услуг потеряют контроль над процессом выбора пользователя, а их основные алгоритмические преимущества будут маргинализированы, что сведет их к обычным поставщикам.
Решение проблем безопасности и содействие универсальности
Многие участники интервью считают, что MCP необходимо решить две ключевые проблемы: безопасность и универсальность.
Во-первых, безопасность. Хоу Синьи отмечает, что MCP сталкивается с двумя проблемами безопасности: отсутствие централизованного контроля безопасности и неполный механизм проверки личности и авторизации данных. В настоящее время не существует официальной ‘площадки для обнаружения’ для MCP. Многие сторонние платформы навигации собирают услуги MCP, непосредственно извлекая кодовые проекты из GitHub, что быстро и просто, но не имеет формального процесса проверки. Anthropic заявила, что официально займется механизмом хостинга MCP и проблемами обнаружения в этом году. Недавно обновленный проект протокола Anthropic работает над устранением этого недостатка. Кроме того, отечественные организации, такие как IIFAA (Интернет-альянс доверенной аутентификации), пытаются восполнить пробел в безопасности.
Существуют также давние проблемы в области агентов ИИ, такие как угон подсказок и атаки с использованием комбинации инструментов. Однако вышеупомянутый технический руководитель считает, что это не уязвимости MCP, а скорее риски, которые существуют для любого агента ИИ. В настоящее время в самом протоколе MCP не обнаружено никаких очевидных уязвимостей безопасности, а механизмы передачи данных и взаимодействия в целом надежны.
Безопасность - это только первое препятствие. Реальная задача - преодолеть защиту интересов производителей и убедить больше производителей стать серверами MCP.
По словам Хоу Синьи, это связано с пониманием ‘огороженного сада’ интернет-платформ. Данные являются важным конкурентным барьером для различных платформ, поэтому многие производители могут открыть только некоторые периферийные функции в качестве серверов MCP для тестирования. Производителям, возможно, придется подождать и посмотреть, какое влияние окажет экосистема MCP.
Вышеупомянутое ответственное лицо заявило, что если он подключен к ИИ в качестве сервера MCP, он может получить больше пользовательских данных и привычек и вернуть их в свою собственную базовую модель, что может стать самой большой мотивацией для активного присоединения производителей.
Когда рынок серверов MCP действительно будет богатым, необходимо будет рассмотреть более отдаленные вопросы.
Например, как умные устройства вызывают различные приложения на мобильных телефонах? Ответственный за это лицо упомянул, что для того, чтобы разбудить другое приложение через локальное ИИ умное устройство мобильного телефона, потребуется дополнительный уровень авторизации приложения и проверки личности, что не так просто, как MCP, вызывающий облачные сервисы, и в настоящее время нет особенно подходящего решения.
В качестве другого примера, когда предложение услуг является чрезмерным, как умные устройства делают выбор - вызывать еду на вынос JD или Meituan? Использовать карту Gaode или карту Baidu? Несколько участников интервью отметили, что сегодняшняя логика вызова MCP все еще очень проста, в основном определяется ‘функциональным описанием’ поставщика услуг, и нет никакого механизма сортировки и оптимизации. Если поставщик услуг намеренно добавляет индуктивный язык в описание, такой как ‘самый эффективный’ и ‘обязательный для выбора’, ИИ может быть введен в заблуждение и перенаправлен в места, куда он не должен идти.
Как объяснил ответственный за вышеупомянутую технологию: ‘Это похоже на то, что вы не можете найти нужный сервис в поисковой системе, но появляется куча бессвязной информации. Как точно сопоставить сервис, который пользователям нужен больше всего, будущая экосистема MCP также столкнется с той же проблемой’.
В конечном счете, процесс реализации любого стандарта полон проблем. Хоу Синьи сказала, что для содействия популяризации MCP может понадобиться ключевая возможность, подобная Manus, чтобы по-настоящему заставить всю отрасль осознать силу MCP.