Хладният прием на MCP от IT гигантите

Обещанието и предизвикателствата на унификацията

Дискурсът около оперативната съвместимост на AI се засилва. След като Baidu обяви своите всеобхватни MCP услуги на конференцията си за разработчици миналата седмица, големи китайски технологични фирми като Alibaba, ByteDance и Tencent също се включиха в пътуването към MCP.

MCP, или Model Context Protocol, е замислен като обединяващ стандарт, който позволява на AI да взаимодейства безпроблемно с множество приложения и услуги. Може да се оприличи на вездесъщия USB интерфейс, който се среща в компютрите и смартфоните, позволявайки plug-and-play интеграцията на разнообразни външни устройства. По същество, MCP цели да предостави на AI универсален ‘USB порт’ за достъп до инструменти и изпълнение на задачи.

През ноември 2024 г. Anthropic, американска AI компания, представи MCP стандарта, който бързо беше възприет от конкуренти като OpenAI и Google, сигнализирайки за отклонение от конвенционалната конкурентна практика на собствени екосистеми. От април месец, водещи китайски технологични компании, включително Bailian на Alibaba Cloud, Knowledge Engine на Tencent Cloud, Kouzi Space на ByteDance и Baidu AI Cloud, стартираха свои собствени всеобхватни MCP услуги.

Основната цел на MCP е да насърчи унификацията, но това начинание е изправено пред значителни предизвикателства. Според множество разработчици и изследователи, въпреки че MCP е ефективен за достъп до локални корпоративни данни, той среща препятствия при опит за интегриране с интернет приложения за задачи като резервиране на полети, проверка на цени и създаване на туристически ръководства. Тези предизвикателства произтичат от незрялостта на процесите на извикване на AI и ограничената наличност на интернет инструменти, като много платформи предлагат достъп само до периферни функционалности.

Не всички интернет платформи са еднакво ентусиазирани да приемат този общ стандарт и да се присъединят към мрежата от доставчици на MCP услуги. Затвореният характер на китайската интернет екосистема, съчетан с повишена чувствителност към поверителността на данните, направи много платформи предпазливи. Те предпочитат да оценят жизнеспособността и развитието на MCP екосистемата, преди да се ангажират напълно с нея.

AI пейзажът е известен със своята бързо развиваща се терминология и концепции. Когато Anthropic първоначално отвориха протокола MCP в края на миналата година, индустрията до голяма степен възприе подход на изчакване и наблюдение. Въпреки това, експлозивната популярност на Manus оттогава подхрани интереса към MCP в Китай.

MCP като катализатор за AI агенция

Според Hou Xinyi от Huazhong University of Science and Technology, решаващата стъпка в надхвърлянето на ограниченията на ‘чатботовете’ се крие в даването на възможност на AI да взаимодейства с външни данни и инструменти, което е точно това, което MCP се стреми да улесни.

Преди MCP, бяха проучени алтернативни подходи за справяне с възприеманата липса на ‘AI агенция’. В края на 2023 г., OpenAI представиха концепцията за магазин за приложения (GPT Store), позволявайки на ChatGPT да използва външни инструменти чрез плъгини, базирани на определен набор от стандарти. Подобни AI магазини за приложения, като Kouzi на ByteDance, Qianfan на Baidu и Bailian на Alibaba, последваха примера.

Въпреки това, тези подходи в крайна сметка достигнаха своите граници. Плъгините и магазините за приложения споделяха общ проблем: изолиране. Всеки инструмент притежаваше своя собствена уникална документация за разработка, формати на параметри и спецификации на интерфейса. Това означаваше, че разработчиците трябваше да преоткриват колелото всеки път, когато интегрират нов инструмент в AI, което водеше до неефективност.

С течение на времето броят на новите инструменти, добавени към магазините за приложения, намаля, а качеството на плъгините варираше значително, възпрепятствайки способността за справяне със сложни задачи. Това показваше, че съществуващите подходи наближават своите граници.

MCP се разглежда като обещаващо решение поради акцента си върху унификацията. В официалната си документация, Anthropic оприличават MCP на универсален USB-C интерфейс за AI света. Hou Xinyi предпочита да го опише като ‘док станция’ - универсален адаптер, който позволява на AI да се свързва с множество външни инструменти едновременно, елиминирайки необходимостта от преобразуване на формати.

Мнозина очакват, че MCP ще има трансформиращо въздействие, подобно на стандартизацията на мерките и теглилките от Qin Shi Huang, която улесни търговията и комуникацията между преди това фрагментираните държави от периода на Пролетта и Есента.

Според технически ръководител в работната група за интелигентно взаимосвързване на голяма технологична компания, MCP също така оптимизира езиковите взаимодействия на AI. Преди това AI изискваше от потребителите да посочат точно ‘Искам да навигирам’, за да използват API на навигационна услуга. Дори и леко отклонение можеше да накара AI да се провали. Сега, всеки инструмент трябва да предостави стандартизирани имена, параметри и функционални описания. В резултат на това, AI трябва само да разбере намерението на потребителя и след това да го съпостави с най-подходящия MCP сървър въз основа на описанията.

Този подход се привежда по-близо до присъщите възможности на големите езикови модели, позволявайки на потребителите да извикват услуги с едно изречение, отдалечавайки се от предишното изискване за директна комуникация между интерфейси.

Настоящо приемане и ограничения на MCP

Въпреки възприемания си потенциал, MCP все още не е постигнал широко разпространение, а практическите му приложения остават ограничени. В момента MCP е най-популярен сред корпоративните технически специалисти и независими разработчици.

Като front-end инженер, Gong Dian разчита силно на AI помощника за програмиране Cursor. Въпреки това, Cursor се бори да се интегрира безпроблемно с вътрешните проектни системи на неговата компания, изисквайки ръчна намеса. Докато плъгини или извиквания на функции можеха да бъдат използвани преди, външен AI не можеше да получи достъп до вътрешните системи на компанията, а извикването в реално време повдигаше опасения за сигурността. MCP, от друга страна, може да бъде иницииран във вътрешната мрежа на компанията, което го прави по-надежден и съвместим.

Независимият разработчик Zhu Mama наскоро инструктира Cursor да научи MCP документация и да пакетира Google Maps и Search API в MCP сървър, който след това беше използван за извикване на големия езиков модел Gemini на Google. Полученият MCP-оборудван Gemini беше трансформиран в асистент за туристически пътеводител. Когато беше попитан за маршрути на обществения транспорт от летище Сингапур до различни атракции, асистентът предостави по-подробна и точна информация в сравнение с отговора на Doubao.

В рамките на общността на разработчиците се появяват различни туристически асистенти. Когато Kouzi Space на ByteDance стартира своята вътрешна бета версия на 19 април, демонстрационният случай също беше AI асистент за пътуване, което накара някои да се шегуват за манията на индустрията по пътуванията.

Zhu Mama открито признава, че фокусът върху туристическите сценарии е предимно поради тяхната значимост за ежедневните потребителски нужди. Друга причина е ограничената наличност на MCP-съвместим интернет софтуер в Китай, което ограничава пазарния потенциал.

Според последните статистически данни от навигационната платформа MCP.so, има над 11 028 доставчици на MCP услуги в световен мащаб и броят им бързо нараства. Въпреки това, в Китай само няколко големи приложения за географско местоположение, като AutoNavi, Baidu Maps и Tencent Maps, в момента функционират като мащабни MCP сървъри.

Това ограничение е причината планът на Zhu Mama да създаде китайска версия на туристически асистент бързо да се провали. За да се разработи китайски туристически пътеводител, би било идеално да се използват местни картографски услуги. Въпреки това, Zhu Mama откри, че официалният MCP сървър, предоставен от AutoNavi, предлага много ограничена информация. Въпреки че може да предостави заявки за маршрути между две местоположения, му липсва подробна информация за забележителности, отзиви, цени на хотелски билети и други важни подробности.

За разлика от това, Google Maps API предоставя подробни методи за резервация, цени на хотели, отзиви за хотели, хотелски удобства и дори сравнения на цените в множество платформи, ниво на детайлност, което е трудно да си представим в китайската екосистема.

Докато продуктите на Tencent, Alibaba, ByteDance и Baidu прегръщат MCP, техните високочестотни приложения все още не са се присъединили официално към мрежата от доставчици на MCP услуги. Платформи като WeChat, Xiaohongshu и Douyin, както и платформи за лайфстайл услуги като Ele.me, Meituan и Ctrip, отсъстват очевидно.

Предизвикателства при наличността на инструменти и планирането на AI

В допълнение към ограничената наличност на инструменти, възможностите за планиране на AI също представляват ограничение. Zhu Mama пакетира 6-8 API интерфейса, включително Google Hotels, Maps и Search, в един MCP сървър, което е далеч под максималния лимит (Cursor позволява максимум 40 инструмента на агент). Въпреки това, AI вече се бореше да определи кой инструмент да извика. Когато беше изправен пред сложни заявки, AI не успя да разбие процеса и да извика MCP на етапи, вместо това се опита да се справи с всичко наведнъж.

Според Gong Dian, стойността на MCP зависи от качеството както на клиентската, така и на сървърната страна. Точно както USB портът няма присъщи възможности и разчита на услугите зад него, MCP изисква стабилни услуги, за да реализира своя потенциал.

MCP поставя основата за AI агенти, но не решава всички проблеми. Стандарт, който остава неизползван, е просто лист хартия.

Гореспоменатият технически ръководител предполага, че широкото приемане на MCP стандарта на Anthropic се дължи на неговия отворен код, нетърговски характер и надеждността на неговия създател. Други организации са готови да следват стандарт, определен от уважавана организация.

В момента малките и средни компании и големите интернет компании, които се стремят да диверсифицират своите потоци от приходи, са основните привърженици на MCP стандарта.

Компанията за AI компаньон MiniMax наскоро стартира MCP сървър, като мениджърът на общността Cai Jiaren заяви, че разработчиците могат да използват MCP, за да извикват мултимодалните възможности на MiniMax за генериране на видео, генериране на глас и клониране на глас. MCP включва строги механизми за контрол на достъпа, за да се гарантира съответствие, когато предприятията имат достъп до вътрешни данни. Общият процес на извикване също е опростен, без да се добавят допълнителни разходи за токени.

Решението на MiniMax да стартира MCP сървър беше продиктувано от желанието да даде възможност на глобалните разработчици лесно да използват възможностите на модела на MiniMax и да отключат по-гъвкаво и ефективно създаване.

Други стартиращи компании споделят подобни стремежи. Biu Technology спомена в интервю, че разработчиците могат да използват AutoNavi MCP, за да получат транспортни данни и след това да използват продуктите на Biu, за да генерират PPT. MCP намалява бариерата за навлизане, като предоставя достъп до интерфейса на AutoNavi, който иначе не би бил достъпен за тях.

Гореспоменатият технически ръководител смята, че MCP е по същество история за доставчиците на услуги. Като капсулират своите API според MCP стандарта, доставчиците на услуги за приложения могат да направят своите услуги достъпни за всички AI.

Разминавания и опасения сред доставчиците на услуги

Въпреки това, възникват разногласия сред доставчиците на услуги. Много компании не са напълно ангажирани с идеята. Докато големи платформи като AutoNavi и Baidu Maps са стартирали MCP сървъри, те основно преопаковат съществуващи API интерфейси, предлагайки конвенционални функционалности, като същевременно поддържат строг контрол върху основните потребителски разрешения и данни за транзакции.

В допълнение към услугите за картографско местоположение, Xiaohongshu auto-publisher на разработчик трета страна, който автоматизира търсенето и публикуването на съдържание, е в момента най-популярният елемент в MCP плазата на общността Modeng. Hou Xinyi предполага, че това може да има ограничено въздействие върху платформи за социално съдържание като Xiaohongshu, но данните и разрешенията стават особено чувствителни в транзакционно-интензивни сценарии като платформи за доставка на храна.

Едно от основните опасения за доставчиците на услуги е контролът върху потребителското изживяване.

Например, отварянето на пълна услуга за доставка на храна изисква предоставяне на AI агенти достъп до чувствителни лични данни като цени, информация за магазини и потребителски адреси и информация за контакт. Anthropic признаха, че системата за сигурност на MCP, включително управление на разрешения и одит на извиквания, все още е в процес на разработка. Следователно, някои платформи са загрижени за риска от неоторизирано извикване при свързване към MCP.

Някои платформи тестват относително безопасни сценарии за транзакции. Например, Alipay наскоро стартира MCP сървър, твърдейки, че дава на AI агентите ‘достъп до възможности за плащане с едно кликване’. Въпреки това, по-отблизо разкрива, че той основно предлага събиране, а не платежни услуги.

Според Hou Xinyi, подходът на Alipay се фокусира върху улесняване на събирането на плащания от търговците, а не върху позволяването на AI да извършва плащания от името на потребителите. Това е жизнеспособна опция, тъй като позволяването на AI да контролира портфейлите и да поставя поръчки свободно все още не е достатъчно сигурно за комфорта на всички. Това е и основната причина, поради която транзакционните услуги не могат да бъдат широко популяризирани.

По-дълбок проблем е, че ако AI свободно участва в процеса на транзакция - помага на потребителите да сравняват цените или да препоръчват най-рентабилния ресторант - това несъмнено би осигурило значително удобство за потребителите. Въпреки това, това също така би означавало, че платформите за услуги ще загубят контрол върху процеса на избор на потребителя и техните основни алгоритмични предимства ще бъдат маргинализирани, превръщайки ги в обикновени доставчици.

Справяне със сигурността и насърчаване на универсалността

Множество интервюирани вярват, че MCP трябва да се справи с два ключови проблема: сигурност и универсалност.

Първо, сигурност. Hou Xinyi посочва, че MCP е изправен пред две предизвикателства пред сигурността: липса на централизиран надзор върху сигурността и непълен механизъм за проверка на самоличността и оторизация на данни. В момента няма официален ‘discovery plaza’ за MCP. Много навигационни платформи на трети страни събират MCP услуги, като директно изтеглят кодови проекти от GitHub, което е бързо и лесно, но липсва официален процес на преглед. Anthropic заявиха, че официално ще се справят с механизма за хостинг на MCP и проблемите с откриваемостта тази година. Наскоро актуализираният протоколен проект на Anthropic работи за справяне с този недостатък. В допълнение, местни организации като IIFAA (Internet Trusted Authentication Alliance) се опитват да запълнят пролуката в сигурността.

Има и дългогодишни проблеми в областта на AI агентите, като prompt hijacking и tool combination attacks. Въпреки това, гореспоменатият технически ръководител вярва, че това не са уязвимости на MCP, а по-скоро рискове, които съществуват за всеки AI агент. В момента не са открити очевидни уязвимости в сигурността в самия MCP протокол, а механизмите за предаване на данни и взаимодействие са като цяло надеждни.

Сигурността е само първото препятствие. Истинското предизвикателство е преодоляването на интересите на производителите и убеждаването на повече производители да станат MCP сървъри.

Според Hou Xinyi, това е свързано с разбирането на ‘walled garden’ природата на интернет платформите. Данните са важна конкурентна бариера за различни платформи, така че много производители могат да отворят само някои периферни функции като MCP сървъри за тестване. Производителите може да се наложи да изчакат и да видят колко въздействие ще има MCP екосистемата.

Гореспоменатото отговорно лице каза, че ако е свързан с AI като MCP сървър, той може да получи повече потребителски данни и навици и да върне към собствения си базов модел, което може да се превърне в най-голямата мотивация за производителите да се присъединят активно.

Когато пазарът на MCP сървъри е наистина изобилен, трябва да се обмислят по-далечни проблеми.

Например, как интелигентните тела извикват различни приложения на мобилни телефони? Отговорното лице спомена, че за да се събуди друго приложение чрез локалното AI интелигентно тяло на мобилния телефон, ще има допълнителен слой оторизация на приложението и проверка на самоличността, което не е толкова просто, колкото MCP да извиква облачни услуги, и в момента няма особено подходящо решение.

За друг пример, когато предлагането на услуги е прекомерно, как интелигентните тела правят избор - да извикат JD takeaway или Meituan takeaway? Да използват Gaode map или Baidu map? Множество интервюирани споменаха, че днешната логика за извикване на MCP е все още много основна, главно се определя от ‘функционалното описание’ на доставчика на услуги и няма механизъм за сортиране и оптимизация. Ако доставчик на услуги умишлено добави индуктивен език към описанието, като ‘най-ефективен’ и ‘задължителен’, AI може да бъде подведен и отклонен към места, където не трябва да ходи.

Както обясни отговорното лице за гореспоменатата технология, ‘Все едно не можете да намерите услугата, която искате в търсачката, но изскача куп разхвърляна информация. Как точно да се съпостави услугата, от която потребителите се нуждаят най-много, бъдещата MCP екосистема също ще се сблъска със същия проблем.’

В крайна сметка, процесът на изпълнение на всеки стандарт е пълен с предизвикателства. Hou Xinyi каза, че за да се насърчи популяризирането на MCP, може да е необходима ключова възможност, подобна на Manus, за да може наистина цялата индустрия да осъзнае силата на MCP.