Декодиране на A2A и MCP протоколи

Наскоро Google представи нов отворен протокол за агенти, наречен Agent2Agent, или накратко A2A. Едновременно с това, Bailian на Alibaba Cloud също обяви навлизането си в MCP. Нека се задълбочим в това какво представляват A2A и MCP.

За да разберете тези протоколи, помислете за аналогията на дипломацията между нациите. Представете си всеки AI агент като малка държава със свой собствен език и обичаи. Тези ‘държави’ имат посолства, настанени в една и съща сграда, опитващи се да комуникират, търгуват и обменят информация.

В идеален случай, тези нации биха поддържали приятелски отношения и биха се придържали към ясен набор от дипломатически правила, позволявайки им безпроблемно да си взаимодействат, да подписват споразумения и да си сътрудничат по международни проекти около конференционна маса.

Въпреки това, реалността е, че всяко посолство работи независимо с различни протоколи. Следователно, инициирането на просто търговско споразумение с ‘Държава А’ изисква изпълнението на множество изисквания, включително разпоредби, сертификати, преводи и специализирани ключове. Ангажирането с ‘Държава Б’ и ‘Държава В’ налага многократно повторение на подобни процедури. Този ad-hoc, фрагментиран и многостранен подход увеличава разходите за комуникация, като всяко взаимодействие води до допълнителна ‘информационна тарифа’.

В миналото AI агентите се сблъскваха с подобни затруднения, когато се опитваха да си сътрудничат.

Например, може да имате агент, който автоматично отговаря на имейли, и друг, интегриран в приложение за календар, за да помага при планирането. Въпреки това, тези AI единици се борят да комуникират директно, налагайки ръчно копиране и поставяне на информация или разчитане на персонализирани интерфейси.

В резултат на това, AI агентите работят изолирано, показвайки лоша оперативна съвместимост. Тази фрагментация разочарова потребителите, които трябва да се ориентират между множество AI приложения, и ограничава потенциала на AI. Сложни задачи, които биха могли да бъдат изпълнени чрез многоагентно сътрудничество, са изкуствено ограничени в рамките на отделни силози.

Тази ситуация отразява пейзажа след Втората световна война, където всеки AI агент действа автономно, липсват единни правила и е изправен пред комуникационни бариери. Настоящата AI екосистема прилича на следвоенна пустош, изискваща придържане към специфични интерфейси и протоколи за достъп до данни и функционалности. Липсата на стандарти налага допълнителни ‘тарифи’ с всяка нова връзка за сътрудничество, което води до разединена и неефективна AI екосистема, характеризираща се с изолация и личен интерес.

AI индустрията проучва възможността за установяване на универсално приет протокол за улесняване на безпроблемното взаимодействие между агенти и външни инструменти. Google и Anthropic се появиха като лидери, като всяка от тях предложи решение: протоколът A2A и протоколът MCP.

A2A протоколът

A2A протоколът, съкратено от Agent2Agent, позволява на AI агентите да комуникират и си сътрудничат директно.

Основната цел на A2A протокола е да позволи на агенти от различен произход и доставчици да се разбират и да си сътрудничат един с друг, подобно на усилията на Световната търговска организация за намаляване на търговските бариери.

Чрез приемането на A2A, агенти от различни доставчици и рамки могат да се присъединят към зона за свободна търговия, комуникирайки, използвайки общ език и безпроблемно си сътрудничейки за изпълнение на сложни задачи, надхвърлящи възможностите на отделните агенти.

За да илюстрирате как работи A2A, помислете за следните аналогии:

1. Агент = Национален дипломат

Всеки агент функционира като дипломат, представляващ посолството на дадена държава. A2A протоколът има за цел да установи единни дипломатически етикети и комуникационни процедури. Преди това, дипломати от ‘Държава А’ комуникираха изключително на френски, докато тези от ‘Държава Б’ използваха кирилица, а ‘Държава В’ изискваше кореспонденция чрез древни писма от златен лист. A2A протоколът гарантира, че всички участници могат да комуникират на предварително договорен език, да подават документи в един и същ формат и да изпълняват договорените резултати.

2. Карта на агента = Дипломатически пълномощия / Визитка на посланика

В рамките на A2A, от всеки агент се изисква да публикува ‘Карта на агента’, аналогична на визитката на дипломата, съдържаща подробности, като името на агента, версия, възможности и поддържани езици или формати.

Подобно на това как визитката на дипломата идентифицира тяхната роля и принадлежност, Картата на агента изброява уменията на агента, методите за удостоверяване и входните/изходните формати. Това позволява на други дипломати бързо да идентифицират и разберат възможностите, минимизирайки комуникационните бариери.

3. Задача = Двустранен или многостранен дипломатически проект

Концепцията за задача е от централно значение за A2A. Когато даден агент възнамерява да делегира задача на друг агент, той издава ‘писмо за намерение за проект за сътрудничество’. При приемане, и двете страни записват идентификатор на задачата, за да проследят напредъка и да обменят информация до завършването.

В дипломатически условия, една нация може да предложи на друга: ‘Желаем да си сътрудничим за изграждането на трансгранична високоскоростна железопътна линия; моля, изпратете вашия инженерен екип.’ Това отразява задача на A2A, където иницииращата страна очертава изисквания, отдалеченият агент приема и двете страни редовно актуализират напредъка през целия проект.

Съобщенията представляват комуникации, обменяни по време на началните или междинните етапи на проекта, подобно на дипломатически кабели, бележки и размени на пратеници.

4. Push нотификации = Дипломатически бюлетини на посолствата

В A2A, ако дадена задача е дългосрочен проект, изискващ продължително време за завършване, отдалеченият агент може да актуализира иницииращата страна чрез push нотификации, подобно на държава, предоставяща периодични актуализации за дългосрочен инфраструктурен проект. Това подобрява възможностите за асинхронно сътрудничество.

5. Удостоверяване и сигурност = Дипломатически привилегии и протоколи

A2A използва стратегии за удостоверяване от корпоративен клас, изискващи и двете комуникиращи страни да проверяват идентификационните данни, за да предотвратят представяне за друг или злонамерено подслушване. Този механизъм е успореден на дипломатическите привилегии и протоколи.

По същество, A2A отразява динамиката на международната дипломация или бизнес сътрудничество, като набляга на стандартизираната комуникация и сигурност.

MCP протоколът

MCP протоколът, или Model Context Protocol, е стандарт, въведен и отворен код от Anthropic през ноември 2024 г.

Докато A2A се занимава с комуникационния процес между AI дипломати, остава постоянно предизвикателство: липсата на надеждни източници на информация. Дори най-красноречивият дипломат или бизнес ръководител е зле подготвен да работи ефективно без точна информация за международния пейзаж и разпределението на ресурсите.

Съвременните дипломати разчитат на външни инструменти, като например визови системи, международни системи за разплащане и бази данни с разузнавателна информация, за да изпълняват задълженията си. По същия начин, агент, поемащ сложни отговорности, трябва да се свърже с различни бази данни, системи за документи, корпоративни приложения и дори хардуерни устройства.

Това може да се сравни с създаването на всеобхватна разузнавателна агенция за дипломати и предоставянето им на достъп до инструменти, които да улеснят работата им.

Преди това, агентите трябваше да разработват персонализирани плъгини и да се интегрират дълбоко с различни инструменти, което беше както трудоемко, така и отнемащо време. Въпреки това, MCP вече е на разположение, за да рационализира процеса.

MCP стандартизира взаимодействията между големи езикови модели и външни източници на данни и инструменти. Anthropic сравнява MCP с USB-C порт за AI приложения.

USB-C служи като универсален интерфейс за устройства, обработващ зареждане и пренос на данни през един порт. MCP има за цел да създаде универсален интерфейс в AI домейна, позволявайки на различни модели и външни системи да се свързват, използвайки същия протокол, вместо да разработват персонализирани решения за интеграция всеки път.

AI моделите, свързващи се с бази данни, търсачки или приложения на трети страни, могат да комуникират безпроблемно, ако всички поддържат MCP.

MCP използва клиент-сървърна архитектура:

1. MCP сървър = Консолидирана разузнавателна агенция

Организации или лица могат да капсулират бази данни, файлови системи, календари и услуги на трети страни в MCP сървъри. Тези сървъри се придържат към MCP протокола, излагайки унифицирано форматирани крайни точки за достъп, позволявайки на всеки агент, съвместим с MCP клиентски стандарти, да изпраща заявки, да извлича информация или да изпълнява операции.

2. MCP клиент = Терминално оборудване, използвано от дипломати

Агент дипломат носи специализирано терминално оборудване, което им позволява да въвеждат команди, като например ‘Извличане на данни за инвентара от финансовата система’, ‘Изпращане на заявка към API’ или ‘Извличане на PDF документ’.

Без MCP, интегрирането с различни системи изисква писането на различни кодове за достъп, което е тромаво. Въпреки това, с MCP, клиентите, поддържащи протокола, могат лесно да превключват между различни MCP сървъри, извличайки информация и изпълнявайки бизнес процеси.

По същество, MCP улеснява безпроблемната интеграция между AI агенти и външни ресурси.

Разликата между A2A и MCP

За да се изясни разликата между A2A и MCP, помислете за хипотетична международна среща на върха, където държавните глави (представляващи AI агентите на компаниите) се събират, за да си сътрудничат по транснационална задача, като например изготвяне на глобален доклад за икономически анализ.

Без универсален протокол, такава среща би била практически невъзможна, тъй като всеки представител говори различен език. Въпреки това, с A2A протокола, всички представители подписват ‘A2A Виенската дипломатическа конвенция’, преди да влязат в срещата, съгласявайки се да комуникират, използвайки унифициран формат, да се идентифицират, да посочват намеренията си и да цитират предишни идентификатори на изказвания, когато отговарят.

Това позволява на ‘Агент G’ да изпрати съобщение до ‘Агент O’ във формат A2A, а ‘Агент O’ отговаря съответно. Това бележи първия случай на безпрепятствена комуникация между AI агенти от различни компании.

По време на дискусиите, AI представителите трябва да се консултират с данни или да използват инструменти за анализ. ‘Агент A’ от Anthropic предлага използването на MCP системата за външни данни или поддръжка на инструменти.

‘MCP стая за симултанен превод’ е създадена успоредно с конферентната зала, окомплектована с експерти, които могат да отговорят на унифициран език чрез MCP при получаване на заявки.

Например, ‘Агент Q’ трябва да има достъп до своята облачна база данни за изчисления. Вместо да изпраща някого обратно в страната, той изпраща MCP заявка за данни от база данни X. MCP администраторът на базата данни превежда заявката, извлича резултатите и отговаря на ‘Агент Q’ на MCP език. Целият процес е прозрачен за другите агенти, които разбират данните, цитирани от ‘Агент Q’, защото MCP преводът е в разпознат формат.

Тъй като писането на доклада напредва, ‘Агент G’ и ‘Агент A’ осъзнават, че трябва да интегрират съответните си приноси. ‘Агент G’ е специализиран в числен анализ, докато ‘Агент A’ се отличава с езиково обобщение.

‘Агент G’ съобщава данните за темпа на растеж на БВП чрез A2A, а ‘Агент A’ се свързва с плъгин за електронни таблици на Excel чрез MCP, проверява тенденциите в данните и отговаря с обобщен параграф.

В този сценарий, A2A улеснява комуникацията между агентите, докато MCP позволява на агентите да имат достъп до външни инструменти и информация. Заедно, протоколите създават индивидуално споразумение за комуникация за AI версия на Организацията на обединените нации. С тези протоколи, AI агентите могат да си сътрудничат ефективно, формирайки взаимосвързана AI екосистема.

A2A е подобен на специализирана гореща линия за дипломатическа комуникация, адресираща директната комуникация между агентите. MCP е подобен на система за симултанен превод и споделяне на ресурси, адресираща въпроса за интелигентните единици, свързващи се с външна информация.

Възходът на A2A и MCP предвещава еволюцията на AI индустрията към сътрудничество, а не към конкуренция. Безброй AI агенти ще бъдат разгърнати като уебсайтове, откриващи и комуникиращи чрез A2A и получаващи достъп до ресурси и споделящи знания чрез MCP.