Istota MCP
Model Context Protocol (MCP) staje się kluczowym, otwartym standardem, który ma przekształcić sposób, w jaki narzędzia napędzane sztuczną inteligencją (AI) wchodzą w interakcje ze źródłami danych. Poprzez promowanie bezpiecznych, dwukierunkowych połączeń, MCP toruje drogę dla szybkiego rozwoju handlu agentowego (a-commerce), rewolucyjnego podejścia, które wykorzystuje agentów AI do automatyzacji i wzmocnienia transakcji handlowych.
MCP, pierwotnie opracowany przez Anthropic i obecnie wspierany również przez OpenAI, ma na celu uproszczenie sposobu, w jaki programiści budują aplikacje AI, które mogą bezproblemowo uzyskiwać dostęp i wykorzystywać dane z różnych źródeł. Architektura protokołu jest prosta: pozwala programistom na udostępnianie swoich funkcji za pośrednictwem serwera MCP lub tworzenie klientów MCP, którzy mogą łączyć się z tymi serwerami w celu wykorzystania dostępnych funkcji.
Z technicznego punktu widzenia, serwer MCP działa jako brama dla programistów do udostępniania ich narzędzi i funkcji. Agenci AI mogą następnie używać klientów MCP, aby łączyć się z tymi serwerami, odkrywać i wykorzystywać narzędzia w razie potrzeby. Kiedy agent wysyła zapytanie do serwera w celu ustalenia, jakie narzędzia są dostępne, serwer udostępnia metadane w standardowym formacie JSON, umożliwiając agentowi zrozumienie, jak korzystać z tych narzędzi. Kiedy agent zdecyduje się użyć narzędzia, wysyła żądanie wywołania narzędzia, ułatwiając bezproblemową interakcję między serwerem a klientem.
Znaczenie MCP: Realizacja Interoperacyjności, Koordynacji i Ekosystemu
Znaczenie MCP polega na jego zdolności do zapewnienia standaryzowanego sposobu komunikacji i wymiany informacji między narzędziami a agentami na temat użytkowników, zadań, danych i celów. Ta standaryzacja przynosi wiele korzyści, w tym:
- Interoperacyjność: MCP umożliwia różnym modelom AI, asystentom i aplikacjom zewnętrznym udostępnianie kontekstu, ułatwiając integrację wielu narzędzi i usług opartych na AI. Ta interoperacyjność eliminuje silosy między różnymi systemami, umożliwiając im współpracę w celu osiągnięcia wspólnych celów.
- Koordynacja: MCP pomaga koordynować zadania między różnymi agentami AI i aplikacjami zewnętrznymi, zapewniając, że płynnie współpracują ze sobą, bez powielania wysiłków lub konieczności powtarzania danych wejściowych przez użytkownika. Poprzez koordynowanie zadań, MCP poprawia efektywność i produktywność, optymalizując procesy napędzane przez AI.
- Ekosystem: Standardy takie jak MCP umożliwiają deweloperom stron trzecich budowanie wtyczek lub narzędzi, które mogą łatwo ‘rozmawiać tym samym językiem’ z asystentami AI, przyspieszając w ten sposób rozwój ekosystemu. Ta standaryzacja promuje innowacje i współpracę, prowadząc do ogromnej liczby skalowalnych funkcji i aplikacji AI.
Na przykład, serwer Google Maps MCP oferuje siedem funkcji, w tym przekształcanie adresów na współrzędne (i odwrotnie), wyszukiwanie miejsc, uzyskiwanie szczegółowych informacji o miejscach, obliczanie odległości między miejscami (a także czasu podróży), uzyskiwanie danych o wysokości i uzyskiwanie tras. Funkcje te pokazują, w jaki sposób MCP może ułatwić bezproblemowy dostęp do różnorodnych usług i danych, wspierając szeroki zakres przypadków użycia w aplikacjach napędzanych AI.
Handel Agentowy: Transformacyjny Wpływ MCP
Organizacje zainteresowane MCP to między innymi detaliści, banki i inne podmioty, które chcą rozwijać własne funkcje AI, aby ich agenci mogli wchodzić w interakcje z agentami klientów. Na przykład, amerykańska gałąź Walmart buduje własnego agenta, aby wchodzić w interakcje z agentami konsumentów w celu oferowania rekomendacji lub dodatkowych informacji o produktach. Jednocześnie, agenci konsumentów mogą dostarczać agentom detalistów informacje o preferencjach, itp.
Banki i detaliści chcą, aby agenci klientów wchodzili w interakcje z agentami detalistów zamiast korzystać ze stron internetowych lub API, aby uzyskać pożądane usługi. Frank Young dobrze podsumowuje tę dynamikę, sugerując, że organizacje powinny udostępniać API, aby wspierać proste procesy (np. subskrypcje) z wykorzystaniem obecnej infrastruktury, ale dla najbardziej zaawansowanych aspektów handlu agentowego (negocjacje, reakcje na oszustwa, optymalizacja) należy wdrożyć serwer MCP, aby rejestrować te złożone, wysokowartościowe scenariusze.
Wyzwania Bezpieczeństwa MCP
Chociaż wizja handlu agentowego jest kusząca, konieczne jest rozwiązanie problemów związanych z bezpieczeństwem MCP, aby zapewnić jego bezpieczne, niezawodne i ekonomicznie efektywne wdrożenie. MCP nie definiuje standardowego mechanizmu wzajemnej uwierzytelniania serwera i klienta, ani nie określa, w jaki sposób delegować uwierzytelnianie API. Ta luka w zabezpieczeniach może otworzyć drzwi dla złośliwych agentów podszywających się pod legalne podmioty, nieautoryzowanego dostępu do poufnych danych lub inicjowania złośliwych działań.
Jednym ze sposobów na rozwiązanie tych problemów związanych z bezpieczeństwem jest weryfikacja poświadczeń agenta przez serwer MCP na podstawie jakiegoś rodzaju rejestru, co stanowi podstawowe KYC (Poznaj Swojego Klienta) dla AI, tak aby tylko zaufani agenci mogli wejść. Może to być zapowiedź bardziej wyrafinowanej infrastruktury Poznaj Swojego Agenta (KYA), która zapewni solidniejsze mechanizmy uwierzytelniania i autoryzacji.
Ponieważ serwery MCP są zarządzane przez niezależnych programistów i współtwórców, nie istnieje scentralizowana platforma do audytowania, egzekwowania lub weryfikowania standardów bezpieczeństwa. Ten zdecentralizowany model zwiększa prawdopodobieństwo niespójnych praktyk bezpieczeństwa, utrudniając zapewnienie, że wszystkie serwery MCP przestrzegają zasad bezpiecznego rozwoju. Ponadto, serwery MCP nie posiadają ujednoliconego systemu zarządzania pakietami, co komplikuje proces instalacji i konserwacji, zwiększając prawdopodobieństwo wdrożenia przestarzałych lub nieprawidłowo skonfigurowanych wersji. Korzystanie z nieoficjalnych narzędzi instalacyjnych w różnych klientach MCP dodatkowo wprowadza zmienność we wdrożeniach serwerów, utrudniając utrzymanie spójnych standardów bezpieczeństwa.
MCP nie posiada również standardowej struktury do obsługi uwierzytelniania i autoryzacji kontrahenta, ani mechanizmu weryfikacji tożsamości lub normalizacji dostępu. Bez tych mechanizmów trudno jest wymusić szczegółowe uprawnienia. Ponieważ MCP również nie posiada modelu uprawnień i opiera się na OAuth, oznacza to, że sesja z narzędziem jest albo dostępna, albo całkowicie ograniczona. Jak zauważył Andreessen Horowitz, wraz z wprowadzeniem większej liczby agentów i narzędzi, pojawią się dodatkowe komplikacje. Dlatego potrzebne będzie coś więcej, a jednym z kandydatów jest tak zwany punkt podejmowania decyzji dotyczących polityki (PDP). Jest to komponent, który ocenia politykę kontroli dostępu. Biorąc pod uwagę dane wejściowe, takie jak tożsamość podmiotu, działanie, zasób i kontekst, decyduje, czy zezwolić na działanie, czy je odrzucić.
Mike Schwartz, założyciel firmy Gluu zajmującej się cyberbezpieczeństwem, twierdzi, że chociaż PDP był kiedyś ciężką infrastrukturą działającą na serwerach lub mainframe’ach, PDP wykorzystujący język polityki open source Cedar jest wystarczająco mały i szybki, aby można go było osadzić w aplikacjach mobilnych i powinien stać się istotną częścią stosu AI agenta. Po szeroko zakrojonych badaniach naukowych nad tematem automatycznego rozumowania, AWS ogłosiło składnię polityki Cedar w 2024 roku. Co ważne, Cedar jest deterministyczny - przy tych samych danych wejściowych zawsze otrzymasz tę samą odpowiedź. Determinizm w bezpieczeństwie jest niezbędny do budowania zaufania, co wymaga wielokrotnego robienia tego samego. Jak mówi Mike, osadzalny PDP oparty na Cedar spełnia wszystkie wymagania agentów AI.
Nowy Początek dla MCP
To coś więcej niż tylko kolejny e-commerce. Jak zauważa Jamie Smith, kiedy mówisz swojemu agentowi ‘Znajdź mi hotel w Paryżu za mniej niż 400 dolarów, z widokiem na Wieżę Eiffla’, to nie tylko wyszukiwanie w Google. Spakuje on żądanie wraz z Twoimi zweryfikowanymi poświadczeniami (z Twojego cyfrowego portfela), preferencjami płatności, programami lojalnościowymi (itp.) oraz ograniczeniami, takimi jak górny limit ceny, zakres dat i programy lojalnościowe. Jest to ‘ustrukturyzowany ładunek kontekstowy’ wysyłany do różnych stron internetowych podróży, które są w stanie odpowiedzieć i wchodzić w interakcje z Twoim agentem.
W przeciwieństwie do e-commerce, który został zbudowany na Internecie bez warstwy bezpieczeństwa (stąd brak waluty cyfrowej i tożsamości cyfrowej), handel agentowy zostanie zbudowany na infrastrukturze, która zapewnia prawdziwe bezpieczeństwo uczestnikom rynku. Wprowadzenie tej bezpiecznej infrastruktury jest doskonałą okazją dla firm fintech i innych startupów, które chcą oferować walutę cyfrową i tożsamość cyfrową jako podstawowe komponenty. Wraz z normalizacją mechanizmów identyfikacji, uwierzytelniania i autoryzacji wokół MCP, nie ma powodu, aby nie oczekiwać szybkiego przyspieszenia handlu agentowego na rynku masowym.
Wraz z rozwiązaniem problemów związanych z bezpieczeństwem MCP i zakończeniem prac nad standaryzacją, handel agentowy będzie miał potencjał, aby zrewolucjonizować sposób, w jaki przeprowadzamy transakcje handlowe. Wykorzystując moc agentów AI do automatyzacji i wzmocnienia różnych procesów, handel agentowy obiecuje poprawę efektywności, wygody i personalizacji, tworząc nowe możliwości dla firm i konsumentów.
Ostatecznie, MCP reprezentuje transformację w kierunku bezpieczniejszej, wydajniejszej i bardziej skoncentrowanej na AI przyszłości handlu, która na nowo zdefiniuje sposób, w jaki firmy wchodzą w interakcje z klientami i sposób, w jaki działają.