Wraz ze wzrostem zapotrzebowania na inteligentne agenty wśród różnych grup użytkowników, zarządzanie nimi musi uwzględniać zróżnicowane priorytety. Protokół Model Context (MCP), wspierany przez współpracę open-source i nadzór człowieka, stanowi fundament dla bezpiecznego i niezawodnego ekosystemu agentów.
Inteligentne agenty (AI Agents) to systemy oparte na dużych modelach językowych, zdolne do interakcji ze światem zewnętrznym za pomocą narzędzi i działania w imieniu użytkowników. Niedawne pojawienie się Manus podkreśla oczekiwania rynku na praktyczne zastosowania agentów.
Ogłoszony w listopadzie 2024 roku, otwarty protokół Model Context Protocol (MCP) firmy Anthropic oferuje techniczne rozwiązanie zwiększające wydajność i bezpieczeństwo agentów ogólnego przeznaczenia. MCP usprawnia integrację dzięki standardowym interfejsom, zwiększając efektywność dostępu do danych i narzędzi. Wzmacnia również bezpieczeństwo poprzez izolowanie modeli od konkretnych źródeł danych i zwiększanie przejrzystości kontroli poleceń. To wyważone podejście priorytetowo traktuje doświadczenie użytkownika, zapewniając jednocześnie kontrolowaną autoryzację.
Chociaż MCP stanowi fundament dla zarządzania agentami, nie rozwiązuje wszystkich wyzwań. Na przykład, nie weryfikuje uzasadnienia wyboru narzędzi ani dokładności wyników wykonania, ani nie rozwiązuje efektywnie konkurencji i współpracy w ekosystemie agent-aplikacja.
Wyzwania stojące przed agentami ogólnego przeznaczenia w aplikacjach
Agent to system wyposażony w pamięć, planowanie, percepcję, wywoływanie narzędzi i możliwości działania, wzmocniony przez rozległe modele językowe, który wchodzi w interakcje ze środowiskiem zewnętrznym za pomocą narzędzi, działając w imieniu użytkownika. Agent musi postrzegać i rozumieć intencje użytkownika, uzyskiwać i przechowywać informacje za pomocą modułu pamięci, formułować i optymalizować strategie, wykorzystując moduł planowania, wywoływać moduł narzędzi do wykonywania określonych zadań i wdrażać plany za pomocą modułu akcji, osiągając w ten sposób cel autonomicznego wykonywania zadań.
Manus jest bardziej agentem ogólnego przeznaczenia, w przeciwieństwie do produktów agentowych zorientowanych na przepływ pracy.
Oczekiwania branży wobec agentów, zwłaszcza agentów ogólnego przeznaczenia, wynikają ze zbiorowych potrzeb, które zaspokajają. Na rynkach kapitałowych agenci reprezentują oczekiwaną przez branżę ścieżkę zamkniętej pętli dla komercyjnej wartości modeli, przesuwając wycenę sztucznej inteligencji z obliczeń opartych na tokenach nawycenę opartą na efektach dla spersonalizowanych usług, co skutkuje większą rentownością. Po stronie użytkownika, firmy oczekują od agentów wykonywania powtarzalnych, standaryzowanych i jasno zdefiniowanych procesów z precyzyjną automatyzacją, podczas gdy społeczeństwo oczekuje, że agenci przyniosą ‘korzyści technologiczne’, stając się spersonalizowanymi, niskoprogowymi ‘cyfrowymi zarządcami’ dla wszystkich.
Jednak agenci ogólnego przeznaczenia stają w obliczu wyzwań związanych z kompatybilnością, bezpieczeństwem i konkurencją w aplikacji. Pod względem kompatybilności, modele muszą efektywnie współpracować z różnymi narzędziami i źródłami danych w wywołaniu. Pod względem bezpieczeństwa, agenci muszą wykonywać zadania w sposób jasny i przejrzysty zgodnie z instrukcjami użytkownika oraz rozsądnie przydzielać obowiązki w zakresie bezpieczeństwa w ramach konwergencji danych wielu stron. Pod względem konkurencji, agenci muszą rozwiązywać konkurencyjne i oparte na współpracy relacje w nowym ekosystemie biznesowym.
Dlatego też protokół MCP, który umożliwia modelom efektywną współpracę z różnymi narzędziami i źródłami danych oraz rozsądny podział obowiązków w zakresie bezpieczeństwa w ramach konwergencji danych wielu stron, jest wart dogłębnego przestudiowania w porównaniu z samym produktem Manus.
Problemy z kompatybilnością
Świat sztucznej inteligencji szybko ewoluuje, a nowe modele i narzędzia pojawiają się nieustannie. Aby agent ogólnego przeznaczenia był naprawdę użyteczny, musi być w stanie bezproblemowo integrować się z szeroką gamą zasobów. Stanowi to poważne wyzwanie, ponieważ każde narzędzie lub źródło danych może mieć własny, unikalny interfejs i format danych. Bez ustandaryzowanego podejścia, programiści musieliby pisać niestandardowy kod dla każdej integracji, co jest czasochłonne i nieefektywne. Ten brak kompatybilności może utrudnić powszechne przyjęcie agentów AI, ponieważ użytkownicy mogą niechętnie inwestować w technologię, która nie działa łatwo z ich istniejącymi systemami.
Zagrożenia bezpieczeństwa
Agenci AI są zaprojektowani do działania w imieniu użytkowników, co oznacza, że często mają dostęp do poufnych danych i systemów. Rodzi to poważne obawy dotyczące bezpieczeństwa, ponieważ naruszony agent może zostać wykorzystany do kradzieży danych, zakłócenia operacji, a nawet spowodowania szkód fizycznych. Ważne jest, aby agenci byli projektowani z myślą o bezpieczeństwie oraz aby byli poddawani rygorystycznym testom i monitorowaniu w celu zapobiegania lukom w zabezpieczeniach. Ponadto ważne jest ustalenie jasnych linii odpowiedzialności za bezpieczeństwo, zwłaszcza gdy w rozwój i wdrażanie agenta zaangażowanych jest wiele stron.
Krajobraz konkurencji
Wraz z coraz większą popularnością agentów AI, prawdopodobnie zakłócą one istniejące modele biznesowe i stworzą nowe formy konkurencji. Na przykład agent, który może automatycznie negocjować ceny z dostawcami, może dać firmie znaczną przewagę konkurencyjną. Może to jednak również prowadzić do wyścigu na dno, ponieważ firmy konkurują o oferowanie najniższych cen. Ważne jest, aby wziąć pod uwagę potencjalny wpływ agentów AI na krajobraz konkurencji oraz opracować strategie poruszania się w tym nowym środowisku. Obejmuje to rozwiązywanie problemów takich jak własność danych, własność intelektualna i potencjał zachowań antykonkurencyjnych.
MCP: Techniczne rozwiązanie dla kompatybilności i bezpieczeństwa w aplikacjach agentowych
W listopadzie 2024 roku firma Anthropic udostępniła jako open-source MCP (Model Context Protocol), otwarty protokół, który pozwala systemom dostarczać kontekst do modeli AI i może być uniwersalizowany w różnych scenariuszach integracji. MCP wykorzystuje warstwową architekturę do rozwiązywania problemów standaryzacji i bezpieczeństwa w aplikacjach Agent. Aplikacja hosta (taka jak Manus) łączy się jednocześnie z wieloma programami serwisowymi (MCP Server) za pośrednictwem klienta MCP, a każdy serwer wykonuje własne obowiązki, zapewniając standardowy dostęp do źródła danych lub aplikacji.
Po pierwsze, MCP rozwiązuje problem kompatybilności w wywołaniach danych/narzędzi agenta poprzez standardowy konsensus. MCP zastępuje fragmentaryczną integrację ujednoliconym interfejsem, a AI musi jedynie rozumieć i przestrzegać umowy, aby wchodzić w interakcje ze wszystkimi narzędziami spełniającymi specyfikacje, co znacznie redukuje duplikaty integracji. Po drugie, MCP ma trzy aspekty w zakresie bezpieczeństwa. Po pierwsze, model i konkretne źródła danych są izolowane na łączu danych, a te dwa wchodzą w interakcje za pośrednictwem protokołu MCP Server. Model nie zależy bezpośrednio od wewnętrznych szczegółów źródła danych, wyjaśniając źródło mieszania danych wielu stron. Drugim jest poprawa przejrzystości i możliwości audytu łącza sterowania i kontroli za pomocą protokołów komunikacyjnych oraz rozwiązanie problemu asymetrii informacji i wyzwań związanych z czarną skrzynką interakcji danych użytkownik-model. Trzecim jest zapewnienie kontrolowalności łącza autoryzacji poprzez odpowiadanie zgodnie z uprawnieniami i zapewnienie użytkownikowi kontroli nad agentem w korzystaniu z narzędzi/danych.
MCP buduje standardowy interfejs i mechanizm ochrony bezpieczeństwa poprzez warstwową architekturę, osiągając równowagę między interoperacyjnością a bezpieczeństwem w wywołaniach danych i narzędzi. Na poziomie wartości dla użytkownika, MCP zapewnia silniejszą współpracę i interakcję między inteligentnymi ciałami i większą liczbą narzędzi, a nawet bardziej inteligentnymi ciałami. W następnym etapie MCP skupi się na rozwoju wsparcia dla połączeń zdalnych.
Standardowe interfejsy dla zwiększonej kompatybilności
Jedną z kluczowych cech MCP jest wykorzystanie standardowych interfejsów. Oznacza to, że agenci AI mogą wchodzić w interakcje z różnymi narzędziami i źródłami danych bez konieczności pisania niestandardowego kodu dla każdej integracji. Zamiast tego agent musi po prostu rozumieć protokół MCP, który definiuje wspólny zestaw poleceń i formatów danych. To znacznie upraszcza proces integracji i zmniejsza ilość wymaganej pracy programistycznej. Ułatwia również przełączanie się między różnymi narzędziami i źródłami danych, ponieważ agent nie musi być za każdym razem konfigurowany na nowo.
Wykorzystanie standardowych interfejsów promuje również interoperacyjność między różnymi agentami AI. Jeśli wielu agentów obsługuje protokół MCP, mogą łatwo komunikować się i udostępniać sobie dane. Może to prowadzić do rozwoju bardziej złożonych i zaawansowanych systemów AI, w których wielu agentów współpracuje ze sobą w celu rozwiązania problemu.
Solidne mechanizmy bezpieczeństwa dla ochrony danych
Bezpieczeństwo jest najwyższym priorytetem w projektowaniu MCP. Protokół zawiera kilka mechanizmów ochrony danych i zapobiegania nieautoryzowanemu dostępowi. Jedną z kluczowych cech jest izolacja modeli od konkretnych źródeł danych. Oznacza to, że agent nie ma bezpośredniego dostępu do danych bazowych, ale zamiast tego wchodzi z nimi w interakcje za pośrednictwem protokołu MCP Server. Dodaje to warstwę pośrednią, która utrudnia atakującemu naruszenie danych.
MCP zawiera również mechanizmy poprawiające przejrzystość i możliwość audytu łączy sterowania i kontroli. Pozwala to użytkownikom zobaczyć dokładnie, jakie polecenia są wysyłane do agenta, i sprawdzić, czy agent działa zgodnie z ich instrukcjami. Jest to ważne dla budowania zaufania do systemów AI, ponieważ pozwala użytkownikom zrozumieć, w jaki sposób agent podejmuje decyzje.
Wreszcie, MCP zapewnia mechanizm kontrolowania autoryzacji agentów. Pozwala to użytkownikom określić, do których narzędzi i źródeł danych agent może mieć dostęp. Jest to ważne, aby zapobiec dostępowi agenta do poufnych danych lub wykonywaniu czynności, do których nie jest upoważniony.
MCP: Kładzenie podwalin pod zarządzanie agentami
MCP zapewnia kompatybilność i gwarancje bezpieczeństwa dla wywołań danych i narzędzi, kładąc podwaliny pod zarządzanie agentami, ale nie może rozwiązać wszystkich wyzwań związanych z zarządzaniem.
Po pierwsze, pod względem wiarygodności, MCP nie stworzyło normatywnego standardu dla wyboru wywołujących źródeł danych i narzędzi, ani nie oceniło i nie zweryfikowało wyników wykonania. Po drugie, MCP nie może tymczasowo dostosować nowego rodzaju komercyjnej relacji konkurencyjnej współpracy spowodowanej przez agenta.
Ogólnie rzecz biorąc, MCP zapewnia wstępną techniczną odpowiedź na podstawowe obawy dotyczące bezpieczeństwa, z którymi borykają się użytkownicy korzystający z agentów, i stał się punktem wyjścia dla zarządzania agentami. Wraz z popularyzacją agentów i innych aplikacji AI, potrzebne są rozproszone metody, aby zaspokoić zróżnicowane potrzeby różnych użytkowników. Celem zarządzania jest nie tylko bezpieczeństwo modelu, ale także podstawowe wymaganie zaspokojenia potrzeb użytkowników. Protokół MCP zrobił pierwszy krok w kierunku reagowania na potrzeby użytkowników i promowania technologicznego współzarządzania. To również na podstawie MCP agent osiąga wydajny podział pracy i współpracę różnych narzędzi i zasobów. Tydzień temu Google udostępnił jako open-source protokół Agent2Agent (A2A) do komunikacji między agentami, dzięki czemu agenci zbudowani na różnych platformach mogą negocjować zadania i prowadzić bezpieczną współpracę oraz promować rozwój ekologii multi-inteligentnych ciał.
Rozwiązywanie problemów związanych z zaufaniem i niezawodnością
Chociaż MCP stanowi solidny fundament dla zarządzania agentami, nie rozwiązuje wszystkich wyzwań. Jednym z kluczowych obszarów, które wymagają dalszej uwagi, jest kwestia zaufania i niezawodności. MCP obecnie nie zawiera żadnych mechanizmów weryfikacji dokładności wyników wykonania ani zapewnienia, że agenci wybierają odpowiednie źródła danych i narzędzia. Oznacza to, że użytkownicy mogą nie być w stanie w pełni zaufać decyzjom podejmowanym przez agenta, zwłaszcza w sytuacjach wysokiego ryzyka.
Aby rozwiązać ten problem, konieczne będzie opracowanie nowych standardów i najlepszych praktyk dotyczących rozwoju i wdrażania agentów. Mogą to być takie rzeczy, jak formalne metody weryfikacji, które można wykorzystać do udowodnienia, że agent zawsze będzie zachowywał się w przewidywalny i bezpieczny sposób. Może to również obejmować wykorzystanie technik wyjaśnialnej AI, które mogą pomóc użytkownikom zrozumieć, w jaki sposób agent podejmuje decyzje.
Poruszanie się po nowym krajobrazie konkurencji
Kolejnym wyzwaniem, którego MCP w pełni nie rozwiązuje, jest wpływ agentów na krajobraz konkurencji. Wraz z coraz większą popularnością agentów, prawdopodobnie zakłócą one istniejące modele biznesowe i stworzą nowe formy konkurencji. Ważne jest, aby wziąć pod uwagę potencjalny wpływ agentów na krajobraz konkurencji oraz opracować strategie poruszania się w tym nowym środowisku. Obejmuje to rozwiązywanie problemów takich jak własność danych, własność intelektualna i potencjał zachowań antykonkurencyjnych.
Jednym z potencjalnych podejść jest opracowanie nowych ram regulacyjnych, które są specjalnie dostosowane do agentów AI. Ramy te mogłyby obejmować takie kwestie, jak prywatność danych, stronniczość algorytmiczna i potencjał manipulacji rynkowych. Mogłyby również obejmować mechanizmy promujące konkurencję i zapobiegające monopolom.
Droga naprzód: Współpraca i innowacje
Rozwój MCP to znaczący krok naprzód w dziedzinie zarządzania agentami. Ważne jest jednak, aby zdać sobie sprawę, że to dopiero początek. Nadal jest wiele wyzwań do pokonania i będzie to wymagało wspólnego wysiłku naukowców, programistów, decydentów i użytkowników, aby zapewnić, że agenci AI będą wykorzystywani w sposób bezpieczny i odpowiedzialny.
Jednym z obiecujących wydarzeń jest niedawne udostępnienie protokołu Agent2Agent (A2A) firmy Google. Protokół ten umożliwia agentom zbudowanym na różnych platformach komunikowanie się i współpracę ze sobą. Może to prowadzić do rozwoju bardziej złożonych i zaawansowanych systemów AI, w których wielu agentów współpracuje ze sobą w celu rozwiązania problemu. Może to również pomóc w tworzeniu bardziej konkurencyjnego i innowacyjnego ekosystemu AI, ponieważ programiści mogą budować agentów, którzy mogą bezproblemowo integrować się z innymi agentami.
Wraz z ciągłą ewolucją technologii AI, ważne jest, aby wyprzedzać trendy i opracowywać nowe mechanizmy zarządzania, które mogą sprostać wyzwaniom przyszłości. Będzie to wymagało zaangażowania we współpracę, innowacje i gotowości do dostosowania się do stalezmieniającego się krajobrazu AI.