Die Essenz des MCP
Das Model Context Protocol (MCP), ursprünglich von Anthropic entwickelt und nun auch von OpenAI unterstützt, zielt darauf ab, die Art und Weise zu vereinfachen, wie Entwickler KI-Anwendungen erstellen, die nahtlos auf Daten aus verschiedenen Quellen zugreifen und diese nutzen können. Die Architektur des Protokolls ist einfach: Es ermöglicht Entwicklern, ihre Funktionalitäten über einen MCP-Server zu veröffentlichen oder MCP-Clients zu erstellen, die sich mit diesen Servern verbinden können, um die verfügbaren Funktionalitäten zu nutzen.
Aus technischer Sicht fungiert der MCP-Server als Gateway, über das Entwickler ihre Tools und Funktionen verfügbar machen. KI-Agenten können dann MCP-Clients verwenden, um sich mit diesen Servern zu verbinden und die Tools bei Bedarf zu entdecken und zu nutzen. Wenn ein Agent einen Server abfragt, um die verfügbaren Tools zu ermitteln, liefert der Server Metadaten in einem standardisierten JSON-Format, so dass der Agent verstehen kann, wie die Tools zu verwenden sind. Wenn ein Agent beschließt, ein Tool zu verwenden, sendet er eine Tool-Aufrufanfrage, wodurch eine nahtlose Interaktion zwischen Server und Client ermöglicht wird.
Die Bedeutung des MCP: Interoperabilität, Koordination und Ökosystem
Die Bedeutung des MCP liegt in seiner Fähigkeit, eine standardisierte Möglichkeit für die Kommunikation zwischen Tools und Agenten und den Austausch von Informationen über Benutzer, Aufgaben, Daten und Ziele bereitzustellen. Diese Standardisierung bringt eine Reihe von Vorteilen mit sich, darunter:
- Interoperabilität: MCP ermöglicht es verschiedenen KI-Modellen, Assistenten und externen Anwendungen, Kontext zu teilen, wodurch die Integration mehrerer KI-gesteuerter Tools und Dienste erleichtert wird. Diese Interoperabilität beseitigt Silos zwischen verschiedenen Systemen und ermöglicht es ihnen, zusammenzuarbeiten, um gemeinsame Ziele zu erreichen.
- Koordination: MCP trägt zur Koordination von Aufgaben zwischen verschiedenen KI-Agenten und externen Anwendungen bei und stellt sicher, dass sie reibungslos zusammenarbeiten, ohne Arbeit zu duplizieren oder wiederholte Benutzereingaben zu erfordern. Durch die Koordination von Aufgaben verbessert MCP die Effizienz und Produktivität und optimiert so KI-gesteuerte Prozesse.
- Ökosystem: Standards wie MCP ermöglichen es Drittentwicklern, Plug-ins oder Tools zu erstellen, die leicht mit KI-Assistenten ‘die gleiche Sprache sprechen’ können, was das Wachstum des Ökosystems beschleunigt. Diese Standardisierung fördert Innovation und Zusammenarbeit und führt zu einer Vielzahl von erweiterbaren KI-Funktionen und Anwendungen.
Beispielsweise bietet der Google Maps MCP-Server sieben Funktionen, darunter das Konvertieren von Adressen in Koordinaten (und umgekehrt), das Suchen von Orten, das Abrufen von Details zu einem Ort, das Berechnen von Entfernungen (und Reisezeiten) zwischen Orten, das Abrufen von Höhendaten und das Abrufen von Routen. Diese Funktionen demonstrieren, wie MCP den nahtlosen Zugriff auf eine Vielzahl von Diensten und Daten erleichtert und so eine breite Palette von Anwendungsfällen in KI-gesteuerten Anwendungen unterstützt.
Agenten-Handel: Die transformative Wirkung des MCP
Zu den Organisationen, die Interesse an MCP haben, gehören Einzelhändler, Banken und andere, die ihre eigenen KI-Funktionen entwickeln möchten, damit ihre Agenten mit den Agenten ihrer Kunden interagieren können. Beispielsweise baut das US-Geschäft von Walmart seine eigenen Agenten, um mit den Agenten der Verbraucher zu interagieren, um Empfehlungen oder zusätzliche Produktinformationen bereitzustellen. Gleichzeitig können Verbraucheragenten den Agenten der Einzelhändler Informationen über Präferenzen usw. liefern.
Banken und Einzelhändler möchten, dass Kundenagenten mit den Agenten der Einzelhändler interagieren, anstatt Webseiten oder APIs zu verwenden, um die gewünschten Dienste zu erhalten. Frank Young fasst diese Dynamik gut zusammen, indem er vorschlägt, dass Organisationen APIs bereitstellen, um einfache Prozesse (z. B. Abonnements) mit der aktuellen Infrastruktur zu unterstützen, aber für die Spitze des Agenten-Handels (Verhandlungen, Betrugsbekämpfung, Optimierung) einen MCP-Server implementieren, um diese komplexen, hochwertigen Szenarien zu erfassen.
Sicherheitsherausforderungen von MCP
Obwohl die Vision des Agenten-Handels verlockend ist, müssen die mit MCP verbundenen Sicherheitsprobleme angegangen werden, um eine sichere, zuverlässige und kostengünstige Bereitstellung zu gewährleisten. MCP definiert keinen Standardmechanismus, mit dem sich Server und Clients gegenseitig authentifizieren können, und es gibt keine Vorgaben, wie die API-Delegierung der Authentifizierung zu erfolgen hat. Diese Sicherheitslücke könnte böswilligen Agenten Tür und Tor öffnen, sich als legitime Entitäten auszugeben, unbefugten Zugriff auf sensible Daten zu erhalten oder böswillige Aktivitäten zu starten.
Eine Möglichkeit, diese Sicherheitsprobleme zu beheben, besteht darin, dass der MCP-Server Agenten-Anmeldeinformationen anhand einer Art Register validiert, was ein grundlegendes KYC (Know Your Customer) für KI ist, so dass nur vertrauenswürdige Agenten zugelassen werden. Dies könnte der Vorbote einer komplexeren Know Your Agent (KYA)-Infrastruktur sein, die robustere Authentifizierungs- und Autorisierungsmechanismen bietet.
Da MCP-Server von unabhängigen Entwicklern und Mitwirkenden verwaltet werden, gibt es keine zentrale Plattform, um Sicherheitsstandards zu prüfen, durchzusetzen oder zu validieren. Dieses dezentrale Modell erhöht die Wahrscheinlichkeit inkonsistenter Sicherheitspraktiken, was es schwierig macht, sicherzustellen, dass alle MCP-Server die Prinzipien der sicheren Entwicklung einhalten. Darüber hinaus fehlt den MCP-Servern ein einheitliches Paketverwaltungssystem, was die Installation und Wartung erschwert und die Wahrscheinlichkeit erhöht, dass veraltete oder falsch konfigurierte Versionen bereitgestellt werden. Die Verwendung inoffizieller Installationstools über verschiedene MCP-Clients hinweg führt zu einer weiteren Variabilität bei der Serverbereitstellung, was es schwierig macht, konsistente Sicherheitsstandards aufrechtzuerhalten.
MCP fehlt es auch an einem Standard-Framework für die Verarbeitung der Authentifizierung und Autorisierung von Gegenparteien, und es gibt keinen Mechanismus zur Überprüfung der Identität oder zur Festlegung des Zugriffs. Ohne diese Mechanismen ist es schwierig, eine feingranulare Berechtigung durchzusetzen. Da MCP auch ein Berechtigungsmodell fehlt und auf OAuth angewiesen ist, bedeutet dies, dass eine Sitzung mit einem Tool entweder zugänglich oder vollständig eingeschränkt ist, wie Andreessen Horowitz feststellt, wird es mit der Einführung weiterer Agenten und Tools zusätzliche Komplexität geben. Daher wird mehr benötigt, ein Kandidat ist der sogenannte Policy Decision Point (PDP). Dies ist eine Komponente, die Zugriffsrichtlinien auswertet. Angesichts von Eingaben wie der Identität, der Aktion, der Ressource und dem Kontext eines Akteurs entscheidet er, ob die Aktion zugelassen oder verweigert wird.
Mike Schwartz, Gründer des Cybersicherheits-Startups Gluu, behauptet, dass PDPs zwar früher eine schwergewichtige Infrastruktur waren, die auf Servern oder Mainframes lief, aber ein PDP, der die Open-Source-Richtliniensprache Cedar verwendet, klein und schnell genug ist, um eingebettet in mobilen Anwendungen zu laufen, und sich zu einem wichtigen Bestandteil des Agent-KI-Stacks entwickeln sollte. AWS kündigte die Cedar-Richtliniensyntax im Jahr 2024 nach umfangreicher wissenschaftlicher Forschung zum Thema automatisches Reasoning an. Wichtig ist, dass Cedar deterministisch ist - bei gleichen Eingaben erhalten Sie immer die gleiche Antwort. Deterministik in der Sicherheit ist notwendig, um Vertrauen aufzubauen, was bedeutet, immer und immer wieder das Gleiche zu tun. Wie Mike sagte, erfüllt ein Cedar-basierter, einbettbarer PDP alle Anforderungen an Agenten-KI.
Ein Neubeginn für MCP
Dies ist nicht nur ein weiterer E-Commerce. Wie Jamie Smith feststellt, ist es nicht einfach, Google zu durchsuchen, wenn Sie Ihrem Agenten sagen: ‘Finden Sie ein Hotel in Paris unter 400 Dollar mit Blick auf den Eiffelturm’. Er wird die Anfrage mit Ihren verifizierten Anmeldeinformationen (aus Ihrer digitalen Geldbörse), Zahlungseinstellungen, Treueprogrammen (usw.) zusammen mit Einschränkungen wie Preisobergrenzen, Datumsbereichen und Treueprogrammen verpacken. Dies ist eine ‘strukturierte Kontext-Payload’, die an verschiedene Reise-Websites gesendet wird, die in der Lage sind, zu antworten und mit Ihrem Agenten zu interagieren.
Im Gegensatz zum E-Commerce, der auf dem Internet ohne Sicherheitsschicht aufgebaut ist (daher keine digitalen Währungen und keine digitale Identität), wird der Agenten-Handel auf einer Infrastruktur aufgebaut, die den Marktteilnehmern echte Sicherheit bietet. Diese Sicherheitsinfrastruktur zu schaffen, ist eine hervorragende Gelegenheit für Fintechs und andere Startups, die digitale Währungen und digitale Identitäten als Kernkomponenten anbieten wollen. Da die Identitäts-, Authentifizierungs- und Autorisierungsmechanismen rund um MCP standardisiert werden, gibt es keinen Grund, nicht mit einer raschen Beschleunigung des Agenten-Handels auf dem Massenmarkt zu rechnen.
Da die Sicherheitsprobleme von MCP angegangen und die Standardisierungsbemühungen abgeschlossen sind, hat der Agenten-Handel das Potenzial, die Art und Weise, wie wir kommerzielle Transaktionen durchführen, grundlegend zu verändern. Durch die Nutzung der Leistungsfähigkeit von KI-Agenten zur Automatisierung und Verbesserung verschiedener Prozesse verspricht der Agenten-Handel eine Steigerung der Effizienz, Bequemlichkeit und Personalisierung und schafft so neue Möglichkeiten für Unternehmen und Verbraucher.
Letztendlich stellt MCP einen Wandel hin zu einer sichereren, effizienteren und KI-zentrierten kommerziellen Zukunft dar, die die Art und Weise, wie Unternehmen mit ihren Kunden interagieren und wie sie agieren, neu definieren wird.