MCP: Lauwarmer Empfang bei Internetgiganten?

Das Versprechen und die Herausforderungen der Vereinheitlichung

Die Diskussion um die Interoperabilität von KI intensiviert sich. Nachdem Baidu auf seiner Entwicklerkonferenz letzte Woche seine umfassenden MCP-Dienste angekündigt hat, haben auch große chinesische Technologieunternehmen wie Alibaba, ByteDance und Tencent die MCP-Reise angetreten.

MCP, oder Model Context Protocol, ist als einheitlicher Standard konzipiert, der es KI ermöglicht, nahtlos mit einer Vielzahl von Anwendungen und Diensten zu interagieren. Es kann mit der allgegenwärtigen USB-Schnittstelle in Computern und Smartphones verglichen werden, die die Plug-and-Play-Integration verschiedener externer Geräte ermöglicht. Im Wesentlichen zielt MCP darauf ab, KI einen universellen ‘USB-Anschluss’ zu bieten, um auf Tools zuzugreifen und Aufgaben auszuführen.

Im November 2024 führte Anthropic, ein amerikanisches KI-Unternehmen, den MCP-Standard ein, der schnell von Wettbewerbern wie OpenAI und Google übernommen wurde, was eine Abkehr von der konventionellen Wettbewerbspraxis proprietärer Ökosysteme signalisierte. Ab April starteten führende chinesische Technologieunternehmen, darunter Alibaba Cloud’s Bailian, Tencent Cloud’s Knowledge Engine, ByteDance’s Kouzi Space und Baidu AI Cloud, ihre eigenen umfassenden MCP-Dienste.

Das Hauptziel von MCP ist die Förderung der Vereinheitlichung, aber dieses Unterfangen steht vor erheblichen Herausforderungen. Laut mehreren Entwicklern und Forschern ist MCP zwar effektiv für den Zugriff auf lokale Unternehmensdaten, stößt aber auf Hindernisse, wenn versucht wird, es in Internetanwendungen für Aufgaben wie Flugbuchungen, Preisprüfungen und die Erstellung von Reiseführern zu integrieren. Diese Herausforderungen sind auf die Unreife der KI-Aufrufprozesse und die begrenzte Verfügbarkeit von Internet-Tools zurückzuführen, wobei viele Plattformen nur Zugriff auf periphere Funktionen bieten.

Nicht alle Internetplattformen sind gleichermaßen begeistert von der Einführung dieses gemeinsamen Standards und dem Beitritt zum MCP-Dienstleisternetzwerk. Die Geschlossenheit des chinesischen Internet-Ökosystems, gepaart mit einer erhöhten Sensibilität für den Datenschutz, hat viele Plattformen vorsichtig gemacht. Sie ziehen es vor, die Tragfähigkeit und Entwicklung des MCP-Ökosystems zu beurteilen, bevor sie sich voll und ganz darauf einlassen.

Die KI-Landschaft ist bekannt für ihre sich schnell entwickelnde Terminologie und Konzepte. Als Anthropic Ende letzten Jahres das MCP-Protokoll ursprünglich als Open Source veröffentlichte, verfolgte die Branche größtenteils einen abwartenden Ansatz. Die explosionsartige Popularität von Manus hat jedoch das Interesse an MCP in China angeheizt.

MCP als Katalysator für KI-Agentur

Laut Hou Xinyi von der Huazhong University of Science and Technology liegt der entscheidende Schritt zur Überwindung der Grenzen von ‘Chatbots’ darin, KI in die Lage zu versetzen, mit externen Daten und Tools zu interagieren, was genau das ist, was MCP zu erleichtern versucht.

Vor MCP wurden alternative Ansätze untersucht, um den wahrgenommenen Mangel an ‘KI-Agentur’ zu beheben. Ende 2023 führte OpenAI das Konzept eines App Stores (GPT Store) ein, der es ChatGPT ermöglicht, externe Tools über Plugins auf der Grundlage eines definierten Satzes von Standards zu nutzen. Ähnliche KI-App-Stores, wie ByteDance’s Kouzi, Baidu’s Qianfan und Alibaba’s Bailian, folgten dem Beispiel.

Diese Ansätze stießen jedoch schließlich an ihre Grenzen. Plugins und App-Stores hatten ein gemeinsames Problem: die Silobildung. Jedes Tool verfügte über seine eigene eindeutige Entwicklungsdokumentation, Parameterformate und Schnittstellenspezifikationen. Dies bedeutete, dass Entwickler jedes Mal das Rad neu erfinden mussten, wenn sie ein neues Tool in KI integrierten, was zu Ineffizienzen führte.

Im Laufe der Zeit ging die Anzahl der neuen Tools, die zu App-Stores hinzugefügt wurden, zurück, und die Qualität der Plugins variierte erheblich, was die Fähigkeit zur Bewältigung komplexer Aufgaben beeinträchtigte. Dies deutete darauf hin, dass sich die bestehenden Ansätze ihren Grenzen näherten.

MCP als vereinheitlichende Lösung

MCP wird aufgrund seiner Betonung der Vereinheitlichung als vielversprechende Lösung angesehen. In seiner offiziellen Dokumentation vergleicht Anthropic MCP mit einer universellen USB-C-Schnittstelle für die KI-Welt. Hou Xinyi beschreibt es lieber als ‘Dockingstation’ - einen vielseitigen Adapter, der es KI ermöglicht, sich gleichzeitig mit mehreren externen Tools zu verbinden, wodurch Formatkonvertierungen überflüssig werden.

Viele erwarten, dass MCP eine transformative Wirkung haben wird, ähnlich der Standardisierung von Gewichten und Maßen durch Qin Shi Huang, die den Handel und die Kommunikation zwischen den zuvor fragmentierten Staaten der Frühlings- und Herbstperiode erleichterte.

Laut einem technischen Leiter der Intelligent Interconnection Working Group eines großen Technologieunternehmens optimiert MCP auch die Sprachinteraktionen von KI. Zuvor mussten Benutzer, um die API eines Navigationsdienstes zu nutzen, präzise angeben: ‘Ich möchte navigieren’. Selbst eine leichte Abweichung konnte dazu führen, dass die KI fehlschlug. Jetzt muss jedes Tool standardisierte Namen, Parameter und Funktionsbeschreibungen bereitstellen. Infolgedessen muss KI nur noch die Absicht des Benutzers verstehen und diese dann anhand der Beschreibungen mit dem am besten geeigneten MCP-Server abgleichen.

Dieser Ansatz stimmt enger mit den inhärenten Fähigkeiten großer Sprachmodelle überein und ermöglicht es Benutzern, Dienste mit einem einzigen Satz aufzurufen, wodurch die vorherige Anforderung einer direkten Schnittstelle-zu-Schnittstelle-Kommunikation entfällt.

Die aktuelle Akzeptanz und die Einschränkungen von MCP

Trotz seines wahrgenommenen Potenzials hat MCP noch keine breite Akzeptanz gefunden, und seine praktischen Anwendungen sind weiterhin begrenzt. Derzeit ist MCP am beliebtesten bei technischen Mitarbeitern von Unternehmen und unabhängigen Entwicklern.

Als Front-End-Ingenieur verlässt sich Gong Dian stark auf den KI-Programmierassistenten Cursor. Cursor hat jedoch Schwierigkeiten, sich nahtlos in die internen Projektsysteme seines Unternehmens zu integrieren, was manuelle Eingriffe erfordert. Während zuvor Plugins oder Funktionsaufrufe verwendet werden konnten, konnte externe KI nicht auf die internen Systeme des Unternehmens zugreifen, und der Echtzeitaufruf warf Sicherheitsbedenken auf. MCP hingegen kann innerhalb des internen Netzwerks des Unternehmens initiiert werden, was es zuverlässiger und konformer macht.

Der unabhängige Entwickler Zhu Mama wies Cursor kürzlich an, die MCP-Dokumentation zu lernen und Google Maps und Search APIs in einen MCP-Server zu verpacken, der dann zum Aufrufen von Googles Gemini-Sprachmodell verwendet wurde. Das resultierende MCP-ausgestattete Gemini wurde in einen Reiseführer-Assistenten verwandelt. Auf die Frage nach öffentlichen Verkehrsmitteln vom Flughafen Singapur zu verschiedenen Sehenswürdigkeiten lieferte der Assistent detailliertere und genauere Informationen als die Antwort von Doubao.

Innerhalb der Entwicklergemeinschaft entstehen verschiedene Reiseassistenten. Als ByteDance’s Kouzi Space am 19. April seine interne Beta-Version startete, war der Demonstrationsfall ebenfalls ein Reise-KI-Assistent, was einige zu Witzen über die Besessenheit der Branche vom Reisen veranlasste.

Zhu Mama räumt offen ein, dass der Fokus auf Reiseszenarien in erster Linie auf ihrer Relevanz für alltägliche Verbraucherbedürfnisse beruht. Ein weiterer Grund ist die begrenzte Verfügbarkeit von MCP-kompatibler Internetsoftware in China, was das Marktpotenzial einschränkt.

Laut den neuesten Statistiken der Navigationsplattform MCP.so gibt es weltweit über 11.028 MCP-Dienstleister, und die Zahl wächst rasant. In China fungieren jedoch derzeit nur wenige große geografische Standortanwendungen wie AutoNavi, Baidu Maps und Tencent Maps als groß angelegte MCP-Server.

Diese Einschränkung ist der Grund, warum Zhu Mamas Plan, eine chinesische Version eines Reiseassistenten zu erstellen, schnell ins Stocken geriet. Um einen chinesischen Reiseführer zu entwickeln, wäre es ideal, inländische Kartendienste zu nutzen. Zhu Mama stellte jedoch fest, dass der offizielle MCP-Server von AutoNavi nur sehr begrenzte Informationen bot. Während er Routenabfragen zwischen zwei Standorten bereitstellen konnte, fehlten ihm detaillierte Informationen zu Sehenswürdigkeiten, Bewertungen, Hotelpreisen und anderen wichtigen Details.

Im Gegensatz dazu bietet die Google Maps API detaillierte Buchungsmethoden, Hotelpreise, Hotelbewertungen, Hoteleinrichtungen und sogar Preisvergleiche über mehrere Plattformen hinweg, ein Detaillierungsgrad, der im chinesischen Ökosystem schwer vorstellbar ist.

Während Tencent-, Alibaba-, ByteDance- und Baidu-Produkte MCP annehmen, sind ihre hochfrequenten Anwendungen dem MCP-Dienstleisternetzwerk noch nicht formell beigetreten. Plattformen wie WeChat, Xiaohongshu und Douyin sowie Lifestyle-Serviceplattformen wie Ele.me, Meituan und Ctrip fehlen auffallend.

Herausforderungen bei der Tool-Verfügbarkeit und der KI-Planung

Zusätzlich zur begrenzten Verfügbarkeit von Tools stellt auch die Planungsfähigkeit der KI eine Einschränkung dar. Zhu Mama verpackte 6-8 API-Schnittstellen, darunter Google Hotels, Maps und Search, in einen einzigen MCP-Server, was weit unter dem maximalen Grenzwert liegt (Cursor erlaubt maximal 40 Tools pro Agent). Die KI hatte jedoch bereits Schwierigkeiten zu bestimmen, welches Tool aufgerufen werden soll. Angesichts komplexer Anfragen war die KI nicht in der Lage, den Prozess aufzuschlüsseln und MCP stufenweise aufzurufen, sondern versuchte, alles auf einmal zu erledigen.

Laut Gong Dian hängt der Wert von MCP von der Qualität sowohl der Client- als auch der Serverseite ab. So wie ein USB-Anschluss keine inhärenten Fähigkeiten hat und auf die dahinter stehenden Dienste angewiesen ist, benötigt MCP robuste Dienste, um sein Potenzial zu verwirklichen.

MCP legt den Grundstein für KI-Agenten, löst aber nicht alle Probleme. Ein Standard, der ungenutzt bleibt, ist nur ein Stück Papier.

Der oben erwähnte technische Leiter legt nahe, dass die weitverbreitete Akzeptanz des MCP-Standards von Anthropic auf seine Open-Source-, Non-Profit-Natur und die Glaubwürdigkeit seines Schöpfers zurückzuführen ist. Andere Organisationen sind bereit, einem Standard zu folgen, der von einer angesehenen Einheit festgelegt wurde.

Derzeit sind kleine und mittlere Unternehmen und große Internetunternehmen, die ihre Einnahmequellen diversifizieren wollen, die Hauptanwender des MCP-Standards.

Das KI-Begleitunternehmen MiniMax hat kürzlich einen MCP-Server gestartet, wobei Community Manager Cai Jiaren erklärte, dass Entwickler MCP verwenden können, um die multimodalen Fähigkeiten von MiniMax für Videogenerierung, Sprachgenerierung und Sprachklonierung aufzurufen. Der MCP umfasst strenge Zugriffskontrollmechanismen, um die Einhaltung der Vorschriften sicherzustellen, wenn Unternehmen auf interne Daten zugreifen. Der gesamte Aufrufprozess wird ebenfalls vereinfacht, ohne zusätzliche Token-Kosten zu verursachen.

Die Entscheidung von MiniMax, einen MCP-Server zu starten, wurde von dem Wunsch getrieben, globalen Entwicklern die einfache Nutzung der Modellfähigkeiten von MiniMax zu ermöglichen und eine flexiblere und effizientere Erstellung zu ermöglichen.

Andere Startups haben ähnliche Ambitionen. Biu Technology erwähnte in einem Interview, dass Entwickler AutoNavi MCP verwenden können, um Transportdaten zu erhalten, und dann die Produkte von Biu verwenden können, um eine PPT zu generieren. MCP senkt die Eintrittsbarriere, indem es Zugriff auf die AutoNavi-Schnittstelle bietet, die ihnen sonst nicht zur Verfügung stehen würde.

Der oben erwähnte technische Leiter glaubt, dass MCP im Wesentlichen eine Geschichte über Dienstleister ist. Durch die Kapselung ihrer APIs gemäß dem MCP-Standard können Anwendungsdienstleister ihre Dienste allen KI zugänglich machen.

Divergenzen und Bedenken bei Dienstleistern

Es gibt jedoch Meinungsverschiedenheiten zwischen den Dienstleistern. Viele Unternehmen sind der Idee nicht voll und ganz verpflichtet. Während große Plattformen wie AutoNavi und Baidu Maps MCP-Server gestartet haben, verpacken sie hauptsächlich bestehende API-Schnittstellen neu und bieten konventionelle Funktionen, während sie die Kontrolle über die wichtigsten Benutzerberechtigungen und Transaktionsdaten streng aufrechterhalten.

Zusätzlich zu den Kartenstandortdiensten ist der Xiaohongshu-Auto-Publisher eines Drittanbieters, der das Suchen und Veröffentlichen von Inhalten automatisiert, derzeit der beliebteste Artikel auf dem MCP-Platz von Modeng community. Hou Xinyi vermutet, dass dies nur begrenzte Auswirkungen auf soziale Content-Plattformen wie Xiaohongshu haben könnte, aber Daten und Berechtigungen werden in transaktionsintensiven Szenarien wie Lebensmittelplattformen besonders sensibel.

Eines der Hauptanliegen der Dienstleister ist die Kontrolle über die Benutzererfahrung.

Zum Beispiel erfordert die Öffnung eines kompletten Lebensmittelieferdienstes, dass KI-Agenten Zugriff auf sensible persönliche Daten wie Preise, Geschäftsinformationen sowie Benutzeradressen und Kontaktinformationen erhalten. Anthropic hat eingeräumt, dass sich das Sicherheitssystem von MCP, einschließlich Berechtigungsmanagement und Aufrufprüfung, noch in der Entwicklung befindet. Folglich sind einige Plattformen besorgt über das Risiko eines unbefugten Aufrufs bei der Verbindung mit MCP.

Einige Plattformen testen relativ sichere Transaktionsszenarien. Zum Beispiel hat Alipay kürzlich einen MCP-Server gestartet und behauptet, KI-Agenten ‘One-Click-Zugriff auf Zahlungsfunktionen’ zu geben. Ein genauerer Blick zeigt jedoch, dass es hauptsächlich Inkasso- statt Zahlungsdienste anbietet.

Laut Hou Xinyi konzentriert sich der Ansatz von Alipay darauf, die Zahlungserfassung von Händlern zu erleichtern, anstatt KI zu erlauben, Zahlungen im Namen der Verbraucher zu leisten. Dies ist eine praktikable Option, da die KI die Kontrolle über Geldbörsen übernehmen und Bestellungen frei aufgeben zu lassen noch nicht sicher genug ist, damit sich jeder wohlfühlt. Dies ist auch der Hauptgrund, warum Transaktionsdienste nicht breit gefördert werden können.

Ein tieferliegendes Problem ist, dass die KI, wenn sie frei am Transaktionsprozess teilnimmt - Benutzern hilft, Preise zu vergleichen oder das kostengünstigste Restaurant empfiehlt -, den Benutzern zweifellos einen erheblichen Komfort bieten würde. Dies würde aber auch bedeuten, dass Serviceplattformen die Kontrolle über den Auswahlprozess des Benutzers verlieren und ihre Kernalgorithmusvorteile marginalisiert würden, wodurch sie zu gewöhnlichen Lieferanten würden.

Bewältigung von Sicherheit und Förderung der Universalität

Mehrere Interviewpartner sind der Meinung, dass MCP zwei Schlüsselfragen ansprechen muss: Sicherheit und Universalität.

Erstens die Sicherheit. Hou Xinyi weist darauf hin, dass MCP vor zwei Sicherheitsherausforderungen steht: ein Mangel an zentraler Sicherheitsüberwachung und ein unvollständiger Mechanismus zur Identitätsprüfung und Datenautorisierung. Derzeit gibt es keinen offiziellen ‘Discovery Plaza’ für MCP. Viele Navigationsplattformen von Drittanbietern sammeln MCP-Dienste, indem sie Code-Projekte direkt von GitHub abrufen, was schnell und unkompliziert ist, aber keinen formellen Überprüfungsprozess beinhaltet. Anthropic hat erklärt, dass es das MCP-Hosting-Mechanismus und die Auffindbarkeitsprobleme in diesem Jahr offiziell angehen wird. Der kürzlich aktualisierte Protokollentwurf von Anthropic arbeitet daran, diesen Mangel zu beheben. Darüber hinaus versuchen inländische Organisationen wie IIFAA (Internet Trusted Authentication Alliance), die Sicherheitslücke zu schließen.

Es gibt auch langjährige Probleme im Bereich der KI-Agenten, wie z. B. Prompt-Hijacking und Tool-Kombinationsangriffe. Der oben erwähnte technische Leiter ist jedoch der Ansicht, dass dies keine MCP-Schwachstellen sind, sondern Risiken, die für jeden KI-Agenten bestehen. Derzeit wurden keine offensichtlichen Sicherheitslücken im MCP-Protokoll selbst gefunden, und die Datenübertragungs- und Interaktionsmechanismen sind im Allgemeinen zuverlässig.

Sicherheit ist nur die erste Hürde. Die eigentliche Herausforderung besteht darin, die Interessenverteidigung der Hersteller zu überwinden und mehr Hersteller davon zu überzeugen, MCP-Server zu werden.

Laut Hou Xinyi hängt dies mit dem Verständnis der ‘Walled Garden’-Natur von Internetplattformen zusammen. Daten sind eine wichtige Wettbewerbsbarriere für verschiedene Plattformen, sodass viele Hersteller möglicherweise nur einige periphere Funktionen als MCP-Server zum Testen öffnen. Hersteller müssen möglicherweise abwarten und sehen, welche Auswirkungen das MCP-Ökosystem haben wird.

Die oben erwähnte Person, die für die Angelegenheit zuständig ist, sagte, dass, wenn es als MCP-Server mit KI verbunden ist, mehr Benutzerdaten und -gewohnheiten abgerufen und an das eigene Basismodell zurückgegeben werden können, was möglicherweise die größte Motivation für Hersteller wird, aktiv beizutreten.

Wenn der MCP-Servermarkt wirklich reichlich vorhanden ist, müssen weiter entfernte Probleme berücksichtigt werden.

Wie rufen beispielsweise intelligente Körper verschiedene Apps auf Mobiltelefonen auf? Die verantwortliche Person erwähnte, dass zum Aufwecken einer anderen App durch den lokalen KI-Smart-Body des Mobiltelefons eine zusätzliche Ebene der Anwendungsautorisierung und Identitätsprüfung vorhanden ist, was nicht so einfach ist wie der MCP-Aufruf von Cloud-Diensten, und es gibt derzeit keine besonders geeignete Lösung.

Wenn das Dienstleistungsangebot übermäßig ist, wie treffen intelligente Körper Entscheidungen - rufen JD-Mitnahme oder Meituan-Mitnahme an? Gaode-Karte oder Baidu-Karte verwenden? Mehrere Interviewpartner erwähnten, dass die heutige MCP-Aufrufslogik immer noch sehr einfach ist, hauptsächlich durch die ‘funktionale Beschreibung’ des Dienstanbieters bestimmt, und es gibt keinen Sortier- und Optimierungsmechanismus. Wenn ein Dienstanbieter absichtlich induktive Sprache in die Beschreibung einfügt, z. B. ‘am effizientesten’ und ‘Must-Choose’, kann die KI irregeführt und an Orte umgeleitet werden, an die sie nicht gehen sollte.

Wie die für die oben genannte Technologie zuständige Person erklärte: ‘Es ist, als ob Sie den gewünschten Dienst in der Suchmaschine nicht finden können, sondern eine Reihe von unübersichtlichen Informationen angezeigt werden. Wie man den Dienst, den Benutzer am meisten benötigen, genau zuordnet, wird das zukünftige MCP-Ökosystem auch vor dem gleichen Problem stehen.’

Letztendlich ist der Implementierungsprozess jedes Standards voller Herausforderungen. Hou Xinyi sagte, dass zur Förderung der Popularisierung von MCP eine wichtige Gelegenheit ähnlich wie Manus erforderlich sein könnte, um die gesamte Branche wirklich die Kraft von MCP erkennen zu lassen.