Manus: KI-Hoffnung oder Hype?

Die Anatomie des Hypes: Manus dekonstruiert

Der Start der Vorschauversion von Manus, einer ‘agentischen’ KI-Plattform, hat einen Sturm der Begeisterung ausgelöst, der an ein ausverkauftes Stadionkonzert erinnert. Doch unter der Oberfläche des Fanfarenrummels bleibt eine kritische Frage bestehen: Wird Manus den hochgesteckten Erwartungen, die es geweckt hat, wirklich gerecht?

Manus’ Entstehung ist nicht im luftleeren Raum erfolgt. Berichten zufolge ist die Plattform keine von Grund auf neu entwickelte Kreation, sondern ein komplexes Geflecht aus bestehenden und feinabgestimmten KI-Modellen. Es nutzt angeblich die Fähigkeiten von Modellen wie Anthropic’s Claude und Alibaba’s Qwen und setzt sie für Aufgaben ein, die von der Erstellung von Forschungsberichten bis zur komplexen Analyse von Finanzdokumenten reichen.

The Butterfly Effect, das chinesische Unternehmen hinter Manus, zeichnet auf seiner Website jedoch ein weitaus ehrgeizigeres Bild. Die Plattform wird als fähig angepriesen, so unterschiedliche Aufgaben wie den Erwerb von Immobilien und die Programmierung von Videospielen zu bewältigen – Behauptungen, die auf den ersten Blick ans Fantastische grenzen.

Kühne Behauptungen und virale Videos: Die Macht der Wahrnehmung

Yichao ‘Peak’ Ji, ein Forschungsleiter für Manus, heizte den Hype in einem viralen Video auf X (ehemals Twitter) weiter an. Er positionierte Manus als überlegene Alternative zu bestehenden agentischen Tools, einschließlich OpenAI’s Deep Research und Operator. Ji behauptete, dass Manus Deep Research auf GAIA, einem weit verbreiteten Benchmark zur Bewertung allgemeiner KI-Assistenten, übertrifft. Dieser Benchmark untersucht die Fähigkeit einer KI, reale Aufgaben zu erfüllen, indem sie im Internet navigiert, mit Software interagiert und vieles mehr.

‘[Manus] ist nicht nur ein weiterer Chatbot oder Workflow’, verkündete Ji in dem Video. ‘Es ist ein völlig autonomer Agent, der die Lücke zwischen Konzeption und Ausführung schließt […]. Wir sehen es als das nächste Paradigma der Mensch-Maschine-Kollaboration.’ Das sind in der Tat kühne Behauptungen, und sie haben wesentlich dazu beigetragen, dass die Plattform so schnell zu viralem Ruhm gelangt ist.

Realitätscheck: Benutzererfahrungen zeichnen ein anderes Bild

Während die Architekten von Manus und einige einflussreiche Stimmen Lobeshymnen auf die Plattform singen, zeichnen die ersten Benutzererfahrungen ein weniger schmeichelhaftes Bild. Berichte über Pannen, Einschränkungen und regelrechte Ausfälle sind aufgetaucht und werfen einen Schatten des Zweifels auf die angeblichen Fähigkeiten der Plattform.

Alexander Doria, Mitbegründer des KI-Startups Pleias, teilte seine wenig erfreuliche Erfahrung mit Manus auf X. Er stieß bei seinen Tests auf eine frustrierende Flut von Fehlermeldungen und Endlosschleifen. Andere Benutzer haben diese Bedenken bestätigt und weisen auf Manus’ Neigung zu sachlichen Fehlern, seine inkonsistenten Zitierpraktiken und seine Tendenz hin, Informationen zu übersehen, die online leicht verfügbar sind.

Persönliche Begegnungen: Ein Erfahrungsbericht aus erster Hand

Meine eigenen Versuche, Manus auf Herz und Nieren zu prüfen, führten zu ähnlich enttäuschenden Ergebnissen. Ich begann mit einer scheinbar einfachen Anfrage: der Bestellung eines Brathähnchen-Sandwiches bei einem hoch bewerteten Fast-Food-Restaurant in meinem Lieferradius. Nach zehn Minuten Wartezeit stürzte die Plattform ab. Ein zweiter Versuch ergab ein Menüelement, das meinen Kriterien entsprach, aber Manus war nicht in der Lage, die Bestellung abzuschließen oder auch nur einen Link zur Kasse bereitzustellen.

Unbeirrt beauftragte ich Manus, einen Tisch für eine Person in einem nahegelegenen Restaurant zu reservieren. Wiederum scheiterte der Versuch nach einigen Minuten. Schließlich forderte ich die Plattform auf, ein von Naruto inspiriertes Kampfspiel zu entwickeln. Nach einer halben Stunde Bearbeitungszeit warf sie einen Fehler aus und beendete damit effektiv mein Experiment.

Die Reaktion des Unternehmens: Ein Eingeständnis der Wachstumsschmerzen

Ein Sprecher von Manus räumte in einer Erklärung gegenüber TechCrunch die aktuellen Einschränkungen der Plattform ein:

‘Als kleines Team konzentrieren wir uns darauf, Manus weiter zu verbessern und KI-Agenten zu entwickeln, die den Benutzern tatsächlich helfen, Probleme zu lösen […]. Das Hauptziel der aktuellen geschlossenen Beta ist es, verschiedene Teile des Systems einem Stresstest zu unterziehen und Probleme zu identifizieren. Wir schätzen die wertvollen Erkenntnisse, die von allen geteilt wurden, sehr.’

Diese Erklärung räumt zwar die Probleme ein, unterstreicht aber auch den Early-Access-Charakter der Plattform. Sie deutet darauf hin, dass die aktuelle Version eher ein Stresstest als ein ausgereiftes Produkt ist, das für eine breite Akzeptanz bereit ist.

Der Hype-Zyklus: Exklusivität, Fehlinformationen und Nationalstolz

Wenn Manus in seinem aktuellen Zustand nachweislich fehlerhaft ist, warum hat es dann so viel Aufmerksamkeit erregt? Mehrere Faktoren haben zu diesem Phänomen beigetragen:

  • Exklusivität: Die begrenzte Verfügbarkeit von Einladungen hat eine Aura der Exklusivität geschaffen, die die Nachfrage und Neugierde steigert.
  • Medienrummel: Chinesische Medien haben Manus schnell als bedeutenden KI-Durchbruch gefeiert, wobei Publikationen wie QQ News es als ‘den Stolz der heimischen Produkte’ bezeichneten.
  • Verstärkung durch soziale Medien: KI-Influencer in den sozialen Medien haben eine wichtige Rolle bei der Verbreitung von – manchmal ungenauen – Informationen über Manus’ Fähigkeiten gespielt. Ein weit verbreitetes Video, das angeblich zeigte, wie Manus nahtlos über mehrere Smartphone-Apps hinweg interagiert, wurde später von Ji als Falschdarstellung bestätigt.
  • Vergleiche mit DeepSeek: Einige einflussreiche KI-Accounts auf X haben Vergleiche zwischen Manus und DeepSeek, einem anderen chinesischen KI-Unternehmen, gezogen. Diese Vergleiche sind jedoch nicht ganz zutreffend. Im Gegensatz zu DeepSeek hat The Butterfly Effect keine proprietären Modelle entwickelt. Während DeepSeek viele seiner Technologien als Open Source zur Verfügung gestellt hat, bleibt Manus vorerst ein geschlossenes System.

Mit Vorsicht zu genießen: Early Access und Zukunftspotenzial

Es ist wichtig zu wiederholen, dass sich Manus derzeit in einem sehr frühen Entwicklungsstadium befindet. The Butterfly Effect beteuert, dass es aktiv daran arbeitet, die Rechenkapazität zu skalieren und die gemeldeten Probleme zu beheben. So wie es aussieht, dient Manus jedoch als ein starkes Beispiel dafür, wie der Hype die technologische Realität überholt. Es bleibt abzuwarten, ob sich die Plattform so entwickeln kann, dass sie die hochgesteckten Erwartungen, die sie an sich selbst gestellt hat, erfüllt. Das Potenzial ist zweifellos vorhanden, aber der Weg zur Verwirklichung dieses Potenzials scheint mit Herausforderungen behaftet zu sein. Die aktuelle Iteration ist weit entfernt von dem nahtlosen, autonomen Agenten, der in viralen Videos und Werbematerialien dargestellt wird. Die Kluft zwischen Anspruch und Ausführung bleibt beträchtlich.