Manus: Hype of China's AI Toekomst?

De Anatomie van Hype: Manus Ontleed

De opkomst van Manus is niet in een vacuüm ontstaan. Rapporten geven aan dat het platform geen van de grond af opgebouwde creatie is, maar eerder een ingewikkeld tapijt geweven van bestaande en verfijnde AI-modellen. Het maakt naar verluidt gebruik van de mogelijkheden van modellen zoals Anthropic’s Claude en Alibaba’s Qwen, en gebruikt ze voor taken variërend van het genereren van onderzoeksrapporten tot de ingewikkelde analyse van financiële documenten.

The Butterfly Effect, het Chinese bedrijf achter Manus, schetst echter een veel ambitieuzer beeld op zijn website. Het platform wordt aangeprezen als in staat tot prestaties zo divers als de aankoop van onroerend goed en het programmeren van videogames – beweringen die op het eerste gezicht grenzen aan het fantastische.

Gedurfde Beweringen en Virale Video’s: De Kracht van Perceptie

Yichao ‘Peak’ Ji, een onderzoeksleider voor Manus, wakkerde de hype verder aan in een virale video op X (voorheen Twitter). Hij positioneerde Manus als een superieur alternatief voor bestaande agentic tools, waaronder OpenAI’s deep research en Operator. Ji beweerde dat Manus deep research overtreft op GAIA, een veelgebruikte benchmark voor het evalueren van algemene AI-assistenten. Deze benchmark onderzoekt het vermogen van een AI om taken uit de echte wereld uit te voeren door op het web te navigeren, te interageren met software en meer.

‘[Manus] is niet zomaar een chatbot of workflow,’ verklaarde Ji in de video. ‘Het is een volledig autonome agent die de kloof overbrugt tussen conceptie en uitvoering […]. We zien het als het volgende paradigma van mens-machine samenwerking.’ Dit zijn inderdaad gedurfde beweringen, en ze hebben aanzienlijk bijgedragen aan de snelle opkomst van het platform tot virale roem.

Reality Check: Gebruikerservaringen Schetsen een Ander Beeld

Terwijl de architecten van Manus en sommige invloedrijke stemmen de loftrompet steken, vertellen vroege gebruikerservaringen een minder vleiend verhaal. Berichten over glitches, beperkingen en regelrechte mislukkingen zijn aan de oppervlakte gekomen, waardoor een schaduw van twijfel wordt geworpen over de vermeende capaciteiten van het platform.

Alexander Doria, mede-oprichter van AI-startup Pleias, deelde zijn minder dan geweldige ervaring met Manus op X. Hij stuitte op een frustrerende reeks foutmeldingen en eindeloze lussen tijdens zijn tests. Andere gebruikers hebben deze zorgen herhaald en wijzen op de neiging van Manus tot feitelijke fouten, zijn inconsistente citatiepraktijken en zijn neiging om informatie over het hoofd te zien die gemakkelijk online beschikbaar is.

Persoonlijke Ontmoetingen: Een Verslag uit de Eerste Hand van Frustratie

Mijn eigen pogingen om Manus op de proef te stellen, leverden eveneens teleurstellende resultaten op. Ik begon met een schijnbaar eenvoudig verzoek: het bestellen van een broodje gefrituurde kip bij een hoog aangeschreven fastfoodrestaurant binnen mijn bezorgingsradius. Na tien minuten wachten crashte het platform. Een tweede poging leverde een menu-item op dat aan mijn criteria voldeed, maar Manus bleek niet in staat om de bestelling te voltooien of zelfs maar een checkout-link te verstrekken.

Onverschrokken gaf ik Manus de opdracht om een tafel voor één te reserveren bij een nabijgelegen restaurant. Opnieuw volgde een mislukking na een paar minuten. Ten slotte daagde ik het platform uit om een op Naruto geïnspireerd vechtspel te bouwen. Na een half uur verwerken, gooide het een foutmelding, waardoor mijn experiment effectief werd beëindigd.

De Reactie van het Bedrijf: Erkenning van de Groeipijnen

Een woordvoerder van Manus erkende in een verklaring aan TechCrunch de huidige beperkingen van het platform:

‘Als een klein team is onze focus om Manus te blijven verbeteren en AI-agenten te maken die gebruikers daadwerkelijk helpen problemen op te lossen […]. Het primaire doel van de huidige gesloten bèta is om verschillende delen van het systeem te stresstesten en problemen te identificeren. We waarderen de waardevolle inzichten die door iedereen zijn gedeeld enorm.’

Deze verklaring erkent weliswaar de problemen, maar benadrukt ook het early-access karakter van het platform. Het suggereert dat de huidige versie meer een stresstest is dan een gepolijst product dat klaar is voor wijdverbreide adoptie.

De Hype Cyclus: Exclusiviteit, Misinformatie en Nationale Trots

Als Manus in zijn huidige staat aantoonbaar gebrekkig is, waarom heeft het dan zo’n intense aandacht gekregen? Verschillende factoren hebben bijgedragen aan dit fenomeen:

  • Exclusiviteit: De beperkte beschikbaarheid van uitnodigingen heeft een aura van exclusiviteit gecreëerd, waardoor de vraag en nieuwsgierigheid zijn toegenomen.
  • Media Buzz: Chinese mediakanalen hebben Manus snel geprezen als een belangrijke AI-doorbraak, met publicaties zoals QQ News die het begroeten als ‘de trots van binnenlandse producten’.
  • Social Media Amplificatie: AI-influencers op sociale media hebben een belangrijke rol gespeeld bij het verspreiden van, soms, onjuiste informatie over de capaciteiten van Manus. Een veel gedeelde video, die naar verluidt liet zien hoe Manus naadloos interageerde met meerdere smartphone-apps, werd later door Ji bevestigd als een verkeerde voorstelling van zaken.
  • Vergelijkingen met DeepSeek: Sommige invloedrijke AI-accounts op X hebben vergelijkingen getrokken tussen Manus en DeepSeek, een ander Chinees AI-bedrijf. Deze vergelijkingen zijn echter niet helemaal accuraat. In tegenstelling tot DeepSeek heeft The Butterfly Effect geen eigen modellen ontwikkeld. Bovendien, terwijl DeepSeek veel van zijn technologieën heeft geopend, blijft Manus voorlopig een gesloten systeem.

Een Korreltje Zout: Early Access en Toekomstig Potentieel

Het is cruciaal om te herhalen dat Manus zich momenteel in een zeer vroeg stadium van ontwikkeling bevindt. The Butterfly Effect beweert dat het actief werkt aan het opschalen van de rekencapaciteit en het aanpakken van de gemelde problemen. Zoals het er nu voor staat, dient Manus echter als een krachtig voorbeeld van hype die de technologische realiteit overtreft. Het valt nog te bezien of het platform kan evolueren om aan de hoge verwachtingen te voldoen die het voor zichzelf heeft gesteld. Het potentieel is er ongetwijfeld, maar het pad om dat potentieel te realiseren, lijkt vol uitdagingen te zitten. De huidige iteratie is ver verwijderd van de naadloze, autonome agent die wordt afgebeeld in virale video’s en promotiemateriaal. De kloof tussen aspiratie en uitvoering blijft aanzienlijk.