Manus: AI-agenten met Claude

De opkomst van Manus en zijn capaciteiten

Manus’ creatie is ontworpen om te functioneren als een veelzijdige AI-agent, in staat tot autonome planning, uitvoering en levering van uitgebreide resultaten. Deze agent interageert met websites in real-time, verwerkt verschillende soorten data en maakt gebruik van een reeks tools om zijn doelstellingen te bereiken.

Ondanks dat het zich in een invite-only fase bevindt, kreeg Manus snel aandacht vanwege zijn indrukwekkende capaciteiten. Deedy Das, een principal bij Menlo Ventures, prees Manus en zei: “Manus, het nieuwe AI-product waar iedereen het over heeft, is de hype waard. Dit is de AI-agent die ons beloofd was.” Das benadrukte dat de agent in staat is om wat normaal gesproken twee weken professioneel werk zou zijn, in ongeveer een uur te condenseren.

Andrew Wilkinson, mede-oprichter van het technologie holdingbedrijf Tiny, uitte een soortgelijk sentiment en merkte op: “Ik heb het gevoel dat ik net zes maanden in de toekomst heb gereisd.” Wilkinson deelde zelfs dat hij Manus de opdracht gaf om een softwareoplossing te ontwikkelen en te vervangen waarvoor zijn bedrijf momenteel $6.000 per jaar uitgeeft.

Manus heeft een breed scala aan functionaliteiten getoond, waaronder:

  • Gedetailleerde reisplancreatie: Het genereren van uitgebreide reisplannen.
  • Diepgaande data-analyse: Het uitvoeren van grondige analyses van aandelen en bedrijven.
  • Genereren van onderzoeksrapporten: Het produceren van rapporten over diverse onderwerpen.
  • Game-ontwerp: Het conceptualiseren en ontwerpen van games.
  • Interactieve educatieve cursussen: Het ontwikkelen van boeiende leerervaringen.

Gebruikers hebben Manus beschreven als een veelzijdige tool, die diepgaande onderzoeksmogelijkheden, autonome werking, computergebruiksfunctionaliteit en een coderingsagent met geheugen combineert.

Gebruikerservaring en prestatiebenchmarking

Naast zijn ‘mind-blowing’ agentische capaciteiten, zoals sommigen het hebben verwoord, wordt Manus ook geprezen om zijn gebruikerservaring (UX). Victor Mustar, hoofd product bij Hugging Face, merkte op: “De UX is wat zoveel anderen beloofden, maar deze keer werkt het gewoon.” Het ontwerp van Manus omvat ook menselijk toezicht, waarbij goedkeuringen en machtigingen vereist zijn voor verschillende acties.

Manus is ook getest op de GAIA-benchmark, die algemene AI-assistenten evalueert op hun vermogen om problemen uit de echte wereld op te lossen. Volgens de gerapporteerde resultaten toonde Manus superieure prestaties in vergelijking met OpenAI’s Deep Research.

Het ‘Wrapper’-debat en de waarde van Manus

Een paar dagen na de eerste golf van opwinding ontdekten sommige gebruikers op X (voorheen Twitter) dat Manus werkte bovenop Anthropic’s Claude Sonnet-model, naast andere tools zoals Browser Use. Deze onthulling leidde tot enige uitingen van teleurstelling, waarbij sommige critici suggereerden dat Manus een unieke ‘moat’ of concurrentievoordeel miste.

De realiteit is dat Manus, om zijn indrukwekkende capaciteiten te bereiken, functioneert als een ‘wrapper’ rond enkele van de meest geavanceerde AI-modellen die beschikbaar zijn. Deze aanpak is echter soms met een vreemd negatieve perceptie op sociale media ontvangen. Uiteindelijk heeft Manus succes getoond in het creëren van een goed ontworpen interface die effectief het agentische potentieel van een fundamenteel AI-model benut.

Aidan McLaughlin, een professional bij OpenAI, merkte op X op dat het ‘wrapper’-aspect geen significant punt van zorg was. Hij benadrukte: “Als het waarde creëerde, verdient het mijn respect. Geef om capaciteiten, niet om architectuur.”

Bovendien benadrukken de eerste reviews van Manus het onaangeboorde potentieel van de huidige AI-modellen, capaciteiten die zelfs de laboratoria die ze ontwikkelen nog niet volledig hebben gerealiseerd. Richardson Dackam, oprichter van GitGlance.co, verklaarde: “Manus heeft niet zomaar een API op een model geplakt. Ze hebben een autonoom systeem gebouwd dat diepgaand onderzoek, diepgaand denken en taken met meerdere stappen kan uitvoeren op een manier die geen enkele andere AI heeft.”

Dit roept een intrigerende vraag op: als Manus is gebouwd op bestaande modellen uit de Verenigde Staten, waarom zijn de makers van die modellen dan niet in staat geweest om zelf vergelijkbare capaciteiten te leveren? Dean W Ball, een AI-onderzoeker, suggereerde: “Ik neem aan dat elk Amerikaans lab deze capaciteiten of beter achter de schermen heeft en ze niet verzendt vanwege risicoaversie, waarvan een deel voortkomt uit regelgevingsrisico.”

Open Source-aspiraties en de opkomst van OpenManus

Het feit dat Manus is gebouwd op bestaande LLM’s suggereert dat de mogelijkheden ervan potentieel gerepliceerd kunnen worden. Dit besef leidde tot een golf van anticipatie onder veel gebruikers op X, waarbij sommigen de hoop uitspraken op een open-source versie.

Deze hoop lijkt relatief snel te zijn beantwoord. Een groep ontwikkelaars op GitHub heeft al een open-source alternatief voor Manus gemaakt, toepasselijk genaamd “OpenManus”. Dit project is nu openbaar beschikbaar op GitHub.

Kritieken en uitdagingen waarmee Manus wordt geconfronteerd

Ondanks de positieve ontvangst heeft Manus ook te maken gehad met kritiek. Sommige gebruikers hebben gemeld dat Manus buitensporig veel tijd nodig had om taken te voltooien, en in sommige gevallen er niet in slaagde ze helemaal af te ronden. Derya Unutmaz, een biomedisch wetenschapper, vergeleek Manus met OpenAI’s Deep Research en merkte op dat terwijl de laatste een taak in 15 minuten voltooide, Manus AI na 50 minuten faalde, vastlopend bij stap 18 van de 20.

Simon Smith, EVP van generatieve AI bij Klick Health, schreef deze problemen toe aan de mogelijkheid dat het onderliggende model van Manus misschien niet zo robuust is als dat van OpenAI’s Deep Research. Hij suggereerde verder dat omdat Manus meerdere modellen gebruikt, het mogelijk meer tijd nodig heeft dan Deep Research om een compleet rapport te genereren.

Een andere gebruiker benadrukte dat Manus soms vastloopt tijdens zoekopdrachten op het web, “onderbrekingen tussendoor” ervaart als gevolg van contextproblemen bij op code gebaseerde taken, en algemene traagheid vertoont.

Sommige critici hebben ook de invite-only toegangsaanpak van Manus bekritiseerd, suggererend dat uitnodigingen voornamelijk werden verspreid onder influencers op sociale media om hype te genereren.

De toekomst van Manus en het bredere AI-landschap

Het is belangrijk om te erkennen dat Manus zich nog in de beginfase van ontwikkeling bevindt en waarschijnlijk verdere verfijning en verbetering zal ondergaan. Een cruciale vraag blijft echter: hoe lang zal het duren voordat grote spelers zoals OpenAI, Anthropic of zelfs Google een meer algemeen toegankelijke versie introduceren van wat Manus momenteel biedt? De opkomst van Manus dient als een overtuigende demonstratie van het potentieel van AI-agenten en de waarde van het creëren van gebruiksvriendelijke interfaces om de mogelijkheden van bestaande AI-modellen te ontsluiten. Hoewel er uitdagingen en kritiek bestaan, vertegenwoordigt Manus een belangrijke stap voorwaarts in de evolutie van AI-aangedreven tools en hun vermogen om complexe, real-world taken aan te pakken. De ontwikkeling van OpenManus onderstreept verder de interesse van de gemeenschap in het verkennen en uitbreiden van de mogelijkheden die deze nieuwe benadering van AI-agenten biedt. De toekomst zal waarschijnlijk voortdurende innovatie en concurrentie in deze ruimte zien, wat de ontwikkeling van nog geavanceerdere en toegankelijkere AI-agenten zal stimuleren.