Manus : Feu de paille ou futur de l'IA chinoise ?

L’anatomie du battage médiatique : décortiquer Manus

L’émergence de Manus ne s’est pas produite dans le vide. Des rapports indiquent que la plateforme n’est pas une création ex nihilo, mais plutôt une tapisserie complexe tissée à partir de modèles d’IA existants et affinés. Elle exploiterait les capacités de modèles comme Claude d’Anthropic et Qwen d’Alibaba, les utilisant pour des tâches allant de la génération de rapports de recherche à l’analyse complexe de documents financiers.

Cependant, The Butterfly Effect, la société chinoise à l’origine de Manus, brosse un tableau beaucoup plus ambitieux sur son site web. La plateforme est présentée comme capable de prouesses aussi diverses que l’acquisition immobilière et la programmation de jeux vidéo – des affirmations qui, à première vue, semblent frôler le fantastique.

Des affirmations audacieuses et des vidéos virales : le pouvoir de la perception

Yichao ‘Peak’ Ji, responsable de la recherche pour Manus, a alimenté le battage médiatique dans une vidéo virale sur X (anciennement Twitter). Il a positionné Manus comme une alternative supérieure aux outils agentiques existants, y compris la recherche approfondie d’OpenAI et Operator. Ji a affirmé que Manus surpasse la recherche approfondie sur GAIA, un benchmark largement utilisé pour évaluer les assistants d’IA généraux. Ce benchmark évalue la capacité d’une IA à effectuer des tâches du monde réel en naviguant sur le web, en interagissant avec des logiciels, etc.

‘[Manus] n’est pas simplement un autre chatbot ou workflow’, a proclamé Ji dans la vidéo. ‘C’est un agent complètement autonome qui comble le fossé entre la conception et l’exécution […]. Nous le considérons comme le prochain paradigme de la collaboration homme-machine.’ Ce sont des affirmations audacieuses, en effet, et elles ont contribué de manière significative à l’ascension rapide de la plateforme vers la célébrité virale.

Retour à la réalité : les expériences des utilisateurs brossent un tableau différent

Alors que les architectes de Manus et certaines voix influentes ont chanté ses louanges, les premières expériences des utilisateurs racontent une histoire moins flatteuse. Des rapports de bugs, de limitations et d’échecs purs et simples ont commencé à faire surface, jetant une ombre de doute sur les capacités prétendues de la plateforme.

Alexander Doria, co-fondateur de la startup d’IA Pleias, a partagé son expérience peu reluisante avec Manus sur X. Il a rencontré un barrage frustrant de messages d’erreur et de boucles sans fin lors de ses tests. D’autres utilisateurs ont fait écho à ces préoccupations, soulignant la propension de Manus aux erreurs factuelles, ses pratiques de citation incohérentes et sa tendance à négliger des informations facilement disponibles en ligne.

Rencontres personnelles : un compte rendu direct de la frustration

Mes propres tentatives pour mettre Manus à l’épreuve ont donné des résultats tout aussi décevants. J’ai commencé par une demande apparemment simple : commander un sandwich au poulet frit dans un restaurant de restauration rapide très bien noté dans mon rayon de livraison. Après dix minutes d’attente, la plateforme a planté. Une deuxième tentative a donné un élément de menu correspondant à mes critères, mais Manus s’est avéré incapable de finaliser la commande ou même de fournir un lien de paiement.

Sans me décourager, j’ai chargé Manus de réserver une table pour une personne dans un restaurant voisin. Encore une fois, l’échec s’est produit après quelques minutes. Enfin, j’ai mis la plateforme au défi de construire un jeu de combat inspiré de Naruto. Après une demi-heure de traitement, elle a renvoyé une erreur, mettant fin à mon expérimentation.

La réponse de l’entreprise : reconnaître les difficultés de croissance

Un porte-parole de Manus, dans une déclaration fournie à TechCrunch, a reconnu les limitations actuelles de la plateforme :

‘En tant que petite équipe, notre objectif est de continuer à améliorer Manus et de créer des agents d’IA qui aident réellement les utilisateurs à résoudre des problèmes […]. L’objectif principal de la version bêta fermée actuelle est de tester sous contrainte différentes parties du système et d’identifier les problèmes. Nous apprécions profondément les précieuses informations partagées par tout le monde.’

Cette déclaration, tout en reconnaissant les problèmes, souligne également la nature d’accès anticipé de la plateforme. Elle suggère que la version actuelle est davantage un test de résistance qu’un produit fini prêt pour une adoption généralisée.

Le cycle du battage médiatique : exclusivité, désinformation et fierté nationale

Si Manus est, dans son état actuel, manifestement imparfait, pourquoi a-t-il suscité une attention aussi intense ? Plusieurs facteurs ont contribué à ce phénomène :

  • Exclusivité : La disponibilité limitée des invitations a créé une aura d’exclusivité, stimulant la demande et la curiosité.
  • Buzz médiatique : Les médias chinois ont rapidement présenté Manus comme une percée significative en matière d’IA, des publications comme QQ News le saluant comme ‘la fierté des produits nationaux’.
  • Amplification des médias sociaux : Les influenceurs de l’IA sur les médias sociaux ont joué un rôle important dans la diffusion, parfois, d’informations inexactes sur les capacités de Manus. Une vidéo largement diffusée, censée montrer Manus interagissant de manière transparente sur plusieurs applications de smartphone, a ensuite été confirmée par Ji comme étant une fausse représentation.
  • Comparaisons avec DeepSeek : Certains comptes d’IA influents sur X ont établi des comparaisons entre Manus et DeepSeek, une autre société d’IA chinoise. Ces comparaisons, cependant, ne sont pas tout à fait exactes. Contrairement à DeepSeek, The Butterfly Effect n’a développé aucun modèle propriétaire. De plus, alors que DeepSeek a rendu open source bon nombre de ses technologies, Manus reste, pour l’instant, un système fermé.

Un grain de sel : accès anticipé et potentiel futur

Il est crucial de réitérer que Manus est actuellement à un stade très précoce de développement. The Butterfly Effect affirme qu’elle travaille activement à augmenter la capacité de calcul et à résoudre les problèmes signalés. Cependant, en l’état actuel des choses, Manus sert d’exemple puissant de battage médiatique dépassant la réalité technologique. Il reste à voir si la plateforme peut évoluer pour répondre aux attentes élevées qu’elle s’est fixées. Le potentiel est indéniablement là, mais le chemin pour réaliser ce potentiel semble semé d’embûches. L’itération actuelle est loin de l’agent autonome et transparent décrit dans les vidéos virales et les documents promotionnels. L’écart entre l’aspiration et l’exécution reste important. Il faut considérer que la version actuelle est une version beta, et que l’entreprise travaille à son amélioration. Les promesses sont grandes, mais la réalité, pour le moment, est bien différente. L’engouement autour de Manus est un mélange complexe d’espoir, de fierté nationale, et d’exagération médiatique. Il est important de garder un esprit critique et d’attendre des preuves concrètes avant de crier au génie. Le futur de Manus est incertain, mais son présent est un cas d’école sur les dangers du hype dans le monde de l’IA.