Manus: Вспышка или будущее ИИ Китая?

Анатомия ажиотажа: Разбираем Manus

Появление Manus не произошло в вакууме. Сообщения указывают на то, что платформа не является созданием с нуля, а скорее сложным гобеленом, сотканным из существующих и точно настроенных моделей ИИ. Сообщается, что она использует возможности таких моделей, как Claude от Anthropic и Qwen от Alibaba, применяя их для задач, начиная от создания исследовательских отчетов и заканчивая сложным анализом финансовых документов.

Однако The Butterfly Effect, китайская компания, стоящая за Manus, рисует гораздо более амбициозную картину на своем веб-сайте. Платформа рекламируется как способная на такие разнообразные подвиги, как приобретение недвижимости и программирование видеоигр – утверждения, которые, на первый взгляд, кажутся граничащими с фантастикой.

Смелые заявления и вирусные видео: Сила восприятия

Ичао ‘Пик’ Джи, руководитель исследований Manus, еще больше подогрел ажиотаж в вирусном видео на X (ранее Twitter). Он позиционировал Manus как превосходящую альтернативу существующим агентным инструментам, включая deep research от OpenAI и Operator. Джи утверждал, что Manus превосходит deep research на GAIA, широко используемом бенчмарке для оценки общих ИИ-помощников. Этот бенчмарк проверяет способность ИИ выполнять реальные задачи, перемещаясь по сети, взаимодействуя с программным обеспечением и т.д.

‘[Manus] — это не просто очередной чат-бот или рабочий процесс’, — заявил Джи в видео. ‘Это полностью автономный агент, который устраняет разрыв между замыслом и исполнением […]. Мы видим в нем новую парадигму сотрудничества человека и машины’. Это действительно смелые заявления, и они внесли значительный вклад в быстрый взлет платформы к вирусной славе.

Проверка реальностью: Опыт пользователей рисует иную картину

В то время как архитекторы Manus и некоторые влиятельные голоса воспевали ей дифирамбы, ранний опыт пользователей рассказывает менее лестную историю. Сообщения о сбоях, ограничениях и откровенных неудачах начали всплывать, бросая тень сомнения на предполагаемые возможности платформы.

Александр Дориа, соучредитель ИИ-стартапа Pleias, поделился своим далеко не звездным опытом работы с Manus на X. Во время тестирования он столкнулся с удручающим шквалом сообщений об ошибках и бесконечными циклами. Другие пользователи повторили эти опасения, указав на склонность Manus к фактическим ошибкам, непоследовательную практику цитирования и тенденцию упускать из виду информацию, легко доступную в Интернете.

Личные встречи: Рассказ о разочаровании из первых рук

Мои собственные попытки испытать Manus на прочность дали столь же неутешительные результаты. Я начал с, казалось бы, простого запроса: заказать сэндвич с жареной курицей в ресторане быстрого питания с высоким рейтингом в радиусе моей доставки. После десятиминутного ожидания платформа вышла из строя. Вторая попытка дала пункт меню, который соответствовал моим критериям, но Manus оказался неспособен завершить заказ или даже предоставить ссылку для оформления заказа.

Не испугавшись, я поручил Manus зарезервировать столик на одного в ближайшем ресторане. Снова неудача последовала через несколько минут. Наконец, я бросил вызов платформе, чтобы создать файтинг, вдохновленный Наруто. После получаса обработки он выдал ошибку, фактически завершив мой эксперимент.

Ответ компании: Признание проблем роста

Представитель Manus в заявлении, предоставленном TechCrunch, признал текущие ограничения платформы:

‘Как небольшая команда, мы сосредоточены на постоянном улучшении Manus и создании ИИ-агентов, которые действительно помогают пользователям решать проблемы […]. Основная цель текущей закрытой бета-версии — провести стресс-тестирование различных частей системы и выявить проблемы. Мы глубоко ценим ценную информацию, которой поделились все’.

Это заявление, признавая проблемы, также подчеркивает характер раннего доступа к платформе. Оно предполагает, что текущая версия — это скорее стресс-тест, чем отточенный продукт, готовый к широкому внедрению.

Цикл ажиотажа: Эксклюзивность, дезинформация и национальная гордость

Если Manus в своем нынешнем состоянии явно несовершенен, почему он привлек такое пристальное внимание? Этому явлению способствовали несколько факторов:

  • Эксклюзивность: Ограниченная доступность приглашений создала ауру эксклюзивности, повышая спрос и любопытство.
  • Шумиха в СМИ: Китайские СМИ поспешили объявить Manus значительным прорывом в области ИИ, а такие издания, как QQ News, назвали его ‘гордостью отечественной продукции’.
  • Усиление в социальных сетях: Влиятельные лица в области ИИ в социальных сетях сыграли значительную роль в распространении, порой, неточной информации о возможностях Manus. Широко распространенное видео, якобы демонстрирующее бесшовное взаимодействие Manus с несколькими приложениями для смартфонов, позже было подтверждено Джи как искажение фактов.
  • Сравнения с DeepSeek: Некоторые влиятельные ИИ-аккаунты на X провели сравнения между Manus и DeepSeek, другой китайской ИИ-компанией. Эти сравнения, однако, не совсем точны. В отличие от DeepSeek, The Butterfly Effect не разработала никаких собственных моделей. Кроме того, в то время как DeepSeek открыла исходный код многих своих технологий, Manus остается, на данный момент, закрытой системой.

Щепотка соли: Ранний доступ и будущий потенциал

Важно еще раз подчеркнуть, что Manus в настоящее время находится на очень ранней стадии разработки. The Butterfly Effect утверждает, что активно работает над масштабированием вычислительных мощностей и решением заявленных проблем. Однако в нынешнем виде Manus служит ярким примером того, как ажиотаж опережает технологическую реальность. Еще неизвестно, сможет ли платформа развиться, чтобы соответствовать высоким ожиданиям, которые она сама себе поставила. Потенциал, несомненно, есть, но путь к реализации этого потенциала, по-видимому, чреват трудностями. Текущая итерация далека от бесшовного, автономного агента, изображенного в вирусных видео и рекламных материалах. Разрыв между стремлением и исполнением остается существенным.