آناتومی هیاهو: رمزگشایی مانوس
ظهور مانوس در خلاء اتفاق نیفتاده است. گزارشها نشان میدهند که این پلتفرم یک സൃഷ്ട از پایه نیست، بلکه یک تار و پود پیچیده بافته شده از مدلهای هوش مصنوعی موجود و بهینهسازی شده است. طبق گزارشها، این پلتفرم از قابلیتهای مدلهایی مانند Claude از Anthropic و Qwen از Alibaba بهره میبرد و از آنها برای وظایفی از تولید گزارشهای تحقیقاتی تا تحلیل پیچیده اسناد مالی استفاده میکند.
با این حال، The Butterfly Effect، شرکت چینی سازنده مانوس، تصویری بسیار بلندپروازانهتر را در وبسایت خود ترسیم میکند. این پلتفرم به عنوان پلتفرمی توصیف میشود که قادر به انجام کارهایی به تنوع خرید املاک و مستغلات و برنامهنویسی بازیهای ویدیویی است – ادعاهایی که در نگاه اول، به نظر میرسد در مرز خیالپردازی قرار دارند.
ادعاهای جسورانه و ویدیوهای وایرال: قدرت ادراک
ییچائو “پیک” جی، سرپرست تحقیقات مانوس، در یک ویدیوی وایرال در X (توییتر سابق) به این هیاهو دامن زد. او مانوس را به عنوان جایگزینی برتر برای ابزارهای عاملگرای موجود، از جمله deep research و Operator از OpenAI معرفی کرد. جی ادعا کرد که مانوس در GAIA، یک معیار پرکاربرد برای ارزیابی دستیاران هوش مصنوعی عمومی، از deep research پیشی میگیرد. این معیار توانایی هوش مصنوعی را برای انجام وظایف دنیای واقعی با پیمایش در وب، تعامل با نرمافزار و موارد دیگر بررسی میکند.
جی در این ویدیو اعلام کرد: “[مانوس] فقط یک ربات چت یا گردش کار دیگر نیست.” “این یک عامل کاملاً خودمختار است که شکاف بین مفهوم و اجرا را پر میکند […]. ما آن را به عنوان پارادایم بعدی همکاری انسان و ماشین میبینیم.” اینها ادعاهای جسورانهای هستند و به طور قابل توجهی به صعود سریع این پلتفرم به شهرت وایرال کمک کردهاند.
بررسی واقعیت: تجربیات کاربر تصویری متفاوت را ترسیم میکند
در حالی که معماران مانوس و برخی از صداهای تأثیرگذار از آن تمجید کردهاند، تجربیات اولیه کاربران داستان کملطفتری را روایت میکند. گزارشهایی از اشکالات، محدودیتها و شکستهای آشکار شروع به ظهور کردهاند و سایهای از تردید را بر قابلیتهای ادعایی این پلتفرم میاندازند.
الکساندر دوریا، یکی از بنیانگذاران استارتآپ هوش مصنوعی Pleias، تجربه ناامیدکننده خود را با مانوس در X به اشتراک گذاشت. او در طول آزمایش خود با انبوهی از پیامهای خطا و حلقههای بیپایان مواجه شد. سایر کاربران نیز این نگرانیها را تکرار کردهاند و به تمایل مانوس به اشتباهات واقعی، شیوههای استناد متناقض و تمایل آن به نادیده گرفتن اطلاعاتی که به راحتی در دسترس آنلاین هستند، اشاره کردهاند.
برخوردهای شخصی: گزارشی دست اول از ناامیدی
تلاشهای شخصی من برای آزمودن مانوس نیز نتایج ناامیدکنندهای به همراه داشت. من با یک درخواست به ظاهر ساده شروع کردم: سفارش یک ساندویچ مرغ سوخاری از یک رستوران فست فود با رتبه بالا در محدوده تحویل من. پس از ده دقیقه انتظار، پلتفرم از کار افتاد. تلاش دوم یک آیتم منو را ارائه داد که با معیارهای من مطابقت داشت، اما مانوس ثابت کرد که قادر به تکمیل سفارش یا حتی ارائه لینک پرداخت نیست.
بدون اینکه دلسرد شوم، به مانوس وظیفه رزرو میز برای یک نفر در یک رستوران نزدیک را دادم. دوباره، پس از چند دقیقه شکست رخ داد. در نهایت، من این پلتفرم را به چالش کشیدم تا یک بازی مبارزهای با الهام از ناروتو بسازد. پس از نیم ساعت پردازش، خطایی ایجاد کرد و عملاً آزمایش من را به پایان رساند.
پاسخ شرکت: اذعان به دردهای رشد
سخنگوی مانوس، در بیانیهای که به TechCrunch ارائه شد، محدودیتهای فعلی این پلتفرم را تأیید کرد:
“به عنوان یک تیم کوچک، تمرکز ما بر بهبود مستمر مانوس و ساخت عوامل هوش مصنوعی است که واقعاً به کاربران در حل مشکلات کمک میکنند […]. هدف اصلی بتای بسته فعلی، آزمایش استرس بخشهای مختلف سیستم و شناسایی مشکلات است. ما عمیقاً از بینشهای ارزشمندی که همه به اشتراک گذاشتهاند قدردانی میکنیم.”
این بیانیه، ضمن اذعان به مشکلات، ماهیت دسترسی زودهنگام این پلتفرم را نیز برجسته میکند. این نشان میدهد که نسخه فعلی بیشتر یک آزمایش استرس است تا یک محصول صیقلی آماده برای پذیرش گسترده.
چرخه هیاهو: انحصار، اطلاعات نادرست و غرور ملی
اگر مانوس، در وضعیت فعلی خود، به طور آشکار دارای نقص است، چرا چنین توجه شدیدی را به خود جلب کرده است؟ عوامل متعددی در این پدیده نقش داشتهاند:
- انحصار: در دسترس بودن محدود دعوتنامهها، هالهای از انحصار ایجاد کرده است و تقاضا و کنجکاوی را افزایش داده است.
- هیاهوی رسانهای: رسانههای چینی به سرعت مانوس را به عنوان یک پیشرفت مهم در هوش مصنوعی معرفی کردهاند، به طوری که نشریاتی مانند QQ News آن را “افتخار محصولات داخلی” نامیدهاند.
- تقویت رسانههای اجتماعی: اینفلوئنسرهای هوش مصنوعی در رسانههای اجتماعی نقش مهمی در انتشار اطلاعات، گاهی اوقات نادرست، در مورد قابلیتهای مانوس ایفا کردهاند. یک ویدیوی پربازدید که ظاهراً مانوس را در حال تعامل یکپارچه در چندین برنامه تلفن هوشمند نشان میداد، بعداً توسط جی به عنوان یک ارائه نادرست تأیید شد.
- مقایسه با DeepSeek: برخی از حسابهای تأثیرگذار هوش مصنوعی در X مقایسههایی بین مانوس و DeepSeek، یک شرکت هوش مصنوعی چینی دیگر، انجام دادهاند. با این حال، این مقایسهها کاملاً دقیق نیستند. برخلاف DeepSeek، The Butterfly Effect هیچ مدل اختصاصی توسعه نداده است. علاوه بر این، در حالی که DeepSeek بسیاری از فناوریهای خود را منبع باز کرده است، مانوس در حال حاضر یک سیستم بسته باقی مانده است.
کمی تردید: دسترسی زودهنگام و پتانسیل آینده
باید دوباره تأکید کرد که مانوس در حال حاضر در مراحل اولیه توسعه قرار دارد. The Butterfly Effect ادعا میکند که به طور فعال در حال کار بر روی مقیاسبندی ظرفیت محاسباتی و رفع مشکلات گزارش شده است. با این حال، در حال حاضر، مانوس به عنوان یک نمونه قدرتمند از هیاهویی که از واقعیت تکنولوژیکی پیشی گرفته است، عمل میکند. باید دید که آیا این پلتفرم میتواند برای برآورده کردن انتظارات بالایی که برای خود تعیین کرده است، تکامل یابد یا خیر. پتانسیل بدون شک وجود دارد، اما به نظر میرسد مسیر تحقق این پتانسیل مملو از چالشها باشد. نسخه فعلی با عامل یکپارچه و خودمختاری که در ویدیوهای وایرال و مواد تبلیغاتی به تصویر کشیده شده است، فاصله زیادی دارد. شکاف بین آرزو و اجرا همچنان قابل توجه است.