مانوس: جرقه ای زودگذر یا آینده هوش مصنوعی چین؟

آناتومی هیاهو: رمزگشایی مانوس

ظهور مانوس در خلاء اتفاق نیفتاده است. گزارش‌ها نشان می‌دهند که این پلتفرم یک സൃഷ്ട از پایه نیست، بلکه یک تار و پود پیچیده بافته شده از مدل‌های هوش مصنوعی موجود و بهینه‌سازی شده است. طبق گزارش‌ها، این پلتفرم از قابلیت‌های مدل‌هایی مانند Claude از Anthropic و Qwen از Alibaba بهره می‌برد و از آن‌ها برای وظایفی از تولید گزارش‌های تحقیقاتی تا تحلیل پیچیده اسناد مالی استفاده می‌کند.

با این حال، The Butterfly Effect، شرکت چینی سازنده مانوس، تصویری بسیار بلندپروازانه‌تر را در وب‌سایت خود ترسیم می‌کند. این پلتفرم به عنوان پلتفرمی توصیف می‌شود که قادر به انجام کارهایی به تنوع خرید املاک و مستغلات و برنامه‌نویسی بازی‌های ویدیویی است – ادعاهایی که در نگاه اول، به نظر می‌رسد در مرز خیال‌پردازی قرار دارند.

ادعاهای جسورانه و ویدیوهای وایرال: قدرت ادراک

ییچائو “پیک” جی، سرپرست تحقیقات مانوس، در یک ویدیوی وایرال در X (توییتر سابق) به این هیاهو دامن زد. او مانوس را به عنوان جایگزینی برتر برای ابزارهای عامل‌گرای موجود، از جمله deep research و Operator از OpenAI معرفی کرد. جی ادعا کرد که مانوس در GAIA، یک معیار پرکاربرد برای ارزیابی دستیاران هوش مصنوعی عمومی، از deep research پیشی می‌گیرد. این معیار توانایی هوش مصنوعی را برای انجام وظایف دنیای واقعی با پیمایش در وب، تعامل با نرم‌افزار و موارد دیگر بررسی می‌کند.

جی در این ویدیو اعلام کرد: “[مانوس] فقط یک ربات چت یا گردش کار دیگر نیست.” “این یک عامل کاملاً خودمختار است که شکاف بین مفهوم و اجرا را پر می‌کند […]. ما آن را به عنوان پارادایم بعدی همکاری انسان و ماشین می‌بینیم.” این‌ها ادعاهای جسورانه‌ای هستند و به طور قابل توجهی به صعود سریع این پلتفرم به شهرت وایرال کمک کرده‌اند.

بررسی واقعیت: تجربیات کاربر تصویری متفاوت را ترسیم می‌کند

در حالی که معماران مانوس و برخی از صداهای تأثیرگذار از آن تمجید کرده‌اند، تجربیات اولیه کاربران داستان کم‌لطف‌تری را روایت می‌کند. گزارش‌هایی از اشکالات، محدودیت‌ها و شکست‌های آشکار شروع به ظهور کرده‌اند و سایه‌ای از تردید را بر قابلیت‌های ادعایی این پلتفرم می‌اندازند.

الکساندر دوریا، یکی از بنیانگذاران استارت‌آپ هوش مصنوعی Pleias، تجربه ناامیدکننده خود را با مانوس در X به اشتراک گذاشت. او در طول آزمایش خود با انبوهی از پیام‌های خطا و حلقه‌های بی‌پایان مواجه شد. سایر کاربران نیز این نگرانی‌ها را تکرار کرده‌اند و به تمایل مانوس به اشتباهات واقعی، شیوه‌های استناد متناقض و تمایل آن به نادیده گرفتن اطلاعاتی که به راحتی در دسترس آنلاین هستند، اشاره کرده‌اند.

برخوردهای شخصی: گزارشی دست اول از ناامیدی

تلاش‌های شخصی من برای آزمودن مانوس نیز نتایج ناامیدکننده‌ای به همراه داشت. من با یک درخواست به ظاهر ساده شروع کردم: سفارش یک ساندویچ مرغ سوخاری از یک رستوران فست فود با رتبه بالا در محدوده تحویل من. پس از ده دقیقه انتظار، پلتفرم از کار افتاد. تلاش دوم یک آیتم منو را ارائه داد که با معیارهای من مطابقت داشت، اما مانوس ثابت کرد که قادر به تکمیل سفارش یا حتی ارائه لینک پرداخت نیست.

بدون اینکه دلسرد شوم، به مانوس وظیفه رزرو میز برای یک نفر در یک رستوران نزدیک را دادم. دوباره، پس از چند دقیقه شکست رخ داد. در نهایت، من این پلتفرم را به چالش کشیدم تا یک بازی مبارزه‌ای با الهام از ناروتو بسازد. پس از نیم ساعت پردازش، خطایی ایجاد کرد و عملاً آزمایش من را به پایان رساند.

پاسخ شرکت: اذعان به دردهای رشد

سخنگوی مانوس، در بیانیه‌ای که به TechCrunch ارائه شد، محدودیت‌های فعلی این پلتفرم را تأیید کرد:

“به عنوان یک تیم کوچک، تمرکز ما بر بهبود مستمر مانوس و ساخت عوامل هوش مصنوعی است که واقعاً به کاربران در حل مشکلات کمک می‌کنند […]. هدف اصلی بتای بسته فعلی، آزمایش استرس بخش‌های مختلف سیستم و شناسایی مشکلات است. ما عمیقاً از بینش‌های ارزشمندی که همه به اشتراک گذاشته‌اند قدردانی می‌کنیم.”

این بیانیه، ضمن اذعان به مشکلات، ماهیت دسترسی زودهنگام این پلتفرم را نیز برجسته می‌کند. این نشان می‌دهد که نسخه فعلی بیشتر یک آزمایش استرس است تا یک محصول صیقلی آماده برای پذیرش گسترده.

چرخه هیاهو: انحصار، اطلاعات نادرست و غرور ملی

اگر مانوس، در وضعیت فعلی خود، به طور آشکار دارای نقص است، چرا چنین توجه شدیدی را به خود جلب کرده است؟ عوامل متعددی در این پدیده نقش داشته‌اند:

  • انحصار: در دسترس بودن محدود دعوت‌نامه‌ها، هاله‌ای از انحصار ایجاد کرده است و تقاضا و کنجکاوی را افزایش داده است.
  • هیاهوی رسانه‌ای: رسانه‌های چینی به سرعت مانوس را به عنوان یک پیشرفت مهم در هوش مصنوعی معرفی کرده‌اند، به طوری که نشریاتی مانند QQ News آن را “افتخار محصولات داخلی” نامیده‌اند.
  • تقویت رسانه‌های اجتماعی: اینفلوئنسرهای هوش مصنوعی در رسانه‌های اجتماعی نقش مهمی در انتشار اطلاعات، گاهی اوقات نادرست، در مورد قابلیت‌های مانوس ایفا کرده‌اند. یک ویدیوی پربازدید که ظاهراً مانوس را در حال تعامل یکپارچه در چندین برنامه تلفن هوشمند نشان می‌داد، بعداً توسط جی به عنوان یک ارائه نادرست تأیید شد.
  • مقایسه با DeepSeek: برخی از حساب‌های تأثیرگذار هوش مصنوعی در X مقایسه‌هایی بین مانوس و DeepSeek، یک شرکت هوش مصنوعی چینی دیگر، انجام داده‌اند. با این حال، این مقایسه‌ها کاملاً دقیق نیستند. برخلاف DeepSeek، The Butterfly Effect هیچ مدل اختصاصی توسعه نداده است. علاوه بر این، در حالی که DeepSeek بسیاری از فناوری‌های خود را منبع باز کرده است، مانوس در حال حاضر یک سیستم بسته باقی مانده است.

کمی تردید: دسترسی زودهنگام و پتانسیل آینده

باید دوباره تأکید کرد که مانوس در حال حاضر در مراحل اولیه توسعه قرار دارد. The Butterfly Effect ادعا می‌کند که به طور فعال در حال کار بر روی مقیاس‌بندی ظرفیت محاسباتی و رفع مشکلات گزارش شده است. با این حال، در حال حاضر، مانوس به عنوان یک نمونه قدرتمند از هیاهویی که از واقعیت تکنولوژیکی پیشی گرفته است، عمل می‌کند. باید دید که آیا این پلتفرم می‌تواند برای برآورده کردن انتظارات بالایی که برای خود تعیین کرده است، تکامل یابد یا خیر. پتانسیل بدون شک وجود دارد، اما به نظر می‌رسد مسیر تحقق این پتانسیل مملو از چالش‌ها باشد. نسخه فعلی با عامل یکپارچه و خودمختاری که در ویدیوهای وایرال و مواد تبلیغاتی به تصویر کشیده شده است، فاصله زیادی دارد. شکاف بین آرزو و اجرا همچنان قابل توجه است.