אנטומיית ההייפ: פירוק לגורמים של מאנוס
הופעתה של מאנוס לא התרחשה בחלל ריק. דיווחים מצביעים על כך שהפלטפורמה אינה יצירה מאפס, אלא שטיח מורכב השזור ממודלי AI קיימים ומכווננים היטב. על פי הדיווחים, היא ממנפת את היכולות של מודלים כמו Claude של Anthropic ו-Qwen של Alibaba, ומשתמשת בהם למשימות הנעות בין יצירת דוחות מחקר לניתוח מורכב של מסמכים פיננסיים.
עם זאת, The Butterfly Effect, החברה הסינית שמאחורי מאנוס, מציירת תמונה הרבה יותר שאפתנית באתר האינטרנט שלה. הפלטפורמה מוצגת כבעלת יכולת לבצע משימות מגוונות כמו רכישת נדל”ן ותכנות משחקי וידאו – טענות שנראות, במבט ראשון, גובלות בפנטזיה.
טענות נועזות וסרטונים ויראליים: כוחה של התפיסה
Yichao ‘Peak’ Ji, מוביל מחקר עבור מאנוס, תדלק עוד יותר את ההייפ בסרטון ויראלי ב-X (לשעבר טוויטר). הוא מיצב את מאנוס כחלופה עדיפה לכלים סוכנתיים קיימים, כולל המחקר העמוק של OpenAI ו-Operator. Ji טען שמאנוס עולה על מחקר עמוק ב-GAIA, מדד בשימוש נרחב להערכת עוזרי AI כלליים. מדד זה בוחן את יכולתו של AI לבצע משימות בעולם האמיתי על ידי ניווט באינטרנט, אינטראקציה עם תוכנה ועוד.
‘[מאנוס] היא לא סתם עוד צ’אטבוט או זרימת עבודה’, הכריז Ji בסרטון. ‘זהו סוכן אוטונומי לחלוטין המגשר על הפער בין תפיסה לביצוע […]. אנו רואים זאת כפרדיגמה הבאה של שיתוף פעולה בין אדם למכונה’. אלו הן טענות נועזות, ואכן, הן תרמו משמעותית לעלייתה המהירה של הפלטפורמה לתהילה ויראלית.
בדיקת מציאות: חוויות משתמשים מציירות תמונה אחרת
בעוד האדריכלים של מאנוס וכמה קולות משפיעים שרו את שבחיה, חוויות משתמשים מוקדמות מספרות סיפור פחות מחמיא. דיווחים על תקלות, מגבלות וכשלים מוחלטים החלו לצוץ, ומטילים צל של ספק על היכולות המוצהרות של הפלטפורמה.
Alexander Doria, מייסד שותף של סטארט-אפ ה-AI, Pleias, שיתף את החוויה הפחות מזהירה שלו עם מאנוס ב-X. הוא נתקל במטח מתסכל של הודעות שגיאה ולולאות אינסופיות במהלך הבדיקות שלו. משתמשים אחרים הדהדו את החששות הללו, והצביעו על נטייתה של מאנוס לשגיאות עובדתיות, לנוהלי הציטוט הלא עקביים שלה, ולנטייתה להתעלם ממידע זמין באינטרנט.
מפגשים אישיים: תיאור ממקור ראשון של תסכול
הניסיונות שלי להעמיד את מאנוס במבחן הניבו תוצאות מאכזבות באופן דומה. התחלתי בבקשה פשוטה לכאורה: הזמנת כריך עוף מטוגן ממסעדת מזון מהיר בעלת דירוג גבוה ברדיוס המשלוח שלי. לאחר המתנה של עשר דקות, הפלטפורמה קרסה. ניסיון שני הניב פריט תפריט שתאם את הקריטריונים שלי, אך מאנוס הוכיחה שאינה מסוגלת להשלים את ההזמנה או אפילו לספק קישור לתשלום.
בלי להתייאש, הטלתי על מאנוס להזמין שולחן לאדם אחד במסעדה סמוכה. שוב, הכישלון הגיע לאחר מספר דקות. לבסוף, אתגרתי את הפלטפורמה לבנות משחק לחימה בהשראת נארוטו. לאחר חצי שעה של עיבוד, היא זרקה שגיאה, ולמעשה סיימה את הניסוי שלי.
תגובת החברה: הכרה בכאבי הגדילה
דובר מטעם מאנוס, בהצהרה שנמסרה ל-TechCrunch, הודה במגבלות הנוכחיות של הפלטפורמה:
‘כצוות קטן, המיקוד שלנו הוא להמשיך ולשפר את מאנוס וליצור סוכני AI שבאמת עוזרים למשתמשים לפתור בעיות […]. המטרה העיקרית של הבטא הסגורה הנוכחית היא לבחון בלחץ חלקים שונים של המערכת ולזהות בעיות. אנו מעריכים מאוד את התובנות החשובות ששותפו על ידי כולם’.
הצהרה זו, תוך הכרה בבעיות, מדגישה גם את אופייה של הפלטפורמה כגישה מוקדמת. היא מצביעה על כך שהגרסה הנוכחית היא יותר מבחן לחץ מאשר מוצר מלוטש ומוכן לאימוץ נרחב.
מחזור ההייפ: בלעדיות, מידע מוטעה וגאווה לאומית
אם מאנוס, במצבה הנוכחי, פגומה באופן מובהק, מדוע היא זכתה לתשומת לב כה עזה? מספר גורמים תרמו לתופעה זו:
- בלעדיות: הזמינות המוגבלת של הזמנות יצרה הילה של בלעדיות, והגבירה את הביקוש והסקרנות.
- באזז תקשורתי: כלי תקשורת סיניים מיהרו להכריז על מאנוס כפריצת דרך משמעותית בתחום ה-AI, כאשר פרסומים כמו QQ News הכריזו עליה כ’גאוות המוצרים המקומיים’.
- הגברה ברשתות החברתיות: משפיעני AI ברשתות החברתיות מילאו תפקיד משמעותי בהפצת מידע, לעתים לא מדויק, על היכולות של מאנוס. סרטון שהופץ באופן נרחב, שלכאורה הציג את מאנוס באינטראקציה חלקה בין מספר אפליקציות לסמארטפון, אושר מאוחר יותר על ידי Ji כהצגה שגויה.
- השוואות ל-DeepSeek: כמה חשבונות AI משפיעים ב-X ערכו השוואות בין מאנוס ל-DeepSeek, חברת AI סינית נוספת. השוואות אלו, עם זאת, אינן מדויקות לחלוטין. בניגוד ל-DeepSeek, The Butterfly Effect לא פיתחה מודלים קנייניים כלשהם. יתר על כן, בעוד ש-DeepSeek פתחה בקוד פתוח רבות מהטכנולוגיות שלה, מאנוס נותרה, לעת עתה, מערכת סגורה.
קורטוב של מלח: גישה מוקדמת ופוטנציאל עתידי
חשוב לחזור ולהדגיש שמאנוס נמצאת כרגע בשלב מוקדם מאוד של פיתוח. The Butterfly Effect טוענת שהיא פועלת באופן פעיל להגדלת קיבולת המחשוב ולטיפול בבעיות המדווחות. עם זאת, כפי שהיא עומדת כעת, מאנוס משמשת כדוגמה חזקה להייפ העולה על המציאות הטכנולוגית. נותר לראות האם הפלטפורמה יכולה להתפתח כדי לעמוד בציפיות הגבוהות שהיא הציבה לעצמה. הפוטנציאל ללא ספק קיים, אך נראה שהדרך למימוש הפוטנציאל הזה רצופה אתגרים. האיטרציה הנוכחית רחוקה מאוד מהסוכן החלק והאוטונומי המתואר בסרטונים ויראליים ובחומרי קידום מכירות. הפער בין השאיפה לביצוע נותר משמעותי.