מיסטרל מדיום 3: כוכב AI אירופי או גימיק שיווקי?

חברת הסטארט-אפ הצרפתית בתחום הבינה המלאכותית, מיסטרל AI (Mistral AI), פרסמה לאחרונה את המודל הרב-מודאלי העדכני ביותר שלה, מיסטרל מדיום 3 (Mistral Medium 3), בטענה שביצועיו קרובים ואף עולים על אלה של קלוד סונט 3.7 (Claude Sonnet 3.7) של Anthropic, בעוד שהעלות שלו נמוכה מזו של DeepSeek V3 הסיני. חדשות אלו ללא ספק עוררו סערה לא קטנה בתחום הבינה המלאכותית, כאשר רבים מצפים שמודל AI מקומי אירופי זה יוכל לשבור את המונופול של חברות אמריקאיות בתחום הבינה המלאכותית.

עם זאת, האידיאלים גבוהים, והמציאות מאכזבת. לאחר שחרורו של מיסטרל מדיום 3, כלי תקשורת ומשתמשים רבים ברשת ערכו לו בדיקות מעשיות, והתוצאות היו מאכזבות למדי. המודל הזה, שתלו בו תקוות רבות, התגלה כפחות טוב ממה שפורסם בהצהרות הרשמיות, ויש שאף אמרו בפה מלא שביצועיו “מאכזבים” והמליצו למשתמשים “לא לבזבז זמן ומשאבים על הורדה”.

מיסטרל מדיום 3: הפער בין פרסום למציאות

כשפרסמה את מיסטרל מדיום 3, מיסטרל AI התגאתה מאוד בביצועיו, וטענה שהוא השיג יותר מ-90% מקלוד סונט 3.7 במספר מבחני ביצועים, והוא מצטיין בתרחישי יישומים מקצועיים כמו כתיבת קוד והבנה רב-מודאלית. בנוסף, מיסטרל AI הדגישה את יתרונות העלות של מיסטרל מדיום 3, וטענה שעלות הקלט שלו היא רק 0.4 דולר למיליון טוקנים, ועלות הפלט היא 2 דולר, נמוך בהרבה מ-DeepSeek V3.

עם זאת, תוצאות הבדיקות בפועל הראו שקיים פער ניכר בין ביצועי מיסטרל מדיום 3 לקלוד סונט 3.7. בכמה הערכות, מיסטרל מדיום 3 אף הציג ביצועים פחות טובים ממודלים בקוד פתוח מסוימים. לדוגמה, בהערכה המבוססת על שאלות מיון אוצר מילים ממדור ה”חיבורים” של הניו יורק טיימס, מיסטרל מדיום 3 דורג בתחתית הרשימה, וקשה היה למצוא אותו.

מה שמאכזב עוד יותר הוא שכמה משתמשים גילו לאחר השימוש במיסטרל מדיום 3 שיכולת הכתיבה שלו לא השתפרה באופן משמעותי, ועדיין קיימות כמה בעיות נפוצות, כמו לוגיקה לא ברורה וביטויים לא רהוטים. בנוסף, מיסטרל מדיום 3 מתקשה להתמודד עם משימות מורכבות ומתקשה לתת תשובות משביעות רצון.

נקודות האור של מיסטרל מדיום 3

למרות שהביצועים הכוללים של מיסטרל מדיום 3 מאכזבים, הוא לא חסר יתרונות לחלוטין. בתחומים מסוימים, מיסטרל מדיום 3 עדיין הראה יתרונות מסוימים. לדוגמה, בתחום כתיבת הקוד, הביצועים של מיסטרל מדיום 3 יציבים יחסית, הוא מסוגל ליצור קוד תמציתי וברור, ומצטיין במשימות קידוד פשוטות מסוימות.

בנוסף, למיסטרל מדיום 3 יש גם כמה פונקציות ארגוניות, כמו תמיכה בפריסה בענן היברידי, פריסה מקומית ופריסה בתוך VPC, אימון מותאם אישית, אינטגרציה לכלי ארגון ומערכות. פונקציות אלה מאפשרות למיסטרל מדיום 3 לענות טוב יותר על הצרכים האמיתיים של ארגונים ולספק לארגונים פתרונות AI גמישים ומותאמים יותר.

התוכנית ה”גדולה” של מיסטרל: מיסטרל לארג’

למרות שהביצועים של מיסטרל מדיום 3 לא עמדו בציפיות, מיסטרל AI לא התייאשה מכך. במקביל לשחרור מיסטרל מדיום 3, מיסטרל AI חשפה גם שהיא מפתחת מודל חזק יותר בשם מיסטרל לארג’ (Mistral Large), וטענה שהביצועים של מיסטרל לארג’ יעלו בהרבה על אלה של מיסטרל מדיום 3, ואף עשויים לעלות על מודלי הבינה המלאכותית המתקדמים ביותר כיום.

מהלך זה של מיסטרל AI ללא ספק הביא תקווה חדשה לאנשים. אם מיסטרל לארג’ באמת יוכל להשיג את רמת הביצועים שמיסטרל AI טוענת, אז יש לו פוטנציאל להפוך לכוכב עולה בתחום הבינה המלאכותית ולהחדיר חיוניות חדשה לפיתוח אירופה בתחום הבינה המלאכותית.

שירות צ’אטבוטים ארגוני: Le Chat Enterprise

בנוסף למיסטרל מדיום 3 ומיסטרל לארג’, מיסטרל AI השיקה גם שירות צ’אטבוטים ארגוני בשם Le Chat Enterprise. Le Chat Enterprise מופעל על ידי מודל מיסטרל מדיום 3, שמטרתו לספק לארגונים פלטפורמת AI אחידה, לפתור אתגרי AI העומדים בפני ארגונים, כגון פיצול כלים, שילוב ידע לא מאובטח, מודלים נוקשים ותשואות איטיות להשקעה וכו’.

Le Chat Enterprise מספק כלי לבניית סוכני AI חכמים שיכולים לשלב את המודלים של Mistral עם שירותי צד שלישי כגון Gmail, Google Drive ו-SharePoint. בנוסף, Le Chat Enterprise יתמוך גם בפרוטוקול MCP, שהוא תקן שהוצע על ידי Anthropic לחיבור AI למערכות נתונים ותוכנה.

בדיקות מעשיות של משתמשים: הביצועים של מיסטרל מדיום 3 לא טובים

למרות שמיסטרל AI קידמה מאוד את מיסטרל מדיום 3, משתמשים רבים גילו לאחר בדיקות מעשיות שביצועיו אינם חזקים כפי שפורסם רשמית. חלק מהמשתמשים אף המליצו לא להוריד את מיסטרל מדיום 3, כדי לא לבזבז תעבורה ושטח דיסק קשיח.

משתמש בשם “karminski-dentist” אמר לאחר בדיקה מעשית שביצועי מיסטרל מדיום 3 “מאכזבים” והמליץ למשתמשים “לא לבזבז זמן ומשאבים על הורדה”. משתמש אחר אמר שיכולת הכתיבה של מיסטרל מדיום 3 “לא השתפרה באופן משמעותי”, ועדיין קיימות כמה בעיות נפוצות.

ביקורות של כלי תקשורת: מיסטרל מדיום 3 מעורב

בדומה לביקורות של משתמשים, ביקורות של כלי תקשורת על מיסטרל מדיום 3 הציגו גם תמונה מעורבת. חלק מכלי התקשורת מאמינים שמיסטרל מדיום 3 מצטיין בתחומים מסוימים, כמו כתיבת קוד וכו’. עם זאת, כלי תקשורת אחרים מאמינים שהביצועים הכוללים של מיסטרל מדיום 3 מאכזבים, וקיים פער ניכר בינו לבין קלוד סונט 3.7.

לדוגמה, The Verge ציין במאמר ביקורת שמיסטרל מדיום 3 מתקשה להתמודד עם משימות מורכבות ומתקשה לתת תשובות משביעות רצון. TechCrunch ציין במאמר ביקורת שיכולת הכתיבה של מיסטרל מדיום 3 “לא השתפרה באופן משמעותי”, ועדיין קיימות כמה בעיות נפוצות.

המגבלות של מיסטרל מדיום 3

לסיכום, המגבלות של מיסטרל מדיום 3 באות לידי ביטוי בעיקר בהיבטים הבאים:

  • ביצועים לא מספיקים: קיים פער ניכר בין ביצועי מיסטרל מדיום 3 לקלוד סונט 3.7, וקשה לעמוד בדרישות של כמה תרחישי יישומים הדורשים ביצועים גבוהים.
  • יכולת כתיבה מוגבלת: יכולת הכתיבה של מיסטרל מדיום 3 לא השתפרה באופן משמעותי, ועדיין קיימות כמה בעיות נפוצות, כמו לוגיקה לא ברורה וביטויים לא רהוטים.
  • יכולת לא מספקת לטיפול במשימות מורכבות: מיסטרל מדיום 3 מתקשה להתמודד עם משימות מורכבות ומתקשה לתת תשובות משביעות רצון.

תרחישי יישומים פוטנציאליים של מיסטרל מדיום 3

למרות שיש כמה מגבלות, למיסטרל מדיום 3 עדיין יש כמה תרחישי יישומים פוטנציאליים, כגון:

  • כתיבת קוד: הביצועים של מיסטרל מדיום 3 יציבים יחסית בכתיבת קוד, וניתן להשתמש בו כדי ליצור קוד תמציתי וברור.
  • יישומי ארגון: למיסטרל מדיום 3 יש כמה פונקציות ארגוניות, כמו תמיכה בפריסה בענן היברידי, פריסה מקומית ופריסה בתוך VPC, אימון מותאם אישית, אינטגרציה לכלי ארגון ומערכות, וניתן להשתמש בו כדי לענות על הצרכים האמיתיים של ארגונים.
  • צ’אטבוטים: ניתן להשתמש במיסטרל מדיום 3 כדי להפעיל צ’אטבוטים ולספק למשתמשים שירותי דיאלוג חכמים.

מדיניות התמחור של מיסטרל מדיום 3

מיסטרל AI אימצה מדיניות תמחור נמוכה יחסית עבור מיסטרל מדיום 3, שמטרתה למשוך יותר משתמשים. עלות הקלט של מיסטרל מדיום 3 היא רק 0.4 דולר למיליון טוקנים, ועלות הפלט היא 2 דולר, נמוך בהרבה מ-DeepSeek V3.

מדיניות התמחור הנמוכה יותר הופכת את מיסטרל מדיום 3 לתחרותי יותר וצפויה לזכות בנתח שוק מסוים בשוק.

שיטות הפריסה של מיסטרל מדיום 3

מיסטרל מדיום 3 תומך במספר שיטות פריסה, כולל:

  • API: ה-API של מיסטרל מדיום 3 כבר עלה ל-Mistral La Plateforme ולאמזון Sagemaker, ובקרוב יעלה ל-IBM WatsonX, NVIDIA NIM, Azure AI Foundry ול-Google Cloud Vertex.
  • פריסה עצמאית: ניתן לפרוס את מיסטרל מדיום 3 בכל ענן, כולל סביבות אירוח עצמי עם ארבעה GPU ומעלה.

מספר שיטות פריסה מאפשרות למיסטרל מדיום 3 לענות טוב יותר על הצרכים של משתמשים שונים ולספק למשתמשים פתרונות פריסה גמישים ונוחים יותר.

מיסטרל מדיום 3: תקווה לבינה מלאכותית אירופית?

שחרורו של מיסטרל מדיום 3 ללא ספק הביא תקווה חדשה לבינה מלאכותית אירופית. כחברת סטארט-אפ מקומית אירופית בתחום הבינה המלאכותית, עלייתה של מיסטרל AI צפויה לשבור את המונופול של חברות אמריקאיות בתחום הבינה המלאכותית ולהחדיר חיוניות חדשה לפיתוח אירופה בתחום הבינה המלאכותית.

עם זאת, הביצועים של מיסטרל מדיום 3 מאכזבים, וקיים פער ניכר בינו לבין קלוד סונט 3.7. זה מראה שבינה מלאכותית אירופית עדיין צריכה לעבוד קשה מבחינה טכנולוגית כדי באמת להדביק את הרמה המובילה של ארצות הברית.

מיסטרל לארג’: האם יכול להביא הפתעות?

למרות שהביצועים של מיסטרל מדיום 3 לא עמדו בציפיות, מיסטרל AI לא התייאשה מכך, אלא המשיכה לפתח מודל חזק יותר, מיסטרל לארג’. האם מיסטרל לארג’ יכול להביא הפתעות ולהפוך לכוכב עולה בתחום הבינה המלאכותית, עדיין ראוי לציפייה.

מסקנה

שחרורו של מיסטרל מדיום 3 עורר תשומת לב רחבה בתחום הבינה המלאכותית, אך הביצועים בפועל שלו שונים מהפרסום הרשמי. למרות שבתחומים מסוימים, מיסטרל מדיום 3 הראה יתרונות מסוימים, עדיין יש לשפר את הביצועים הכוללים שלו. הפיתוח העתידי של מיסטרל AI והאם מיסטרל לארג’ יכול להביא הפתעות, יהיו מוקד תשומת הלב.

סיכום

שחרורו של מיסטרל מדיום 3 הוא אבן דרך חשובה בפיתוח הבינה המלאכותית האירופית, אך ביצועיו מזכירים לנו שבינה מלאכותית אירופית עדיין צריכה לעבוד קשה מבחינה טכנולוגית. אנו מצפים שמיסטרל לארג’ יביא הפתעות ויחדיר חיוניות חדשה לפיתוח הבינה המלאכותית האירופית.