סרוואם AI (Sarvam AI), סטארטאפ חדשני מבנגלור, התגלה כחלוץ בנוף הבינה המלאכותית, הודות לבחירתו במסגרת תוכנית IndiaAI היוקרתית של ממשלת הודו. החברה השיקה לאחרונה את מודל השפה הגדול (LLM) המוביל שלה, בשם סרוואם-M (Sarvam-M), המציין קפיצת מדרגה משמעותית ביכולות הבינה המלאכותית בהקשר ההודי.
מודל LLM רב-לשוני זה, בעל 24 מיליארד פרמטרים, הוא עדות למחויבותה של סרוואם AI לדחיפת גבולות טכנולוגיית הבינה המלאכותית. סרוואם-M, הבנוי על בסיס Mistral Small, מודל בינה מלאכותית במשקל פתוח שפותח על ידי מעצמת הבינה המלאכותית הצרפתית Mistral AI, משלב גישה היברידית של חשיבה, המאפשרת לו להצטיין במגוון רחב של משימות מבוססות טקסט.
העיצוב של סרוואם-M מעוצב בקפידה כדי לתת מענה למגוון רחב של מקרי שימוש, המבסס את הרבגוניות שלו ככלי בעל ערך בתעשיות שונות. החל מהנעת סוכני שיחה מתוחכמים שיכולים לנהל דיאלוגים טבעיים ומודעים להקשר, ועד לספק שירותי תרגום חלקים המגשרים על פערים לשוניים, סרוואם-M עתיד לחולל מהפכה בתקשורת ובגישה למידע.
יתר על כן, הפוטנציאל של המודל מתרחב לתחום החינוך, בו הוא יכול לשמש ככלי חינוכי דינמי, המציע חוויות למידה מותאמות אישית ומטפח הבנה מעמיקה יותר של נושאים מורכבים. יכולת הסתגלות זו הופכת את סרוואם-M לנכס רב עוצמה עבור יחידים וארגונים המבקשים לרתום את הכוח הטרנספורמטיבי של הבינה המלאכותית.
ביצועים
סרוואם-M הפגין יכולת יוצאת דופן במספר תחומים מרכזיים, וקבע אמות מידה חדשות לביצועים בשפות הודיות, חשיבה מתמטית ומשימות תכנות. הישגים אלה מדגישים את יכולתו של המודל לתת מענה לצרכים ולאתגרים הספציפיים של השוק ההודי.
מצטיין בשפות הודיות, מתמטיקה ותכנות
מודל הבינה המלאכותית מציג שיפור מדהים של 20% בממוצע על פני מודל הבסיס שלו במדדי ביצועים של שפות הודיות, ומדגיש את ההבנה המתקדמת והרהיטות שלו בשפות אלה. שיפור זה מבטיח תקשורת מדויקת וניואנסית יותר בהקשרים לשוניים מגוונים.
בתחום פתרון בעיות מתמטיות, סרוואם-M מציג שיפור ניכר של 21.6% במשימות הקשורות למתמטיקה, ומאפשר לו להתמודד עם משוואות מורכבות ואתגרי חשיבה לוגית בדיוק ויעילות משופרים. תכונה זו הופכת את סרוואם-M לכלי בעל ערך ליישומים מדעיים והנדסיים שונים.
יתר על כן, המודל מדגים שיפור ניכר של 17.6% במדדי ביצועים של קידוד, ומדגים את יכולתו ליצור קוד נקי, יעיל וללא שגיאות. יכולת זו ממצבת את סרוואם-M כמשאב בעל ערך עבור מפתחי תוכנה ומתכנתים המבקשים להפוך את זרימות העבודה שלהם לאוטומטיות ולייעל אותן.
בצומת של שפות הודיות ומתמטיקה, סרוואם-M משיג שיפור מרשים של +86% במדדי ביצועים GSM-8K בשפה ההודית המרומנת. הישג זה מדגיש את יכולתו של המודל לגשר על הפער בין תחומים לשוניים ומתמטיים שונים, ומציע גישה מקיפה ומשולבת לפתרון בעיות.
שחרורו של סרוואם-M מגיע לאחר השקת בולבול (Bulbul), מודל הדיבור החדש של סרוואם AI הכולל מבטאים הודיים אותנטיים. זה ממחיש עוד יותר את מסירותה של החברה ליצירת פתרונות בינה מלאכותית הרלוונטיים מבחינה תרבותית ומתאימים לניואנסים של השוק ההודי.
השוואה
סרוואם AI טוענת בביטחון שסרוואם-M עולה על LLaMA-4 Scout של Meta ברוב מדדי הביצועים. החברה גם טוענת שביצועי המודל דומים לאלה של מודלים צפופים גדולים בהרבה, כמו LLaMA-3 70B ו-Gemma 3 27B של Google. זה ראוי לציון בהתחשב בכך שמודלים אלה מאומנים מראש על יותר אסימונים באופן משמעותי.
סרוואם-M: מתחרה ל-LLaMA-4 Scout ודומה למודלים גדולים יותר
היכולת של סרוואם-M להשיג רמות ביצועים דומות למודלים גדולים יותר אלה עם פחות פרמטרים היא עדות לארכיטקטורה היעילה שלו ולמתודולוגיות האימון המותאמות שלו. זה מדגיש את הפוטנציאל של מודלים קטנים וזריזים יותר להתחרות ביעילות עם מקביליהם הגדולים והעתירי משאבים.
עם זאת, החברה מודה שיש מקום לשיפור ב-"מדדי ביצועים הקשורים לידע באנגלית," שם סרוואם-M יורד כנקודת אחוז אחת מעל מודל הבסיס MMLU. זהו תחום שסרוואם AI פועלת באופן פעיל כדי לטפל בו, ולשפר עוד יותר את הביצועים והרבגוניות הכוללים של המודל.
סרוואם-M הוא קוד פתוח וזמין בחינם ב-Hugging Face, פלטפורמת קהילת בינה מלאכותית. ממשקי API זמינים למפתחים שרוצים לשלב אותו במוצרים שלהם. נגישות זו מקלה על מפתחים להשתמש במודל ולחקור יישומים חדשניים.
תכונות
סרוואם-M הוא מודל רב תכליתי שתוכנן עם כישורי Indic מתקדמים. המודל תומך בצורה חלקה במצבי "חשיבה" ו-"לא חשיבה", ומתאים לדרישות משימה שונות בקלות.
Sarvam-M: מודל בינה מלאכותית רב תכליתי עם כישורי Indic מתקדמים
מצב "חשיבה" מיועד לחשיבה לוגית מורכבת, בעיות מתמטיות ומשימות קידוד. הוא מאפשר למודל לנתח ולפתור בעיות מורכבות הדורשות עיבוד קוגניטיבי עמוק.
מצב "לא חשיבה" מיועד לשיחה יעילה למטרות כלליות. הוא מאפשר למודל לנהל דיאלוגים נינוחים וספונטניים יותר שאינם דורשים את אותה רמה של קפדנות אנליטית.
המודל אומן במיוחד לאחר מכן על שפות הודיות עם אנגלית, המשקף באופן אותנטי ערכים תרבותיים הודיים. זה מבטיח שהמודל יוכל לתקשר ביעילות ובכבוד בהקשרים תרבותיים מגוונים.
הוא מציע גם תמיכה מלאה בסקריפטים של Indic, כמו גם גרסאות רומניות של שפות הודיות. תכונה זו משפרת עוד יותר את יכולתו של המודל לתת מענה לצרכים הספציפיים של השוק ההודי.