יבמ ממקדת יעילות ארגונית עם AI קטן וחכם

חידוד סדרת Granite: יכולת ממוקדת, טביעת רגל מופחתת

מודלי Granite 3.2 של IBM מייצגים המשך של אסטרטגיית החברה לפיתוח מודלים קטנים יותר. מודלים אלה נועדו לספק יכולות ספציפיות מבלי להטיל דרישות מוגזמות על משאבי מחשוב. גישה זו תואמת את הצרכים המעשיים של עסקים רבים הדורשים פתרונות AI שהם גם חזקים וגם חסכוניים.

מודלים אלה זמינים באופן פתוח תחת רישיון Apache 2.0 ב-Hugging Face. גרסאות נבחרות נגישות גם דרך פלטפורמת watsonx.ai של IBM, כמו גם Ollama, Replicate ו-LM Studio. נגישות רחבה זו משופרת עוד יותר על ידי תוכניות לשלב מודלים אלה ב-Red Hat Enterprise Linux AI 1.5 בחודשים הקרובים, מה שמבסס את מחויבותה של IBM ל-AI בקוד פתוח.

מהפכה בעיבוד מסמכים: מודל ה-Granite Vision

תכונה בולטת במהדורה זו היא מודל שפת ראייה חדשני שתוכנן במיוחד עבור משימות הבנת מסמכים. מודל זה מייצג התקדמות משמעותית באופן שבו עסקים יכולים ליצור אינטראקציה ולחלץ מידע ממסמכים. על פי מבחני ביצועים פנימיים של IBM, מודל חדש זה מתפקד ברמה שווה, או אפילו עולה, על מודלים מתחרים גדולים בהרבה במבחנים שתוכננו במיוחד כדי לשקף עומסי עבודה ברמה ארגונית.

פיתוח יכולת זו כלל מינוף ערכת הכלים Docling בקוד פתוח של IBM. ערכת כלים זו שימשה לעיבוד 85 מיליון מסמכי PDF, ויצרה 26 מיליון צמדי שאלות ותשובות סינתטיים. הכנה נרחבת זו מבטיחה שהמודל מצויד היטב להתמודד עם זרימות עבודה עתירות מסמכים האופייניות לסביבות ארגוניות רבות, כולל שירותים פיננסיים, שירותי בריאות ושירותים משפטיים.

נתונים סטטיסטיים מרכזיים מדגישים את ההיקף והיעילות:

  • 85 מיליון: מספר מסמכי ה-PDF שעובדו באמצעות ערכת הכלים Docling של IBM כדי לאמן את מודל הראייה החדש. מערך נתונים עצום זה מדגיש את מוכנות המודל לאתגרי עיבוד מסמכים בעולם האמיתי.
  • 30%: הפחתת הגודל שהושגה במודלי הבטיחות של Granite Guardian תוך שמירה על רמות הביצועים. זה מדגים את המחויבות של IBM לאופטימיזציה של יעילות מבלי לוותר על בטיחות.
  • שנתיים: טווח התחזית המקסימלי של מודלי TinyTimeMixers של IBM, למרות שיש להם פחות מ-10 מיליון פרמטרים. זה מדגים את היכולת המדהימה של מודלים מיוחדים אלה לחיזוי לטווח ארוך.

הסקה משופרת: שרשרת מחשבות והיקף הסקה

IBM שילבה גם חשיבה של “שרשרת מחשבות” בגרסאות 2B ו-8B פרמטרים של Granite 3.2. תכונה זו מאפשרת למודלים לגשת לבעיות בצורה מובנית ושיטתית, ולפרק אותן לשלבים המשקפים תהליכי חשיבה אנושיים. זה משפר את יכולת המודלים להתמודד עם משימות מורכבות הדורשות הסקה לוגית.

באופן מכריע, למשתמשים יש את הגמישות להפעיל או להשבית יכולת זו בהתאם למורכבות המשימה. יכולת הסתגלות זו היא גורם מבדיל מרכזי, המאפשר לארגונים לייעל את ניצול המשאבים בהתבסס על הצרכים הספציפיים שלהם. עבור משימות פשוטות יותר, ניתן להשבית את חשיבת שרשרת המחשבות כדי לחסוך בכוח מחשוב, בעוד שעבור בעיות מורכבות יותר, ניתן להפעיל אותה כדי למנף את פוטנציאל ההסקה המלא של המודל.

שיפורים אלה הובילו לשיפורים משמעותיים בביצועי מודל ה-8B במדדי ביצועים העוקבים אחר הוראות, ועלו על גרסאות קודמות. באמצעות שיטות חדשניות של “היקף הסקה”, IBM הוכיחה שאפילו מודל קטן יחסית זה יכול להתחרות ביעילות במערכות גדולות בהרבה במדדי ביצועים של חשיבה מתמטית. זה מדגיש את הפוטנציאל של מודלים קטנים יותר וממוטבים לספק ביצועים מרשימים בתחומים ספציפיים.

בטיחות וניואנסים: עדכוני Granite Guardian

מודלי הבטיחות של Granite Guardian, שנועדו לנטר ולהפחית סיכונים פוטנציאליים הקשורים לתוכן שנוצר על ידי AI, עברו גם הם עדכונים משמעותיים. מודלים אלה הופחתו בגודלם ב-30% תוך שמירה על רמות הביצועים שלהם. אופטימיזציה זו תורמת ליעילות רבה יותר ולצריכת משאבים מופחתת.

יתר על כן, מודלים אלה כוללים כעת תכונה הנקראת “ביטחון מילולי”. תכונה זו מספקת הערכת סיכונים מפורטת יותר על ידי הכרה בדרגות של אי ודאות בניטור בטיחות. במקום לספק פשוט סיווג בינארי בטוח/לא בטוח, המודלים יכולים לבטא רמות שונות של ביטחון בהערכות שלהם, ולספק למשתמשים הערכה אינפורמטיבית ושקופה יותר.

TinyTimeMixers: חיזוי לטווח ארוך לתכנון אסטרטגי

בנוסף לעדכוני Granite, IBM פרסמה גם את הדור הבא של מודלי TinyTimeMixers שלה. מודלים אלה קטנים להפליא, ומכילים פחות מ-10 מיליון פרמטרים – חלק קטן מגודלם של מודלים רבים אחרים בתעשייה. למרות גודלם הקומפקטי, מודלים מיוחדים אלה מסוגלים לחזות נתוני סדרות זמן עד שנתיים קדימה.

יכולת זו חשובה במיוחד עבור מגוון יישומים עסקיים, כולל:

  • ניתוח מגמות פיננסיות: חיזוי תנועות שוק וזיהוי הזדמנויות השקעה.
  • תכנון שרשרת אספקה: אופטימיזציה של רמות המלאי וציפייה לתנודות בביקוש.
  • ניהול מלאי קמעונאי: הבטחת רמות מלאי נאותות כדי לענות על דרישת הלקוחות תוך מזעור בזבוז.

יישומים אלה מסתמכים כולם על היכולת לקבל החלטות מושכלות המבוססות על תחזיות לטווח ארוך, מה שהופך את מודלי TinyTimeMixers לכלי רב עוצמה לתכנון עסקי אסטרטגי.

טיפול באילוצים עסקיים בעולם האמיתי

היכולת להחליף יכולות חשיבה במודלי Granite מטפלת ישירות באתגר מעשי ביישום AI. גישות חשיבה צעד אחר צעד, למרות שהן חזקות, דורשות כוח מחשוב משמעותי שאינו תמיד נחוץ. על ידי הפיכת תכונה זו לאופציונלית, IBM מאפשרת לארגונים להפחית את עלויות המחשוב עבור משימות פשוטות יותר תוך שמירה על האפשרות של חשיבה מתקדמת עבור בעיות מורכבות יותר.

גישה זו משקפת הבנה עמוקה של אילוצים עסקיים בעולם האמיתי, שבהם יעילות וחסכוניות חשובים לעתים קרובות לא פחות מביצועים גולמיים. ההתמקדות של IBM באספקת פתרונות מעשיים שניתן להתאים לצרכים עסקיים ספציפיים היא גורם מבדיל מרכזי בשוק ה-AI הצפוף יותר ויותר.

צבירת תאוצה: עדות להשפעה מעשית

נראה כי האסטרטגיה של IBM לפיתוח מודלים קטנים ומיוחדים יותר מהדהדת בשוק. מודל Granite 3.1 8B הקודם השיג לאחרונה ביצועים חזקים במדד Salesforce LLM לניהול קשרי לקוחות (CRM). מדד זה תוכנן במיוחד כדי להעריך את הביצועים של LLMs במשימות הרלוונטיות ל-CRM, כגון ניתוח אינטראקציה עם לקוחות ויצירת תוכן מותאם אישית.

הביצועים החזקים של מודל Granite 3.1 8B במדד זה מצביעים על כך שמודלים קטנים ומיוחדים יותר אכן יכולים לענות ביעילות על צרכים עסקיים ספציפיים. זה מספק עדות נוספת לכך שהגישה של IBM אינה רק תיאורטית אלא גם מעשית.

התמקדות ביעילות, אינטגרציה והשפעה בעולם האמיתי

סריראם רגהאוואן, סגן נשיא IBM AI Research, מסכם בתמציתיות את הפילוסופיה של החברה: “העידן הבא של AI עוסק ביעילות, אינטגרציה והשפעה בעולם האמיתי – כאשר ארגונים יכולים להשיג תוצאות חזקות ללא הוצאות מוגזמות על מחשוב. פיתוחי Granite האחרונים של IBM מתמקדים בפתרונות פתוחים ומדגימים צעד נוסף קדימה בהפיכת AI לנגיש, חסכוני ובעל ערך רב יותר עבור ארגונים מודרניים.”

הצהרה זו מתמצתת את המחויבות של IBM לפיתוח פתרונות AI שהם לא רק מתקדמים מבחינה טכנולוגית אלא גם מעשיים, נגישים ומותאמים לצרכים האמיתיים של עסקים. ההתמקדות בפתרונות פתוחים מדגישה עוד יותר את המסירות של IBM לטיפוח שיתוף פעולה וחדשנות בקהילת ה-AI. הדגש עובר מבניית המודלים הגדולים ביותר ליצירת כלי AI המספקים ערך מוחשי ומעצימים עסקים להשיג את יעדיהם האסטרטגיים.