אתגר אמיתי בניית יישומי AI ארגוניים

האתגר האמיתי: בניית יישומי AI ארגוניים

בעוד משאבים עצומים מושקעים באימון מודלי שפה גדולים (LLM) מדי שנה, מכשול משמעותי עדיין קיים: שילוב יעיל של מודלים אלה ביישומים מעשיים ושימושיים.

האשליה של כוונון עדין

כוונון עדין (Fine-tuning) ויצירת תגובות מוגברות אחזור (Retrieval Augmented Generation - RAG) נחשבות בדרך כלל לשיטות מבוססות היטב לשיפור הידע והיכולות של מודלי AI שאומנו מראש. עם זאת, מנכ”ל Aleph Alpha, יונאס אנדרוליס, מציין שהמציאות מורכבת יותר.

“לפני שנה, הייתה אמונה נרחבת שכוונון עדין הוא פתרון קסם. אם מערכת AI לא תפקדה כרצוי, התשובה הייתה פשוט כוונון עדין. זה לא כל כך פשוט”, הסביר.

בעוד שכוונון עדין יכול לשנות את הסגנון או ההתנהגות של מודל, זו לא הגישה היעילה ביותר ללמד מידע חדש. הציפייה שכוונון עדין לבדו יכול לפתור את כל בעיות יישומי ה-AI היא תפיסה מוטעית.

RAG: גישה חלופית

RAG מציעה גישה חלופית על ידי תפקוד כמו ספרן שאחזר מידע מארכיון חיצוני. גישה זו מאפשרת עדכונים ושינויים במידע בתוך מסד הנתונים מבלי לאמן מחדש או לכוונן את המודל. בנוסף, ניתן לצטט ולבקר את התוצאות שנוצרו לצורך דיוק.

“ידע ספציפי תמיד צריך להיות מתועד ולא מאוחסן בתוך הפרמטרים של ה-LLM”, הדגיש אנדרוליס.

בעוד ש-RAG מספק יתרונות רבים, הצלחתו תלויה בתיעוד נאות של תהליכים, נהלים וידע מוסדי מרכזיים בפורמט שהמודל יכול להבין. למרבה הצער, זה לרוב לא המקרה.

גם כאשר קיים תיעוד, ארגונים עשויים להיתקל בבעיות אם המסמכים או התהליכים מסתמכים על נתונים מחוץ להפצה - נתונים השונים באופן משמעותי מהנתונים ששימשו לאימון מודל הבסיס. לדוגמה, מודל שאומן אך ורק על מערכי נתונים באנגלית יתקשה בתיעוד גרמני, במיוחד אם הוא מכיל נוסחאות מדעיות. במקרים רבים, המודל עשוי שלא להיות מסוגל לפרש את הנתונים כלל.

לכן, אנדרוליס מציע שבדרך כלל יש צורך בשילוב של כוונון עדין ו-RAG כדי להשיג תוצאות משמעותיות. גישה היברידית זו ממנפת את החוזקות של שתי השיטות כדי להתגבר על המגבלות האישיות שלהן.

גישור על הפער

Aleph Alpha שואפת לבדל את עצמה כ-DeepMind אירופית על ידי התמודדות עם האתגרים המונעים מארגונים וממדינות לפתח AI ריבוני משלהם.

AI ריבוני מתייחס למודלים שאומנו או כוונו עדין באמצעות מערכי נתונים פנימיים של מדינה בחומרה שנבנתה או נפרסה בתוך גבולותיה. גישה זו מבטיחה פרטיות נתונים, אבטחה ושליטה, שהם חיוניים עבור ארגונים וממשלות רבים.

“אנו שואפים להיות מערכת ההפעלה, הבסיס לארגונים וממשלות לבנות אסטרטגיית AI ריבונית משלהם”, הצהיר אנדרוליס. “אנו שואפים לחדש היכן שצריך, תוך מינוף קוד פתוח וטכנולוגיות חדישות היכן שאפשר.”

בעוד שזה כרוך מדי פעם באימון מודלים, כמו Pharia-1-LLM של Aleph, אנדרוליס מדגיש שהם לא מנסים לשכפל מודלים קיימים כמו Llama או DeepSeek. המוקד שלהם הוא יצירת פתרונות ייחודיים המטפלים באתגרים ספציפיים.

“אני תמיד מכוון את המחקר שלנו להתמקד בדברים שונים באופן משמעותי, לא רק להעתיק את מה שכולם עושים, כי זה כבר קיים”, אמר אנדרוליס. “אנחנו לא צריכים לבנות עוד Llama או DeepSeek כי הם כבר קיימים.”

במקום זאת, Aleph Alpha מתרכזת בבניית מסגרות המפשטות ומייעלות את אימוץ הטכנולוגיות הללו. דוגמה עדכנית היא ארכיטקטורת האימון החדשה שלהם ללא טוקנייזר, או “T-Free”, שמטרתה לכוונן מודלים שיכולים להבין נתונים מחוץ להפצה בצורה יעילה יותר.

גישות מסורתיות מבוססות טוקנייזר דורשות לעתים קרובות כמויות גדולות של נתונים מחוץ להפצה כדי לכוונן מודל ביעילות. זה יקר מבחינה חישובית ומניח שקיימים מספיק נתונים.

ארכיטקטורת ה-T-Free של Aleph Alpha עוקפת את הבעיה הזו על ידי ביטול הטוקנייזר. בדיקות מוקדמות על Pharia LLM שלהם בשפה הפינית הראו הפחתה של 70 אחוזים בעלות האימון ובטביעת הרגל הפחמנית בהשוואה לגישות מבוססות טוקנייזר. גישה חדשנית זו הופכת את הכוונון העדין לנגיש ובר קיימא יותר.

Aleph Alpha פיתחה גם כלים לטיפול בפערים בידע מתועד שיכולים להוביל למסקנות לא מדויקות או לא מועילות.

לדוגמה, אם שני חוזים הרלוונטיים לשאלת תאימות סותרים זה את זה, “המערכת יכולה לפנות לאדם ולומר, ‘מצאתי אי התאמה… האם תוכל בבקשה לספק משוב האם מדובר בסכסוך ממשי?’” הסביר אנדרוליס.

המידע שנאסף באמצעות מסגרת זו, הנקראת Pharia Catch, יכול להיות מוזן בחזרה לבסיס הידע של היישום או לשמש לכוונון מודלים יעילים יותר. לולאת משוב זו משפרת את הדיוק והאמינות של מערכת ה-AI לאורך זמן.

לדברי אנדרוליס, כלים אלה משכו שותפים כמו PwC, Deloitte, Capgemini ו-Supra, שעובדים עם לקוחות קצה כדי ליישם את הטכנולוגיה של Aleph Alpha. שותפויות אלה מדגימות את הערך והמעשיות של הפתרונות של Aleph Alpha ביישומים בעולם האמיתי.

גורם החומרה

תוכנה ונתונים אינם האתגרים היחידים העומדים בפני מאמצי AI ריבוני. חומרה היא שיקול קריטי נוסף.

לארגונים ומדינות שונים עשויים להיות דרישות ספציפיות לפעול על חומרה שפותחה באופן מקומי או פשוט להכתיב היכן ניתן להריץ עומסי עבודה. מגבלות אלה יכולות להשפיע באופן משמעותי על בחירת החומרה והתשתית.

משמעות הדבר היא שאנדרוליס והצוות שלו חייבים לתמוך במגוון רחב של אפשרויות חומרה. Aleph Alpha משכה קבוצה אקלקטית של שותפי חומרה, כולל AMD, Graphcore ו-Cerebras.

בחודש שעבר, Aleph Alpha הכריזה על שותפות עם AMD לשימוש במאיצי MI300-series שלה. שיתוף פעולה זה ימנף את החומרה המתקדמת של AMD כדי להאיץ את אימון והסקת ה-AI.

אנדרוליס הדגיש גם שיתופי פעולה עם Graphcore, שנרכשה על ידי Softbank, ו-Cerebras, שמאיצי CS-3 בקנה מידה של פרוסות משמשים לאימון מודלי AI עבור הכוחות המזוינים הגרמניים. שותפויות אלה מדגימות את המחויבות של Aleph Alpha לעבוד עם ספקי חומרה מגוונים כדי לענות על הצרכים הספציפיים של לקוחותיה.

למרות שיתופי פעולה אלה, אנדרוליס מתעקש שמטרת Aleph Alpha אינה להפוך לספק שירותים מנוהלים או ספק ענן. “לעולם לא נהפוך לספק ענן”, הצהיר. “אני רוצה שהלקוחות שלי יהיו חופשיים וללא נעילה.” מחויבות זו לחופש וגמישות לקוחות מייחדת את Aleph Alpha מחברות AI רבות אחרות.

הדרך קדימה: מורכבות גוברת

במבט קדימה, אנדרוליס צופה שבניית יישומי AI תהפוך למורכבת יותר ככל שהתעשייה עוברת מצ’אטבוטים למערכות AI סוכנותיות המסוגלות לפתרון בעיות מתוחכם יותר.

AI סוכנותי זכה לתשומת לב משמעותית בשנה האחרונה, כאשר בוני מודלים, מפתחי תוכנה וספקי חומרה מבטיחים מערכות שיכולות להשלים תהליכים מרובי שלבים באופן אסינכרוני. דוגמאות מוקדמות כוללות את Operator של OpenAI ואת API השימוש במחשב של Anthropic. מערכות AI סוכנותיות אלה מייצגות התקדמות משמעותית ביכולות ה-AI.

“בשנה שעברה, התמקדנו בעיקר במשימות פשוטות כמו סיכום מסמכים או סיוע בכתיבה”, אמר. “עכשיו, זה הופך למרגש יותר עם דברים שממבט ראשון אפילו לא נראים כבעיות genAI, שבהן חוויית המשתמש אינה צ’אטבוט.” מעבר זה ליישומי AI מורכבים ומשולבים יותר מציג אתגרים והזדמנויות חדשות לתעשייה.

אתגרים מרכזיים בבניית יישומי AI ארגוניים:

  • גישור על הפער בין אימון מודלים לשילוב יישומים: תרגום יעיל של היכולות של LLM ליישומים מעשיים נותר מכשול משמעותי.
  • התגברות על המגבלות של כוונון עדין: כוונון עדין לבדו לרוב אינו מספיק כדי ללמד מודלי AI מידע חדש או להתאים אותם למשימות ספציפיות.
  • הבטחת האיכות והנגישות של נתונים: RAG מסתמך על נתונים מתועדים היטב ונגישים בקלות, שלעתים קרובות חסרים בארגונים רבים.
  • טיפול בנתונים מחוץ להפצה: מודלי AI חייבים להיות מסוגלים לטפל בנתונים השונים מהנתונים שעליהם אומנו, דבר הדורש טכניקות מיוחדות.
  • טיפול במגבלות חומרה: לארגונים ומדינות שונים יש דרישות חומרה שונות שיש לקחת בחשבון.
  • שמירה על פרטיות ואבטחת נתונים: AI ריבוני דורש הבטחה שהנתונים מעובדים ומאוחסנים בצורה מאובטחת בתוך גבולות המדינה.
  • פיתוח מערכות AI סוכנותיות: בניית יישומי AI שיכולים לבצע תהליכים מרובי שלבים מורכבים באופן אסינכרוני היא תחום מחקר מאתגר אך מבטיח.

הזדמנויות מרכזיות בבניית יישומי AI ארגוניים:

  • פיתוח פתרונות AI חדשניים: האתגרים בבניית יישומי AI ארגוניים יוצרים הזדמנויות לפיתוח פתרונות חדשניים המטפלים בצרכים ספציפיים.
  • מינוף טכנולוגיות קוד פתוח: טכנולוגיות קוד פתוח יכולות לעזור להפחית עלויות ולהאיץ את הפיתוח של יישומי AI.
  • שיתוף פעולה עם שותפי חומרה: שיתוף פעולה עם שותפי חומרה יכול לעזור להבטיח שיישומי AI מותאמים לפלטפורמות חומרה ספציפיות.
  • בניית יכולות AI ריבוניות: AI ריבוני יכול לספק למדינות ולארגונים שליטה רבה יותר על הנתונים ותשתית ה-AI שלהם.
  • שינוי תעשיות באמצעות AI: ל-AI יש פוטנציאל לשנות תעשיות על ידי אוטומציה של משימות, שיפור קבלת החלטות ויצירת מוצרים ושירותים חדשים.

העתיד של יישומי AI ארגוניים:

העתיד של יישומי AI ארגוניים צפוי להתאפיין ב:

  • מורכבות מוגברת: יישומי AI יהפכו למורכבים ומשולבים יותר, וידרשו מומחיות וכלים מיוחדים.
  • דגש רב יותר על איכות נתונים: איכות הנתונים תהפוך לחשובה יותר ויותר ככל שיישומי AI יסתמכו על נתונים מדויקים ואמינים.
  • דגש רב יותר על אבטחה ופרטיות: אבטחה ופרטיות יהיו בעלי חשיבות עליונה כאשר יישומי AI יטפלו בנתונים רגישים.
  • אימוץ רחב יותר של AI סוכנותי: מערכות AI סוכנותיות יהפכו לנפוצות יותר ככל שארגונים יבקשו לבצע אוטומציה של משימות מורכבות.
  • חדשנות מתמשכת: תחום ה-AI ימשיך להתפתח במהירות, מה שיוביל לפריצות דרך והזדמנויות חדשות.

על ידי התמודדות עם האתגרים ואימוץ ההזדמנויות, ארגונים יכולים לרתום את הכוח של AI כדי לשנות את העסקים שלהם וליצור עתיד טוב יותר.