עליית OpenAI: מימון שיא ודגם 'משקל-פתוח' חדש

נוף הבינה המלאכותית משתנה תדיר, ומאופיין בהתקדמות מהירה ובהשקעות פיננסיות מדהימות. במהלך שהדהד בעולם הטכנולוגיה ובשווקים הפיננסיים כאחד, OpenAI אישרה לאחרונה התפתחויות המדגישות את מעמדה בחזית השינוי הזה. החברה לא רק הבטיחה הזרמת הון מונומנטלית, שקבעה שיאים והעלתה את הערכת השווי שלה לגבהים אסטרונומיים, אלא גם אותתה על שינוי אסטרטגי בגישתה לנגישות מודלים, כשהודיעה על תוכניות לשחרור מודל השפה הראשון שלה מסוג ‘open-weight’ מזה מספר שנים. הכרזות כפולות אלו מציירות תמונה של ארגון עתיר משאבים ומוכן לנווט במשחק הגומלין המורכב שבין חדשנות קניינית ומעורבות קהילתית.

סבב גיוס היסטורי: מתדלקים את חזית ה-AI

המסלול הפיננסי של OpenAI נסק באופן דרמטי עם סגירת מה שנחשב לסבב גיוס ההון הפרטי הגדול ביותר שנרשם עד כה בטכנולוגיה. החברה גייסה בהצלחה סכום מרשים של 40 מיליארד דולר, סכום המעיד רבות על אמון המשקיעים בחזונה וביכולתה הטכנולוגית. הזרמת הון זו הובלה על ידי התחייבות משמעותית מצד SoftBank, שתרמה 30 מיליארד דולר, עם 10 מיליארד דולר נוספים שגויסו מקונסורציום של משקיעים אחרים.

ההשלכה המיידית של סבב גיוס מסיבי זה הייתה הערכה מחדש של שווי השוק של OpenAI. עם ההון החדש שנלקח בחשבון, הערכת השווי של החברה זינקה לכ-300 מיליארד דולר. נתון זה ממקם את OpenAI בין החברות הפרטיות בעלות השווי הגבוה ביותר בעולם, לא רק במגזר הטכנולוגי אלא בכל הענפים. הערכת שווי כזו משקפת את הפוטנציאל העצום הנתפס של בינה מלאכותית כללית (AGI) ואת תפקידה המוביל של החברה במרדף אחריה, במיוחד באמצעות מוצריה המוכרים כמו ChatGPT.

על פי ההצהרה הרשמית של OpenAI, הכספים החדשים שגויסו מיועדים למספר תחומים קריטיים. המטרות העיקריות כוללות דחיפה אגרסיבית של גבולות מחקר ה-AI, הרחבת תשתית המחשוב המשמעותית ממילא הנדרשת לאימון והרצת מודלים בקנה מידה גדול, ושיפור הכלים הזמינים לבסיס המשתמשים העצום של ChatGPT, המוערך ב-500 מיליון משתמשים שבועיים. העלות העצומה הכרוכה בפיתוח AI חדשני – הכוללת מערכי נתונים מסיביים, כוח חישוב נרחב (לעתים קרובות מערב עשרות אלפי מעבדים מיוחדים הפועלים במשך שבועות או חודשים), וכישרונות מחקר מהשורה הראשונה – מחייבת מימון כה משמעותי. השקעה זו ממוצבת כדלק חיוני לשמירה על המומנטום ולהאצת ההתקדמות לעבר מערכות AI מתוחכמות ויכולות יותר. קנה המידה של המימון מדגיש את האופי עתיר ההון של הובלת מרוץ ה-AI, שבו פריצות דרך דורשות משאבים עצומים.

השינוי האסטרטגי: חשיפת מודל ‘Open-Weight’

במקביל לחדשות על התחזקותה הפיננסית, מנכ’ל OpenAI, Sam Altman, חשף התפתחות משמעותית בחזית הטכנית: השקה קרובה של מודל שפה חדש המאופיין ביכולות הסקה מתקדמות. מה שהופך את ההכרזה הזו למיוחדת במינה היא שיטת ההפצה המתוכננת – הוא ישוחרר כמודל ‘open-weight’. זה מסמן סטייה מהמסלול האחרון של החברה, ומייצג את השחרור הראשון מסוג זה מאז הצגת GPT-2 בשנת 2019.

הבנת המושג ‘open-weight’ חיונית לתפיסת ההשלכות האסטרטגיות. הוא תופס עמדת ביניים בין שתי פרדיגמות מוכרות יותר: מערכות קוד פתוח מלא ומערכות קנייניות לחלוטין (או קוד סגור).

  • מודלים בקוד פתוח (Open-Source Models): בדרך כלל כוללים שחרור לא רק של פרמטרי המודל (המשקלים) אלא גם של קוד האימון, פרטים על מערך הנתונים ששימש, ולעתים קרובות מידע על ארכיטקטורת המודל. זה מאפשר לקהילת המחקר ולמפתחים שקיפות מרבית ויכולת לשכפל, ללמוד ולבנות על העבודה באופן חופשי.
  • מודלים בקוד סגור (Closed-Source Models): מוצעים בדרך כלל באמצעות APIs (Application Programming Interfaces), כמו הגרסאות המתקדמות יותר של GPT. משתמשים יכולים לתקשר עם המודל ולשלב את יכולותיו ביישומים שלהם, אך המשקלים, הקוד, הנתונים והארכיטקטורה הבסיסיים נותרים סודות מסחריים חסויים של החברה המפתחת. גישה זו ממקסמת את השליטה ואת פוטנציאל המונטיזציה עבור היוצר.
  • מודלים מסוג ‘Open-Weight’: כפי ש-OpenAI מתכוונת לעשות עם השחרור הקרוב שלה, גישה זו כוללת שיתוף של הפרמטרים המאומנים מראש (המשקלים) של הרשת הנוירונית. זה מאפשר למפתחים ולחוקרים להוריד את המשקלים הללו ולהשתמש במודל למשימות כמו inference (הרצת המודל ליצירת פלטים) ו-fine-tuning (התאמת המודל למשימות או למערכי נתונים ספציפיים באמצעות אימון נוסף). עם זאת, אלמנטים חיוניים נותרים חסויים: קוד האימון המקורי, מערך/י הנתונים הספציפי/ים ששימשו לאימון הראשוני, ופרטים מורכבים הנוגעים לארכיטקטורת המודל ולמתודולוגיית האימון.

הבחנה זו חיונית. על ידי שחרור המשקלים, OpenAI מאפשרת למגוון רחב יותר של משתמשים להריץ את המודל באופן מקומי, להתנסות בו ולהתאים אותו לצרכיהם מבלי להסתמך אך ורק על תשתית ה-API של OpenAI. זה יכול לטפח חדשנות ופוטנציאלית לדמוקרטיזציה של הגישה למידה מסוימת של יכולת AI מתקדמת. עם זאת, על ידי הסתרת נתוני האימון והקוד, OpenAI שומרת על שליטה משמעותית. היא מונעת שכפול ישיר של תהליך האימון, מגנה על מערכי נתונים וטכניקות שעלולים להיות קנייניים, ושומרת על יתרון ידע בנוגע לבנייה הבסיסית של המודל. זוהי אסטרטגיה המאזנת בין העצמת הקהילה לבין שמירה על קניין רוחני ליבתי.

ההתייחסות ל’יכולות הסקה מתקדמות’ מרמזת שמודל חדש זה שואף להתעלות על מגבלותיהם של מודלים קודמים במשימות הדורשות לוגיקה, הסקה ופתרון בעיות רב-שלבי. בעוד ש-GPT-2 היה פורץ דרך לזמנו, התחום התקדם במידה ניכרת. הצעת מודל עם הסקה מתוחכמת יותר תחת רישיון ‘open-weight’ עשויה להשפיע באופן משמעותי על יישומים שונים, ממחקר מדעי ועד ניתוח נתונים מורכב ו-AI שיחתי מתוחכם יותר. מהלך זה מגיע לאחר שנים שבהן המודלים החזקים ביותר של OpenAI, כמו GPT-3 ו-GPT-4, נשמרו במידה רבה מאחורי דלתות API סגורות, מה שהופך את החזרה הזו לצורה של פתיחות להחלטה אסטרטגית ראויה לציון.

רציונל ומעורבות קהילתית: הפרספקטיבה של Altman

הפרשנות של Sam Altman סביב ההכרזה על מודל ה-‘open-weight’ סיפקה תובנה לגבי חשיבת החברה. באמצעות פוסט בפלטפורמת המדיה החברתית X (לשעבר Twitter), הוא ציין שהרעיון לא היה חדש בתוך OpenAI. ‘חשבנו על זה הרבה זמן’, הצהיר Altman, והודה ש’סדרי עדיפויות אחרים קדמו’ בשנים שחלפו. המשמעות היא שהפיתוח והשחרור של מודלים קנייניים חזקים יותר ויותר כמו GPT-3 ו-GPT-4, יחד עם בניית שירות ChatGPT ועסקי ה-API, תפסו את המיקוד של החברה.

עם זאת, נראה שהחישוב האסטרטגי השתנה. ‘עכשיו זה מרגיש חשוב לעשות את זה’, הוסיף Altman, מה שמרמז שצירוף גורמים הפך את שחרור מודל ‘open-weight’ לצעד מתוזמן והכרחי. בעוד שהוא לא פירט במפורש את כל הגורמים הללו, ההקשר של נוף ה-AI המתפתח במהירות מספק רמזים פוטנציאליים. עלייתן של חלופות קוד פתוח חזקות, לחצים תחרותיים, ואולי רצון להתחבר מחדש לקהילת המחקר והפיתוח הרחבה יותר, שיחקו ככל הנראה תפקיד.

באופן מכריע, Altman גם אותת שפרטי השחרור עדיין נמצאים בשלבי גיבוש סופיים. ‘עדיין יש לנו כמה החלטות לקבל’, ציין, והדגיש כוונה לערב את הקהילה בתהליך. ‘לכן אנו מארחים אירועי מפתחים כדי לאסוף משוב ובהמשך לשחק עם אבות טיפוס מוקדמים’. גישה זו משרתת מטרות מרובות. היא מאפשרת ל-OpenAI לאמוד את צרכי המפתחים והעדפותיהם, פוטנציאלית לעצב את ההצעה הסופית כדי למקסם את התועלת והאימוץ שלה, ולבנות ציפייה ורצון טוב בתוך הקהילה. היא ממסגרת את השחרור לא כהחלטה חד-צדדית אלא כמאמץ שיתופי יותר, אפילו במסגרת המגבלות של מסגרת ה-‘open-weight’. אסטרטגיית מעורבות זו עשויה להיות חיונית בהבטחת שהמודל יצבור תאוצה וינוצל ביעילות לאחר שחרורו. היא גם מאפשרת ל-OpenAI לנהל ציפיות ופוטנציאלית לטפל בחששות לפני שהמשקלים הסופיים יפורסמו לציבור.

ניווט בנוף התחרותי: מהלך מחושב

לא ניתן לראות את החלטתה של OpenAI לשחרר מודל ‘open-weight’ מתקדם במנותק. היא מתרחשת בתוך סביבה תחרותית עזה שבה חברות טכנולוגיה גדולות וסטארט-אפים ממומנים היטב מתחרים על דומיננטיות בתחום ה-AI. מהלך זה נראה מחושב אסטרטגית כדי למצב את OpenAI באופן יתרוני ביחס ליריבותיה.

מתחרה מרכזית אחת היא Meta (לשעבר Facebook), שעשתה צעדים משמעותיים עם סדרת המודלים שלה Llama. יש לציין כי Llama 2 שוחרר תחת רישיון מותאם אישית שאמנם היה מתירני בדרך כלל, אך כלל הגבלה ספציפית: חברות עם בסיסי משתמשים גדולים מאוד (מעל 700 מיליון משתמשים פעילים חודשיים) יצטרכו לבקש רישיון מיוחד מ-Meta כדי להשתמש בו מסחרית. סעיף זה פורש באופן נרחב כמכוון נגד מתחרות גדולות כמו Google.

נראה ש-Sam Altman התייחס ישירות לנקודה זו בפוסט מאוחר יותר ב-X, תוך שהוא עוקץ בבירור את גישתה של Meta. ‘לא נעשה שום דבר מטופש כמו להגיד שאתה לא יכול להשתמש במודל הפתוח שלנו אם לשירות שלך יש יותר מ-700 מיליון משתמשים פעילים חודשיים’, הוא כתב. הצהרה זו משרתת מספר פונקציות אסטרטגיות:

  1. בידול: היא מבדילה במפורש את הגישה המתוכננת של OpenAI מזו של Meta, וממצבת את OpenAI כפוטנציאלית פחות מגבילה ויותר ‘פתוחה’ באמת במסגרת הנבחרת, לפחות בכל הנוגע למגבלות פריסה בקנה מידה גדול.
  2. איתות תחרותי: זהו אתגר ישיר למתחרה גדולה, המבקר במרומז את אסטרטגיית הרישוי שלה כ’מטופשת’ ופוטנציאלית אנטי-תחרותית.
  3. משיכת מפתחים: על ידי הבטחת פחות מגבלות שימוש (לפחות מהסוג הספציפי הזה), OpenAI עשויה לקוות למשוך מפתחים וחברות גדולות שהיססו או הודרו מתנאי הרישיון של Llama 2 של Meta.

מעבר ל-Meta, OpenAI מתמודדת עם תחרות מצד Google (עם מודלי ה-Gemini שלה), Anthropic (עם מודלי ה-Claude שלה), ואקוסיסטם הולך וגדל של מודלי קוד פתוח טהורים שפותחו על ידי קבוצות מחקר וחברות שונות (כמו Mistral AI).

  • מול מתחרים בקוד סגור מלא כמו אולי הרמות הגבוהות ביותר של Gemini של Google או Claude של Anthropic, מודל ה-‘open-weight’ מציע למפתחים גמישות רבה יותר, שליטה מקומית ויכולת לבצע fine-tuning, שגישת API לבדה אינה מספקת.
  • מול מודלי קוד פתוח מלא, ההצעה של OpenAI עשויה להתהדר ביכולות ‘הסקה מתקדמות’ עדיפות הנובעות ממשאביה העצומים ומיקוד המחקר שלה, פוטנציאלית מציעה בסיס ביצועים גבוה יותר גם אם חסרה לה שקיפות מלאה. היא ממצבת את עצמה כספקית של טכנולוגיה חדשנית, אך נגישה במידה מסוימת.

לכן, אסטרטגיית ה-‘open-weight’ נראית כניסיון לגבש נישה ייחודית: להציע מודל פוטנציאלי חזק או מעודן יותר מאשר אפשרויות קוד פתוח רבות הקיימות כיום, תוך מתן גמישות רבה יותר ופחות מגבלות שימוש בקנה מידה גדול (בהתבסס על הערותיו של Altman) מאשר כמה מודלים מתחרים כמו Llama 2, אך עדיין לשמור על שליטה רבה יותר מאשר שחרור קוד פתוח מלא. זהו איזון עדין שמטרתו למקסם את ההשפעה והאימוץ על פני פלחים שונים של קהילת ה-AI תוך הגנה על נכסי ליבה אינטלקטואליים.

השלכות ומסלול עתידי

השילוב של מימון שובר שיאים ושינוי אסטרטגי לעבר הפצת מודלים מסוג ‘open-weight’ נושא השלכות משמעותיות עבור OpenAI ועבור האקוסיסטם הרחב יותר של AI. ארגז המלחמה של 40 מיליארד דולר מספק ל-OpenAI משאבים שאין שני להם לרדוף אחר מטרותיה השאפתניות, פוטנציאלית מאיץ את ציר הזמן לעבר בינה מלאכותית כללית (AGI), או לפחות מערכות AI בעלות יכולות משמעותיות יותר בטווח הקרוב. רמת מימון זו מאפשרת הימורי מחקר ארוכי טווח, הרחבת תשתיות מסיבית, ומשיכה ושימור של כישרונות מובילים, מה שמחזק עוד יותר את מעמדה של OpenAI כמובילה.

הערכת השווי של 300 מיליארד דולר, בעודה משקפת אופטימיות עצומה, מביאה גם ציפיות ולחץ מוגברים. המשקיעים יצפו לתשואות משמעותיות, מה שעלול להשפיע על אסטרטגיות המוצר העתידיות של OpenAI, פוטנציאלית לדחוף לעבר מסחור אגרסיבי יותר או אפילו הנפקה ראשונית לציבור (IPO) בסופו של דבר. איזון בין המשימה המקורית הממוקדת במחקר לבין הציוויים המסחריים הללו יהיה אתגר מרכזי.

הצגת מודל ‘open-weight’ מתקדם עשויה לזרז חדשנות ברחבי התעשייה. מפתחים וחוקרים שיקבלו גישה למודל עם יכולות הסקה מתוחכמות, אפילו ללא שקיפות מלאה, עשויים להוביל לפריצות דרך בתחומים שונים. זה עשוי להנמיך את מחסום הכניסה לפיתוח יישומי AI מורכבים, בתנאי שלמשתמשים יהיו החומרה והמומחיות הנדרשות להריץ ולבצע fine-tuning למודל. זה יכול לטפח גל חדש של ניסויים ופיתוח מחוץ לגבולות הגישה מבוססת ה-API.

עם זאת, מהלך זה מעלה גם שאלות. עד כמה ‘מתקדמות’ יהיו באמת יכולות ההסקה בהשוואה למודלים קנייניים חדישים כמו GPT-4 או יורשיו? אילו תנאי רישוי ספציפיים ילוו את שחרור ה-‘open-weight’, מעבר לחוסר המגבלות על בסיס המשתמשים שרמזו עליו? התשובות יקבעו את ההשפעה האמיתית של המודל. יתר על כן, גישת ה-‘open-weight’, בעודה מציעה יותר גישה מאשר APIs סגורים, עדיין נופלת מהשקיפות שדוגלים בה תומכי הקוד הפתוח. זה עלול להוביל לוויכוח מתמשך על הדרך הטובה ביותר לפיתוח ופריסה אחראיים של AI – איזון בין מהירות חדשנות לבין בטיחות, שליטה וגישה שוויונית.

דרכה של OpenAI קדימה כרוכה בניווט בדינמיקות מורכבות אלו. עליה למנף את כוחה הפיננסי כדי לשמור על יתרונה המחקרי, לנהל את דרישות המחשוב העצומות, להתמודד עם חששות חברתיים גוברים לגבי בטיחות ואתיקה של AI, ולמקם אסטרטגית את הצעותיה בשוק דינמי. ההחלטה לשחרר מודל ‘open-weight’ מרמזת על אסטרטגיה מורכבת, המכירה בערך של מעורבות קהילתית ואימוץ רחב יותר תוך שמירה קפדנית על חידושי הליבה המהווים בסיס להערכת השווי המסיבית שלה. גישה כפולה זו – מימון מסיבי לפיתוח פנימי בשילוב עם פתיחות מבוקרת – ככל הנראה מגדירה את מסלולה של OpenAI כשהיא ממשיכה לעצב את עתיד הבינה המלאכותית.