OpenAI חושפת את GPT-4.5

צעד קדימה, לא קפיצת מדרגה

GPT-4.5 זמין למשתמשי ChatGPT Pro כגרסת תצוגה מקדימה למחקר. OpenAI מתגאה בכך שזהו “המודל בעל הידע הרב ביותר שלה עד כה”, אך תקשורת ראשונית הזהירה כי ייתכן שהוא לא ישתווה בביצועיו למודלים כמו o1 או o3-mini. זה מצביע על התמקדות בשיפור ויעילות ולא בהתקדמות פורצת דרך.

יכולות משופרות, אינטראקציה מעודנת

מה יכולים המשתמשים לצפות מ-GPT-4.5? OpenAI מדגישה שיפורים במספר תחומים מרכזיים:

  • יכולת כתיבה: המודל נועד להיות עוזר כתיבה מוכשר יותר.
  • ידע עולם מורחב: ל-GPT-4.5 יש הבנה רחבה יותר של מושגים ומידע בעולם האמיתי.
  • ‘אישיות מעודנת’: OpenAI טוענת שהאינטראקציות עם מודל זה ירגישו טבעיות ואינטואיטיביות יותר.

החברה מדגישה את יכולתו של GPT-4.5 לזהות דפוסים וליצור קשרים, מה שהופך אותו למתאים במיוחד למשימות כמו כתיבה, תכנות ופתרון בעיות מעשיות.

לא מודל פורץ דרך: הבנת ההבחנה

למרות שיפורים אלה, OpenAI מבהירה ש-GPT-4.5 אינו מייצג קפיצה ליכולות חדשות לחלוטין. מסמך שדלף, שתוקן מאוחר יותר, סיפק הקשר נוסף:

“GPT-4.5 אינו מודל פורץ דרך, אך הוא ה-LLM הגדול ביותר של OpenAI, ומשפר את יעילות החישוב של GPT-4 ביותר מ-10x”, נכתב במסמך. “הוא אינו מציג 7 יכולות פורצות דרך חדשות נטו בהשוואה למהדורות חשיבה קודמות, וביצועיו נמוכים מאלה של o1, o3-mini ומחקר עמוק ברוב הערכות המוכנות.”

הבחנה זו חשובה. היא מצביעה על כך שבעוד ש-GPT-4.5 הוא שדרוג משמעותי מבחינת קנה מידה ויעילות, הוא אינו פורץ את גבולות יכולות הבינה המלאכותית באותו אופן שבו מודל “פורץ דרך” היה עושה זאת.

אימון ופיתוח

דיווחים מצביעים על כך ש-OpenAI השתמשה במודל החשיבה o1 שלה (שם קוד Strawberry) ובנתונים סינתטיים כדי לאמן את GPT-4.5. החברה מאשרת שילוב של טכניקות פיקוח חדשניות ושיטות מבוססות:

  • Supervised Fine-Tuning (SFT)
  • Reinforcement Learning from Human Feedback (RLHF)

אלו גישות דומות לאלו ששימשו בפיתוח GPT-4o.

טיפול בהזיות ושיפור שיתוף הפעולה

שיפור בולט אחד הוא הפחתה בהזיות. לדברי OpenAI, GPT-4.5 הוזה בתדירות נמוכה יותר מ-GPT-4o ואפילו מעט פחות ממודל o1.

רפאל גונטיג’ו לופס, חוקר ב-OpenAI, הדגיש את ההתמקדות בשיתוף פעולה: “התאמנו את GPT-4.5 להיות משתף פעולה טוב יותר, מה שגורם לשיחות להרגיש חמות יותר, אינטואיטיביות יותר ובעלות ניואנסים רגשיים.” הוא ציין כי בודקים אנושיים דירגו את GPT-4.5 גבוה יותר מ-GPT-4o בקטגוריות שונות.

נקודת מבטו של המנכ”ל: הכרה במגבלות

מנכ”ל OpenAI, סם אלטמן, בפוסט ב-X, הודה באופי של GPT-4.5: “מודל ענק ויקר” ש”לא ירסק מדדים”. הערכה גלויה זו מחזקת את הרעיון שהמהדורה הזו עוסקת בהתקדמות מצטברת ולא בפריצות דרך מהפכניות.

תוכנית הפריסה

הפריסה של GPT-4.5 מתבצעת בגישה מדורגת:

  1. משתמשי Pro: גישה מיידית כגרסת תצוגה מקדימה למחקר.
  2. משתמשי Plus ו-Team: זמינות צפויה בשבוע הבא.
  3. משתמשי Enterprise ו-Edu: גישה תתאפשר לאחר משתמשי Plus ו-Team.

המודל זמין גם דרך פלטפורמת Azure AI Foundry של Microsoft, לצד הצעות מ-Stability, Cohere ו-Microsoft עצמה.

דיוק והפחתת הזיות

OpenAI מדגישה את הדיוק המשופר של GPT-4.5, וטוענת שהוא מייצר תגובות מדויקות יותר והוזה פחות בהשוואה למודלים האחרים שלה. זהו צעד קדימה מכריע, שכן הזיות (יצירת מידע שקרי או חסר היגיון) היו אתגר מתמשך במודלי שפה גדולים.

מבט קדימה: GPT-5 והדרך ל-AGI

דיווחים קודמים הצביעו על ציר זמן למהדורות של OpenAI: GPT-4.5 עד סוף פברואר ו-GPT-5 כבר בסוף מאי. אלטמן תיאר את GPT-5 כ”מערכת המשלבת הרבה מהטכנולוגיה שלנו”. צפוי שהוא ישלב את מודל החשיבה החדש o3 של OpenAI, שהוצג במהלך הכרזות “12 ימי חג המולד” של החברה בדצמבר.

בעוד ש-o3-mini שוחרר מוקדם יותר, מודל o3 המלא נשמר עבור מערכת GPT-5. זה עולה בקנה אחד עם החזון הרחב יותר של OpenAI לשלב את מודלי השפה הגדולים שלה כדי ליצור מערכת בעלת יכולת רבה יותר, שעשויה להתקרב לתחום הבינה המלאכותית הכללית (AGI).

העמקה בארכיטקטורה של GPT-4.5

בעוד ש-OpenAI לא פרסמה פרטים טכניים מקיפים, ניתן להסיק מספר מסקנות לגבי הארכיטקטורה של GPT-4.5 בהתבסס על מידע זמין:

  • מספר פרמטרים גדול יותר: כ”LLM הגדול ביותר של OpenAI”, סביר להניח ש-GPT-4.5 מתהדר במספר פרמטרים גבוה משמעותית מקודמיו. קיבולת מוגברת זו תורמת ככל הנראה לבסיס הידע המשופר וליכולות החשיבה שלו.

  • יעילות חישובית ממוטבת: המסמך שדלף הזכיר שיפור של “יותר מ-10x” ביעילות החישוב בהשוואה ל-GPT-4. זה מצביע על שיפורים ארכיטקטוניים המאפשרים למודל לעבד מידע בצורה יעילה יותר, מה שעשוי להוביל לזמני תגובה מהירים יותר ולצריכת אנרגיה מופחתת.

  • מנגנוני קשב משופרים: בהתחשב בדגש על זיהוי דפוסים ויצירת קשרים, סביר להניח ש-GPT-4.5 משלב התקדמות במנגנוני קשב. מנגנונים אלה מאפשרים למודל להתמקד בחלקים הרלוונטיים ביותר של טקסט הקלט, מה שמוביל לתגובות קוהרנטיות ומתאימות יותר מבחינה הקשרית.

  • **נתוני אימון מעודנים:**השימוש ב”טכניקות פיקוח חדשות” מרמז על שיפורים באיכות ובמגוון של נתוני האימון. זה יכול לכלול שילוב של מערכי נתונים מיוחדים יותר, מינוף יצירת נתונים סינתטיים, או שימוש בשיטות מתוחכמות יותר לסינון וניקוי נתונים קיימים.

תפקידם של נתונים סינתטיים

השימוש המדווח בנתונים סינתטיים באימון GPT-4.5 ראוי לציון במיוחד. נתונים סינתטיים, שנוצרו על ידי מודלי AI עצמם, מציעים מספר יתרונות פוטנציאליים:

  • התגברות על מחסור בנתונים: ניתן להשתמש בהם כדי להגדיל מערכי נתונים קיימים, במיוחד בתחומים שבהם נתונים מהעולם האמיתי מוגבלים או קשים להשגה.

  • טיפול בהטיות: ניתן ליצור נתונים סינתטיים בקפידה כדי להפחית הטיות הקיימות במערכי נתונים מהעולם האמיתי, מה שמוביל למודלי AI הוגנים ושוויוניים יותר.

  • בחינת תרחישים היפותטיים: זה מאפשר לחוקרים לאמן מודלים על תרחישים שעלולים להיות נדירים או בלתי אפשריים לצפייה בעולם האמיתי, ולשפר את יכולתם להתמודד עם מצבים בלתי צפויים.

עם זאת, השימוש בנתונים סינתטיים מעלה גם חששות:

  • פוטנציאל להגברת הטיות: אם לא נשלטים בקפידה, נתונים סינתטיים עלולים להגביר בשוגג הטיות קיימות או להציג הטיות חדשות.

  • סיכון להתאמת יתר: מודלים שאומנו בעיקר על נתונים סינתטיים עשויים להצליח בנתונים סינתטיים דומים אך להתקשות להכליל לקלטים מהעולם האמיתי.

הגישה של OpenAI לשימוש בנתונים סינתטיים כרוכה ככל הנראה באימות ובדיקה קפדניים כדי להפחית סיכונים אלה.

‘האישיות המעודנת’: מבט מקרוב

הטענה של OpenAI של-GPT-4.5 יש ‘אישיות מעודנת’ מסקרנת. זה מצביע על מאמצים להפוך את האינטראקציות של המודל למרתקות, טבעיות ואינטליגנטיות יותר מבחינה רגשית. זה יכול לכלול מספר טכניקות:

  • כוונון עדין על נתוני שיחה: אימון המודל על מערכי נתונים גדולים של שיחות אנושיות כדי להבין טוב יותר ניואנסים של שפה, טון ורמזים חברתיים.

  • שילוב מודלים של אינטליגנציה רגשית: שילוב מודלים מיוחדים שנועדו לזהות ולהגיב לרגשות אנושיים, מה שמאפשר ל-GPT-4.5 להתאים את סגנון התקשורת שלו בהתאם.

  • למידת חיזוק עם משוב אנושי: שימוש במשוב אנושי כדי לתגמל תגובות הנתפסות כטבעיות, מרתקות ואמפתיות יותר.

המטרה היא ליצור חווית שיחה דמוית אנוש יותר, תוך מעבר לאינטראקציות פונקציונליות גרידא כדי לטפח תחושה של חיבור וקרבה.

השלכות על קבוצות משתמשים שונות

הפריסה המדורגת של GPT-4.5 מצביעה על השלכות שונות עבור קבוצות משתמשים שונות:

  • משתמשי Pro: כמאמצים מוקדמים, למשתמשי Pro תהיה הזדמנות להתנסות ביכולות המודל ולספק משוב ל-OpenAI. משוב זה יהיה מכריע בעיצוב הפיתוח הנוסף של המודל.

  • משתמשי Plus ו-Team: משתמשים אלה ייהנו ככל הנראה מהביצועים המשופרים ומסגנון האינטראקציה המעודן של GPT-4.5 במשימות היומיומיות שלהם, כגון כתיבה, קידוד ומחקר.

  • משתמשי Enterprise ו-Edu: עבור משתמשים אלה, הדיוק המשופר וההזיות המופחתות עשויים להיות בעלי ערך במיוחד, ולהבטיח תוצאות אמינות ומהימנות יותר במסגרות מקצועיות וחינוכיות.

  • משתמשי Microsoft Azure AI Foundry: הזמינות של GPT-4.5 בפלטפורמה זו מרחיבה את הגישה למודל עבור מפתחים וחוקרים, ומטפחת חדשנות ויצירת יישומים חדשים המופעלים על ידי AI.

ההקשר הרחב יותר: האסטרטגיה של OpenAI

השחרור של GPT-4.5, למרות שאינו מודל פורץ דרך, משתלב באסטרטגיה הרחבה יותר של OpenAI של פיתוח איטרטיבי והתקדמות הדרגתית לעבר AGI. על ידי שחרור שיפורים מצטברים, OpenAI יכולה:

  • לאסוף משוב משתמשים: לחדד ללא הרף את המודלים שלה בהתבסס על שימוש ומשוב בעולם האמיתי.

  • לנהל ציפיות: להימנע מהייפ מוגזם ולקבוע ציפיות ריאליות לכל מהדורה.

  • לשמור על יתרון תחרותי: להישאר בחזית בתחום הבינה המלאכותית המתפתח במהירות.

  • להתכונן לפריצות דרך עתידיות: להניח את היסודות להתקדמות משמעותית יותר, כגון GPT-5.

גישה זו מנוגדת למהדורות “המפץ הגדול” של כמה חברות AI אחרות, ומצביעה על גישה זהירה ומדודה יותר לפיתוח ופריסה של מערכות AI חזקות יותר ויותר. ההתמקדות היא לא רק בפריצת גבולות האפשרי אלא גם בהבטחת בטיחות, אמינות ושביעות רצון המשתמשים.
הפיתוח והפריסה של מודלים כמו GPT-4.5 מעלים שאלות רבות:

  • איך נוכל למדוד אם למודל יש “אישיות מעודנת”?
  • מהן ההשלכות של מודל שהוזה פחות?
  • מה החשיבות של שחרור מודל שאינו מודל פורץ דרך?

אלו כולן שאלות טובות, ואין תשובות סופיות.