OpenAI מציגה את GPT-4.5: השלב הבא

אינטראקציה משופרת והפחתת הזיות

חברת OpenAI, חברת מחקר ופריסה של בינה מלאכותית, הציגה תצוגה מקדימה מחקרית של מודל השפה הגדול והרב-תכליתי העדכני ביותר שלה, GPT-4.5, ביום חמישי. בתחילה, הגישה תינתן למפתחי תוכנה ולאנשים בעלי מנויי ChatGPT Pro. מודל חדש זה מבטיח הפחתה משמעותית בתדירות המידע השגוי בהשוואה לקודמיו, ומציין התקדמות בולטת באמינות של תוכן שנוצר על ידי בינה מלאכותית.

בפוסט בבלוג שליווה את ההכרזה, OpenAI הדגישה את חוויית המשתמש המשופרת שמציע GPT-4.5. “בדיקות מוקדמות מראות שאינטראקציה עם GPT‑4.5 מרגישה טבעית יותר”, ציינה החברה. טבעיות משופרת זו נובעת ממספר שיפורים מרכזיים:

  • בסיס ידע רחב יותר: ל-GPT-4.5 יש בסיס ידע נרחב יותר, המאפשר לו לטפל במגוון רחב יותר של נושאים ושאילתות בדיוק ובעומק רב יותר.
  • הבנת כוונות משופרת: המודל מדגים יכולת מעולה להבין ולעקוב אחר כוונת המשתמש, מה שמוביל לתגובות רלוונטיות ומועילות יותר.
  • ‘EQ’ גדול יותר: OpenAI מציעה ש-GPT-4.5 מפגין רמה גבוהה יותר של “אינטליגנציה רגשית”, המאפשרת לו להבין טוב יותר ולהגיב לניואנסים של תקשורת אנושית.

שיפורים אלה תורמים יחד לחוויית משתמש אינטואיטיבית ופרודוקטיבית יותר. יתר על כן, בדיקות פנימיות גילו ש-GPT-4.5 מפגין שיעור הזיות נמוך משמעותית מהמודלים הקודמים של OpenAI, GPT-4o ו-o1. הזיות, מקרים שבהם מודלים של בינה מלאכותית מייצרים מידע שגוי עובדתית או חסר היגיון, היו אתגר מתמשך בפיתוח מודלים של שפה גדולים. שיעור ההזיות המופחת של GPT-4.5 מייצג צעד משמעותי לקראת הקלה על בעיה זו.

צעד קדימה, אך לא הפסגה

בעוד ש-GPT-4.5 מייצג התקדמות משמעותית, המייסד השותף והמנכ”ל של OpenAI, סם אלטמן, הבהיר כי הוא לא יהיה המתקדם ביותר מבחינת ביצועי benchmark. בפוסט ב-X (לשעבר טוויטר), אלטמן תיאר את המודל כבעל “קסם שלא הרגשתי בעבר”, ורמז על היכולות הייחודיות והפוטנציאל שלו. עם זאת, הוא הודה שהוא לא בהכרח יתעלה על מודלים אחרים במבחנים סטנדרטיים.

הבחנה זו מדגישה את הגישה של OpenAI לפיתוח מודלים, שמעדיפה לא רק ביצועים גולמיים אלא גם את חוויית המשתמש הכוללת ואת יכולתו של המודל להתמודד עם משימות בעולם האמיתי ביעילות. ההתמקדות של GPT-4.5 באינטראקציה טבעית, הפחתת הזיות והבנת כוונות משופרת מצביעה על מעבר למודלים שהם לא רק חזקים אלא גם אמינים וידידותיים למשתמש.

פריסה מדורגת ואתגרי תשתית

OpenAI מתכננת פריסה מדורגת של GPT-4.5, החל ממנויי ChatGPT Plus ו-Team בשבוע הבא, כפי שציין אלכס פאינו, ראש המחקר של OpenAI וחבר בצוות הטכני של החברה, במהלך שידור חי. מנויי ChatGPT Edu ו-Enterprise יקבלו גישה בשבוע שלאחר מכן. גישה מדורגת זו מאפשרת ל-OpenAI לנהל את הביקוש למודל החדש ולהבטיח מעבר חלק לבסיס המשתמשים שלה.

אלטמן, בפוסט שלו ב-X, תיאר את GPT-4.5 כ”מודל ענק ויקר”. הוא הסביר שהפריסה הראשונית תעדיף מנויי Plus ו-Pro עקב מגבלות משאבים. “באמת רצינו להשיק אותו ל-plus ול-pro בו זמנית, אבל גדלנו מאוד ונגמרו לנו ה-GPUs”, כתב. “נוסיף עשרות אלפי GPUs בשבוע הבא ונפרוס אותו לשכבת ה-plus אז.” הצהרה זו מדגישה את הדרישות החישוביות המשמעותיות של מודלים של שפה גדולים ואת האתגרים המתמשכים בהבטחת משאבי חומרה מספיקים כדי לתמוך בפריסה שלהם. GPUs (יחידות עיבוד גרפיות) הם מעבדים מיוחדים המתאימים במיוחד לעיבוד המקבילי הנדרש על ידי מודלים של בינה מלאכותית.

שילוב עם Azure AI Foundry של Microsoft

הזמינות של GPT-4.5 משתרעת מעבר לפלטפורמות של OpenAI עצמה. מנכ”ל מיקרוסופט, סאטיה נאדלה, הודיע ב-X שהמודל זמין בתצוגה מקדימה דרך Azure AI Foundry של מיקרוסופט. שילוב זה משקף את השותפות העמוקה בין שתי החברות. מיקרוסופט השקיעה רבות ב-OpenAI, מעל 13 מיליארד דולר, ושילבה את המודלים של OpenAI במוצרי מיקרוסופט שונים. יתר על כן, מיקרוסופט מספקת משאבי מחשוב קריטיים ל-OpenAI, התומכים בפיתוח ובפריסה של טכנולוגיות הבינה המלאכותית המתקדמות שלה.

Azure AI Foundry מספק למפתחים פלטפורמה להתנסות ולבנות יישומים באמצעות מודלים מתקדמים של בינה מלאכותית, כולל GPT-4.5. שיתוף פעולה זה מרחיב את טווח ההגעה של הטכנולוגיה של OpenAI ומאפשר למגוון רחב יותר של מפתחים למנף את היכולות שלה.

הקשר: דינמיקת שוק ומפת דרכים עתידית

השקת GPT-4.5 מגיעה בתקופה של פעילות ותחרות אינטנסיביות בנוף הבינה המלאכותית. חודש בלבד קודם לכן, השוק הגיב בעוצמה לחשיפת גישה יעילה על ידי המעבדה הסינית DeepSeek. אירוע זה הוביל לירידה משמעותית, כמעט 600 מיליארד דולר, ביום אחד בשווי השוק של Nvidia, יצרנית מובילה של GPUs הנמצאים בשימוש נרחב בפיתוח מודלים של בינה מלאכותית. תקרית זו הדגישה את רגישות השוק להתקדמות וללחצים תחרותיים בתחום המתפתח במהירות של בינה מלאכותית.

בתגובה למודעות המוגברת של השוק, אלטמן הודה בצורך בשקיפות רבה יותר לגבי מפת הדרכים של OpenAI. שבועיים לאחר הירידה בשוק של Nvidia, הוא הצהיר בפוסט ב-X שהחברה שואפת לשפר את התקשורת הציבורית שלה לגבי תוכניות עתידיות. מחויבות זו לשקיפות משקפת הכרה גוברת בחשיבות שמירת בעלי העניין מעודכנים לגבי הכיוון וההתקדמות של פיתוח הבינה המלאכותית.

אלטמן סיפק תובנות נוספות לגבי התוכניות העתידיות של OpenAI, וציין ש-GPT-4.5 יבוא אחריו GPT-5, שישלב מגוון רחב יותר של טכנולוגיות OpenAI. הוא הזכיר גם את עבודתה של החברה על “מודלים של חשיבה”, המבצעים חישובים נרחבים בזמן שאילתות המשתמש. לעומת זאת, GPT-4.5 מתואר כ”מודל ה-non-chain-of-thought האחרון” של החברה, מה שמרמז על מעבר ליכולות חשיבה מתוחכמות יותר באיטרציות עתידיות. Chain-of-thought prompting היא טכניקה המעודדת מודלים של שפה גדולים לפרק בעיות מורכבות לסדרה של שלבי ביניים, ולשפר את יכולות החשיבה ופתרון הבעיות שלהם.

צלילה עמוקה יותר ליכולות של GPT-4.5

בעוד שפרטים טכניים ספציפיים על הארכיטקטורה ונתוני האימון של GPT-4.5 נותרו חסויים, ההצהרות של OpenAI ותוצאות הבדיקה הראשוניות מספקות כמה רמזים לגבי התכונות והשיפורים העיקריים שלו:

  • הבנת שפה משופרת: GPT-4.5 ככל הנראה מתבסס על ההתקדמות של קודמיו בהבנת שפה טבעית. זה כולל שיפורים בתחומים כגון:
    • תחביר ודקדוק: ניתוח ויצירה מדויקים יותר של משפטים נכונים מבחינה דקדוקית.
    • סמנטיקה: הבנה טובה יותר של המשמעות והיחסים בין מילים ומושגים.
    • פרגמטיקה: יכולת משופרת לפרש את ההקשר והכוונה מאחורי השימוש בשפה.
  • ייצוג ידע מורחב: “בסיס הידע הרחב יותר” שהוזכר על ידי OpenAI מצביע על כך ש-GPT-4.5 אומן על מערך נתונים גדול ומגוון יותר מאשר מודלים קודמים. זה יכול לכלול מגוון רחב יותר של נושאים, מידע עובדתי וסגנונות כתיבה.
  • חשיבה ופתרון בעיות מעודנים: למרות שאינו מסומן במפורש כ”מודל חשיבה”, היכולת המשופרת של GPT-4.5 לעקוב אחר כוונת המשתמש ולפתור בעיות מעשיות מרמזת על שיפורים ביכולות החשיבה שלו. זה יכול לכלול שיפורים ב:
    • היסק לוגי: הסקת מסקנות תקפות מהנחות יסוד נתונות.
    • חשיבה של Common Sense: יישום ידע והבנה יומיומיים לפתרון בעיות.
    • חשיבה סיבתית: זיהוי קשרי סיבה ותוצאה.
  • הפחתת הזיות: שיעור ההזיות המופחת הוא התקדמות מכרעת. זה נובע ככל הנראה משילוב של גורמים, כגון:
    • נתוני אימון משופרים: סינון מידע שגוי או מטעה ממערך נתוני האימון.
    • Reinforcement Learning from Human Feedback (RLHF): כוונון עדין של המודל בהתבסס על משוב אנושי כדי לתעדף דיוק עובדתי ולהפחית את יצירת תוכן חסר היגיון.
    • שינויים ארכיטקטוניים: שילוב פוטנציאלי של מנגנונים לביסוס טוב יותר של תגובות המודל בבסיס הידע שלו ולמנוע ממנו לסטות לטענות לא נתמכות.

המשמעות של "אינטליגנציה רגשית"

האזכור של OpenAI ל”EQ” הגדול יותר של GPT-4.5 מסקרן במיוחד. בעוד שלמודלים של בינה מלאכותית אין רגשות במובן האנושי, המונח “אינטליגנציה רגשית” בהקשר זה מתייחס ככל הנראה ליכולתו של המודל:

  • לזהות ולהגיב לטון רגשי: לזהות את הטון הרגשי של קלט המשתמש (למשל, חיובי, שלילי, ניטרלי, מתוסכל, נלהב) ולהתאים את תגובותיו בהתאם.
  • ליצור טקסט עם ניואנסים רגשיים מתאימים: לייצר טקסט שהוא לא רק מדויק מבחינה עובדתית אלא גם מתאים מבחינה רגשית להקשר הנתון. זה יכול לכלול שימוש בשפה אמפתית, מעודדת או מרגיעה, בהתאם למצב.
  • להבין ולהגיב לרמזים רגשיים מרומזים: להסיק מצבים רגשיים מרמזים עדינים בשימוש בשפה, כגון בחירת מילים, מבנה משפט ופיסוק.

שיפור ה”אינטליגנציה הרגשית” של מודלים של בינה מלאכותית הוא צעד משמעותי לקראת יצירת אינטראקציות טבעיות ומרתקות יותר. זה יכול לשפר את חוויית המשתמש ביישומים שונים, כגון שירות לקוחות, חינוך וכתיבה יצירתית.

ההשלכות הרחבות יותר של GPT-4.5

להשקת GPT-4.5 יש מספר השלכות רחבות יותר על תחום הבינה המלאכותית ויישומי