GPT-4.5 של OpenAI: מחיר גבוה, תמורה?

שיפורים מצטברים, עלויות אסטרונומיות

OpenAI הציגה לאחרונה את GPT-4.5, שהוצג בתחילה כתצוגה מקדימה למחקר. איטרציה חדשה זו של מודל השפה העוצמתי הפכה לזמינה על בסיס מוגבל, עם תג מחיר כבד: משתמשי Pro מתמודדים עם תשלום חודשי של 200 דולר, בעוד שמשתמשי Plus יכולים לגשת אליו תמורת 20 דולר לחודש. בעוד שמנכ”ל OpenAI, סם אלטמן, הציג את GPT-4.5 כמודל טבעי ושיחתי יותר, השחרור התקבל בקבלת פנים מעורבת בהחלט, במיוחד בכל הנוגע ליכולות החשיבה הבסיסיות שלו.

GPT-4.5 מתגאה בשיפורים במספר תחומי מפתח. OpenAI טוענת לשיפורים בדיוק, הפחתה בנטייה ל’הזות’ (ליצור מידע כוזב) ויכולת משופרת לשכנע. עם זאת, שיפורים אלה מגיעים במחיר גבוה. מבנה התמחור לשימוש ב-GPT-4.5 נקבע על 75 דולר למיליון אסימוני קלט ו-150 דולר מדהימים למיליון אסימוני פלט. תמחור זה הצית ויכוח סוער בקהילת הבינה המלאכותית, כאשר מומחים חלוקים בחדות בשאלה האם השיפורים המצטברים מצדיקים הוצאה כספית כה משמעותית.

השאלה המרכזית סובבת סביב הצעת הערך האמיתית של GPT-4.5. בעוד ששיחות חלקות יותר ודיוק משופר מעט מתקבלים בברכה, השאלה הבסיסית נותרה בעינה: האם הוא מייצג קפיצת מדרגה משמעותית ביכולות הבינה המלאכותית, או שמא מדובר רק בשיפור יקר של טכנולוגיה קיימת?

בדיקות בעולם האמיתי: ניתוק מהטענות של OpenAI?

הערכות עצמאיות של GPT-4.5 תדלקו עוד יותר את הדיון. אנדריי קרפתי, דמות בולטת בתחום הבינה המלאכותית, ערך ניסוי השוואתי בין GPT-4 ל-GPT-4.5. חמש משימות כתיבה יצירתית הוצגו למשתמשים, ולאחר מכן הם התבקשו לשפוט את איכות הפלט. באופן מפתיע, התוצאות העדיפו את מודל GPT-4 הישן יותר בארבע מתוך חמש המשימות. תוצאה זו קוראת תיגר ישירות על התפיסה ש-GPT-4.5 מייצג איטרציה מעולה אוניברסלית.

ההערכות הטכניות של ד”ר ראג’ דנדקר הניבו תוצאות מדאיגות באופן דומה. הבדיקות שלו התמקדו בתחומים שבהם OpenAI טענה במפורש לשיפורים, כגון חשיבה מתמטית והסקה לוגית. עם זאת, GPT-4.5 התקשה על פי הדיווחים בתחומים אלה, והפגין יתרון מועט עד אפסי על פני קודמו. ממצאים אלה סותרים ישירות את טענותיה של OpenAI ומעלים שאלות רציניות לגבי השקיפות והדיוק של טענות השיווק של החברה.

תגובות התקשורת והתעשייה: קשת של דעות

תגובת התקשורת ל-GPT-4.5 שיקפה את הדעות החלוקות בקהילת הבינה המלאכותית. מגזין Wired, קול בולט בעיתונות הטכנולוגיה, הציע פרספקטיבה ביקורתית, הטיל ספק במרדף הבלתי פוסק של OpenAI אחר Artificial General Intelligence (AGI) ואפיין את GPT-4.5 כשדרוג יקר עם רווחים שוליים בלבד. Futurism, פרסום משפיע נוסף, ציין ירידה בהייפ הראשוני סביב השחרור, מה שמרמז על ספקנות גוברת לגבי הפוטנציאל האמיתי של הטכנולוגיה.

עם זאת, לא כל התגובות היו שליליות. ג’ייקוב רינטמאקי, המזוהה עם אוניברסיטת סטנפורד, הציע הערכה חיובית יותר, ושיבח במיוחד את חוש ההומור המשופר של GPT-4.5. הוא טען שזה מייצג צעד משמעותי קדימה ביכולת של הבינה המלאכותית להבין ולהשתתף באינטראקציות חברתיות. זה מדגיש נישה פוטנציאלית עבור GPT-4.5: הצטיינות בתחומים שבהם תקשורת מגוונת וחוש הומור הם בעלי חשיבות עליונה.

המתחרים שוקלים

אפילו מודלים מתחרים של AI, במובן מסוים, “הגיבו” על שחרורו של GPT-4.5. Grok של xAI, מודל שפה יריב, הכיר בשיפורים של GPT-4.5 ביכולות השיחה, אך גם ציין את אופיו עתיר המשאבים. זה מדגיש דאגה קריטית: כוח החישוב העצום הנדרש להפעלת GPT-4.5, שמתורגם ישירות לעלויות תפעול גבוהות יותר ולטביעת רגל סביבתית גדולה יותר.

ChatGPT עצמו, כאשר נשאל, הדגיש את שימור ההקשר, היצירתיות והדיוק המשופרים של GPT-4.5. עם זאת, הוא גם הודה שהמודל עדיין מפגין פגמים, במיוחד בשיחות ממושכות, שבהן הוא יכול לפעמים לאבד מעקב אחר הדיאלוג המתמשך או ליצור תגובות לא עקביות. הערכה עצמית זו, שנראית אובייקטיבית,מחזקת עוד יותר את התפיסה ש-GPT-4.5, למרות התקדמותו, נותר טכנולוגיה לא מושלמת.

להעמיק בפרטים הספציפיים

כדי להבין את קבלת הפנים המעורבת, חיוני לבחון ביתר פירוט את הטענות והטענות הנגדיות הספציפיות סביב GPT-4.5.

1. הטענה לדיוק משופר:

OpenAI טוענת ש-GPT-4.5 מדויק יותר מקודמו. בעוד שזה עשוי להיות נכון במשימות מסוימות המוגדרות באופן צר, הבדיקות העצמאיות של קרפתי ודנדקר מטילות ספק ביכולת ההכללה של טענה זו. נראה שהשיפורים בדיוק אינם אחידים בכל התחומים ועשויים להיות פחות משמעותיים ממה שפורסם בתחילה.

2. ההבטחה להפחתת הזיות:

“הזיות”, הנטייה של מודלי שפה ליצור מידע כוזב או חסר היגיון, היו אתגר מתמשך בתחום. OpenAI טוענת ש-GPT-4.5 עשה צעדים בצמצום בעיה זו. עם זאת, דיווחי משתמשים וראיות אנקדוטליות מצביעים על כך שהזיות, למרות שאולי פחות תכופות, נותרו בעיה. המודל עדיין יכול לייצר אי דיוקים המוצהרים בביטחון, במיוחד כאשר עוסקים בנושאים מורכבים או מגוונים.

3. אמנות השכנוע:

OpenAI מדגישה את יכולות השכנוע המשופרות של GPT-4.5. זה מעלה חששות אתיים, שכן AI משכנע יותר יכול לשמש למטרות מניפולטיביות, כגון הפצת מידע מוטעה או השפעה על דעות בדרכים לא רצויות. המידה שבה השכנוע של GPT-4.5 מייצג שיפור אמיתי או סיכון פוטנציאלי נותרה נושא לוויכוח מתמשך.

4. היתרון השיחתי:

GPT-4.5 הוא ללא ספק שיחתי שוטף ומרתק יותר מ-GPT-4. זהו אולי השיפור המשמעותי והבולט ביותר שלו. המודל מייצר טקסט שזורם בצורה טבעית יותר, מחקה דפוסי דיבור דמויי אדם בצורה יעילה יותר ומפגין הבנה רבה יותר של ניואנסים שיחתיים. זה הופך אותו למתאים יותר ליישומים כמו צ’אטבוטים, עוזרים וירטואליים וכלי כתיבה יצירתיים.

5. גירעון החשיבה:

למרות השיפורים השיחתיים, היעדר התקדמות משמעותית ביכולות החשיבה הוא נקודת מחלוקת מרכזית עבור מבקרים רבים. GPT-4.5 עדיין מתקשה במשימות הדורשות הסקה לוגית, חשיבה מתמטית והבנה של השכל הישר. מגבלה זו מעכבת את יישומו בתחומים הדורשים חשיבה מדויקת ואנליטית, כגון מחקר מדעי, מודלים פיננסיים וניתוח משפטי.

6. גורם העלות:

העלות המופקעת של השימוש ב-GPT-4.5 היא מחסום כניסה משמעותי עבור משתמשים פוטנציאליים רבים. מבנה התמחור, המבוסס על אסימוני קלט ופלט, הופך אותו ליקר באופן בלתי סביר עבור יישומים בקנה מידה גדול או שימוש ממושך. זה מעלה חששות לגבי נגישות והוגנות, שכן רק ארגונים ואנשים ממומנים היטב יכולים להרשות לעצמם למנף את הטכנולוגיה.

7. תווית “תצוגה מקדימה למחקר”:

ההחלטה של OpenAI לשחרר את GPT-4.5 כ”תצוגה מקדימה למחקר” ראויה לציון. זה מצביע על כך שהמודל עדיין בפיתוח ועשוי לעבור שיפורים נוספים. זה גם מרמז ש-OpenAI מודעת למגבלות ומחפשת משוב ממשתמשים כדי להנחות שיפורים עתידיים. עם זאת, תווית “תצוגה מקדימה למחקר” אינה מצדיקה במלואה את העלות הגבוהה או את הפערים בין טענות OpenAI לביצועים בפועל של המודל.

ההקשר הרחב יותר: מרוץ החימוש של הבינה המלאכותית

יש להבין את שחרורו של GPT-4.5 בהקשר הרחב יותר של “מרוץ החימוש של הבינה המלאכותית” המתמשך. חברות כמו OpenAI, Google ו-Anthropic עוסקות בתחרות עזה לפיתוח מודלי הבינה המלאכותית המתקדמים והיכולים ביותר. לחץ תחרותי זה יכול להוביל לשחרורים נמהרים, טענות מוגזמות ולהתמקדות בשיפורים מצטברים ולא בפריצות דרך מהותיות.

המרדף אחר AGI, AI היפותטי עם אינטליגנציה ברמה אנושית ויכולות פתרון בעיות כלליות, נותר כוח מניע מאחורי חלק ניכר מהמחקר והפיתוח בתחום. עם זאת, GPT-4.5, למרות התקדמותו, רחוק מלהשיג מטרה שאפתנית זו. הוא משמש תזכורת לכך שהדרך ל-AGI צפויה להיות ארוכה ומפרכת, ושפריצות דרך אמיתיות הן נדירות וקשות להשגה.

עתידו של GPT-4.5

גורלו הסופי של GPT-4.5 נותר לא ברור. כ”תצוגה מקדימה למחקר”, סביר להניח שהוא יתפתח עם הזמן. OpenAI עשויה לטפל בביקורת ולשפר את יכולות החשיבה של המודל, להפחית את עלותו או לחדד את ביצועיו בתחומים ספציפיים.

עם זאת, קבלת הפנים המעורבת ל-GPT-4.5 מדגישה את החשיבות של הערכה ביקורתית ובדיקות עצמאיות בתחום הבינה המלאכותית. היא גם מדגישה את הצורך בשקיפות רבה יותר מחברות כמו OpenAI, במיוחד فيما يتعلق ביכולות ובמגבלות של המודלים שלהן.

לעת עתה, GPT-4.5 עומד כעדות להתקדמות המתמשכת בבינה המלאכותית, אך גם כסיפור אזהרה על הסכנות שבהייפ, האתגרים בהשגת פריצות דרך אמיתיות והחשיבות של איזון בין חדשנות לבין שיקולים אתיים ומציאות מעשית. תג המחיר הגבוה, יחד עם ההחזר המפוקפק על ההשקעה, הופכים אותו למותרות שמעטים יכולים להרשות לעצמם, ועוד פחות יכולים להצדיק. הוא משמש תזכורת רבת עוצמה לכך שההתקדמות בבינה המלאכותית אינה תמיד ליניארית, ושמודלים גדולים ויקרים יותר אינם תמיד טובים יותר.