GPT-4.5: עידון, לא מהפכה
OpenAI הפכה לאחרונה את GPT-4.5 לזמין למשתמשי ChatGPT Pro, כאשר חשבונות Plus, Team, enterprise ו- education יבואו בהמשך. המודל, המכונה פנימית ‘Orion’, מתהדר ב”הבנה טובה יותר של כוונת אנוש, פירוש רמזים עדינים וציפיות מרומזות עם ניואנסים ואינטליגנציה רגשית רבה יותר”, על פי OpenAI. הוא ממנף טכניקות פיקוח חדשות לצד כוונון עדין מסורתי ולמידת חיזוק ממשוב אנושי, המשקף את תהליך הפיתוח של GPT-4o. GPT-4.5 מציע יכולות חיפוש בזמן אמת, תומך בהעלאות קבצים ותמונות, ומשתלב עם קנבס לכתיבה וקידוד. עם זאת, חסרות לו כרגע התכונות הרב-מודאליות כמו מצב קולי, וידאו או שיתוף מסך שנמצאות ב-ChatGPT.
OpenAI מדגישה שלמידה לא מפוקחת משפרת את הדיוק והאינטואיציה של המודל. גישה זו הייתה הכוח המניע מאחורי התקדמות במודלים כמו GPT-3.5, GPT-4, ועכשיו, GPT-4.5. בנפרד, הרחבת חשיבה מאמנת מודלים לעבד מידע באופן שיטתי, ויוצרת שרשרת מחשבות לפני התגובה. גישה שיטתית זו משפרת את יכולתם להתמודד עם אתגרי STEM ולוגיקה מורכבים, כפי שהודגם על ידי מודלים כמו OpenAI o1 ו- OpenAI o3-mini. GPT-4.5 מוצג כדוגמה מצוינת להרחבת למידה לא מפוקחת, תוך מינוף כוח מחשוב מוגבר, מערכי נתונים גדולים יותר וחדשנות ארכיטקטונית. המודל, שאומן על מחשבי-על של Microsoft Azure AI, מחזיק לכאורה בידע רחב יותר ובהבנה מעמיקה יותר של העולם, מפחית הזיות ומגביר את האמינות.
למרות ההתקדמות הללו, GPT-4.5 לא יצר התלהבות משמעותית. הוא נתפס כשיפור מצטבר ולא כפריצת דרך. בעוד ש- OpenAI מתגאה באינטליגנציה רגשית משופרת, ניואנסים ויצירתיות, משתמשים רבים לא הבחינו בהבדל משמעותי בהשוואה ל- GPT-4o. היעדר התקדמות רב-מודאלית, תכונה מרכזית של GPT-4o, תורם עוד יותר לתפיסה זו.
יתר על כן, GPT-4.5 הפגין נטייה לייצר תוצאות חסרות היגיון. כלי הבדיקה הפנימי של OpenAI, SimpleQA, מגלה ש- GPT-4.5 הוזה (מציג בדותות כעובדה בביטחון) 37.1% מהמקרים. זהו חשש משמעותי, אפילו בהשוואה ל- GPT-4o, מודל “חשיבה” מתקדם נוסף, שמזיות 61.8% מהמקרים באותו מדד. מודל o3-mini הקטן והזול יותר מציג שיעור הזיות גבוה עוד יותר של 80.3%.
הנוף הנוכחי של AI, הכולל מתחרים כמו Anthropic עם Claude 3.7 ו- Google עם ההתקדמות של Gemini, העלה את הציפיות לשדרוגים משמעותיים. משתמשים מחפשים פריצות דרך, לא רק שיפורים, ו- GPT-4.5, בצורתו הנוכחית, נראה כלא עומד בציפיות אלו.
עלייתם של מודלי חשיבה ואמון המשקיעים
אילון מאסק הציע לאחרונה ב- X ש- Artificial General Intelligence (AGI) נמצא באופק. הצהרה זו מגיעה בעיצומו של מרוץ קדחתני בין ענקיות טכנולוגיה כמו OpenAI, Google, Meta, Microsoft, DeepSeek, Anthropic, וה- xAI של מאסק עצמו לפיתוח מודלי חשיבה – מערכות AI שנועדו לחקות חשיבה דמוית אנוש.
משקיעים מראים בבירור התלהבות מהמרדף הזה. זמן קצר לאחר השקת Claude 3.7 Sonnet עם חשיבה היברידית, Anthropic הבטיחה סבב גיוס הון משמעותי בסדרה E בסך 3.5 מיליארד דולר. זה שילש את שוויה ל-61.5 מיליארד דולר, וביסס את מעמדה כמתחרה מרכזית ל- OpenAI. ההשקעה, בהובלת Lightspeed Venture Partners ובהשתתפות Salesforce Ventures, Cisco, Fidelity, Jane Street ואחרים, תשמש להרחבת כוח המחשוב לפיתוח AI, שיפור מחקר הבטיחות והאצת הצמיחה העולמית.
דחיקת גבולות החשיבה: מדד BBEH
מודלי שפה גדולים (LLMs) משולבים יותר ויותר ביישומים יומיומיים, הדורשים יכולות חשיבה חזקות בתחומים מגוונים. עם זאת, מדדים קיימים נותנים לעתים קרובות עדיפות למתמטיקה וקידוד, תוך הזנחת סוגי חשיבה מכריעים אחרים. בעוד שמערך הנתונים BIG-Bench היה בשימוש נרחב להערכת LLMs במשימות חשיבה מורכבות, המודלים התקדמו כל כך עד שהם משיגים כעת ציונים כמעט מושלמים הן ב- BIG-Bench והן בגרסה המאתגרת יותר שלו, BIG-Bench Hard (BBH). רוויה זו הופכת את המדדים הללו לפחות יעילים למדידת התקדמות נוספת.
כדי להתמודד עם מגבלה זו, חוקרים הציגו את BIG-Bench Extra Hard (BBEH). מדד חדש זה מחליף כל משימה ב- BBH בגרסה קשה משמעותית, תוך שהוא עדיין מעריך כישורי חשיבה דומים. בדיקות ב- BBEH מגלות שאפילו המודלים הטובים ביותר לשימוש כללי משיגים ציון של 9.8% בלבד, בעוד שהמודל המוביל שתוכנן במיוחד לחשיבה מגיע ל- 44.8%. תוצאות אלו מדגישות את האתגרים המתמשכים ש- LLMs מתמודדים איתם בחשיבה מורכבת, ומצביעות על מקום רב לשיפור. המאמר המלא מספק פרטים נוספים על מדד חדש זה.
לוויינים המופעלים על ידי AI: עידן חדש בחקר החלל ותפעולו
TakeMe2Space, סטארט-אפ spacetech מהיידראבאד, הבטיח לאחרונה 5.5 crore רופי בסבב גיוס pre-seed בהובלת Seafund, בהשתתפות Blume Ventures, Artha Venture Fund, AC Ventures ומשקיעי אנג’ל אחרים. מימון זה, למרות שהוא צנוע, מסמל צעד משמעותי לקראת הקמת מעבדת ה- AI הראשונה של הודו בחלל. TakeMe2Space מתכננת להשתמש בכספים לפיתוח MOI-1 (My Orbital Infrastructure–Technology Demonstrator), פלטפורמה שתאפשר למשתמשים להעלות מודלים של AI לתצפית על כדור הארץ או ניסויים אחרים בחלל ישירות ללוויין מסלולי באמצעות קונסולת אינטרנט בשם Orbitlab. משתמשים ישלמו רק עבור זמן השימוש בלוויין, בשיעור של 2 דולר לדקה.
פלטפורמת MOI-TD של החברה דיווחה על יכולת להעלות מודלים גדולים של AI מתחנת קרקע, לבצע קוד חיצוני בלוויין, ולהוריד באופן מאובטח תוצאות מקודדות ומוצפנות. זה מייצג צעד לקראת פעולות לוויין אוטונומיות ויעילות יותר.
TakeMe2Space אינה לבד במאמץ זה. ארגונים כמו ESA (עם OPS-SAT) ו- Globalstar הם גם חלוצים ביישומים בעולם האמיתי של טכנולוגיית לוויין המופעלת על ידי AI, החל מתקשורת IoT מאובטחת ועד להפעלת מודל AI במסלול. ככל שהטכנולוגיה ממשיכה להתקדם, לוויינים המונעים על ידי AI צפויים להפוך לאוטונומיים יותר ויותר, מה שיוביל לפעולות חלל יעילות יותר ויפתח אפשרויות חדשות למחקר, אבטחה וקישוריות גלובלית.
באופן מסורתי, לוויינים הסתמכו במידה רבה על תחנות קרקע לעיבוד נתונים, קבלת החלטות וביצוע פקודות. היה צורך להוריד נתונים, לנתח אותם על פני כדור הארץ, ולאחר מכן תובנות מעובדות הועלו חזרה ללוויין – תהליך שהיה גם גוזל זמן וגם עתיר רוחב פס. עם זאת, התקדמות ב- AI וב- edge computing (עיבוד נתונים במכשיר עצמו ולא בענן) מאפשרות כעת ללוויינים לעבד נתונים על הסיפון, לקבל החלטות אוטונומיות ולשדר באופן מאובטח רק את התובנות החשובות ביותר. התוצאה היא פעולות מהירות, חכמות ויעילות יותר.
הפעולה של לוויינים מודרניים המופעלים על ידי AI כוללת בדרך כלל שלושה שלבים עיקריים:
- Uplink של אלגוריתמי AI: אלגוריתמי AI מועברים מתחנות קרקע ללוויינים, ומספקים להם יכולות עיבוד נתונים מתקדמות.
- ניתוח נתונים על הסיפון: מודלים של AI מנתחים תמונות, נתוני חיישנים ותשומות אחרות ישירות במסלול, וממזערים את הצורך בהתערבות קרקעית מתמדת.
- Downlink מאובטח של תובנות: במקום לשדר נתונים גולמיים, לוויינים שולחים תובנות מוצפנות, חוסכים ברוחב פס ומשפרים את האבטחה.
גישה זו המונעת על ידי AI מציעה מספר יתרונות. היא מפחיתה משמעותית את ההשהיה על ידי מתן אפשרות ללוויינים לעבד נתונים בחלל, ומאפשרת תגובות מהירות יותר לתנאים בזמן אמת מבלי להמתין להוראות מתחנות קרקע. השימוש ברוחב הפס ממוטב, מכיוון שרק התובנות הרלוונטיות ביותר מועברות במקום כמויות גדולות של נתונים גולמיים. האבטחה משופרת גם באמצעות תקשורת מוצפנת, ומפחיתה את הסיכון לאיומי סייבר ופריצות נתונים. יתרונות אלה חשובים במיוחד ביישומים כגון תגובה לאסונות, פעולות צבאיות וחקר החלל.
היישומים בעולם האמיתי של לוויינים המופעלים על ידי AI מגוונים ומשפיעים:
- ניהול אסונות: לוויינים המצוידים ב- AI יכולים לזהות שריפות, שיטפונות והוריקנים בזמן אמת, ולאפשר פעולה מהירה של צוותי תגובת חירום.
- חקלאות מדייקת: מודלים של AI מנתחים את בריאות היבול ותנאי הקרקע כדי לשפר את שיטות החקלאות המדייקת.
- ניטור סביבתי: סוכנויות סביבתיות משתמשות בנתוני לוויין כדי לעקוב אחר רמות זיהום האוויר והמים.
- ניווט אוטונומי ופעולות חלל: AI משפר את הימנעות מהתנגשות על ידי חיזוי ותגובה לאיומים פוטנציאליים, ומבטיח את בטיחות הלוויינים. הוא גם מאפשר תיאום של קבוצות לוויינים, משפר את הכיסוי והיעילות. יתר על כן, AI ממלא תפקיד מכריע במעקב ובחיזוי תנועות פסולת מסלולית, ומפחית את הסיכון לנזק לתשתית החלל.
- הגנה וביטחון: מערכות מעקב המופעלות על ידי AI מזהות פעילויות לא מורשות ותנועות צבאיות בדיוק מוגבר.
- טלקומוניקציה ו- IoT: לוויינים המונעים על ידי AI תורמים לניתוב תעבורה חכם יותר, משפרים את קישוריות האינטרנט הלווייני ומבטיחים תקשורת גלובלית חלקה.
- חקר החלל: AI משפר את היעילות של טלסקופי חלל בזיהוי אסטרואידים וכוכבי לכת חוץ-שמשיים, ומקדם משמעותית את מאמצי גילוי החלל.
למרות היתרונות הרבים, נותרו אתגרים בפיתוח ובפריסה של לוויינים המופעלים על ידי AI:
- כוח מחשוב מוגבל: לוויינים חייבים לפעול על שבבים בעלי הספק נמוך ועמידים לקרינה, המגבילים את יכולות ה- AI.
- סביבת חלל קשה: חשיפה לקרינה מהווה סיכון לתקלות בחומרה.
- איומי אבטחה: העלאה וביצוע של קוד חיצוני בחלל דורשים ניהול זהיר כדי למנוע התקפות סייבר.
- עלות וזמן פיתוח: בנייה, בדיקה ואימות של חומרת לוויין תואמת AI הוא תהליך יקר וגוזל זמן.
- דרישות הסתגלות: מודלים של AI שנפרסו במסלול חייבים להיות ניתנים להתאמה גבוהה, לתפקד עם עדכונים מינימליים ולהתאים את עצמם באופן אוטונומי לתרחישים חדשים.
AI Unlocked: ביטול ביטויים חוזרים ב- ChatGPT
AI יכול להיות כלי רב ערך ביצירת תוכן, סיוע בכתיבה, סיעור מוחות, שיפור הבהירות, חידוד המבנה ושיפור הקריאות הכללית. עם זאת, בעיה נפוצה בטקסט שנוצר על ידי AI היא נטייתו לשפה נוסחתית עקב בחירות מילים חוזרות. במקום להעביר מסרים רעננים ומשפיעים, AI מסתמך לעתים קרובות על דפוסים מוכרים, מפחית את האפקטיביות והמקוריות.
מילים וביטויים בשימוש יתר, כגון “delve,” “tapestry,” “vibrant,” “landscape,” “realm,” “embark,” “excels,” “It’s important to note…,” ו- “A testament to…,” יכולים לפגוע משמעותית באיכות התוכן שנוצר על ידי AI. עבור משווקי מוצרים, חזרה זו עלולה להפוך את המסרים לפחות משכנעים, להפחית את מעורבות הקהל, להחליש את בידול המותג ולמנוע מתובנות וממסרים אסטרטגיים לבלוט בשוק צפוף.
על ידי מינוף תכונת הזיכרון של ChatGPT, ניתן לצמצם בעיה זו ולבטל מילים וביטויים בשימוש יתר. כך ניתן לנצל ביעילות תכונה זו:
גישה: ניתן לגשת ל- ChatGPT דרך אתר האינטרנט או האפליקציה לנייד שלו.
יתרונות:
- מקוריות משופרת: מבטיח שתוכן שנוצר על ידי AI ירגיש פחות רובוטי ויותר אנושי.
- מסרים משופרים של המותג: מונע ניסוחים גנריים המחלישים את בידול המותג.
- מעורבות מוגברת: מעודד תקשורת יעילה יותר על ידי הפחתת יתירות.
דוגמה: יצירת תוכן שיווקי למוצר
שקול משווק מוצר שמוטל עליו לנסח תוכן להשקת מוצר חדש. בקשה ראשונית ל- ChatGPT עשויה לגרום לתגובה מלאה בביטויים חוזרים וגנריים כמו “delving into an intricate landscape of innovation…,” מה שגורם למסרים להרגיש לא מעוררי השראה.
כדי ליצור תוכן משכנע וייחודי יותר, המשווק יכול לבצע את השלבים הבאים:
- הגדרת ההנחיה: המשווק מורה במפורש ל- ChatGPT: “Please avoid the following words: delve, tapestry, vibrant, landscape, realm, embark, excels. Commit this to memory.” זה מורה ל- ChatGPT לסנן באופן פעיל מונחים אלה בתגובותיו.
- שימוש בזיכרון מתמשך: הביטוי “Commit this to memory” מבטיח ש- ChatGPT ישמור הוראות ספציפיות אלה על פני אינטראקציות מרובות. זה מאפשר הימנעות מתמשכת מהמילים והביטויים שצוינו. ChatGPT יבדוק את הזיכרון שלו לפני יצירת טקסט ויציית להוראות כדי להימנע מהמונחים המיועדים.
- סקירה ידנית: לאחר יצירת התגובה, המשווק סוקר את התוכן לאיתור יתירות שנותרה ומכוונן את השפה לבהירות והשפעה.
יעילות:
- התאמה אישית של הנחיות: הוראות ספציפיות עוזרות לעצב את הפלט של ה- AI.
- שימור זיכרון: ChatGPT יכול לאחסן ולעקוב אחר כללי הימנעות ממילים על פני שיחות.
- חידוד ידני: עריכה אנושית סופית מבטיחה בהירות ואותנטיות.
הערה: הכלים והניתוח המוצגים בסעיף זה מבוססים על בדיקות פנימיות ומדגימים ערך ברור. ההמלצות הן עצמאיות ואינן מושפעות מיוצרי הכלים.
חדשות ופיתוחים נוספים בתחום ה- AI
סמארטפונים המופעלים על ידי AI בעלייה: Deutsche Telekom הודיעה על תוכניותיה בקונגרס העולמי לניידים 2025 בברצלונה להשיק סמארטפון המופעל על ידי AI הכולל עוזר Perplexity. עוזר זה נועד לפשט משימות יומיומיות כגון הזמנת מוניות, הזמנת שולחנות, תרגום שפות בזמן אמת ומענה על שאילתות משתמשים. החברה רואה בכך עוזר וירטואלי שיתמוך במיליוני לקוחות על ידי כתיבת מיילים, ייזום שיחות, סיכום טקסטים וניהול לוחות שנה. ה- AI Phone ישלב את Google Cloud AI, ElevenLabs ו- Picsart כדי לשפר את הפונקציונליות שלו, והוא מתוכנן לצאת לשוק מאוחר יותר השנה. Glance, יחידה של InMobi, ו- Google Cloud הודיעו גם על שיתוף פעולה למינוף מודלי ה- AI של Google לפיתוח יישומי AI הפונים לצרכנים כדי לשפר את חוויות המשתמש במסכי נעילת סמארטפונים ומסכי טלוויזיה סביבתיים. Glance מפעילה כיום למעלה מ-450 מיליון סמארטפונים מבוססי Android ברחבי העולם.
מגזרי הממשלה רואים ירידה בתקריות סייבר קריטיות: תעשיות הממשל והפיתוח חוו ירידה משמעותית בתקריות בעלות חומרה גבוהה הכוללות מעורבות אנושית ישירה בשנת 2024, על פי דו”ח האנליסטים האחרון של Kaspersky Managed Detection and Response (MDR). עם זאת, מגזרי המזון, ה- IT, הטלקום והתעשייה הראו עלייה בתקריות כאלה.
OpenAI מתכננת לשלב את Sora ב- ChatGPT: OpenAI פועלת לשילוב כלי יצירת הווידאו שלה, Sora, ישירות ב- ChatGPT. נכון לעכשיו, Sora זמינה רק דרך אפליקציית אינטרנט ייעודית, המאפשרת למשתמשים ליצור קליפים קולנועיים באורך של עד 20 שניות. OpenAI מפתחת גם מחולל תמונות AI המופעל על ידי Sora.