ג'מיני 2.5: אינטליגנציה חסרת תקדים

ב-I/O 2025, גוגל חשפה סדרה של עדכונים פורצי דרך למודל ג’מיני 2.5, יחד עם תכונה ניסיונית חדשנית הידועה בשם Deep Think, שנועדה לשפר את יכולות הנימוק של מודל 2.5 Pro. התקדמויות אלה מסמנות קפיצת מדרגה משמעותית בתחום הבינה המלאכותית, ומציעות למפתחים ולמשתמשים כאחד רמות ביצועים, יעילות ורב-תכליתיות חסרות תקדים.

מודל ג’מיני 2.5 Pro זכה לשבחים נרחבים ממפתחים כפתרון הטוב ביותר למשימות קידוד, בעוד שמודל 2.5 Flash עתיד לקבל שדרוג משמעותי. יתר על כן, גוגל מציגה מגוון יכולות חדשות בכל המודלים שלה, כולל Deep Think, מצב חשיבה מעמיקה ניסיוני המשפר את יכולות הנימוק ומותאם במיוחד עבור מודל 2.5 Pro.

בהודעה קודמת, גוגל חשפה את ג’מיני 2.5 Pro, המודל האינטליגנטי ביותר שלה עד כה, והחישה את שחרור עדכון ה-I/O כדי להעצים מפתחים ביצירת יישומי אינטרנט יוצאי דופן. היום, החברה משתפת עידונים נוספים בסדרת הדגמים ג’מיני 2.5, המתגאה בהישגים מדהימים:

  • ג’מיני 2.5 Pro עלה על כל הציפיות, והדגים ביצועים יוצאי דופן במבחנים אקדמיים. הוא מחזיק כעת בעמדה המובילה בלוחות WebDev Arena ו-LMArena, ומבסס את מעמדו כמודל המוביל בעולם לסיוע בקידוד ולמידה.

  • תכונות חדשות משולבות ב-2.5 Pro וב-2.5 Flash, כולל פלט שמע מקורי לחוויית שיחה טבעית ומרתקת יותר, אמצעי אבטחה מתקדמים ושילוב של יכולות השימוש במחשב של Project Mariner. מודל 2.5 Pro ישופר עוד יותר עם Deep Think, מצב ניסיוני שנועד לשפר את הנימוק לבעיות מתמטיות וקידוד מורכבות.

  • גוגל נותרה מחויבת לשיפור חוויית המפתחים באמצעות שילוב של סיכומי מחשבות ב-Gemini API וב-Vertex AI. סיכומים אלה מציעים שקיפות מוגברת, תקציבי חשיבה מורחבים ל-2.5 Pro כדי להבטיח שליטה רבה יותר, ותמיכה בכלי MCP ב-Gemini API ובערכת ה-SDK לגישה למגוון רחב יותר של כלים בקוד פתוח.

  • מודל 2.5 Flash נגיש כעת באופן אוניברסלי בתוך אפליקציית ג’מיני. גרסה מעודכנת תהיה זמינה בקרוב ב-Google AI Studio למפתחים וב-Vertex AI לארגונים, המיועדת לתחילת יוני, כאשר 2.5 Pro יבוא בעקבותיה בקרוב לאחר מכן.

התקדמות מדהימה זו היא תוצאה של מסירות בלתי פוסקת של צוותי גוגל, המחויבים לשפר ללא הרף את הטכנולוגיות שלה ולפרוס אותן בצורה בטוחה ואחראית.

חשיפת הביצועים המעולים של 2.5 Pro

מודל 2.5 Pro עודכן לאחרונה כדי להעצים מפתחים ביצירת יישומי אינטרנט אינטראקטיביים ועשירים יותר בתכונות. המשוב החיובי שהתקבל ממשתמשים ומפתחים מוערך מאוד, ושיפורים מתמשכים ימשיכו להיות מיושמים על סמך קלט משתמשים.

בנוסף לביצועים המצוינים שלה במבחנים אקדמיים, האיטרציה האחרונה של 2.5 Pro כבשה את המקום הראשון בלוח הקידוד הפופולרי, WebDev Arena, עם ציון ELO מרשים של 1415. היא גם מובילה על פני כל לוחות LMArena, המעריכה העדפת אנוש על סמך קריטריונים שונים. יתר על כן, מצויד בחלון הקשר של מיליון טוקנים, 2.5 Pro מספק ביצועים חדישים בהבנת הקשר ארוך ומסרטוני וידאו.

על ידי שילוב LearnLM, משפחה של מודלים שפותחו בשיתוף עם מומחים לחינוך, 2.5 Pro הפך למודל המוביל ללמידה. בהשוואות ישירות המעריכות את הפדגוגיה והיעילות שלה, מחנכים ומומחים העדיפו את ג’מיני 2.5 Pro על פני מודלים אחרים על פני מערך מגוון של תרחישים. הוא גם עלה על מודלים מובילים על פני כל חמשת העקרונות של מדעי הלמידה, המשמשים לבניית מערכות AI ללמידה. זה מדגיש את האפקטיביות שלה בהקשרים חינוכיים, ומציע אסטרטגיות הוראה מותאמות ויעילות.

חשיבה מעמיקה: דחיפת גבולות הנימוק

גוגל חוקרת באופן פעיל את גבולות היכולות הקוגניטיביות של ג’מיני ומתחילה להתנסות במצב נימוק משופר הנקרא Deep Think. מצב חדשני זה משתמש בטכניקות מחקר חדישות, המאפשרות למודל להעריך השערות מרובות לפני גיבוש תגובה. גישה זו משפרת את תהליכי קבלת ההחלטות, ומאפשרת תוצאות מתוחכמות ומגוונות יותר במצבים מורכבים.

ג’מיני 2.5 Pro Deep Think השיג ציון מרשים ב-USAMO 2025, המוכר באופן נרחב כאחד ממבחני המתמטיקה המאתגרים ביותר. הוא גם מצטיין ב LiveCodeBench, מדד תובעני לקידוד ברמת תחרות, ומשיג ציון של 84.0% ב-MMMU, המעריך נימוקים מולטימדיאליים. תוצאות אלה מדגישות את הביצועים היוצאי דופן של Deep Think בטיפול במשימות מורכבות, המצביעות על עתיד מבטיח לפתרון בעיות מתקדם באמצעות AI.

בהתחשב בעובדה ש-2.5 Pro Deep Think דוחף את הגבול של מה שאפשרי, גוגל מקדישה זמן נוסף לביצוע הערכות בטיחות יסודיות ולבקש קלט נוסף ממומחי בטיחות. החברה תספק גם לבודקים נבחרים גישה ל-Gemini API כדי לאסוף משוב לפני שיהפוך אותו לזמין באופן נרחב. גישה זהירה ומכוונת זו נועדה להבטיח את הפריסה האחראית של טכנולוגיית AI מתקדמת.

הצגת 2.5 Flash משופר

מודל 2.5 Flash, הידוע ביעילותו ובעלויות-תועלתיות שלו, עבר עידון לאורך ממדים רבים. הוא הציג שיפורים על פני נקודות ציון קריטיות עבור נימוקים, ריבוי אופנים, טיפול בקוד והקשר ארוך, תוך שהוא הופך ליעיל יותר בו-זמנית, ומשתמש בין 20-30% פחות אסימונים בהערכות. זה מדגיש את הביצועים המותאמים שלו וניהול משאבים.

ה-2.5 Flash החדש זמין כעת לתצוגה מקדימה ב-Google AI Studio למפתחים, ב-Vertex AI ליישומי ארגון ובאפליקציית Gemini למשתמשים כלליים. הוא מתוכנן להיות זמין בדרך כלל בתחילת יוני, מה שהופך אותו לנגיש לסביבות ייצור.

יכולות חדשות של ג’מיני 2.5

שיפורים בפלט שמע מקורי וב-Live API

ה-Live API מציג גרסת תצוגה מקדימה של קלט אודיו-ויזואלי ודיאלוג פלט שמע מקורי, המאפשר למשתמשים ליצור חוויות שיחה עם ג’מיני טבעי ואקספרסיבי יותר. תכונה זו מאפשרת יישומים מרתקים ואינטראקטיביים יותר. היכולת של ה-AI להפיק תגובות שמע מציאותיות משפרת משמעותית את אינטראקציית המשתמש על ידי יצירת דרך אינטואיטיבית יותר לתקשר.

ה-Live API מעצים למשתמשים לנווט את הטון, המבטא וסגנון הדיבור של המודל. לדוגמה, ניתן להנחות את המודל לאמץ קול דרמטי בעת סיפור סיפור. הוא תומך גם בשימוש בכלי, המאפשר לו לבצע חיפושים בשם המשתמש. הגמישות בשליטה קולית ובגישה לכלי עבודה חיצוניים הופכת את המודל לרב-תכליתי ובעל ערך במיוחד על פני תרחישי יישום מגוונים.

משתמשים יכולים להתנסות בתכונות מוקדמות שונות, כולל:

  • דיאלוג אפקטיבי: המודל מזהה רגש בקולו של המשתמש ומגיב בהתאם. פונקציונליות זו מוסיפה שכבות של בינה רגשית ל-AI, מה שהופך את האינטראקציה למותאמת אישית יותר.

  • שמע פרואקטיבי: המודל מתעלם משיחות רקע ויודע מתי להגיב, מצמצם הפרעות ושיפור הבהירות. תכונה זו משפרת את איכות האינטראקציה, ומאפשרת תקשורת יעילה וממוקדת יותר.

  • חשיבה ב-Live API: המודל ממנף את יכולות החשיבה של ג’מיני כדי לתמוך במשימות מורכבות יותר. זה מאפשר ניתוח מעמיק יותר ושיקול דעת בפתרון משימות מורכבות, מה שהופך אותו לבעל ערך יוצא דופן בתחומים הדורשים פתרונות מדויקים ובעלי תובנה.

גוגל גם משחררת תצוגות מקדימות חדשות ליכולת טקסט לדיבור הן ב-2.5 Pro והן ב-2.5 Flash. אלה מספקים תמיכה ראשונה מסוגה במספר רמקולים, המאפשרים טקסט לדיבור בשני קולות באמצעות פלט שמע מקורי. תכונה זו חשובה במיוחד ליצירת נרטיבים מרתקים ודיאלוגים ביישומי מולטימדיה.

כמו דיאלוג שמע מקורי, טקסט לדיבור הוא אקספרסיבי ויכול ללכוד ניואנסים עדינים כגון לחישות. הוא תומך ביותר מ-24 שפות ועובר ביניהן בצורה חלקה, מה שהופך אותו לכלי רב-תכליתי לתקשורת גלובלית. עדינות זו בשימוש בשפה מעשירה את חוויית המשתמש, ומאפשרת תהליך תקשורת מגוון ומותאם אישית יותר.

יכולת טקסט לדיבור זו תהיה זמינה בהמשך היום ב-Gemini API.

ממשק מחשב משופר

גוגל מציגה את יכולות השימוש במחשב של Project Mariner בתוך Gemini API וב-Vertex AI. חברות בעלות חזון קדימה כגון Automation Anywhere, UiPath, Browserbase, Autotab, The Interaction Company ו-Cartwheel חוקרות את הפוטנציאל שלה. גוגל מצפה להשקה רחבה יותר למפתחים כדי להתנסות ביכולת זו בקיץ הקרוב, ולסלול את הדרך לפרויקטים ופתרונות חדשניים. היכולת לשלב מודלים של AI ישירות עם ממשקי מחשב מובילה לפתרונות זרימתעבודה יעילים ופרודוקטיביים יותר על פני תעשיות מגוונות.

אמצעי אבטחה מעולים

גוגל חיזקה משמעותית את ההגנות שלה מפני איומי אבטחה, כגון הזרקות הנחיות עקיפות. זה כרוך בהטמעת הוראות זדוניות בנתונים שאוחזרו על ידי מודל AI. גישת האבטחה החדשה של גוגל הגדילה באופן משמעותי את שיעור ההגנה של ג’מיני מפני התקפות הזרקת הנחיות עקיפות במהלך שימוש בכלי, מה שהופך את ג’מיני 2.5 למשפחת המודלים המאובטחת ביותר שלה עד כה. אבטחה משופרת זו מבטיחה למשתמשים חוויה בטוחה ואמינה בעת אימוץ פתרונות מונעי AI.

חוויית מפתח משופרת

סיכומי מחשבות

גם 2.5 Pro וגם Flash יכללו כעת סיכומי מחשבות ב-Gemini API וב-Vertex AI. סיכומים אלה לוקחים את המחשבות הגולמיות של המודל ומארגנים אותם לפורמט ברור עם כותרות, פרטים מרכזיים ומידע על פעולות מודל, כגון כאשר הם משתמשים בכלי עבודה. על ידי הצעת תובנות לגבי התהליך האנליטי של ה-AI, סיכומי מחשבות עוזרים להבין ולנפות באגים בנושאים בתוך מערכות AI, שיפור יעילות ועיצוב מערכת.

עם פורמט מובנה ויעיל יותר בתהליך החשיבה של המודל, מפתחים ומשתמשים ימצאו את האינטראקציות עם מודלי ג’מיני קלים יותר להבנה ולניפוי באגים.

תקציבי חשיבה

גוגל השיקה את 2.5 Flash עם תקציבי חשיבה כדי לתת למפתחים שליטה רבה יותר על עלויות על ידי איזון חביון ואיכות. יכולת זו מורחבת כעת ל-2.5 Pro, ומעניקה לך אפשרויות כוונון עדין רבות יותר. על ידי שליטה באסימונים המשמשים ואופטימיזציה של משאבים, מפתחים יכולים להשיג את האיזון המתאים בין עלות חישובית ליעילות פתרון, מה שהופך את יישום AI לחסכוני ויעיל כאחד.

זה מאפשר שליטה מלאה על מספר האסימונים שמודל משתמש בהם כדי לחשוב לפני שהוא מגיב, או אפילו לכבות את יכולות החשיבה שלו.

ג’מיני 2.5 Pro עם תקציבים יהיה זמין בדרך כלל לשימוש יציב בייצור בשבועות הקרובים, יחד עם המודל הזמין בדרך כלל.

תאימות לכלי MCP

גוגל הוסיפה תמיכת SDK מקורית להגדרות Model Context Protocol (MCP) ב-Gemini API לשילוב קל יותר עם כלי קוד פתוח. שיטות פריסה שונות, כמו שרתי MCP וכלי אירוח, נחקרות כדי להקל על משתמשים לבנות יישומים סוכנים. זה משפר את סביבת הפיתוח של AI באמצעות מגוון רחב יותר של אפשרויות לשילוב כלי שיתוף פעולה בפרויקטים.

חדשנות מתמשכת היא המפתח במחויבות המתמשכת לשיפור המודלים וחוויית המפתח, מה שהופך אותם ליעילים, בעלי ביצועים ותגובתיים יותר למשוב המפתחים. הכפל את הרוחב והעומק של מחקר יסודי כדי לדחוף את גבולות יכולותיו של ג’מיני. העתיד טומן בחובו עוד.