באידו, כוח דומיננטי בנוף הטכנולוגי של סין, השיקה שני עדכונים משמעותיים למודל הבסיס שלה ERNIE (Enhanced Representation through Knowledge Integration). איטרציות חדשות אלו, ERNIE X1 ו-ERNIE 4.5, מייצגות את התגובה האסטרטגית של באידו לנוף הבינה המלאכותית הגלובלית התחרותי יותר ויותר, ובמיוחד להתקדמות שנעשתה על ידי חברות סיניות ואמריקאיות כאחד. מודלים אלה אינם רק שדרוגים מצטברים; הם נועדו להתחרות ראש בראש עם כמה ממערכות הבינה המלאכותית המתקדמות ביותר הקיימות, ומתהדרים ביכולות שלדברי באידו, תואמות או עולות על אלו של יריביהם. שני המודלים נגישים למשתמשים דרך הצ’אטבוט ERNIE Bot, ובאידו מתכננת שילוב הדרגתי במגוון המוצרים הרחב יותר שלה, כולל Baidu Search.
העיתוי של מהדורה זו הוא קריטי. תחום הבינה המלאכותית היוצרת חווה תקופה של חדשנות מהירה ויריבות עזה, עם דגש מיוחד על הדינמיקה בין סין לארצות הברית. DeepSeek, סטארט-אפ AI סיני, לכד את תשומת הלב של התעשייה בתחילת 2025 עם R1, מודל חשיבה בקוד פתוח שעל פי הדיווחים ביצע ביצועים טובים יותר ממודלי AI מובילים בעלות נמוכה משמעותית. מהלך זה הניע את DeepSeek לפני מתחרים הן בסין והן בארה”ב, כולל באידו. באידו, לעומת זאת, הייתה אחת החברות הסיניות הראשונות שהציגה מתחרה ל-ChatGPT, בשם ERNIE Bot.
מבט מקרוב על המודלים החדשים של באידו: ERNIE X1 ו-ERNIE 4.5
ERNIE X1 ו-ERNIE 4.5, שניהם פותחו על ידי באידו, הם מודלי בסיס נפרדים המותאמים ליישומים שונים:
ERNIE X1: מודל זה ממוצב כמנוע חשיבה בעל יעילות גבוהה, המתחרה ישירות במודלים כמו DeepSeek R1 ו-o3 mini של OpenAI. הוא מיועד למשימות הדורשות עיבוד לוגי מורכב ופתרון בעיות רב-שלבי.
ERNIE 4.5: מודל זה הוא AI רב-מודאלי גדול, המסוגל לעבד ולהבין צורות שונות של מדיה – טקסט, תמונות, אודיו ווידאו. הוא מתחרה במודלים כמו GPT-4o ו-Gemini של Google.
הופעתו של R1 של DeepSeek גרמה לשינוי בסדרי העדיפויות של שחקני AI מרכזיים כמו Google, OpenAI, Anthropic ו-xAI. חברות אלו החלו להתמקד ביעילות ובמחיר סביר, לצד קנה המידה הגולמי של המודל. ההשקה של ERNIE X1 על ידי באידו, בפרט, מסמנת את כניסתה למירוץ הבינה המלאכותית העולמי הזה, ומציעה ביצועים דומים ל-R1 ולמודלים אחרים, פוטנציאלית בנקודת מחיר תחרותית אף יותר.
באידו מדגישה כי 2025 היא שנה מרכזית עבור האבולוציה של מודלי שפה גדולים וטכנולוגיות קשורות. ההודעה לעיתונות של החברה מדגישה את מחויבותה המתמשכת להשקעה בבינה מלאכותית, מרכזי נתונים ותשתיות ענן, במטרה לשפר עוד יותר את יכולות הבינה המלאכותית שלה ולפתח מודלים חזקים אף יותר מהדור הבא.
ERNIE X1: צלילה לתוך חשיבה מעמיקה
ERNIE X1 הוא מודל שפה שתוכנן במיוחד עבור “חשיבה מעמיקה”. זה מבדיל אותו ממודלי שפה מסורתיים המצטיינים ביצירת תגובות מהירות המבוססות על דפוסים. מודלי חשיבה, לעומת זאת, נועדו לנתח בעיות מורכבות לסדרה של צעדים לוגיים. הם מעריכים פתרונות פוטנציאליים שונים ומעדנים את תשובותיהם לפני הצגת פלט סופי. זה הופך אותם למתאימים במיוחד למשימות הכוללות תכנון רב-שלבי, הסקה לוגית ופתרון בעיות מורכב.
באידו מייחסת את יכולת החשיבה של ERNIE X1 למספר טכניקות מתקדמות, כולל:
- Progressive Reinforcement Learning: זה מצביע על תהליך למידה איטרטיבי שבו המודל משפר ללא הרף את ביצועיו באמצעות משוב.
- End-to-End Training: זה מרמז על גישת אימון הוליסטית שבה המודל כולו ממוטב בו זמנית, ולא בשלבים נפרדים.
- Chains of Thought and Action: טכניקה זו מאפשרת ככל הנראה למודל לעקוב אחר רצף של צעדים לוגיים, תוך חיקוי תהליכי חשיבה אנושיים.
- Unified Multi-faceted Reward System: זה מצביע על מערכת מתוחכמת להערכה ותגמול של ביצועי המודל על פני היבטים שונים של חשיבה.
בעוד שבאידו לא חשפה פרטים טכניים ממצים, שיטות אלו מצביעות על התמקדות בלמידה איטרטיבית, הבנה הקשרית וחשיבה מובנית – חוזקות האופייניות גם למודלי חשיבה מוצלחים אחרים.
ביישומים מעשיים, באידו טוענת ש-ERNIE X1 מפגין “יכולות משופרות בהבנה, תכנון, רפלקציה ואבולוציה”. החברה מדגישה את בקיאותה בתחומים כגון:
- Literary Creation: יצירת פורמטים של טקסט יצירתי.
- Manuscript Writing: סיוע בניסוח מסמכים ארוכים יותר.
- Dialogue: השתתפות בשיחות טבעיות וקוהרנטיות.
- Logical Reasoning: פתרון בעיות הדורשות הסקה לוגית.
- Complex Calculations: ביצוע פעולות מתמטיות מורכבות.
- ‘Chinese Knowledge’: יכולת לא מוגדרת זו מתייחסת ככל הנראה להבנה עמוקה של השפה, התרבות וההקשר הסיניים.
כתוצאה מכך, ERNIE X1 צפוי להפעיל מגוון רחב של יישומים, כולל:
- Search Engines: שיפור תוצאות החיפוש עם הבנה מעודנת יותר.
- Document Summarization and Q&A: מתן סיכומים תמציתיים ותשובות מדויקות לשאלות.
- Image Understanding and Generation: פירוש ויצירה של תוכן חזותי.
- Code Interpretation: ניתוח והבנה של קוד תכנות.
- Webpage Analysis: חילוץ מידע מרכזי מדפי אינטרנט.
- Mind Mapping: יצירת ייצוגים חזותיים של רעיונות ומושגים.
- Academic Research: סיוע במשימות מחקר בתחומים שונים.
- Business and Franchise Information Search: מתן מידע רלוונטי לשאילתות עסקיות.
ERNIE X1: השוואה מול המתחרים
בעוד שבאידו לא פרסמה ציוני Benchmark ספציפיים או הערכות מפורטות עבור ERNIE X1, היא טוענת שביצועי המודל “שווים ל-“ DeepSeek R1, בעוד שהוא מוצע ב”חצי המחיר בלבד”. נכון לעכשיו, באידו לא סיפקה השוואות עם מודלי חשיבה אחרים בשוק. היעדר נתונים השוואתיים מפורטים זה מקשה על הערכה מלאה של מעמדו התחרותי של ERNIE X1, אך הטענה לביצועים דומים בעלות נמוכה יותר בהחלט ראויה לציון.
ERNIE 4.5: אימוץ יכולות רב-מודאליות מקוריות
ERNIE 4.5 מוצג על ידי באידו כ”מודל רב-מודאלי מקורי”. משמעות הדבר היא שהוא נועד לשלב ולהבין בצורה חלקה צורות שונות של מדיה – טקסט, תמונות, אודיו ווידאו – במסגרת מאוחדת. בניגוד למערכות AI רבות המעבדות סוגי מדיה שונים בנפרד, ERNIE 4.5 מתוכנן לשלב את המודאליות הללו ואף להמיר ביניהן (למשל, טקסט לאודיו ולהיפך).
באידו מדגישה כי ERNIE 4.5 “משיג אופטימיזציה שיתופית באמצעות מודלים משותפים של מספר מודאליות, ומפגין יכולות הבנה רב-מודאליות יוצאות דופן”. זה מצביע על גישה מתוחכמת שבה המודל לומד להבין ולקשר מידע בין סוגי מדיה שונים.
בנוסף ליכולת הרב-מודאלית שלו, ERNIE 4.5 מתגאה ב”כישורי שפה מעודנים”, המשפרים את יכולות ההבנה והיצירה שלו, כמו גם את יכולות החשיבה הלוגית, הזיכרון והקידוד שלו. באידו גם מדגישה את ה”אינטליגנציה החזקה” ואת ה”מודעות ההקשרית” של המודל, ובמיוחד את יכולתו לזהות תוכן ניואנסי כמו ממים באינטרנט וקריקטורות סאטיריות. זה מצביע על התמקדות בהבנה לא רק של המשמעות המילולית של התוכן, אלא גם של ההקשר התרבותי והחברתי שלו.
יתר על כן, באידו טוענת כי ERNIE 4.5 פחות רגיש ל”הזיות” – בעיה נפוצה ב-AI שבה מודלים מייצרים מידע שקרי או מטעה שעשוי להיראות סביר במבט ראשון. זהו שיפור מכריע, שכן הזיות עלולות לערער את האמינות והמהימנות של מערכות AI.
באידו מייחסת את ההתקדמות הללו למספר טכנולוגיות מפתח, כולל:
- Spatiotemporal Representation Compression: זה מתייחס ככל הנראה לטכניקות לייצוג ועיבוד יעיל של מידע המשתנה לאורך זמן ומרחב, כגון תוכן וידאו.
- Knowledge-Centric Training Data Construction: זה מצביע על התמקדות בבניית מערכי נתונים לאימון עשירים בידע עובדתי.
- Self-Feedback Enhanced Post-Training: זה מרמז על מנגנון שבו המודל יכול ללמוד מהתפוקות שלו ולשפר את ביצועיו לאורך זמן.
- Heterogeneous Multimodal Mixture-of-Experts (MoE): גישה זו משתמשת במודלים “מומחים” קטנים יותר ומתמחים המופעלים רק בעת הצורך. זה מייעל את הביצועים ומפחית את עלויות החישוב. מודלי MoE הם לעתים קרובות קטנים יותר וחסכוניים יותר ממודלים מסורתיים המבוססים על טרנספורמרים, אך הם יכולים להשיג ביצועים דומים או אפילו טובים יותר, מה שהופך אותם לאופציה אטרקטיבית לפיתוח AI.
במבט קדימה, דיווחים מצביעים על כך שבאידו מתכננת לשחרר את ERNIE 5 מאוחר יותר בשנת 2025, ומבטיחה “שיפורים גדולים” ביכולות הרב-מודאליות שלה. זה מצביע על מחויבות מתמשכת לפרוץ את גבולות הבינה המלאכותית הרב-מודאלית.
ERNIE 4.5: ניתוח השוואתי
באידו השוותה ישירות את היכולות הרב-מודאליות של ERNIE 4.5 ל-GPT-4o של OpenAI. החברה טוענת כי ERNIE 4.5 עלה בביצועיו על GPT-4o כמעט בכל Benchmark, למעט MMU (Massive Multi-discipline Understanding). MMU מעריך מודלים על מגוון רחב של משימות ברמת קולג’ הדורשות ידע מעמיק בנושא וחשיבה מכוונת. זה מצביע על כך שבעוד ש-ERNIE 4.5 מצטיין בתחומים רבים, ל-GPT-4o עשוי עדיין להיות יתרון במשימות הדורשות ידע אקדמי מיוחד.
באידו מציגה גם תוצאות Benchmark המצביעות על כך ש-ERNIE 4.5 עולה על GPT-4o ו-GPT-4.5 של OpenAI, כמו גם על V3 של DeepSeek, במספר תחומים אחרים, כולל:
- C-Eval: Benchmark זה מעריך ידע מתקדם ויכולות חשיבה בתחומים שונים, ממדעי הרוח ועד מדע והנדסה. הביצועים החזקים של ERNIE 4.5 כאן מצביעים על הבנה רחבה של נושאים מגוונים.
- CMMLU: Benchmark זה מעריך ידע ויכולות חשיבה בהקשר הספציפי של השפה והתרבות הסינית. ההצלחה של ERNIE 4.5 כאן מדגישה את בקיאותו בתחום זה.
- GSM8K: Benchmark זה מעריך חשיבה רב-שלבית באמצעות בעיות מתמטיקה בבית הספר היסודי. הביצועים של ERNIE 4.5 מצביעים על יכולות חזקות בחשיבה מתמטית.
- DROP: Benchmark זה מודד את יכולות הבנת הנקרא של LLM. התוצאות של ERNIE 4.5 מצביעות על רמה גבוהה של הבנת טקסט.
חשוב להכיר בכך, עם זאת, שרבים מה-Benchmarks שבהם ERNIE 4.5 הפגין ביצועים מעולים התמקדו במיוחד בשפה ובתרבות הסינית. זה עשוי להסביר באופן חלקי מדוע GPT-4o ו-GPT-4.5, מודלים שפותחו על ידי חברה אמריקאית, לא הצליחו באותה מידה. אף על פי כן, ERNIE 4.5 גם עלה בביצועיו על DeepSeek-V3, מודל שפותח על ידי חברה סינית, ברבים מה-Benchmarks הללו, מה שמצביע על יתרון תחרותי אמיתי בהקשר הסיני.
לעומת זאת, ERNIE 4.5 על פי הדיווחים לא הצליח באותה מידה ב-Benchmarks מסוימים אחרים, כולל:
- MMLU-Pro: Benchmark זה מעריך הבנת שפה על פני קבוצה רחבה ומאתגרת יותר של משימות. GPT-4.5 עלה בביצועיו על ERNIE 4.5 כאן, מה שמצביע על יתרון פוטנציאלי בהבנת שפה כללית.
- GPQA: Benchmark זה כולל מערך נתונים של שאלות רב-ברירה שנכתבו על ידי מומחים בביולוגיה, פיזיקה וכימיה. GPT-4.5 שוב עלה בביצועיו על ERNIE 4.5, מה שמצביע על הבנה חזקה יותר של ידע מדעי מיוחד.
- Math-500: Benchmark זה בודק את היכולת לפתור בעיות מתמטיות מאתגרות ברמת תיכון. גם DeepSeek-V3 וגם GPT-4.5 עלו בביצועיהם על ERNIE 4.5, מה שמצביע על צורך בשיפור נוסף בחשיבה מתמטית מתקדמת.
- LiveCodeBench: Benchmark זה מודד יכולות קידוד. GPT-4.5 עלה בביצועיו על ERNIE 4.5, מה שמצביע על יתרון פוטנציאלי ביצירת קוד והבנתו.
למרות הביצועים העדיפים של GPT-4.5 בכמה Benchmarks, באידו מדגישה כי ERNIE 4.5 מתומחר ב-1% בלבד מהמודל של OpenAI. הבדל עלויות משמעותי זה עשוי להפוך את ERNIE 4.5 לאופציה אטרקטיבית ביותר עבור עסקים ומפתחים המחפשים פתרון AI רב-מודאלי חסכוני.
גישה ל-ERNIE X1 ו-ERNIE 4.5
ERNIE 4.5 נגיש כעת דרך ה-API שלו ובפלטפורמת MaaS (Model-as-a-Service) של Baidu AI Cloud, Qianfan. מחירי הקלט מתחילים ב-0.004 יואן סיני לאלף טוקנים, ומחירי הפלט מתחילים ב-0.016 יואן סיני לאלף טוקנים. באידו מצהירה כי ERNIE X1 יהיה זמין בפלטפורמה “בקרוב”, כאשר מחירי הקלט מתחילים ב-0.002 יואן סיני לאלף טוקנים ומחירי הפלט מתחילים ב-0.008 יואן סיני לאלף טוקנים.
משתמשים יכולים גם ליצור אינטראקציה עם שני המודלים דרך הצ’אטבוט של באידו, ERNIE Bot, המספק ממשק נוח וידידותי למשתמש לחקירת היכולות שלהם.
מבנה התמחור הספציפי ופרטי הזמינות מדגישים את מחויבותה של באידו להפוך את מודלי הבינה המלאכותית המתקדמים הללו לנגישים למגוון רחב של משתמשים, ממפתחים בודדים ועד ארגונים גדולים. התמחור התחרותי, במיוחד עבור ERNIE X1, ממצב את באידו כמתחרה חזקה בשוק הבינה המלאכותית העולמי, ומציע אלטרנטיבה משכנעת למודלים של ענקיות טכנולוגיה אמריקאיות.