Ernie 4.5: מעצמה רב-מודאלית
Ernie 4.5, עם היכולות הרב-מודאליות הנרחבות שלו הכוללות תמונות, אודיו ווידאו, הראה ביצועים מעולים בהשוואה ל-GPT-4o של OpenAI. ביצועים טובים אלה נצפו במגוון פלטפורמות ביצועים, כולל CCBench ו-OCRBench הבולטות, כמפורט בהצהרה שפרסמה באידו בפלטפורמת WeChat. יתר על כן, החברה טוענת כי יכולות הטיפול בטקסט של מודל היסוד Ernie 4.5 לא רק עולות על אלה של DeepSeek V3, אלא גם משיגות רמת ביצועים הדומה בערך לזו של GPT-4.5 של OpenAI, בהתבסס על סדרה של הערכות ביצועים.
תפקידה החלוצי של באידו ועליית התחרות
באידו מחזיקה בתואר החברה הטכנולוגית הסינית הגדולה הראשונה שהציגה LLM בתוך סין. מהלך חלוצי זה התרחש במרץ 2023, ברכיבה על גל ההתרגשות שנוצר על ידי השקת ChatGPT של OpenAI. עם זאת, היתרון הראשוני של באידו אותגר יותר ויותר על ידי שחקני AI מתעוררים אחרים בסין במהלך השנתיים האחרונות. התמרון האסטרטגי האחרון של ענקית החיפוש לחזק את מעמדה בשוק הבינה המלאכותית של סין מגיע בתקופה שבה DeepSeek הציתה מגמה של קוד פתוח. במקביל, ענקיות התעשייה כמו Alibaba, Tencent ו-ByteDance רודפות באגרסיביות הן אחר משתמשים עסקיים והן אחר משתמשים צרכניים עבור מודלי הבינה המלאכותית שלהן.
Ernie X1: ביצועים ותמחור
בעוד שבאידו לא חשפה תוצאות ביצועים ספציפיות עבור מודל החשיבה החדש שלה, Ernie X1, החברה הצהירה כי הוא “מספק ביצועים ברמה של DeepSeek R1 במחיר של חצי בלבד”. הצהרה זו מרמזת על יתרון תחרותי משמעותי מבחינת עלות-תועלת.
עבור עסקים המבקשים לשלב את היכולות של Ernie X1, התמחור עבור גישה לממשק תכנות היישומים (API) שלו בנוי באופן הבא: 2 יואן (כ-0.28 דולר ארה”ב) למיליון אסימוני קלט ו-8 יואן למיליון אסימוני פלט. לעומת זאת, DeepSeek גובה כיום 0.55 דולר ארה”ב למיליון אסימוני קלט ו-2.19 דולר ארה”ב למיליון אסימוני פלט עבור DeepSeek-reasoner שלה, המונע על ידי מודל החשיבה R1 שלה. ראוי לציין כי DeepSeek, סטארט-אפ הממוקם בהאנגג’ואו, יישם לאחרונה עלייה במחירי ה-API שלו בתגובה לעלייה משמעותית בביקוש.
המעבר של באידו לקוד פתוח
רובין לי ינהונג, המייסד, היו”ר והמנכ”ל של באידו, פרסם הודעה בולטת בחודש שעבר בנוגע לעתידו של Ernie 4.5. הוא חשף כי המודל יהפוך לקוד פתוח החל מ-30 ביוני. החלטה זו מייצגת סטייה משמעותית מתמיכתו הנחרצת הקודמת בפיתוח AI בקוד סגור, ומסמנת תפנית של 180 מעלות בגישתו.
לי פירט על השינוי האסטרטגי הזה במהלך שיחת רווחים עם אנליסטים בפברואר, ואמר, “דבר אחד שלמדנו מ-DeepSeek הוא שקוד פתוח של המודלים הטובים ביותר יכול לעזור מאוד לאימוץ”. הוא הסביר עוד, “כאשר המודל הוא קוד פתוח, אנשים באופן טבעי רוצים לנסות אותו מתוך סקרנות, מה שעוזר להניע אימוץ רחב יותר”. הכרה זו ביתרונות של פיתוח קוד פתוח מדגישה את האסטרטגיה המתפתחת של באידו בנוף התחרותי של הבינה המלאכותית.
ביצועים עסקיים של באידו על רקע התקדמות הבינה המלאכותית
למרות ההתקדמות הבולטת שבאידו עשתה בתחום הבינה המלאכותית, העסקים הכוללים של החברה מתמודדים עם רוחות נגד עקב הכנסות חלשות יותר מפרסום. דוחות כספיים אחרונים מצביעים על כך שההכנסות הכוללות של באידו ברבעון הרביעי חוו ירידה של 2 אחוזים משנה לשנה. יתר על כן, ההכנסות לשנה כולה ראו גם ירידה של 1 אחוז. נתונים אלה מדגישים את האתגרים העומדים בפני באידו באיזון בין השקעותיה בטכנולוגיית AI מתקדמת לבין הצורך לשמור על ביצועים פיננסיים חזקים.
הרחבה על ההיבטים המרכזיים
כדי לספק הבנה מקיפה יותר, הבה נתעמק בכמה מההיבטים הקריטיים של ההכרזה של באידו וההקשר הרחב יותר של נוף הבינה המלאכותית בסין.
המשמעות של רב-מודאליות:
הדגש על יכולות “רב-מודאליות” הן ב-Ernie 4.5 והן ב-Ernie X1 הוא מכריע. LLMs מסורתיים התמקדו בעיקר בעיבוד מבוסס טקסט. עם זאת, היכולת לעבד ולהבין מידע ממודאליות שונות – תמונות, אודיו ווידאו – פותחת מגוון עצום של אפשרויות חדשות. זה כולל:
- זיהוי תמונה משופר: מודלי AI יכולים כעת לא רק לזהות אובייקטים בתמונות אלא גם להבין את ההקשר והיחסים ביניהם.
- תמלול וניתוח אודיו משופרים: תמלול שפה מדוברת בדיוק רב יותר ואפילו זיהוי ניואנסים כמו רגש וכוונה בהקלטות אודיו.
- הבנת וידאו: ניתוח תוכן וידאו כדי לזהות סצנות, פעולות ואפילו לחזות אירועים עתידיים.
הדיון בקוד פתוח:
ההחלטה של רובין לי להפוך את Ernie 4.5 לקוד פתוח היא התפתחות משמעותית בדיון המתמשך בין פיתוח AI בקוד סגור לקוד פתוח.
- קוד סגור: תומכי גישה זו טוענים שהיא מאפשרת שליטה טובה יותר בטכנולוגיה, ומבטיחה את השימוש האחראי בה ומונעת שימוש לרעה. זה גם מאפשר לחברות להגן על הקניין הרוחני שלהן ולשמור על יתרון תחרותי.
- קוד פתוח: תומכי פיתוח קוד פתוח מאמינים שהוא מטפח שיתוף פעולה, מאיץ חדשנות ומקדם שקיפות. זה מאפשר לחוקרים ולמפתחים ברחבי העולם לתרום לקידום טכנולוגיית הבינה המלאכותית.
המעבר של באידו לקוד פתוח, לפחות עבור Ernie 4.5, מרמז על הכרה במומנטום הגובר של תנועת הקוד הפתוח וביתרונות הפוטנציאליים שלה.
הנוף התחרותי:
מרוץ הבינה המלאכותית בסין הוא אינטנסיבי, כאשר חברות רבות מתחרות על דומיננטיות.
- Alibaba: ה-LLM Tongyi Qianwen של Alibaba הוא מתחרה מרכזי, והחברה משלבת באופן פעיל AI ביחידות העסקיות השונות שלה, כולל מסחר אלקטרוני, מחשוב ענן ולוגיסטיקה.
- Tencent: ה-LLM Hunyuan של Tencent הוא שחקן משמעותי נוסף, והחברה ממנפת את הבינה המלאכותית כדי לשפר את פלטפורמות המדיה החברתית שלה, היצע המשחקים ושירותי הענן שלה.
- ByteDance: חברת האם של TikTok, ByteDance, משקיעה גם היא רבות בבינה מלאכותית, תוך שימוש בה כדי להפעיל את אלגוריתמי ההמלצות שלה ולפתח מוצרים חדשים.
- DeepSeek: דיפסיק היא מתחרה אדירה בתחום ה-LLM.
ההשפעה של תמחור:
אסטרטגיית התמחור האגרסיבית של באידו עבור Ernie X1, החותכת את התמחור של DeepSeek בחצי, היא אינדיקציה ברורה לכוונתה להשיג נתח שוק. מלחמת מחירים זו עשויה להועיל לעסקים ולצרכנים על ידי הפיכת טכנולוגיית הבינה המלאכותית לנגישה וזולה יותר.
ההשלכות הרחבות יותר:
להתקדמות של באידו בבינה מלאכותית, יחד עם התחרות העזה בשוק הסיני, יש השלכות מרחיקות לכת:
- התקדמות טכנולוגית: קצב החדשנות המהיר מניע את הפיתוח של מודלי AI מתוחכמים יותר ויותר עם יכולות רחבות יותר.
- השפעה כלכלית: AI עומד לשנות תעשיות שונות, להגביר את הפרודוקטיביות, ליצור מקומות עבודה חדשים ולעצב מחדש את הנוף הכלכלי העולמי.
- השפעה חברתית: האימוץ הנרחב של AI מעלה שאלות אתיות וחברתיות חשובות שיש לטפל בהן, כולל סוגיות הקשורות להטיה, פרטיות ועקירת מקומות עבודה.
פירוט נוסף על האסטרטגיה של באידו
האסטרטגיה של באידו נראית רבת פנים, וכוללת הן חדשנות טכנולוגית והן מיצוב שוק.
1. יכולת טכנולוגית:
- התמקדות ברב-מודאליות: באידו נותנת עדיפות ברורה לפיתוח מודלי AI רב-מודאליים, מתוך הכרה בפוטנציאל של טכנולוגיה זו לפתוח יישומים ויכולות חדשים.
- שיפור מתמיד: השקת Ernie 4.5 ו-Ernie X1 מדגימה את המחויבות של באידו למחקר ופיתוח מתמשכים, תוך דחיפה מתמדת של גבולות ביצועי הבינה המלאכותית.
- אימוץ קוד פתוח: ההחלטה להפוך את Ernie 4.5 לקוד פתוח מסמנת נכונות לעסוק בקהילת הבינה המלאכותית הרחבה יותר ולתרום לקידום הקולקטיבי של התחום.
2. מיצוב שוק:
- תמחור תחרותי: התמחור האגרסיבי של Ernie X1 הוא מהלך אסטרטגי למשוך משתמשים ולהשיג נתח שוק בנוף ה-LLM התחרותי ביותר.
- מיקוד בעסקים: ההתמקדות בגישת API מצביעה על כך שבאידו מכוונת באופן פעיל לעסקים המבקשים לשלב AI בפעילותם.
- טיפול בחולשות: החברה מכירה ומטפלת באתגרים שלה, כגון הירידה בהכנסות מפרסום, על ידי מינוף התקדמות הבינה המלאכותית שלה כדי לגוון את ההיצע שלה ולחקור מקורות הכנסה חדשים.
3. חזון לטווח ארוך:
- מנהיגות AI: הפעולות של באידו מצביעות על שאיפה ברורה להפוך למובילה בנוף הבינה המלאכותית העולמי, לא רק בתוך סין.
- טכנולוגיה טרנספורמטיבית: נראה שהחברה רואה בבינה מלאכותית טכנולוגיה טרנספורמטיבית עם פוטנציאל לעצב מחדש את עסקיה ולתרום להתקדמות חברתית רחבה יותר.
- יכולת הסתגלות: הנכונות של באידו להתאים את האסטרטגיה שלה, כפי שמעיד המעבר לפיתוח קוד פתוח, מדגימה את הזריזות וההיענות שלה לדינמיקה המתפתחת של תעשיית הבינה המלאכותית.
למעשה, באידו ממצבת את עצמה ככוח מרכזי במהפכת הבינה המלאכותית, תוך שילוב של חדשנות טכנולוגית עם תמרונים אסטרטגיים בשוק כדי להשיג את מטרותיה השאפתניות. ההתקדמות של החברה והתחרות המתמשכת בשוק הבינה המלאכותית הסיני יהיו במעקב צמוד מכיוון שיש להן השלכות משמעותיות על עתיד הבינה המלאכותית בעולם.