המהפכה של DeepSeek: עיצוב מחדש של ה-AI בסין

אפקט ה”דג קרב”: ההפרעה הלא מכוונת של DeepSeek

ההשפעה של DeepSeek חורגת מגבולות סין, ומשפיעה הן על וול סטריט והן על עמק הסיליקון. עם זאת, השפעתה מורגשת בצורה החריפה ביותר בתוך קהילת הבינה המלאכותית הסינית, שם היא האפילה על שחקנים מבוססים כמו Moonshot AI ו-MiniMax.

ליאנג וונפנג, הכוח המניע מאחורי DeepSeek, הודה בראיון ביולי 2024 שהחברה הפכה שלא במתכוון ל”דג קרב” בשוק הבינה המלאכותית של סין. מונח מטפורי זה מתייחס לאלמנט תחרותי שמעורר פעילות ומונע קיפאון בתעשייה מסוימת. בעוד שהכוונה הראשונית של DeepSeek אולי לא הייתה לשבש, שחרור מודל V2 שלה ביולי 2024 עורר מלחמת מחירים, והמהדורות הבאות (V3 בדצמבר ו-R1 בינואר) חיזקו עוד יותר את תפקידה המשבש. התקדמות זו הציבה שאלות קיומיות עבור שחקנים רבים בשוק מודלי הבינה המלאכותית הצפוף ממילא בסין.

סטייה בגישות: סין מול ארה”ב

באופן פרדוקסלי, השיבוש של DeepSeek עשוי היה בסופו של דבר להועיל למערכת האקולוגית של הבינה המלאכותית בסין. על ידי דחיקת גבולות היכולות של מודל הבינה המלאכותית והפיכת הטכנולוגיה לנגישה יותר, DeepSeek, על פי כמה אנליסטים, העניקה לסין “יתרון”.

גרייס שאו, אנליסטית בינה מלאכותית ומייסדת עלון התעשייה AI Proem, מדגישה הבדל מרכזי באופן שבו ניגשים לבינה מלאכותית בסין לעומת ארצות הברית. לפני R1 של DeepSeek, סטארט-אפים סיניים רבים בתחום הבינה המלאכותית התמקדו ביישומים הפונים לצרכן. האסטרטגיות מונעות על ידי אסטרטגיית המונטיזציה מעידן האינטרנט הסלולרי. לעומת זאת, ארה”ב אימצה במידה רבה את הבינה המלאכותית ככלי לשיפור הפרודוקטיביות הארגונית והמשרדית.

שאו מייחסת את ההבדל הזה להבדלים כלכליים מבניים בין שני השווקים. עם זאת, היא מדגישה כי יכולות מודל חזקות נותרו אבן הפינה של תעשיית הבינה המלאכותית, ללא קשר ליישום הספציפי.

המירוץ להדביק את הפער: סטארט-אפים סיניים בתחום הבינה המלאכותית מגיבים

מתוך הכרה בחשיבותם של פיתוחי בינה מלאכותית בסיסיים, מפתחי מודלים סיניים אחרים בתחום הבינה המלאכותית שואפים כעת לצמצם את הפער מול DeepSeek.

Zhipu AI: הבטחת מימון ואימוץ קוד פתוח

Zhipu AI, סטארט-אפ מבייג’ינג שמקורו באוניברסיטת Tsinghua, הודיע לאחרונה על סבב גיוס משמעותי של מיליארד יואן (140 מיליון דולר). השקעה זו כללה תמיכה מממשלת העיר האנגג’ואו, שם הקימה Zhipu AI חברת בת.

מעבר להבטחת מימון, Zhipu AI אימצה גם את תנועת הקוד הפתוח. החברה הפכה את מודלי הבינה המלאכותית והסוכנים שלה לזמינים למפתחים, תוך טיפוח שיתוף פעולה וחדשנות בתוך הקהילה הרחבה יותר. דוגמה עדכנית למחויבות זו היא שחרורו של CogView-4, מודל קוד פתוח להמרת טקסט לתמונה המסוגל ליצור תווים סיניים.

נחשול הקוד הפתוח: שינוי תרבותי

המגמה לעבר פיתוח קוד פתוח במגזר הבינה המלאכותית בסין משקפת שינוי תרבותי רחב יותר.

למה קוד פתוח?

  • רצון להוכיח חדשנות: עבור דור של יזמים שנולדו בשנות ה-80 וה-90, יש רצון עז להוכיח שחברות סיניות מסוגלות לחדשנות אמיתית, תוך התרחקות מהתפיסה של “העתקה” פשוטה של טכנולוגיות קיימות.
  • הכרה גלובלית: הפיתוי של הכרה בינלאומית הוא מניע רב עוצמה. להיות מצוטט ומנוצל על ידי מפתחים ועסקים מחוץ לסין נתפס לעתים קרובות כיוקרתי יותר מאשר התמקדות אך ורק ברווח מפרויקטים בודדים.

Stepfun: מודלים מולטי-מודאליים ושותפויות אסטרטגיות

Stepfun, סטארט-אפ משנחאי שנוסד בשנת 2023 על ידי המדען הראשי לשעבר של Microsoft Research Asia, ג’יאנג דקסין, הוא סטארט-אפ נוסף שעושה צעדים משמעותיים בזירת הקוד הפתוח.

תרומות הקוד הפתוח של Stepfun:

  • Step-Video-T2V: מודל שמייצר סרטונים מקלט טקסט.
  • Step-Audio: מיועד לאינטראקציות קוליות.
  • מודל עתידי להמרת תמונה לווידאו: מתוכנן לצאת החודש.

השותפויות האסטרטגיות של Stepfun מדגישות את האופי השיתופי של המערכת האקולוגית של הבינה המלאכותית בסין. התומכים כוללים את Capital Investment Co, חברת השקעות בבעלות ממשלת העיר שנחאי, ענקית האינטרנט Tencent Holdings, Qiming Venture Partners ו-5Y Capital.

MiniMax: אימוץ מאוחר של קוד פתוח

MiniMax, הידועה באפליקציות הבינה המלאכותית המותאמות אישית הפופולריות שלה Talkie ו-Xingye, נקטה בתחילה בגישה סגורה יותר. עם זאת, החברה שינתה כיוון בינואר, זמן קצר לאחר שחרור V3 של DeepSeek.

היצע הקוד הפתוח של MiniMax:

  • MiniMax-Text-01: מודל שפה גדול (LLM), הטכנולוגיה העומדת בבסיס שירותי בינה מלאכותית גנרטיבית כמו ChatGPT.
  • MiniMax-VL-01: מודל מולטי-מודאלי.

המייסד יאן ג’ונג’י הודה בראיון לכלי התקשורת הסיני LatePost שאילו ניתנה לו הזדמנות שנייה, הוא היה בוחר בנתיב הקוד הפתוח מההתחלה.

Moonshot AI: חשיבה מולטי-מודאלית וחדשנות

Moonshot AI, המוכרת בזכות הצ’אטבוט Kimi שלה, הייתה פעילה גם בתחום הקוד הפתוח.

התרומות של Moonshot AI:

  • K1.5: מודל חשיבה מולטי-מודאלי ברמת o1, ששוחרר בינואר (במקביל להשקת R1 של DeepSeek).
  • ארכיטקטורת קוד פתוח וחידושי אופטימיזציה: הוצגו בחודש שעבר.

Baichuan AI: מיקוד מחדש במגזר הרפואי

Baichuan AI, שנוסדה על ידי מנכ”ל Sogou לשעבר, וואנג שיאאוצ’ואן, ביצעה שינוי אסטרטגי כדי לרכז את מאמציה במגזר הרפואי. מיקוד מחדש זה כלל ארגון מחדש, כולל פירוק צוות השירותים הפיננסיים שלה. Baichuan AI אישרה את המהלך, וקבעה כי היא “מייעלת ומתאימה את העסק הפיננסי כדי לרכז משאבים ולהתמקד בעסקי הליבה הרפואיים שלנו”.

01.AI: ממודלים בקנה מידה גדול ליישומים ספציפיים לתעשייה

01.AI, שנוסדה על ידי נשיא גוגל סין לשעבר, לי קאי-פו, עברה גם היא שינוי אסטרטגי. החברה התרחקה מאימון מודלים של בינה מלאכותית בקנה מידה גדול וכעת היא מחדדת את המיקוד שלה בפיתוח יישומים ספציפיים לתעשייה. דוגמה בולטת לשינוי זה היא השותפות של 01.AI עם יחידת שירותי מחשוב הענן של Alibaba Group Holding להקמת “מעבדה משותפת למודלים תעשייתיים גדולים”. שיתוף פעולה זה כלל מעבר של מספר עובדי 01.AI ל-Alibaba Cloud.

הנוף המתפתח:תחרות ושיתוף פעולה

הנוף הסיני של הבינה המלאכותית מאופיין במשחק גומלין דינמי של תחרות ושיתוף פעולה. הכניסה המשבשת של DeepSeek עוררה ללא ספק גל של חדשנות, ואילצה שחקנים מבוססים להסתגל וחדשים להאיץ את מאמציהם. אימוץ עקרונות הקוד הפתוח מטפח סביבה שיתופית יותר, שבה שיתוף ידע וקידמה קולקטיבית מקבלים עדיפות.

מגמות עיקריות:

  • התמקדות מוגברת במודלים בסיסיים: סטארט-אפים מכירים בחשיבות של פיתוח מודלי בינה מלאכותית חזקים ובסיסיים כבסיס לחדשנות עתידית.
  • תנועת הקוד הפתוח: גישת הקוד הפתוח צוברת תאוצה, מונעת על ידי רצון להכרה גלובלית ואמונה בכוחו של פיתוח שיתופי.
  • שותפויות אסטרטגיות: שיתופי פעולה בין סטארט-אפים, חברות טכנולוגיה מבוססות וגופים ממשלתיים הופכים נפוצים יותר ויותר, תוך איגום משאבים ומומחיות.
  • יישומים ספציפיים לתעשייה: חברות מסוימות מעבירות את המיקוד שלהן ממודלים של בינה מלאכותית לשימוש כללי לפיתוח יישומים מיוחדים המותאמים לתעשיות ספציפיות, כגון שירותי בריאות ופיננסים.

ההשפעה ארוכת הטווח של השיבוש של DeepSeek עדיין לא נראית. עם זאת, דבר אחד ברור: הנוף הסיני של הבינה המלאכותית עובר תקופה של התפתחות מהירה, המונעת על ידי שילוב של לחץ תחרותי, התקדמות טכנולוגית ומחויבות גוברת לעקרונות הקוד הפתוח. סביבה דינמית זו מבטיחה להניב פריצות דרך נוספות ולעצב מחדש את עתיד הבינה המלאכותית, לא רק בסין אלא בעולם כולו. התחרות המוגברת מאלצת גם דגש רב יותר על יעילות וחסכוניות. חברות נתונות ללחץ לספק מודלים באיכות גבוהה במחירים תחרותיים, מה שבסופו של דבר מועיל למשתמשי הקצה ומאיץ את אימוץ הבינה המלאכותית במגזרים שונים.

המעבר ליישומים ספציפיים לתעשייה הוא גם מגמה ראויה לציון. על ידי התמקדות בצרכים ובאתגרים הייחודיים של מגזרים מסוימים, חברות כמו Baichuan AI ו-01.AI שואפות ליצור פתרונות רלוונטיים ומשפיעים יותר באופן ישיר. גישה זו עשויה להוביל לאימוץ מהיר יותר של בינה מלאכותית בתחומים כמו שירותי בריאות, פיננסים וייצור, ולהניע יתרונות מוחשיים לעסקים ולצרכנים כאחד.

יתר על כן, מעורבותם של גופים ממשלתיים, כגון השקעת ממשלת העיר שנחאי ב-Stepfun ותמיכת ממשלת האנגג’ואו ב-Zhipu AI, מדגישה את החשיבות האסטרטגית של פיתוח בינה מלאכותית בסין. תמיכה ממשלתית זו מספקת לא רק משאבים כספיים אלא גם מידה של אימות ויציבות, ומעודדת השקעות וחדשנות נוספות במגזר.

משחק הגומלין בין תחרות לשיתוף פעולה הוא גם מאפיין מגדיר של הנוף הסיני של הבינה המלאכותית. בעוד שחברות ללא ספק מתחרות על נתח שוק והכרה, יש גם הכרה גוברת בכך ששיתוף פעולה, במיוחד באמצעות יוזמות קוד פתוח, יכול להאיץ את ההתקדמות עבור התעשייה כולה. רוח שיתופית זו ניכרת בשיתוף מודלים, קוד וממצאי מחקר, תוך טיפוח תחושה של התקדמות קולקטיבית.

ההתפתחות המתמשכת של מגזר הבינה המלאכותית בסין היא עדות לשאיפתה של המדינה להפוך למובילה עולמית בתחום הבינה המלאכותית. השילוב של דחף יזמי, תמיכה ממשלתית ואימוץ גובר של עקרונות הקוד הפתוח יוצר קרקע פורייה לחדשנות. בעוד שחברות בינה מלאכותית סיניות ממשיכות לדחוף את גבולות האפשר, הן לא רק מעצבות מחדש את השוק המקומי שלהן אלא גם תורמות להתקדמות העולמית של הבינה המלאכותית. סיפורה של DeepSeek והשפעתה על הנוף הסיני של הבינה המלאכותית הוא דוגמה משכנעת לאופן שבו כוח משבש יחיד יכול לזרז שינוי נרחב ולהאיץ את קצב החדשנות בתעשייה שלמה.