אתגר הבינה המלאכותית האמריקאית: עלייתה של DeepSeek
בזירה המורכבת של הבינה המלאכותית, מתפתח סיפור של דוד מול גוליית. ארצות הברית, עם פרויקט “סטארגייט” השאפתני שלה והשקעה מדהימה של 500 מיליארד דולר, שואפת לבסס את מעמדה כמובילה העולמית בתחום הבינה המלאכותית. מאמץ מונומנטלי זה, הנתמך על ידי ענקיות טכנולוגיה, מבקש להקים רשת של מרכזי נתונים מתקדמים ברחבי המדינה. עם זאת, סטארטאפ סיני זריז, הפועל עם מה שחלק עשויים לכנות “בדיחה של תקציב”, הופיע כמתחרה אדיר, המטיל צל על שאיפותיה של ארה”ב.
DeepSeek, חברה שבסיסה בהאנגג’ואו, חשפה לאחרונה סדרה של מודלים בינה מלאכותית בקוד פתוח, שלא רק תואמים אלא, במקרים מסוימים, עולים על הביצועים של המודלים של OpenAI. יתר על כן, הם השיגו זאת ביעילות יוצאת דופן ובשבריר מהעלות. התפתחות זו שלחה גלים בקהילת הבינה המלאכותית, והעלתה שאלות לגבי יעילות האסטרטגיה של ארה”ב ועתיד השליטה בבינה המלאכותית.
שינוי הדינמיקה בתחום הבינה המלאכותית
נוף הבינה המלאכותית נשלט כיום על ידי מספר שחקנים מרכזיים, בעיקר בארה”ב. חברות אלה, עשירות במימון ובמשאבים, היו בחזית החדשנות בתחום הבינה המלאכותית, ופיתחו מודלים רבי עוצמה העומדים בבסיס מגוון רחב של יישומים. עם זאת, הופעתה של DeepSeek מסמלת שינוי פוטנציאלי בדינמיקה זו, ומדגימה שניתן לפתח בינה מלאכותית פורצת דרך עם משאבים מועטים משמעותית.
מודל R1 של DeepSeek, ששוחרר מוקדם יותר השבוע, הוא דוגמה מצוינת לשיבוש זה. לדברי החברה, מודל זה תואם ואף עולה על הביצועים של מודל o1 של OpenAI, ששוחרר בשנה שעברה ונועד להתמודד עם בעיות מורכבות של חשיבה ומתמטיקה. העובדה שהמודל של DeepSeek הוא קוד פתוח וזמין לציבור מרחיבה עוד יותר את השפעתו, ומאפשרת לחוקרים ומפתחים ברחבי העולם למנף את יכולותיו. מבקרים שיבחו את יכולתו של מודל R1 להתמודד עם משימות כמו קידוד וחשיבה, והציבו אותו בתחרות ישירה עם המודלים המתקדמים ביותר בשוק.
יעילות ועלות נמוכה: המודל של DeepSeek
הישג זה מרשים עוד יותר בהתחשב במשאבים העומדים לרשות DeepSeek. מודל השפה הגדול V3 של החברה, שהוכרז בדצמבר, אומן על פי הדיווחים באמצעות כוח מחשוב בשווי של 5.6 מיליון דולר בלבד. זהו ניגוד מוחלט ליותר מ-100 מיליון דולר ששימשו על פי הדיווחים לאימון GPT-4 של OpenAI. מודל V3 של DeepSeek נמדד מול מודלים של OpenAI ו-Anthropic, כאשר DeepSeek טוענת לשוויון בביצועים. אנדריי קרפתי, חוקר בינה מלאכותית בולט שעבד בעבר בטסלה וב-OpenAI, תיאר את יכולתה של DeepSeek לאמן את הבינה המלאכותית המתקדמת שלה ב”בדיחה של תקציב” כמרשימה ביותר.
עלייתה של DeepSeek לבולטות במגזר הבינה המלאכותית התחרותי של סין אינה מקרית. מייסד החברה בן ה-40, ליאנג וונפנג, נפגש לאחרונה עם ראש ממשלת סין לי צ’יאנג, מה שמדגיש את משמעות ההישגים של DeepSeek בתוך המדינה. פגישה זו, בה השתתפו מומחים מובילים אחרים בתעשייה, מדגישה את מחויבותה של סין לטיפוח חדשנות טכנולוגית ואת שאיפותיה בתחום הבינה המלאכותית. הצלחתה של DeepSeek משמשת עדות לכושר ההמצאה והתושייה של מגזר הטכנולוגיה הסיני, ומדגימה את יכולתו להתחרות בזירה הגלובלית למרות מגבלות על גישה לטכנולוגיות מסוימות.
מקורותיה של DeepSeek והיתרון האסטרטגי
מקורותיה של DeepSeek חוזרים ל-HighFlyer, קרן גידור כמותית סינית שניהלה כ-1.4 מיליארד דולר בנכסים נכון לשנת 2019. HighFlyer פיצלה את DeepSeek בשנת 2023, והקימה אותה כסטארטאפ ייעודי לבינה מלאכותית המתמקד בפיתוח מודלים ויצירת מוצרי בינה מלאכותית. ליאנג וונפנג, בעל רקע בבינה מלאכותית מאוניברסיטת ג’ג’יאנג, היה שותף להקמת HighFlyer ומינף את משאביה הכספיים לרכישת אלפי שבבי בינה מלאכותית של Nvidia לפני הטלת ההגבלות של ארה”ב בשנת 2022. מהלך אסטרטגי זה העניק ל-DeepSeek יתרון משמעותי על פני סטארטאפים אחרים בתחום הבינה המלאכותית, ואפשר לה להמשיך במחקר ובפיתוח שלה בזמן שאחרים התקשו להשיג כוח עיבוד.
בעוד שלמומחים יש דעות שונות לגבי הביצועים של DeepSeek ביחס ל-ChatGPT של OpenAI ול-Claude של Anthropic, הקונצנזוס הכללי הוא שהמודלים של DeepSeek מתפקדים היטב במיוחד תחת תצורות חומרה ספציפיות. עם זאת, הם עשויים להיתקל באתגרים בתרחישים אחרים. ההתמקדות של DeepSeek היא בשיפור היעילות והפחתת העלויות, דבר הבא לידי ביטוי במודל “תערובת המומחים” החדשני שלה. מודל זה משתמש בחלקים שונים של הבינה המלאכותית כדי לטפל בשאלות ספציפיות, תוך אופטימיזציה של הביצועים וניצול המשאבים.
שקיפות ונגישות: יתרונות מודלי DeepSeek
מבדל מרכזי נוסף של המודלים של DeepSeek הוא אופיים בקוד פתוח, המאפשר שימוש בפלטפורמות חומרה מגוונות. חשוב מכך, המודלים של DeepSeek מספקים שקיפות, וחושפים כיצד הם מגיעים לתשובותיהם, בניגוד ל-o1 של OpenAI. שקיפות זו היא נקודת מכירה מרכזית עבור לקוחות המחפשים פתרונות בינה מלאכותית חסכוניים, במיוחד אלה שאינם נכללים בשוק עבור מודלים יקרים שפותחו בארה”ב ואלה שמוגבלים מגישה לכוח מחשוב אמריקאי.
החשש של ארה”ב לגבי התקדמותה של סין בתחום הבינה המלאכותית אינו חסר בסיס. ממשלת ארה”ב מנסה באופן פעיל לרסן את פיתוח הבינה המלאכותית של סין באמצעות בקרת יצוא על שבבי בינה מלאכותית מתקדמים מאז 2022. זה מנע למעשה מחברות סיניות לרכוש את המעבדים הדרושים לאימון מודלים מובילים של בינה מלאכותית. למרות הגבלות אלה, יצרניות שבבים כמו Nvidia ואינטל ניסו ליצור מעבדים העומדים בדרישות ארה”ב עבור השוק הסיני, רק כדי להתמודד עם הידוק נוסף של הכללים על ידי וושינגטון.
אסטרטגיות סיניות להתמודדות עם הגבלות
הגבלות אלה אילצו חברות בינה מלאכותית סיניות לחקור אסטרטגיות חלופיות. חלקן מסתמכות על שבבים מתוצרת ארה”ב שיובאו לפני האיסורים, בעוד שאחרות פונות לרשתות הברחה בשוק האפור ששולחות שבבים ממקומות צד שלישי. חלקן בוחנות מרכזי נתונים מחוץ לסין, בעוד שאחרות מסתמכות על חלופות מתוצרת סין מחברות כמו Huawei. בעוד ש-Huawei טוענת שהשבבים שלה לבינה מלאכותית עולים על מעבד A100 של Nvidia, היא התמודדה עם אתגרים בייצורם באופן מהימן בקנה מידה גדול.
ליאנג וונפנג הצהיר כי “כסף מעולם לא היה הבעיה עבורנו; איסורים על משלוחי שבבים מתקדמים הם הבעיה”. הצהרה זו מדגישה את המכשולים המשמעותיים העומדים בפני חברות סיניות במרדפן אחר מנהיגות בתחום הבינה המלאכותית. בנוסף לאיסורי יצוא שבבים, ממשל ביידן אסר גם על השקעות אמריקאיות בבינה מלאכותית סינית, מה שמסבך עוד יותר את המצב.
למרות אתגרים אלה, סין טיפחה מערכת אקולוגית משגשגת של בינה מלאכותית. חברות טכנולוגיה גדולות כמו Baidu, Alibaba ו-ByteDance מפתחות מודלים בסיסיים משלהן ומציעות שירותים מבוססי בינה מלאכותית. סטארטאפים סיניים לבינה מלאכותית כמו MiniMax ו-Moonshot AI השיקו שירותים המכוונים לצרכן שהשיגו הצלחה אפילו בשוק האמריקאי.
מלחמת מחירים ויתרון תחרותי
התחרות העזה בתוך מגזר הבינה המלאכותית הסיני הובילה למלחמת מחירים, כאשר חברות מפחיתות באופן דרסטי את המחירים עד 90% במהלך 2024 על מנת להשיג יתרון תחרותי. מלחמת מחירים זו מדגישה עוד יותר את התושייה והכושר ההסתגלות של מגזר הבינה המלאכותית הסיני.
ארה”ב מודאגת יותר ויותר מהצלחותיה של סין בתחום הבינה המלאכותית, שכן הדבר מרמז שהאמצעים שננקטו כדי להגן על מנהיגות ארה”ב בתחום הבינה המלאכותית אינם עובדים. מנכ”ל גוגל לשעבר, אריק שמידט, הביע את הפתעתו מההתקדמות של סין, ואמר כי “חשבתי שההגבלות שהטלנו על שבבים ירחיקו אותם”.
OpenAI, מפתחת ChatGPT, העלתה גם היא חששות לגבי התקדמות הבינה המלאכותית של סין. בנייר מדיניות שנכתב לאחרונה, OpenAI הצהירה כי ישנם כ-175 מיליארד דולר בקרנות גלובליות הממתינות להשקעה בפרויקטים של בינה מלאכותית. החברה הזהירה כי “אם ארה”ב לא תמשוך את הכספים הללו, הם יזרמו לפרויקטים הנתמכים על ידי סין - ויחזקו את השפעתה הגלובלית של המפלגה הקומוניסטית הסינית”.
תגובת ארה”ב: פרויקט סטארגייט
בתגובה לחששות אלה, מנכ”ל OpenAI סם אלטמן, מנכ”ל SoftBank מסאיושי סון ומייסד שותף של אורקל לארי אליסון הכריזו על פרויקט סטארגייט, המתחייב להשקיע 500 מיליארד דולר בתשתית בינה מלאכותית ברחבי ארה”ב. פרויקט זה הוא אינדיקציה ברורה למחויבותה של ארה”ב לשמור על מנהיגותה בתחום הבינה המלאכותית.
עם זאת, הופעתן של חברות כמו DeepSeek מרמזת שהדרך לשליטה בבינה המלאכותית עשויה שלא להיות פשוטה כמו השקעה בסכומים עצומים של כסף. היכולת לחדש, להסתגל ולהשיג פריצות דרך עם משאבים מוגבלים היא גורם קריטי בנוף הבינה המלאכותית הנוכחי. ככל שהמירוץ לבינה מלאכותית ממשיך להתעצם, העולם יצפה מקרוב כיצד ארה”ב וסין ינווטו את האתגרים המורכבים הללו. לתוצאה יהיו השלכות מרחיקות לכת על עתיד הטכנולוגיה ודינמיקת הכוח העולמית. הסיפור של DeepSeek משמש תזכורת לכך שכושר המצאה ותושייה יכולים להיות כוחות רבי עוצמה במירוץ לשליטה בבינה המלאכותית. בעוד שארה”ב משקיעה רבות כדי לשמור על הובלתה, האתגר מסין, במיוחד מסטארטאפים חדשניים כמו DeepSeek, הוא אדיר. השנים הקרובות יהיו מכריעות בקביעת המנצח הסופי בתחרות רבת הסיכונים הזו. נוף הבינה המלאכותית מתפתח במהירות, והדינמיקה בין שתי המעצמות הגלובליות הללו תמשיך לעצב את עתידה של הטכנולוגיה הטרנספורמטיבית הזו.