פענוח DeepSeek: עלייתה של מעצמת AI סינית

DeepSeek, שם שעלה במהירות מחוסר ודאות יחסי לנקודת מוקד בשיחה העולמית על AI, עורר דיון וספקולציות אינטנסיביים במגזרי הטכנולוגיה והפיננסים. מעבדת ה-AI הסינית שמאחורי הכוח הפורח הזה שיבשה את הסדר הקיים, והניעה אנליסטים לתהות על הקיימות של הדומיננטיות האמריקאית במירוץ ה-AI ועל הכדאיות ארוכת הטווח של הביקוש הנוכחי לשבבי AI. אבל מהם הגורמים המרכזיים שהניעו את DeepSeek לבולטותה הנוכחית?

התהוות DeepSeek: מקרן גידור למעבדת AI

מקורותיה של DeepSeek שזורים עמוק בעולם הכספים הכמותיים. היא מגובה על ידי High-Flyer Capital Management, קרן גידור סינית הידועה בשימוש שלה ב-AI בקבלת החלטות מסחר מונחות נתונים.

ליאנג וונפנג, חובב AI עם רקע במסחר במהלך שהותו באוניברסיטת ג’ג’יאנג, ייסד יחד את High-Flyer בשנת 2015. בשנת 2019, הוא השיק את High-Flyer Capital Management כקרן גידור עם התמקדות ספציפית בפיתוח ויישום אלגוריתמי AI ליישומים פיננסיים.

בשנת 2023, High-Flyer הדגירה את DeepSeek כמעבדת מחקר AI ייעודית, הפועלת באופן עצמאי מעסקי הליבה הפיננסיים שלה. לאחר מכן, כאשר High-Flyer משמשת כמשקיעה מרכזית, המעבדה הופרדה לישות נפרדת, תוך שמירה על השם DeepSeek.

מהקמתה, DeepSeek העניקה עדיפות להקמת אשכולות מרכזי נתונים משלה כדי להקל על אימון מודלים. עם זאת, בדומה לחברות AI אחרות הפועלות בסין, DeepSeek נתקלה באתגרים עקב הגבלות הייצוא של ארה”ב על חומרה מתקדמת. כתוצאה מכך, כדי לאמן את המודלים החדשים יותר שלה, החברה נאלצה להשתמש בשבבי Nvidia H800, גרסה פחות עוצמתית של שבבי H100 הזמינים לחברות אמריקאיות.

הצוות הטכני של DeepSeek ידוע בנעוריו ובדינמיותו. החברה מגייסת באופן פעיל חוקרי AI דוקטורט מאוניברסיטאות סיניות מובילות. יתר על כן, DeepSeek מעסיקה אנשים מרקע מגוון, אפילו כאלה ללא מומחיות במדעי המחשב, כדי להבטיח שהטכנולוגיה שלה תוכל להבין ביעילות ולספק מגוון רחב של נושאים, כפי שדווח על ידי הניו יורק טיימס.

מודלי ה-AI של DeepSeek: מאתגרים את הסטטוס קוו

DeepSeek חשפה את חבילת המודלים הראשונית שלה - DeepSeek Coder, DeepSeek LLM ו-DeepSeek Chat - בנובמבר 2023. עם זאת, היה זה השחרור של משפחת המודלים DeepSeek-V2 מהדור הבא שלה באביב שתפס באמת את תשומת הלב של תעשיית ה-AI.

DeepSeek-V2, מערכת רב-תכליתית המסוגלת לנתח טקסט ותמונות כאחד, הדגימה ביצועים מרשימים על פני מדדי AI שונים. ראוי לציין שהיא השיגה ביצועים אלה בעלות נמוכה משמעותית בהשוואה למודלים מתחרים שהיו זמינים באותה עת. זה הניע את יריביה המקומיים של DeepSeek, כולל ByteDance ו-Alibaba, להפחית את המחירים של חלק מהמודלים שלהם ולהציע אחרים בחינם לחלוטין.

DeepSeek V3 הציגה ביצועים מעולים בהשוואה הן למודלים להורדה בקוד פתוח כמו Llama של Meta והן למודלים “סגורים” הנגישים רק דרך ממשקי API, כגון GPT-4o של OpenAI.

במידה שווה ראויה לציון היא מודל ה-“reasoning” R1 של DeepSeek. DeepSeek, שהושק בינואר, טוענת ש-R1 משיג ביצועים דומים למודל o1 של OpenAI במדדי מפתח.

כמודל הסקה, R1 משלב מנגנוני בדיקה עצמית, הממתנים חלק מהמלכודות הנפוצות הקשורות למודלים סטנדרטיים. בעוד שמודלי הסקה עשויים לדרוש זמני עיבוד מעט ארוכים יותר כדי להגיע לפתרונות (הנעים בין שניות לדקות), הם נוטים להפגין אמינות רבה יותר בתחומים כגון פיזיקה, מדע ומתמטיקה.

עם זאת, המודלים של DeepSeek, כולל R1 ו-DeepSeek V3, כפופים לפיקוח של רגולטור האינטרנט של סין, המבטיח שתגובותיהם יתיישרו עם “ערכי ליבה סוציאליסטיים”. לדוגמה, באפליקציית הצ’אטבוט של DeepSeek, R1 לא תתייחס לשאלות הנוגעות לכיכר טיין-אן-מן או לאוטונומיה של טייוואן.

במרץ, תעבורת האתר של DeepSeek עלתה על 16.5 מיליון ביקורים. למרות ירידה של 25% בתעבורה בהשוואה לפברואר, DeepSeek דורגה במקום השני מבחינת ביקורים יומיים, על פי דייוויד קאר, עורך ב-Similarweb. עם זאת, נתון זה עדיין חיוור בהשוואה ל-ChatGPT, שחרגה מ-500 מיליון משתמשים פעילים שבועיים במרץ.

גישה משבשת לנוף ה-AI

המודל העסקי של DeepSeek נותר אניגמטי במידת מה. החברה מתמחרת את המוצרים והשירותים שלה מתחת לערך השוק באופן משמעותי, ואף מציעה חלק בחינם. יתר על כן, היא התנגדה למימון חיצוני למרות עניין ניכר מצד חברות הון סיכון.

DeepSeek מייחסת את התחרותיות הקיצונית בעלויות שלה לפריצות דרך ביעילות. עם זאת, כמה מומחים הטילו ספק בדיוק הנתונים שמספקת החברה.

בכל מקרה, מפתחים אימצו את המודלים של DeepSeek, אשר, למרות שאינם קוד פתוח במובן המסורתי, זמינים תחת רישיונות מתירים המאפשרים שימוש מסחרי. לדברי קלם דלנג, מנכ”ל Hugging Face, מפתחים בפלטפורמה יצרו למעלה מ-500 מודלים נגזרים של R1, שנצברו בסך הכל 2.5 מיליון הורדות.

ההצלחה של DeepSeek נגד מתחרים גדולים ומבוססים יותר תוארה כ”הפיכת AI “ ו”מנופחת יתר על המידה”. ההישגים של החברה היו אחראים חלקית לירידה של 18% במחיר המניות של Nvidia בינואר, ועוררו תגובה פומבית ממנכ”ל OpenAI סם אלטמן. במרץ, לשכות משרד המסחר האמריקאי דיווחו שאסרו על DeepSeek במכשירי ממשלה, לפי רויטרס.

מיקרוסופט שילבה את DeepSeek בשירות Azure AI Foundry שלה, פלטפורמה המאחדת שירותי AI עבור ארגונים. במהלך שיחת הרווחים של הרבעון הראשון של Meta, המנכ”ל מארק צוקרברג הצהיר כי השקעות בתשתית AI ימשיכו להיות “יתרון אסטרטגי” עבור החברה, כאשר נשאל על ההשפעה הפוטנציאלית של DeepSeek על הוצאות ה-AI של Meta. במרץ, OpenAI תייגה את DeepSeek כ”מסובסדת על ידי המדינה” ו”נשלטת על ידי המדינה”, והמליצה לממשלת ארה”ב לשקול לאסור את המודלים שלה.

במהלך שיחת הרווחים של הרבעון הרביעי של Nvidia, המנכ”ל ג’נסן הואנג הדגיש את ה”חדשנות המצוינת” של DeepSeek, וציין שמודלי ההסקה שלה דורשים כוח מחשוב רב יותר באופן משמעותי, מה שמטיב עם Nvidia.

לעומת זאת, כמה חברות, מדינות וממשלות, כולל דרום קוריאה ומדינת ניו יורק, אסרו על השימוש ב-DeepSeek במכשירי ממשלה.

במאי, סגן יו”ר ונשיא מיקרוסופט בראד סמית’ העיד בפני הסנאט כי לעובדי מיקרוסופט אסור להשתמש ב-DeepSeek בגלל חששות לגבי אבטחת מידע ותעמולה פוטנציאלית.

העתיד הלא בטוח של DeepSeek

המסלול העתידי של DeepSeek נותר לא בטוח. בעוד שיפורים נוספים במודלים צפויים, נראה שממשלת ארה”ב נזהרת יותר ויותר מהשפעה זרה מזיקה לכאורה. במרץ, ה-Wall Street Journal דיווח שארה”ב צפויה לאסור את DeepSeek במכשירי ממשלה.

העלייה המהירה של DeepSeek טלטלה ללא ספק את יסודות תעשיית ה-AI, והניעה הערכה מחדש של דינמיקה תחרותית והפוטנציאל לחדשנות משבשת. האם היא יכולה לשמור על המומנטום הנוכחי שלה מול בדיקה גוברת ואתגרים רגולטוריים, предстоит увидеть. השנים הקרובות יהיו מכריעות בקביעת ההשפעה ארוכת הטווח של DeepSeek על נוף ה-AI העולמי. יכולתה לנווט את יחסי הגומלין המורכבים של התקדמות טכנולוגית, שיקולים גיאופוליטיים וחששות אתיים תגדיר בסופו של דבר את מורשתה. עולם ה-AI יצפה מקרוב.

סיפור DeepSeek הוא תזכורת לכך שבעולם המתפתח במהירות של בינה מלאכותית, שחקנים חדשים יכולים להופיע במהירות ולאתגר את הסדר הקיים. ההצלחה של החברה, המונעת על ידי טכנולוגיה חדשנית ורצון לשבש מודלים עסקיים מסורתיים, אילצה את התעשייה לשים לב. ככל ש-DeepSeek ממשיכה לפתח ולהרחיב את טווח ההגעה שלה, היא ללא ספק תשחק תפקיד משמעותי בעיצוב עתיד ה-AI.