מעבר לאימוץ AI ארגוני: יום שני של DeepSeek
DeepSeek, סטארטאפ סיני מבטיח בתחום הבינה המלאכותית (AI), מעורר גלים בזכות מודלי הבסיס המוזלים שלו באופן משמעותי. למהלך הזה יש פוטנציאל לחולל מהפכה באימוץ AI על ידי עסקים, על ידי התמודדות עם אחד החסמים המשמעותיים ביותר: העלות.
העלות הגבוהה של אימוץ AI
לדברי האנליסטים בראד סילס וקרלי ליו מ-BofA Global Research, ההוצאה הכרוכה ביישומי AI היא המכשול העיקרי המעכב את היישום הנרחב שלהם. הדו”ח שלהם, שפורסם ביום שלישי, 28 בינואר, מצביע על כך שפריצות דרך בהפחתת עלויות יכולות להפחית עוד יותר את המחירים, מה שיוביל לעלייה בשיעורי האימוץ.
ההכרזה של DeepSeek ביום שני, 27 בינואר, שלחה גלי הלם בתעשיית ה-AI, וגרמה לירידה במניות של מספר חברות AI. החברה חשפה את יכולתה לאמן מודל בסיס תמורת 5.58 מיליון דולר בלבד באמצעות 2,048 שבבי Nvidia H800. נתון זה עומד בניגוד מוחלט לעלויות המשוערות של OpenAI ו-Anthropic, הנעות בין 100 מיליון דולר למיליארד דולר וכוללות שימוש באלפי שבבי AI של Nvidia.
רוי בנש, סמנכ”ל הטכנולוגיות ב-eSIMple, הדגיש את הפוטנציאל הטרנספורמטיבי של ההישג של DeepSeek, וציין שהוא מעצים חברות קטנות יותר, מפתחים בודדים ואפילו חוקרים למנף את עוצמת ה-AI מבלי לשאת בעלויות מופקעות. נגישות מוגברת זו יכולה לטפח את הפיתוח של רעיונות וטכנולוגיות חדשניים, מה שיוביל לתחרותיות רבה יותר בתחום. כתוצאה מכך, לקוחות יכולים ליהנות מאפשרויות חדשות, בעוד שחברות AI מבוססות צפויות להוריד את המחירים שלהן ולהאיץ התקדמות טכנולוגית.
אנליסטים מ-BofA סיפקו דוגמאות לעלויות הכרוכות ביישומי AI קיימים. Microsoft’s 365 Copilot Chat גובה בין 1 סנט ל-30 סנט לפרומפט, תלוי במורכבות הבקשה. Salesforce’s Agentforce עבור Service Cloud גובה תעריף אחיד של 2 דולר להמרה.
בעוד ש-BofA הכירה בכך שהנתון של 5.58 מיליון דולר שהוצג על ידי DeepSeek מטעה במידה מסוימת עקב אי הכללת עלויות הקשורות למחקר, ניסויים, ארכיטקטורות, אלגוריתמים ונתונים, האנליסטים הדגישו את המשמעות של החידושים של הסטארטאפ בהדגמת היתכנות של שיטות אימון זולות יותר.
אימון מוקדם לעומת הסקה: הבנת העלויות
מודלי בסיס של AI, כגון GPT-4o של OpenAI ו-Gemini של Google, עוברים תהליך הנקרא אימון מוקדם, שבו הם נחשפים לכמויות עצומות של נתונים, כגון האינטרנט כולו, כדי לפתח ידע כללי. עם זאת, כדי להפוך את המודלים הללו לרלוונטיים ושימושיים יותר עבור חברות ותעשיות ספציפיות, ארגונים צריכים לאמן או לכוונן אותם עוד יותר באמצעות הנתונים שלהם.
לאחר כוונון מודל ה-AI, הוא יכול לעבד הנחיות משתמשים ולהפיק תגובות רלוונטיות. עם זאת, תהליך הנחיית המודל וקבלת תגובה כרוך בעלויות הסקה, שהן עמלות הקשורות לשילוב המודל עם נתונים חדשים כדי להבין ולנתח.
חשוב לציין שרוב החברות אינן נושאות בעלות של אימון מודלי בסיס. אחריות זו מוטלת על המפתחים של מודלים אלה, כולל OpenAI, Google, Meta, Amazon, Microsoft, Anthropic, Cohere, Hugging Face, Mistral AI, Stability AI, xAI, IBM, Nvidia, מעבדות מחקר מסוימות וענקיות טכנולוגיה סיניות כמו Baidu ו-Alibaba.
עסקים נושאים בעיקר בעלויות הסקה לעיבוד עומסי עבודה של AI, המהווים את רוב ההוצאות הקשורות ל-AI.
החיבור הסיני: עלויות ההסקה של DeepSeek וחששות פרטיות
DeepSeek מציעה שירותי הסקה משלה בעלויות נמוכות משמעותית בהשוואה לחברות בעמק הסיליקון. עם זאת, ישנם שיקולים מסוימים שיש לזכור בעת שימוש בשירותים אלה.
על פי מדיניות הפרטיות של DeepSeek, מידע משתמשים מאוחסן בשרתים הממוקמים בסין. החברה גם מציינת שהיא תציית להתחייבויות משפטיות ותבצע משימות לטובת הציבור או כדי להגן על האינטרסים החיוניים של משתמשיה ואנשים אחרים.
חוק המודיעין הלאומי של סין, ספציפית סעיף 7, מחייב שכל הארגונים והאזרחים יתמכו, יסייעו וישתפו פעולה עם מאמצי המודיעין הלאומי בהתאם לחוק ויגנו על סודות עבודת המודיעין הלאומי שהם מודעים להם.
קווין סורייס, מנכ”ל Appvance, העלה חששות לגבי פרטיות, וציין שאיסוף נתונים ממשתמשים הוא נוהג נפוץ בסין. הוא יעץ למשתמשים לנקוט משנה זהירות.
בניסוי שנערך על ידי PYMNTS, התבקש הצ’אטבוט של DeepSeek להסביר כיצד השפיעו הפגנות כיכר טיאנאנמן בשנת 1989 על הפוליטיקה הסינית. הצ’אטבוט הגיב, “מצטער, אני לא בטוח איך לגשת לסוג השאלה הזה עדיין.”
טים אנקינג, מנכ’ל Presearch, ציין ש-DeepSeek היא חברה בבעלות סינית מלאה הממוקמת בסין. הוא ציין כי חוסר היכולת של הצ’אטבוט לספק מידע על כיכר טיאנאנמן או על דמויות בכירות בממשלת סין מצביע על מגבלות באובייקטיביות של הטכנולוגיה. בעוד שאנקינג הכיר בפוטנציאל המרגש של הטכנולוגיה, הוא הביע חששות לגבי השליטה בה.
עם זאת, אנקינג הדגיש גם את האופי של קוד פתוח של המודלים של DeepSeek, המאפשר תיקונים להסרת שליטה ממשלתית ותאגידית. הוא מאמין שהיצירתיות ההנדסית של החברה יוצרת הזדמנויות לחברות ומדינות קטנות יותר להשתתף ולהצליח בנוף ה-AI הגנרטיבי.
הפוטנציאל של DeepSeek להוריד את עלויות ההסקה לכולם
לגישה החדשנית של DeepSeek לאימון מודלי בסיס בעלות נמוכה יותר יש השלכות חיוביות עבור חברות כמו Microsoft, שיכולות להמשיך להפחית את עלות מחשוב ה-AI ולהניע קנה מידה. לדברי סילס וליו, עלויות מחשוב נמוכות יותר יכולות להוביל לשיפור במרווחים בהצעות המופעלות על ידי AI.
בהערת מחקר נפרדת, אנליסטים מ-BofA, אלקש שאה, אנדרו מוס ובראד סילס, הציעו שעלויות מחשוב AI נמוכות יותר יכולות לאפשר שירותי AI רחבים יותר במגזרים שונים, ממכוניות ועד סמארטפונים.
אמנם לא סביר שמפתחי מודלי בסיס כמו OpenAI ישיגו באופן מיידי עלויות אימון נמוכות כמו של DeepSeek, אך האנליסטים מאמינים שטכניקות האימון והפוסט-אימון החדשניות של DeepSeek יאומצו על ידי מפתחי מודלים מתחרים כדי לשפר את היעילות. עם זאת, הם מדגישים כי המודלים הנוכחיים עדיין ידרשו השקעה משמעותית מכיוון שהם מהווים את הבסיס לסוכני AI.
בטווח הארוך, האנליסטים צופים אימוץ מואץ של AI על ידי ארגונים ככל שהצ’אטבוטים, הטייסים האוטומטיים והסוכנים יהפכו לחכמים וזולים יותר, תופעה המכונה פרדוקס ג’בונס.
מנכ’ל מיקרוסופט, סאטיה נאדלה, חזר על תחושה זו ב-X, וציין שפרדוקס ג’בונס משחק תפקיד כאשר AI הופך ליעיל ונגיש יותר. הוא מאמין שזה יוביל לעלייה בשימוש ב-AI, ויהפוך אותו לסחורה שאי אפשר לנו להספיק ממנה.
צלילה עמוקה יותר למודלי בסיס והשפעתם
מודלי בסיס, עמוד השדרה של ה-AI המודרני, מחוללים מהפכה באופן שבו עסקים פועלים ומתקשרים עם הטכנולוגיה. מודלים אלה, שאומנו על מערכי נתונים עצומים, מחזיקים ביכולת לבצע מגוון רחב של משימות, החל מעיבוד שפה טבעית ועד זיהוי תמונות. עם זאת, הפיתוח והפריסה של מודלים אלה כרוכים במשחק גומלין מורכב של גורמים, כולל עלויות אימון, עלויות הסקה, פרטיות נתונים ושיקולים אתיים.
הבנת מודלי בסיס
בבסיסם, מודלי בסיס הם רשתות עצביות גדולות שאומנו על מערכי נתונים עצומים. תהליך אימון זה מאפשר להם ללמוד דפוסים ויחסים בתוך הנתונים, ומאפשר להם לבצע מגוון משימות בדיוק מדהים. כמה דוגמאות למודלי בסיס כוללות:
- GPT-4o: מודל שפה עוצמתי שפותח על ידי OpenAI, המסוגל ליצור טקסט באיכות אנושית, לתרגם שפות ולענות על שאלות בצורה מקיפה.
- Gemini של Google: מודל AI רב-מודאלי שיכול לעבד ולהבין סוגים שונים של נתונים, כולל טקסט, תמונות ושמע.
מודלים אלה אינם מוגבלים למשימות ספציפיות אלא ניתנים להתאמה למגוון רחב של יישומים, מה שהופך אותם לכלי רב-תכליתי עבור עסקים.
תפקידם של אימון מוקדם וכוונון
הפיתוח של מודל בסיס כולל בדרך כלל שני שלבים עיקריים: אימון מוקדם וכוונון.
- אימון מוקדם: בשלב זה, המודל מאומן על מערך נתונים עצום, כגון האינטרנט כולו, כדי ללמוד ידע כללי ומיומנויות שפה. תהליך זה מצייד את המודל ביכולת להבין וליצור טקסט, לתרגם שפות ולבצע משימות בסיסיות אחרות.
- כוונון: בשלב זה, המודל שאומן מראש מאומן עוד יותר על מערך נתונים קטן יותר וספציפי יותר הקשור למשימה או לתעשייה מסוימת. תהליך זה מאפשר למודל להתאים את הידע והמיומנויות שלו לצרכים הספציפיים של היישום.
לדוגמה, ניתן לכוונן מודל שפה שאומן מראש על מערך נתונים של אינטראקציות שירות לקוחות כדי ליצור צ’אטבוט שיכול להגיב ביעילות לפניות לקוחות.
עלות האימון וההסקה
העלויות הקשורות למודלי בסיס ניתנות לחלוקה לשתי קטגוריות עיקריות: עלויות אימון ועלויות הסקה.
- עלויות אימון: עלויות אלה כוללות את משאבי המחשוב, הנתונים והמומחיות הנדרשים לאימון מודל הבסיס. אימון מודל בסיס גדול יכול להיות יקר ביותר, ולעיתים קרובות דורש השקעה של מיליוני דולרים.
- עלויות הסקה: עלויות אלה כוללות את משאבי המחשוב הנדרשים לשימוש במודל המאומן כדי לבצע תחזיות או ליצור פלטים. עלויות ההסקה יכולות להשתנות בהתאם לגודל ולמורכבות של המודל, לכמות הנתונים המעובדים ולתשתית המשמשת.
החידוש של DeepSeek טמון ביכולתו להפחית באופן משמעותי את עלויות האימון הקשורות למודלי בסיס, מה שהופך אותם לנגישים יותר למגוון רחב יותר של עסקים וארגונים.
התמודדות עם חששות פרטיות ואתיים
השימוש במודלי בסיס מעלה שאלות חשובות לגבי פרטיות נתונים ושיקולים אתיים. מודלי בסיס מאומנים על מערכי נתונים עצומים, שעשויים להכיל מידע רגיש או אישי. חיוני להבטיח שמודלים אלה ישמשו בצורה אחראית ואתית, תוך כיבוד פרטיות המשתמשים והימנעות מהטיה.
כמה אסטרטגיות להתמודדות עם חששות אלה כוללות:
- אנונימיזציה של נתונים: הסרה או הסוואה של מידע אישי מנתוני האימון כדי להגן על פרטיות המשתמשים.
- איתור והפחתת הטיה: זיהוי וטיפול בהטיות בנתוני האימון כדי להבטיח שהמודל אינו מנציח סטריאוטיפים מזיקים או פרקטיקות מפלות.
- שקיפות ואחריותיות: מתן מידע ברור לגבי אופן פעולתו של המודל ואופן השימוש בו, וכן הקמת מנגנונים לאחריות במקרה של שגיאות או השלכות לא מכוונות.
ככל שמודלי בסיס הופכים לנפוצים יותר, חיוני לטפל בחששות פרטיות ואתיים אלה באופן יזום כדי להבטיח שהם משמשים לטובת החברה.
עתיד מודלי הבסיס
מודלי בסיס מתפתחים במהירות, וההשפעה הפוטנציאלית שלהם על החברה עצומה. בעתיד, אנו יכולים לצפות לראות:
- מודלים חזקים ורב-תכליתיים יותר: ככל שמדענים ממשיכים לפתח ארכיטקטורות וטכניקות אימון חדשות, מודלי הבסיס יהפכו לחזקים ורב-תכליתיים עוד יותר, המסוגלים לבצע מגוון רחב יותר של משימות בדיוק רב יותר.
- נגישות מוגברת: ככל שעלויות האימון פוחתות ופלטפורמות AI מבוססות ענן הופכות לנפוצות יותר, מודלי בסיס יהפכו לנגישים יותר לעסקים בכל הגדלים.
- יישומים ותיקי שימוש חדשים: מודלי בסיס ימשיכו להיות מיושמים על תיקי שימוש חדשים וחדשניים בתעשיות שונות, החל משירותי בריאות ועד פיננסים ועד חינוך.
עלייתם של מודלי בסיס מייצגת שינוי פרדיגמה בתחום הבינה המלאכותית. על ידי הבנת היכולות, העלויות והשיקולים האתיים שלהם, נוכל לרתום את כוחם כדי ליצור עתיד טוב יותר.
תרומתה של DeepSeek לדמוקרטיזציה של AI
ההישג של DeepSeek בהפחתה משמעותית של עלות אימון מודלי בסיס מסמן רגע מכריע בדמוקרטיזציה של AI. על ידי הורדת מחסום הכניסה, DeepSeek מעצימה מגוון רחב יותר של ארגונים ויחידים להשתתף במהפכת ה-AI.
ההשפעה על עסקים קטנים יותר
לעתים קרובות לעסקים קטנים יותר חסרים המשאבים והמומחיות לפתח ולפרוס מודלים AI משלהם. מודלי הבסיס החסכוניים של DeepSeek מספקים לעסקים אלה גישה לטכנולוגיית AI מתקדמת שהייתה בעבר מעבר להישג ידם. זה יכול להשוות את תנאי המשחק, ולאפשר לעסקים קטנים יותר להתחרות ביעילות רבה יותר עם חברות גדולות ומבוססות יותר.
לדוגמה, עסק קטן למסחר אלקטרוני יכול להשתמש במודלים של DeepSeek כדי להתאים אישית המלצות מוצרים ללקוחותיו, לשפר את שירות הלקוחות שלואו לבצע אוטומציה של קמפייני השיווק שלו.
העצמת מפתחים בודדים
המודלים של DeepSeek גם מעצימים מפתחים וחוקרים בודדים לחקור יישומי AI וחידושים חדשים. עם גישה למודלי בסיס במחירים סבירים, מפתחים יכולים להתנסות ברעיונות שונים, לפתח כלי AI מופעלים חדשים ולתרום להתקדמות טכנולוגיית ה-AI.
זה יכול להוביל לעלייה בחדשנות, מכיוון של יותר אנשים יש את ההזדמנות להשתתף בפיתוח AI.
הפוטנציאל לשיתוף פעולה בקוד פתוח
הגישה של קוד פתוח של DeepSeek מקדמת עוד יותר שיתוף פעולה וחדשנות בקהילת ה-AI. על ידי הפיכת המודלים שלה לזמינים לציבור, DeepSeek מעודדת מפתחים לתרום לשיפורם, לזהות ולתקן באגים ולפתח תכונות חדשות.
גישה שיתופית זו יכולה להאיץ את הפיתוח של טכנולוגיית AI ולהבטיח שהיא משמשת לטובת כולם.
האצת אימוץ AI
על ידי הורדת עלות ה-AI, DeepSeek מאיצה את אימוץ ה-AI בתעשיות שונות. ככל שה-AI הופך למשתלם ונגיש יותר, עסקים רבים יותר יוכלו לשלב אותו בפעילותם, מה שיוביל לעלייה בפריון, ביעילות ובחדשנות.
זה יכול להשפיע עמוקות על הכלכלה העולמית, ולהניע צמיחה וליצור הזדמנויות חדשות.
מערכת אקולוגית של AI מכילה יותר
מאמציה של DeepSeek לדמוקרטיזציה של AI תורמים למערכת אקולוגית של AI מכילה יותר, שבה ליותר אנשים יש את ההזדמנות להשתתף בפיתוח ובשימוש ב-AI. זה יכול לעזור להבטיח שה-AI משמש באופן שמטיב עם כל חברי החברה, ולא רק עם קומץ נבחרים.
על ידי העצמת עסקים קטנים יותר, מפתחים בודדים וחוקרים, DeepSeek מטפחת נוף AI מגוון וחדשני יותר.