הזעזוע הראשוני: DeepSeek ואשליית היעילות
הופעתה של DeepSeek AI הסינית מוקדם יותר השנה שלחה גלי הלם בנוף השקעות הטכנולוגיה. הגישה שלה, שנראתה פורצת דרך, והבטיחה בינה מלאכותית עוצמתית עם תקורה חישובית נמוכה משמעותית, עוררה מיד ספקולציות. נרטיב התגבש במהירות: אולי ההתרחבות הבלתי פוסקת והיקרה של תשתית ה-AI, המאופיינת ברכישות מסיביות של שבבים ומערכות ייעודיים, עומדת להאט. השוק הגיב, משקף אמונה שעידן חדש של AI חסכוני עשוי לצמצם באופן דרמטי את בום ההוצאות הצפוי.
עם זאת, תובנות ממפגש רם דרג שנערך לאחרונה של מוחות בתעשייה מציירות תמונה שונה בתכלית. כנס AI גנרטיבי שכונס בניו יורק על ידי Bloomberg Intelligence הציע שהפרשנות הראשונית, שהתמקדה אך ורק בחיסכון פוטנציאלי בעלויות, החמיצה את הסיפור הגדול יותר. רחוק מסימון האטה בהוצאות, האירוע הדגיש רעב כמעט בלתי נדלה ליכולת AI גדולה יותר. הקונצנזוס לא היה על קיצוץ; הוא היה על הבנה כיצד להאכיל תיאבון גדל באופן אקספוננציאלי למערכות חכמות, גם תוך רצון נואש שהתפריט יהיה פחות יקר.
קולות מהשטח: צמא בלתי נדלה לקיבולת
הדיונים לאורך האירוע בן היום, שכינס מפתחים, אסטרטגים ומשקיעים, חזרו וחזרו בעקביות לנושא הביקוש הגואה המניע השקעות מונומנטליות. Mandeep Singh, אנליסט טכנולוגיה בכיר ב-Bloomberg Intelligence ואחד ממארגני האירוע, תפס את הסנטימנט השורר בתמציתיות. בהתייחסו לפאנלים הרבים ולדיוני המומחים, הוא ציין פזמון אוניברסלי: אף אחד מהמעורבים לא הרגיש שיש לו מספיק קיבולת AI. התחושה המכריעה הייתה של צורך ביותר, לא שיש יותר מדי.
באופן מכריע, הוסיף Singh, רוח הרפאים של ‘בועת תשתית’, פחד נפוץ במגזרי טכנולוגיה המתרחבים במהירות, נעדרה באופן בולט מהשיחה. המיקוד נותר מרובע באתגר הבסיסי העומד בפני התעשייה כולה. Anurag Rana, עמיתו של Singh והאנליסט הבכיר של Bloomberg Intelligence לשירותי IT ותוכנה, מסגר זאת כשאלת העל: ‘היכן אנו נמצאים במחזור [בניית תשתית ה-AI] הזה?’
תוך הכרה בכך שזיהוי השלב המדויק של הבנייה המסיבית הזו נותר חמקמק (‘אף אחד לא יודע’ בוודאות, הודה Rana), תופעת DeepSeek ללא ספק שינתה פרספקטיבות. היא הזריקה מנה חזקה של תקווה שניתן יהיה לטפל בעומסי עבודה משמעותיים של AI בצורה חסכונית יותר. ‘DeepSeek זעזעה הרבה אנשים’, ציין Rana. ההשלכה הייתה ברורה: אם מודלים מתוחכמים של AI אכן יוכלו לפעול ביעילות על חומרה פחות תובענית, אולי פרויקטים ענקיים, כמו היוזמות בשווי מאות מיליארדי דולרים ששמועות אומרות שמתוכננות על ידי קונסורציומים הכוללים שחקני טכנולוגיה מרכזיים, עשויים להיות מוערכים מחדש או מותאמים באופן שונה.
החלום, שהדהד ברחבי התעשייה לדברי Rana, הוא שעלויות התפעול של AI, במיוחד עבור inference (השלב שבו מודלים מאומנים מייצרים תחזיות או תוכן), ילכו בעקבות המסלול היורד הדרמטי שנראה באחסון מחשוב ענן בעשור האחרון. הוא נזכר כיצד הכלכלה של אחסון כמויות עצומות של נתונים בפלטפורמות כמו Amazon Web Services (AWS) השתפרה באופן דרמטי במשך כשמונה שנים. ‘הירידה הזו בעקומת העלות… הכלכלה הייתה טובה’, הוא קבע. ‘וזה מה שכולם מקווים, שבצד ה-inference… אם העקומה תיפול לרמה הזו, הו אלוהים, קצב האימוץ של AI… יהיה מרהיב’. Singh הסכים, וציין כי הגעתה של DeepSeek ‘שינתה באופן יסודי את הלך הרוח של כולם לגבי השגת יעילות’.
הכמיהה הזו ליעילות הייתה מוחשית לאורך כל מושבי הכנס. בעוד שפאנלים רבים התעמקו בפרקטיקות של העברת פרויקטי AI ארגוניים משלבים רעיוניים לייצור חי, דיון מקביל הדגיש כל הזמן את הצורך הקריטי לקצץ בעלויות הכרוכות בפריסה והרצה של מודלי AI אלה. המטרה ברורה: דמוקרטיזציה של הגישה על ידי הפיכת AI לכדאי כלכלית עבור מגוון רחב יותר של יישומים ומשתמשים. Shawn Edwards, הטכנולוג הראשי של Bloomberg עצמו, הציע ש-DeepSeek לא הייתה בהכרח הפתעה מוחלטת, אלא המחשה עוצמתית לרצון אוניברסלי. ‘מה שזה גרם לי לחשוב הוא שזה יהיה נהדר אם אפשר היה לנפנף בשרביט ולגרום למודלים האלה לרוץ ביעילות מדהימה’, הוא העיר, והרחיב את המשאלה לכל קשת מודלי ה-AI, לא רק לפריצת דרך ספציפית אחת.
עקרון הריבוי: מתדלק את הביקוש לחישוב
אחת הסיבות העיקריות לכך שמומחים צופים המשך השקעה משמעותית בתשתית AI, למרות החיפוש אחר יעילות, טמונה בריבוי העצום של מודלי AI. נושא חוזר לאורך הכנס בניו יורק היה המעבר המכריע מהרעיון של מודל AI יחיד ומונוליטי המסוגל להתמודד עם כל המשימות.
- עניין משפחתי: כפי שניסח זאת Edwards מ-Bloomberg, ‘אנו משתמשים במשפחה של מודלים. אין דבר כזה מודל הטוב ביותר’. זה משקף הבנה גוברת שארכיטקטורות AI שונות מצטיינות במשימות שונות – יצירת שפה, ניתוח נתונים, זיהוי תמונות, השלמת קוד וכן הלאה.
- התאמה אישית ארגונית: חברי הפאנל הסכימו באופן נרחב שבעוד שמודלי ‘יסוד’ או ‘חזית’ גדולים וכלליים ימשיכו להיות מפותחים ומעודנים על ידי מעבדות AI מרכזיות, הפעולה האמיתית בתוך עסקים כוללת פריסה של מאות או אפילו אלפי מודלי AI מתמחים.
- Fine-Tuning ונתונים קנייניים: רבים ממודלי הארגון הללו יותאמו ממודלי בסיס באמצעות תהליך הנקרא fine-tuning. זה כרוך באימון מחדש של רשת עצבית שאומנה מראש על נתונים ספציפיים, לעתים קרובות קנייניים, של חברה. זה מאפשר ל-AI להבין הקשרים עסקיים ייחודיים, טרמינולוגיה ואינטראקציות עם לקוחות, ומספק תוצאות רלוונטיות ובעלות ערך רב יותר מאשר מודל גנרי יכול היה.
- דמוקרטיזציה של הפיתוח: Jed Dougherty, המייצג את פלטפורמת מדעי הנתונים Dataiku, הדגיש את הצורך ב’אופציונליות בין המודלים’ עבור סוכני AI ארגוניים. הוא הדגיש את החשיבות של מתן שליטה לחברות, יכולות יצירה ויכולת ביקורת (auditability) על כלי ה-AI שלהן. ‘אנחנו רוצים לשים את הכליםלבניית הדברים האלה בידי האנשים’, טען Dougherty. ‘אנחנו לא רוצים עשרה בעלי דוקטורט שיבנו את כל הסוכנים’. הדחף הזה לעבר נגישות רחבה יותר בפיתוח עצמו מרמז על צורך בתשתית בסיסית נוספת כדי לתמוך במאמצי היצירה המבוזרים הללו.
- AI ספציפי למותג: תעשיות הקריאייטיב מציעות דוגמה מצוינת. Hannah Elsakr, המובילה מיזמים עסקיים חדשים ב-Adobe, הסבירה את האסטרטגיה שלהם המהמרת על מודלים מותאמים אישית כמבדיל מרכזי. ‘אנו יכולים לאמן הרחבות מודל מותאמות אישית למותג שלך שיכולות לעזור לקמפיין פרסומי חדש’, היא הדגימה, והראתה כיצד ניתן להתאים AI לשמירה על אסתטיקה ומסרים ספציפיים למותג.
מעבר לגיוון המודלים, הפריסה הגוברת של סוכני AI בתוך זרימות עבודה תאגידיות היא מניע משמעותי נוסף לביקוש לעיבוד. סוכנים אלה נתפסים לא רק ככלים פסיביים אלא כמשתתפים פעילים המסוגלים לבצע משימות מרובות שלבים.
Ray Smith, העומד בראש מאמצי הסוכנים והאוטומציה של Microsoft Copilot Studio, חזה עתיד שבו משתמשים יתקשרו עם מאות סוכנים מתמחים פוטנציאליים דרך ממשק מאוחד כמו Copilot. ‘לא תדחס תהליך שלם לסוכן אחד, תחלק אותו לחלקים’, הוא הסביר. סוכנים אלה, הוא הציע, הם למעשה ‘אפליקציות בעולם החדש’ של התכנות. החזון הוא כזה שבו משתמשים פשוט מציינים את מטרתם – ‘לומר לו מה אנחנו רוצים להשיג’ – והסוכן מתזמר את הצעדים הדרושים. ‘אפליקציות סוכניות הן פשוט דרך חדשה לזרימת עבודה’, קבע Smith, והדגיש שהגשמת החזון הזה היא פחות עניין של אפשרות טכנולוגית (‘הכל אפשרי טכנולוגית’) ויותר עניין של ‘הקצב שבו אנו בונים אותו’.
הדחיפה הזו להטמיע סוכני AI עמוק יותר בתהליכים ארגוניים יומיומיים מגבירה עוד יותר את הלחץ להפחתת עלויות ופריסה יעילה. James McNiven, ראש ניהול מוצר בענקית המיקרו-מעבדים ARM Holdings, מסגר את האתגר במונחים של נגישות. ‘כיצד אנו מספקים גישה על יותר ויותר מכשירים?’ הוא תהה. בהתבוננות במודלים המשיגים יכולות כמעט ‘ברמת דוקטורט’ במשימות ספציפיות, הוא השווה להשפעה הטרנספורמטיבית של הבאת מערכות תשלום ניידות למדינות מתפתחות לפני שנים. שאלת הליבה נותרה: ‘כיצד אנו מביאים את [יכולת ה-AI] הזו לאנשים שיכולים להשתמש ביכולת הזו?’ הפיכת סוכני AI מתוחכמים לזמינים בקלות כעוזרים למגוון רחב של כוח העבודה מחייבת לא רק תוכנה חכמה אלא גם חומרה יעילה, ובאופן בלתי נמנע, יותר השקעה בתשתית בסיסית, גם כאשר היעילות לכל חישוב משתפרת.
מכשולי קנה מידה: סיליקון, חשמל וענקיות הענן
אפילו מודלי היסוד הגנריים הנפוצים ביותר מתרבים בקצב מסחרר, ומטילים עומס עצום על התשתית הקיימת. Dave Brown, המפקח על מחשוב ורשתות ב-Amazon Web Services (AWS), חשף שהפלטפורמה שלהם לבדה מציעה ללקוחות גישה לכ-1,800 מודלי AI שונים. הוא הדגיש את המיקוד האינטנסיבי של AWS ב’לעשות הרבה כדי להוריד את העלות’ של הפעלת הכלים העוצמתיים הללו.
אסטרטגיה מרכזית עבור ספקי ענן כמו AWS כוללת פיתוח סיליקון מותאם אישית משלהם. Brown הדגיש את השימוש הגובר בשבבים שתוכננו על ידי AWS, כגון מעבדי Trainium שלהם המותאמים לאימון AI, וקבע, ‘AWS משתמשת ביותר מעבדים משלנו מאשר מעבדים של חברות אחרות’. המעבר הזה לחומרה ייעודית ופנימית נועד להיאבק על השליטה בביצועים ובעלות, ולהפחית את התלות בספקי שבבים לשימוש כללי כמו Nvidia, AMD ו-Intel. למרות המאמצים הללו, Brown הודה בכנות במציאות הבסיסית: ‘לקוחות היו עושים יותר אם העלות הייתה נמוכה יותר’. תקרת הביקוש מוגדרת כיום יותר על ידי מגבלות תקציב מאשר על ידי חוסר ביישומים פוטנציאליים.
היקף המשאבים הנדרש על ידי מפתחי AI מובילים הוא עצום. Brown ציין את שיתוף הפעולה היומיומי של AWS עם Anthropic, יוצרי משפחת מודלי השפה המתוחכמים Claude. Michael Gerstenhaber, ראש ממשקי תכנות היישומים של Anthropic, שדיבר לצד Brown, הצביע על העוצמה החישובית של AI מודרני, במיוחד מודלים המיועדים להנמקה מורכבת או ‘חשיבה’. מודלים אלה מייצרים לעתים קרובות הסברים מפורטים צעד אחר צעד לתשובותיהם, וצורכים כוח עיבוד משמעותי. ‘מודלי חשיבה גורמים לשימוש בקיבולת רבה’, קבע Gerstenhaber.
בעוד ש-Anthropic עובדת באופן פעיל עם AWS על טכניקות אופטימיזציה כמו ‘prompt caching’ (אחסון ושימוש חוזר בחישובים מאינטראקציות קודמות כדי לחסוך במשאבים), דרישת החומרה הבסיסית נותרה עצומה. Gerstenhaber קבע בבוטות ש-Anthropic זקוקה ל’מאות אלפי מאיצים’ – שבבי AI ייעודיים – המפוזרים ‘על פני מרכזי נתונים רבים’ פשוט כדי להריץ את חבילת המודלים הנוכחית שלה. זה מספק תחושה קונקרטית של היקף משאבי החישוב העצומים העומדים בבסיס שחקן AI מרכזי אחד בלבד.
מה שמחריף את האתגר של רכישה וניהול של ציים עצומים של סיליקון הוא צריכת האנרגיה המזנקת הקשורה ל-AI. Brown הדגיש זאת כדאגה קריטית, ומתגברת במהירות. מרכזי נתונים נוכחיים התומכים בעומסי עבודה אינטנסיביים של AI כבר צורכים חשמל הנמדד במאות מגה-וואט. תחזיות מצביעות על כך שדרישות עתידיות יעלו בהכרח לטווח הג’יגה-וואט – התפוקה של תחנות כוח גדולות. ‘הכוח שהוא צורך’, הזהיר Brown, בהתייחסו ל-AI, ‘הוא גדול, והטביעה גדולה במרכזי נתונים רבים’. דרישת האנרגיה הגואה הזו מציבה לא רק עלויות תפעול עצומות אלא גם אתגרים סביבתיים ולוגיסטיים משמעותיים לאיתור והפעלת הדור הבא של תשתית ה-AI.
הג’וקר הכלכלי: צל על תוכניות הצמיחה
למרות התחזית השורית המונעת על ידי התקדמות טכנולוגית ומקרי שימוש מתפתחים, משתנה משמעותי מרחף מעל כל התחזיות להשקעות ב-AI: האקלים הכלכלי הרחב יותר. כשהכנס של Bloomberg Intelligence הסתיים, המשתתפים כבר הבחינו בתנודתיות בשוק שנבעה מחבילות מכסים גלובליות שהוכרזו לאחרונה, שנתפסו כנרחבות מהצפוי.
זה משמש כתזכורת חזקה לכך שמפות דרכים טכנולוגיות שאפתניות יכולות להשתבש במהירות על ידי רוחות נגדיות מאקרו-כלכליות. Rana מ-Bloomberg הזהיר שבעוד שהוצאות ה-AI עשויות להיות מבודדות במידה מסוימת בתחילה, תחומי השקעה מסורתיים ב-IT תאגידי, כגון שרתים ואחסון שאינם קשורים ל-AI, עשויים להיות הנפגעים הראשונים בהתכווצות כלכלית. ‘הדבר הגדול האחר שאנו מתמקדים בו הוא הוצאות הטכנולוגיה שאינן AI’, הוא ציין, והביע דאגה מההשפעה הפוטנציאלית על ספקי שירותי טכנולוגיה גדולים לקראת עונת הדוחות, עוד לפני התחשבות בתקציבי AI ספציפית.
עם זאת, קיימת תיאוריה רווחת ש-AI עשוי להתגלות כעמיד באופן ייחודי. Rana הציע שמנהלי כספים ראשיים (CFOs) בתאגידים גדולים, העומדים בפני מגבלות תקציב עקב אי ודאות כלכלית או אפילו מיתון, עשויים לבחור לתעדף יוזמות AI. הם עשויים להעביר כספים מתחומים פחות קריטיים כדי להגן על השקעות AI אסטרטגיות הנתפסות כחיוניות לתחרותיות עתידית.
עם זאת, השקפה אופטימית זו רחוקה מלהיות מובטחת. המבחן האולטימטיבי, לדברי Rana, יהיה האם תאגידים גדולים ישמרו על יעדי ההוצאות ההוניות האגרסיביים שלהם, במיוחד לבניית מרכזי נתונים של AI, לנוכח אי הוודאות הכלכלית הגוברת. השאלה הקריטית נותרה: ‘האם הם יגידו, ‘אתם יודעים מה? זה לא ודאי מדי’’. התשובה תקבע אם המומנטום שנראה בלתי ניתן לעצירה מאחורי הוצאות תשתית ה-AI ימשיך בטיפוסו הבלתי פוסק או יתמודד עם הפסקה בלתי צפויה המוכתבת על ידי מציאות כלכלית גלובלית.