בזירה עתירת הסיכונים של פיתוח בינה מלאכותית, הגישה לטכנולוגיית מוליכים למחצה מתקדמת מכתיבה לעתים קרובות את קצב החדשנות. עבור ענקיות טכנולוגיה סיניות, גישה זו הפכה למורכבת יותר ויותר, מעוצבת על ידי מתחים גיאופוליטיים ובקרות יצוא מחמירות שהוטלו על ידי ארצות הברית. בתוך נוף מאתגר זה, Ant Group, מעצמת הפינטק המסונפת ל-Alibaba, סוללת נתיב ייחודי. החברה פורסת באופן אסטרטגי תמהיל הטרוגני של מוליכים למחצה, שמקורם בספקים אמריקאים ומקומיים כאחד, כדי להניע את שאיפות ה-AI שלה, תוך התמקדות מיוחדת בשיפור היעילות והכדאיות הכלכלית של אימון מודלי AI מתוחכמים.
גישה מחושבת זו היא יותר מסתם פתרון טכני; היא מייצגת הסתגלות אסטרטגית יסודית. על ידי שילוב מכוון של שבבים מיצרנים שונים, כולל חלופות מתוצרת מקומית, Ant Group שואפת למתן את הסיכונים הקשורים לשיבושים בשרשרת האספקה ולהפחית את תלותה בכל ספק יחיד, במיוחד אלה הכפופים למגבלות סחר בינלאומיות. גיוון זה חיוני להבטחת ההמשכיות והחוסן של צינור המחקר והפיתוח שלה בתחום ה-AI. המטרה המרכזית היא כפולה: לשמור על מומנטום בחדשנות AI תוך אופטימיזציה בו-זמנית של העלויות המשמעותיות הקשורות בדרך כלל לאימון מודלים בקנה מידה גדול.
הכוח של התמחות: אימוץ Mixture of Experts (MoE)
במרכז אסטרטגיית החומרה של Ant Group עומד אימוץ ארכיטקטורת AI מתקדמת המכונה Mixture of Experts (MoE). טכניקה זו מייצגת סטייה משמעותית ממודלי AI מונוליטיים מסורתיים, שבהם רשת עצבית אחת, מסיבית, מנסה ללמוד ולטפל בכל ההיבטים של משימה נתונה. גישת ה-MoE, לעומת זאת, משתמשת במבנה מבוזר ומתמחה יותר. היא מתפקדת בדומה לוועדת מומחים ולא כגנרליסט יחיד.
דמיינו בעיה מורכבת הדורשת ידע מגוון. במקום להסתמך על פולימת אחד, אתם מרכיבים צוות: מתמטיקאי, בלשן, היסטוריון ואולי פיזיקאי. ‘רשת שער’ (gating network) פועלת כשדרן, מנתחת משימות נכנסות או נקודות נתונים ומנתבת אותן בצורה חכמה למודל ה’מומחה’ המתאים ביותר בתוך המערכת הגדולה יותר. כל מודל מומחה מאומן להצטיין בסוגים ספציפיים של קלט או תת-משימות. לדוגמה, במודל שפה, מומחה אחד עשוי להתמחות בהבנת ז’רגון טכני, אחר בסגנונות כתיבה יצירתיים, ושלישי בדיאלוג שיחתי.
היתרון המרכזי של עיצוב מודולרי זה טמון ביעילות החישובית שלו. במהלך אימון או הסקה (inference - כאשר המודל מבצע תחזיות), רק מודלי המומחים הרלוונטיים ורשת השער מופעלים עבור קלט נתון. חישוב סלקטיבי זה עומד בניגוד חריף למודלים צפופים (dense models) שבהם הרשת כולה, על מיליארדי או אפילו טריליוני הפרמטרים שלה, חייבת להיות מעורבת בכל חישוב בודד. כתוצאה מכך, מודלי MoE יכולים להשיג ביצועים דומים או אפילו עדיפים על מקביליהם הצפופים תוך דרישה לכוח חישובי נמוך משמעותית, ולכן פחות אנרגיה.
Ant Group מינפה יתרון ארכיטקטוני זה ביעילות. מחקר פנימי ויישום מעשי הראו ש-MoE מאפשר לחברה להשיג תוצאות אימון חזקות גם בעת שימוש בחומרה פחות חזקה, זמינה יותר או בעלות נמוכה יותר. על פי ממצאים ששותפו על ידי החברה, יישום אסטרטגי זה של MoE אפשר הפחתה ראויה לציון של 20% בעלויות המחשוב הקשורות לאימון מודלי ה-AI שלה. אופטימיזציית עלויות זו אינה רק חיסכון שולי; היא מאפשרת אסטרטגית, המאפשרת ל-Ant להמשיך בפרויקטי AI שאפתניים מבלי להסתמך בהכרח רק על יחידות העיבוד הגרפי (GPUs) היקרות ביותר מהשורה הראשונה, שהופכות קשות יותר ויותר להשגה עבור חברות סיניות. רווח יעילות זה מתמודד ישירות עם מגבלות החומרה שהוטלו על ידי הסביבה החיצונית.
מארג של סיליקון: פורטפוליו החומרה של Ant
היישום המעשי של האסטרטגיה של Ant Group כרוך בניווט בנוף מוליכים למחצה מורכב. על פי הדיווחים, תשתית אימון ה-AI של החברה מופעלת על ידי מגוון רחב של שבבים, המשקפים את מחויבותה לגמישות וחוסן. זה כולל סיליקון שתוכנן בתוך הבית על ידי החברה המסונפת לה, Alibaba, ככל הנראה בהתייחס לשבבים שפותחו על ידי יחידת המוליכים למחצה T-Head של Alibaba. יתר על כן, Ant משלבת שבבים מ-Huawei, ענקית טכנולוגיה סינית נוספת שהשקיעה רבות בפיתוח מאיצי AI משלה (כמו סדרת Ascend) בתגובה לסנקציות האמריקאיות.
בעוד ש-Ant Group השתמשה היסטורית ב-GPUs בעלי ביצועים גבוהים מבית Nvidia, המובילה הבלתי מעורערת בשוק אימוני ה-AI, בקרות הייצוא המתפתחות של ארה”ב חייבו שינוי. תקנות אלה מגבילות באופן ספציפי את מכירת מאיצי ה-AI המתקדמים ביותר לגופים סיניים, תוך ציון חששות לביטחון לאומי. למרות ש-Nvidia עדיין יכולה לספק שבבים במפרט נמוך יותר לשוק הסיני, נראה ש-Ant Group מרחיבה באופן פעיל את בסיס הספקים שלה כדי לפצות על הגישה המוגבלת למוצרי Nvidia מהשורה הראשונה.
גיוון זה כולל באופן בולט שבבים מבית Advanced Micro Devices (AMD). AMD התגלתה כמתחרה משמעותית ל-Nvidia בתחום המחשוב עתיר הביצועים וה-AI, ומציעה GPUs חזקים המהווים חלופה בת-קיימא עבור עומסי עבודה מסוימים. על ידי שילוב חומרת AMD לצד אפשרויות מקומיות מ-Alibaba ו-Huawei, Ant בונה סביבת מחשוב הטרוגנית. גישת ‘ערבב והתאם’ זו, למרות שהיא עשויה להוסיף מורכבות באופטימיזציית תוכנה וניהול עומסי עבודה, מספקת גמישות חיונית. היא מאפשרת לחברה להתאים את השימוש בחומרה שלה בהתבסס על זמינות, עלות והדרישות החישוביות הספציפיות של מודלי AI ומשימות שונות, ובכך לעקוף צווארי בקבוק הנגרמים מהסתמכות על מקור יחיד ומוגבל.
הרקע לאסטרטגיה זו הוא הרשת הסבוכה של בקרות הייצוא האמריקאיות. צעדים אלה הודקו בהדרגה, במטרה לבלום את התקדמותה של סין בייצור מוליכים למחצה מתקדמים ופיתוח AI. בעוד שבתחילה התמקדו בשבבים מהקצה העליון המוחלט, המגבלות התפתחו, והשפיעו על מגוון רחב יותר של חומרה וציוד לייצור מוליכים למחצה. Nvidia, לדוגמה, נאלצה ליצור גרסאות ספציפיות בעלות ביצועים נמוכים יותר של שבבי ה-AI המובילים שלה (כמו ה-A800 וה-H800, שנגזרו מה-A100 וה-H100) עבור השוק הסיני כדי לעמוד בתקנות אלה. האסטרטגיה של Ant לאמץ חלופות מ-AMD ושחקנים מקומיים היא תגובה ישירה ופרגמטית ללחץ רגולטורי זה, המדגימה מאמץ לשמור על תחרותיות בתחום ה-AI במסגרת האילוצים הנתונים.
AI בפעולה: שינוי שירותי בריאות
ההתקדמות של Ant Group ביעילות AI אינן רק תרגילים תיאורטיים; הן מתורגמות באופן פעיל ליישומים בעולם האמיתי, עם התמקדות בולטת במגזר הבריאות. החברה חשפה לאחרונה שיפורים משמעותיים בפתרונות ה-AI שלה המותאמים לשירותי בריאות, המדגישים את ההשפעה המעשית של אסטרטגיית הטכנולוגיה הבסיסית שלה.
יכולות AI משודרגות אלו נמצאות כבר בשימוש במספר מוסדות בריאות בולטים בערים סיניות מרכזיות, כולל Beijing, Shanghai, Hangzhou (מטה Ant) ו-Ningbo. שבעה בתי חולים וארגוני בריאות מרכזיים ממנפים את ה-AI של Ant כדי לשפר היבטים שונים של פעילותם וטיפול בחולים.
הבסיס של מודל ה-AI לשירותי בריאות של Ant הוא עצמו דוגמה לחדשנות שיתופית ומינוף של חוזקות טכנולוגיות מגוונות. הוא בנוי על שילוב של מודלי שפה גדולים (LLMs) חזקים:
- מודלי R1 ו-V3 של DeepSeek: DeepSeek היא חברת מחקר AI סינית בולטת הידועה בפיתוח מודלי קוד פתוח בעלי יכולות, שלעתים קרובות משיגים ציוני ביצועים חזקים.
- Qwen של Alibaba: זוהי משפחת מודלי השפה הגדולים הקנייניים שפותחו על ידי החברה המסונפת ל-Ant, Alibaba, המכסה מגוון גדלים ויכולות.
- מודל BaiLing של Ant עצמה: זה מצביע על המאמצים הפנימיים של Ant Group בפיתוח מודלי AI מותאמים אישית לצרכיה הספציפיים, ככל הנראה משלבים נתונים ומומחיות פיננסיים ואולי ספציפיים לשירותי בריאות.
בסיס רב-מודלי זה מאפשר לפתרון ה-AI לשירותי בריאות לשאוב מבסיס ידע ויכולות רחב. על פי Ant Group, המערכת מיומנת במתן מענה לשאילתות במגוון רחב של נושאים רפואיים, ועשויה לשמש ככלי רב ערך הן לאנשימקצוע בתחום הבריאות המחפשים מידע מהיר והן למטופלים המחפשים ידע רפואי כללי (אם כי תיחום קפדני של תפקידה לעומת ייעוץ רפואי מקצועי הוא חיוני).
מעבר לאחזור מידע, החברה מציינת כי מודל ה-AI נועד לשפר את שירותי המטופלים. בעוד שפרטים ספציפיים מתגלים, זה יכול לכלול מגוון יישומים, כגון:
- מיון חכם (Intelligent Triage): סיוע בתעדוף צרכי המטופל בהתבסס על תסמינים מתוארים.
- תזמון וניהול תורים: אוטומציה ואופטימיזציה של תהליך הזמנת התורים.
- מעקב לאחר שחרור: מתן תזכורות אוטומטיות או בדיקת התקדמות ההחלמה של המטופלים.
- תמיכה אדמיניסטרטיבית: סיוע לצוות הרפואי במשימות תיעוד, סיכום או הזנת נתונים, ובכך פינוי זמן לטיפול ישיר בחולה.
הפריסה בבתי חולים מרכזיים מסמלת צעד קריטי באימות התועלת של הטכנולוגיה ובניווט במורכבויות של תחום הבריאות, הכרוך בדרישות מחמירות לדיוק, אמינות ופרטיות נתונים.
ניווט מסלול מעבר ל-GPUs פרימיום
במבט קדימה, נראה שהאסטרטגיה של Ant Group מתיישרת עם שאיפה רחבה יותר בתעשיית הטכנולוגיה הסינית: להשיג ביצועי AI מתקדמים מבלי להסתמך אך ורק על ה-GPUs המתקדמים ביותר, שלעתים קרובות מוגבלים. על פי הדיווחים, החברה מתכננת לחקות את הנתיב שננקט על ידי ארגונים כמו DeepSeek, תוך התמקדות בשיטות להרחבת (scale) מודלי AI בעלי ביצועים גבוהים ‘ללא GPUs פרימיום’.
שאיפה זו מאותתת על אמונה שחידושים ארכיטקטוניים (כמו MoE), אופטימיזציות תוכנה, והניצול החכם של חומרה מגוונת, פוטנציאלית פחות חזקה, יכולים יחד לגשר על פער הביצועים שנוצר עקב גישה מוגבלת לסיליקון מהשורה הראשונה. זוהי אסטרטגיה שנולדה בחלקה מתוך הכרח עקב בקרות יצוא, אך היא גם משקפת נתיב בר-קיימא פוטנציאלי לפיתוח AI חסכוני ודמוקרטי יותר.
השגת מטרה זו כרוכה בחקר אפיקים שונים מעבר ל-MoE בלבד:
- יעילות אלגוריתמית: פיתוח אלגוריתמי AI חדשים הדורשים פחות כוח חישובי לאימון והסקה.
- טכניקות אופטימיזציה של מודלים: שימוש בשיטות כמו קוונטיזציה (quantization - הפחתת הדיוק של המספרים המשמשים בחישובים) וגיזום (pruning - הסרת חלקים מיותרים של הרשת העצבית) כדי להפוך מודלים לקטנים ומהירים יותר ללא אובדן ביצועים משמעותי.
- מסגרות תוכנה (Software Frameworks): יצירת תוכנה מתוחכמת שיכולה לנהל ולהפיץ ביעילות עומסי עבודה של AI על פני סביבות חומרה הטרוגניות, תוך מקסום הניצול של משאבי המחשוב הזמינים.
- חומרה מקומית מתמחה: המשך השקעה וניצול של מאיצי AI שפותחו על ידי חברות סיניות כמו Huawei (Ascend), Alibaba (T-Head), ואולי אחרות, שתוכננו במיוחד למשימות AI.
המרדף של Ant Group אחר נתיב זה, לצד אחרים באקוסיסטם הטכנולוגי של סין, עשוי להיות בעל השלכות משמעותיות. אם יצליח, הוא יוכל להדגים שהובלה בתחום ה-AI אינה תלויה אך ורק בגישה לשבבים המהירים ביותר, אלא תלויה גם בחדשנות בתוכנה, בארכיטקטורה ובאופטימיזציה ברמת המערכת. הוא מייצג מאמץ נחוש לבנות יכולת AI חסינה ועצמאית, תוך ניווט במורכבויות של נוף הטכנולוגיה העולמי הנוכחי באמצעות גיוון אסטרטגי וחדשנות בלתי פוסקת. השילוב של מוליכים למחצה אמריקאים וסיניים, שעברו אופטימיזציה באמצעות טכניקות כמו MoE ויושמו במגזרים קריטיים כמו שירותי בריאות, מציג גישה פרגמטית ומסתגלת לקיום התקדמות AI תחת לחץ.