הגישה החדשנית של Ant לאימון מודלי AI
קבוצת Ant, ענקית הפינטק הנתמכת על ידי ג’ק מא, השיגה פריצת דרך משמעותית בתחום הבינה המלאכותית על ידי שימוש במוליכים למחצה מתוצרת סין. גישה חדשנית זו אפשרה לחברה לפתח טכניקות לאימון מודלי AI, וכתוצאה מכך להפחית את העלויות ב-20% באופן מרשים. מקורות המכירים את הנושא חשפו כי Ant השתמשה בשבבים מקומיים, כולל אלה של החברה המסונפת לה Alibaba Group Holding Ltd. ו-Huawei Technologies Co., כדי לאמן מודלים תוך שימוש בגישת למידת המכונה Mixture of Experts (MoE).
התוצאות שהשיגה Ant היו דומות לאלו שהושגו באמצעות שבבי Nvidia Corp., כגון H800, מעבד רב עוצמה שהייצוא שלו לסין הוגבל על ידי ארה”ב. בעוד ש-Ant ממשיכה להשתמש ב-Nvidia לפיתוח AI, היא מסתמכת יותר ויותר על חלופות, כולל Advanced Micro Devices Inc. (AMD) ושבבים סיניים, עבור המודלים העדכניים ביותר שלה.
כניסה למרוץ ה-AI: סין נגד ארה”ב
הכניסה של Ant לפיתוח מודלי AI ממקמת אותה במרכזה של תחרות עזה בין חברות סיניות ואמריקאיות. מרוץ זה התעצם מאז ש-DeepSeek הדגימה את הפוטנציאל של אימון מודלים בעלי יכולת גבוהה בשבריר מהעלות שנגרמה על ידי ענקיות התעשייה כמו OpenAI ו-Alphabet Inc.’s Google, שהשקיעו מיליארדים. ההישג של Ant מדגיש את הנחישות של חברות סיניות להשתמש בחלופות ממקור מקומי למוליכים למחצה המתקדמים ביותר של Nvidia.
ההבטחה של הסקת AI חסכונית
מאמר המחקר שפרסמה Ant החודש מדגיש את הפוטנציאל של המודלים שלה, וטוען לביצועים מעולים במדדים מסוימים בהשוואה ל-Meta Platforms Inc., אם כי טענות אלו לא אומתו באופן עצמאי על ידי Bloomberg News. עם זאת, אם הפלטפורמות של Ant יפעלו כפי שפורסם, הן עשויות לייצג התקדמות משמעותית בפיתוח הבינה המלאכותית הסינית. זאת בעיקר בשל יכולתן להפחית באופן דרסטי את עלות ההסקה, שהיא תהליך התמיכה בשירותי AI.
Mixture of Experts: משנה את כללי המשחק ב-AI
ככל שחברות משקיעות משאבים ניכרים ב-AI, מודלי MoE זכו לבולטות כגישה פופולרית ויעילה. טכניקה זו, המופעלת על ידי חברות כמו Google והסטארט-אפ DeepSeek מהאנגג’ואו, כוללת חלוקת משימות לקבוצות נתונים קטנות יותר. זה מקביל לצוות של מומחים, שכל אחד מהם מתמקד בפלח ספציפי של עבודה, ובכך מייעל את התהליך הכולל.
התגברות על צוואר הבקבוק של ה-GPU
באופן מסורתי, אימון מודלי MoE הסתמך במידה רבה על שבבים בעלי ביצועים גבוהים, כגון יחידות העיבוד הגרפיות (GPUs) המיוצרות על ידי Nvidia. העלות האסורה של שבבים אלה הייתה מכשול מרכזי עבור חברות קטנות רבות, והגבילה את האימוץ הנרחב של מודלי MoE. Ant, לעומת זאת, עבדה בשקידה על שיטות לאימון מודלי שפה גדולים (LLMs) בצורה יעילה יותר, תוך הסרת מגבלה זו. כותרת מאמר המחקר שלהם, שמציבה את המטרה להרחיב מודל “ללא GPUs מובחרים”, משקפת בבירור מטרה זו.
קריאת תיגר על הדומיננטיות של Nvidia
הגישה של Ant קוראת תיגר ישירות על האסטרטגיה הרווחת שבה תומך מנכ”ל Nvidia, ג’נסן הואנג. הואנג טען בעקביות שהביקוש החישובי ימשיך לגדול, אפילו עם הופעתם של מודלים יעילים יותר כמו R1 של DeepSeek. הוא מאמין שחברות ידרשו שבבים טובים יותר כדי לייצר הכנסות גבוהות יותר, ולא שבבים זולים יותר כדי להפחית עלויות. כתוצאה מכך, Nvidia שמרה על התמקדותה בבניית GPUs גדולים עם ליבות עיבוד משופרות, טרנזיסטורים ויכולת זיכרון מוגברת.
כימות החיסכון בעלויות
Ant סיפקה נתונים קונקרטיים כדי להדגים את העלות-תועלת של הגישה הממוטבת שלה. החברה הצהירה שאימון טריליון טוקנים באמצעות חומרה בעלת ביצועים גבוהים יעלה כ-6.35 מיליון יואן (880,000 דולר). עם זאת, על ידי שימוש בחומרה בעלת מפרט נמוך יותר ובטכניקות הממוטבות שלה, Ant יכולה להפחית את העלות הזו ל-5.1 מיליון יואן. טוקנים מייצגים את יחידות המידע שמודל מעבד כדי ללמוד על העולם ולספק תגובות רלוונטיות לשאילתות משתמשים.
מינוף פריצות דרך ב-AI לפתרונות תעשייתיים
Ant מתכננת לנצל את ההתקדמות האחרונה שלה במודלי שפה גדולים, במיוחד Ling-Plus ו-Ling-Lite, כדי לפתח פתרונות AI תעשייתיים עבור מגזרים כמו שירותי בריאות ופיננסים. מודלים אלה נועדו לתת מענה לצרכים ספציפיים בתעשייה ולספק פתרונות מותאמים אישית.
הרחבת יישומי AI בשירותי בריאות
המחויבות של Ant לשירותי בריאות ניכרת בשילוב הפלטפורמה המקוונת הסינית Haodf.com בשירותי הבינה המלאכותית שלה. באמצעות יצירת AI Doctor Assistant, Ant שואפת לתמוך ברשת הענפה של Haodf המונה 290,000 רופאים על ידי סיוע במשימות כגון ניהול רשומות רפואיות. יישום זה של AI עשוי לשפר משמעותית את היעילות והדיוק במתן שירותי בריאות.
סיוע מבוסס AI לחיי היומיום
מעבר לשירותי בריאות, Ant פיתחה גם אפליקציית “עוזר חיים” AI בשם Zhixiaobao ושירות ייעוץ פיננסי AI בשם Maxiaocai. יישומים אלה מדגימים את השאיפה של Ant לשלב AI בהיבטים שונים של חיי היומיום, ולספק למשתמשים סיוע מותאם אישית וחכם.
השוואת ביצועים: מודלי Ling מול מתחרים
במאמר המחקר שלה, Ant טוענת שמודל Ling-Lite התעלה על אחד ממודלי Llama של Meta במדד מפתח להבנת השפה האנגלית. יתר על כן, גם מודלי Ling-Lite וגם Ling-Plus הפגינו ביצועים מעולים בהשוואה למקביליהם של DeepSeek במדדים בשפה הסינית. זה מדגיש את מעמדה התחרותי של Ant בנוף ה-AI.
כפי שרובין יו, מנהל הטכנולוגיה הראשי של ספקית פתרונות AI מבייג’ינג Shengshang Tech Co., ציין בצדק, “אם אתה מוצא נקודת תקיפה אחת כדי לנצח את אמן הקונג פו הטוב בעולם, אתה עדיין יכול לומר שניצחת אותם, וזו הסיבה שיישום בעולם האמיתי חשוב.”
קוד פתוח לשיתוף פעולה וחדשנות
Ant הפכה את מודלי Ling לקוד פתוח, תוך טיפוח שיתוף פעולה וחדשנות בתוך קהילת ה-AI. Ling-Lite כולל 16.8 מיליארד פרמטרים, שהם הגדרות מתכווננות השולטות בביצועי המודל. Ling-Plus, לעומת זאת, מתגאה ב-290 מיליארד פרמטרים גדולים משמעותית, ומציב אותו בין מודלי השפה הגדולים יותר. כדי לספק הקשר, מומחים מעריכים של-GPT-4.5 של ChatGPT יש כ-1.8 טריליון פרמטרים, בעוד של-DeepSeek-R1 יש 671 מיליארד.
התמודדות עם אתגרים באימון מודלים
המסע של Ant בפיתוח מודלים אלה לא היה חף מאתגרים. החברה נתקלה בקשיים בתחומים מסוימים של אימון, במיוחד בכל הנוגע ליציבות. אפילו שינויים קלים בחומרה או במבנה המודל עלולים להוביל לבעיות, כולל תנודות בשיעור השגיאות של המודלים. זה מדגיש את המורכבות והרגישות הכרוכות באימון מודלי AI מתקדמים.
פריסה בעולם האמיתי בשירותי בריאות
המחויבות של Ant ליישומים מעשיים מודגמת עוד יותר על ידי פריסת מכונות מודל גדולות המתמקדות בשירותי בריאות. מכונות אלה נמצאות כעת בשימוש על ידי שבעה בתי חולים וספקי שירותי בריאות בערים מרכזיות כמו בייג’ינג ושנגחאי. המודל הגדול ממנף את DeepSeek R1, Qwen של Alibaba ואת ה-LLM של Ant עצמה כדי לספק שירותי ייעוץ רפואי.
סוכני AI לשירותי בריאות משופרים
בנוסף למכונות המודל הגדולות, Ant הציגה שני סוכני AI רפואיים: Angel ו-Yibaoer. Angel כבר שירת למעלה מ-1,000 מתקנים רפואיים, בעוד ש-Yibaoer מספק תמיכה בשירותי ביטוח רפואי. יתר על כן, בספטמבר של השנה הקודמת, Ant השיקה את שירות AI Healthcare Manager באפליקציית התשלומים Alipay שלה, והרחיבה עוד יותר את טווח ההגעה שלה בתחום הבריאות. יוזמות אלה מדגימות את מסירותה של Ant למינוף AI כדי לשנות ולשפר את אספקת שירותי הבריאות.