התכנסות הקוד הפתוח הסיני
בתחילת פברואר, כאשר מודל השפה הגדול הסיני בקוד פתוח DeepSeek עמד בראש טבלאות ההורדות בשוק האפליקציות ב-140 מדינות ואזורים ברחבי העולם, OpenAI האשימה בפומבי את DeepSeek בשימוש בנתונים מזוקקים מ-ChatGPT ללא רשות.
במקום להציל את המוניטין של OpenAI, האשמה זו התקבלה בלעג נרחב מצד חוקרים ברחבי העולם.
כעת, מתמודד נוסף, שמאמץ באופן מלא את היתרון של “זיקוק”, הופיע.
ב-13 באפריל, Kunlun Wanwei השיקה את מודלי סדרת Skywork-OR1 (Open Reasoner 1), שעולים על Qwen-32B של עליבאבא באותו קנה מידה ומתיישרים עם DeepSeek-R1.
כיצד Kunlun Wanwei, חברה עם משאבים כספיים מוגבלים, יכולה ליצור מודל שפה גדול ברמת SOTA? ההסבר הרשמי הוא שהמודלים שלהם מבוססים על DeepSeek-R1-Distill-Qwen-7B ו-DeepSeek-R1-Distill-Qwen-32B.
כפי שהשמות מרמזים, המודלים של DeepSeek זיקקו את מודלי סדרת Qwen של עליבאבא.
תוך מינוף מודלים מצוינים בקוד פתוח, Kunlun Wanwei תורמת גם לקהילת הקוד הפתוח. שלא כמו DeepSeek, שרק פתחה את משקלי המודל, Kunlun Wanwei פתחה גם את מערכי הנתונים וקוד האימון שלה, והתיישרה בצורה הדוקה יותר עם הרעיון של “קוד פתוח אמיתי”. זה אומר שכל משתמש יכול לנסות לשחזר את תהליך אימון המודל שלהם.
ההישג של Kunlun Wanwei מדגים את ההיבט החשוב ביותר של קוד פתוח: הוא לא רק מספק למשתמשים מוצר חינמי וזמין, אלא גם מאפשר ליותר מפתחים לעמוד על כתפי קודמיהם, ולקדם במהירות וביעילות מבחינה כלכלית את הטכנולוגיה.
למעשה, בין הדיונים בתעשייה בשנה שעברה על צוואר הבקבוק באימון מוקדם של מודלים גדולים, קצב האיטרציה של מודלים גדולים סיניים הואץ השנה, כאשר יותר ויותר חברות משקיעות בקוד פתוח.
Tongyi Qianwen של Alibaba Cloud פתחה את המודל החזותי החדש שלה Qwen2.5-VL בערב ראש השנה הסיני, ושחררה ופתחה את מודל הנימוקים החדש שלה QwQ-32B בתחילת מרץ, ועמדה בראש רשימת הטרנדים של קהילת הקוד הפתוח העולמית המרכזית Hugging Face ביום שבו נפתחה.
לאחר מכן Stepwise פתחה שלושה מודלים גדולים מרובי מודלים בערך בחודש, האחרון שבהם הוא מודל התמונה לווידאו Step-Video-TI2V, שתומך ביצירת סרטונים עם משרעת תנועה וצילום עדשה ניתנים לשליטה, ומגיע גם עם יכולות יצירת אפקטים מיוחדים מסוימים.
Zhipu הכריזה באפריל שתפתח את מודלי סדרת GLM 32B/9B, המכסים מודלים בסיסיים, מודלים של נימוקים ומודלים רפלקטיביים, כולם תחת הסכם רישיון MIT.
אפילו Baidu, שפעם הייתה קוד סגור, הודיעה שהיא תפתח באופן מלא את מודל Wenxin ב-30 ביוני.
בהשוואה לשגשוג הגובר של המערכת האקולוגית של קוד פתוח מקומי, חברות מודל גדולות אמריקאיות עדיין מתמקדות בעיקר בקוד סגור, מה שנתן למודלים גדולים סיניים הזדמנות נדירה לצאת לחו”ל. DeepSeek אפשרה לחברת החינוך האינדונזית Ruangguru לייעל את מודל ההוראה שלה בעלות נמוכה; חברת הטכנולוגיה הסינגפורית B2B Atlas שילבה את Qwen במערכת שירות הלקוחות החכמה שלה כדי להשיג תמיכה רב-לשונית 24/7.
מדוע קוד סגור בארה”ב, קוד פתוח בסין?
הנטייה לקראת קוד סגור בתעשיית הבינה המלאכותית בארה”ב והפתיחות הגוברת של הבינה המלאכותית הסינית הן תוצאות בלתי נמנעות של סביבות פיתוח הבינה המלאכותית השונות בשתי המדינות.
תעשיית הבינה המלאכותית בארה”ב מובלת בעיקר על ידי ענקיות טכנולוגיה וקרנות הון סיכון (VC), שלהן ציפיות עצומות לתשואות הון מבינה מלאכותית. לכן, לחברות מודל AI בארה”ב יש בדרך כלל אמונה חזקה בטכנולוגיה, כלומר, לרדוף אחר מנהיגות טכנולוגית, להשיג מידה מסוימת של מונופול בשוק, ואז ליצור רווחים עצומים, והמערכת האקולוגית שלהן נוטה באופן טבעי לקוד סגור.
אם ניקח לדוגמה את ההיסטוריה ההתפתחותית של OpenAI, היא החלה כגוף ללא מטרות רווח במהלך הקמתה, אך מאז הפכה לסגורה יותר ויותר. GPT-1 היה קוד פתוח לחלוטין, GPT-2 היה קוד פתוח חלקי ונתקל בהתנגדות לפני שהיה קוד פתוח לחלוטין, GPT-3 הפך רשמית לקוד סגור, ולאחר מכן GPT-4 חיזק עוד יותר את אסטרטגיית הקוד הסגור, כאשר ארכיטקטורת המודל ונתוני האימון חסויים לחלוטין, ואפילו הגבלת תדירות קריאות ה-API של משתמשים ארגוניים.
למרות ש-OpenAI אמרה שסגירת קוד מבוססת על ציות ושליטה בניצול לרעה של טכנולוגיה, השוק מאמין בדרך כלל שהאירוע המכונן של המעבר של OpenAI לקוד סגור היה הגעתה לשיתוף פעולה של מאה מיליארד דולר עם מיקרוסופט, והטמעת GPT-3 בשירותי הענן של Azure כדי ליצור מעגל סגור של “טכנולוגיה-הון”.
כאשר מיקרוסופט חשפה לראשונה את השקעתה ב-OpenAI בדוח הכספי שלה באוקטובר אשתקד, היא אמרה: “השקענו ב-OpenAIGlobal, LLC, עם התחייבות השקעה כוללת של 13 מיליארד דולר, וההשקעה מחושבת בשיטת השווי העצמי.”
שיטת השווי העצמי יכולה גם להיות מובנת כהשקעה של מיקרוסופט ב-OpenAI שמטרתה השגת תשואות ולא מחקר צדקה טהור. ברור שמכירת ממשקי API יקרים באמצעות מערכת אקולוגית סגורה היא מקור ההכנסות הגדול ביותר שלה כיום, והפכה למכשול הגדול ביותר לחוסר הנכונות של OpenAI לפתוח את הקוד.
Anthropic, שנוסדה מה”פיצול” של OpenAI, נחושה לנקוט בדרך הקוד הסגור מההתחלה, ומוצר המודל הגדול שלה Claude אימץ באופן מלא את מודל הקוד הסגור.
אפילו Llama של META, מובילת הקוד הפתוח היחידה בארצות הברית, הוסיפה שני סעיפים אנטי-חברים כאשר פתחה את הקוד:
- לא ניתן להשתמש במודלים בקוד פתוח עבור מוצרים ושירותים עם יותר מ-700 מיליון משתמשים פעילים חודשיים לפני ש-META מאשרת אותם.
- לא ניתן להשתמש בתוכן הפלט של מודלי Llama כדי לאמן ולשפר מודלים שפה גדולים אחרים.
ניתן לראות שאפילו עבור מודלים בקוד פתוח, המטרה העיקרית של Meta היא עדיין לבנות מערכת אקולוגית בינה מלאכותית משלה ולא הכללה טכנית.
ארצות הברית בחרה באסטרטגיית בינה מלאכותית המבוססת על קוד סגור עם קוד פתוח כתוספת ברמת ההון, וניתן לומר שהיא שיקולים מסחריים טהורים. לעומת זאת, התכנון המעולה מלמעלה למטה של סין ייחס חשיבות לקוד פתוח מההתחלה, ושיקף נתיב ראשון בתעשייה במסגרת הרעיון של שליטה עצמאית.
כבר בשנת 2017, ממשלת סין פרסמה את “תוכנית הפיתוח של הדור החדש של בינה מלאכותית”, שהציעה בבירור להאיץ את השילוב העמוק של בינה מלאכותית עם הכלכלה והחברה, ולפרוס כדי לבנות את היתרון הראשון של פיתוח בינה מלאכותית. בשנת 2021, תוכן הקשור לקוד פתוח נכלל במפורש ב”תכנית החומש ה-14” של סין, שעוררה קידום פעיל של חדשנות טכנולוגית על ידי ממשלות מקומיות.
מיי הונג, אקדמאי באקדמיה הסינית למדעים, אמר פעם שהפיתוח העתידי של מודלי שפה חייב להסתמך על פלטפורמות קוד פתוח. רק בסביבה פתוחה ניתן להבטיח את האבטחה והמהימנות של העלאות נתונים ושילוב עסקי עבור משתמשים בתעשיות שונות.
“תוכנית הפעולה המיוחדת להעצמה דיגיטלית של ארגונים קטנים ובינוניים (2025-2027)” שהוציאו משרד התעשייה וטכנולוגיית המידע וארבעה מחלקות אחרות בדצמבר אשתקד תומכת בבירור בקרן הקוד הפתוח Open Atom להקים “פרויקט מיוחד לקוד פתוח בינה מלאכותית לארגונים קטנים ובינוניים” כדי לספק מסגרות אימון ניתנות לשחזור וקלות לקידום, כלי בדיקה ומשאבים אחרים כדי להוריד את הסף הטכני עבור ארגונים.
בעיה מציאותית יותר היא שבגלל החסימה הטכנולוגית הפוטנציאלית על ידי ארצות הברית, סין לא יכולה פשוט להיות עוקבת בתחום הבינה המלאכותית, אלא חייבת לבנות מערכת אקולוגית מקומית עצמאית. בניית מערכת אקולוגית נוספת של קוד סגור תחת המערכת האקולוגית שארצות הברית כבר בנתה עם קוד סגור כעיקרית כמוה כבניית מכונית מאחורי דלתות סגורות. רק מערכת אקולוגית של קוד פתוח יכולה לעזור במהירות לפיתוח תעשיית הבינה המלאכותית.
בנוסף לתמיכה מעולה, ממשלות מקומיות שונות גם ביצעו השקעות כספיות אמיתיות במערכת האקולוגית של קוד פתוח.
קרן Z, שהוקמה במשותף על ידי Zhipu ונכסי מדינה בבייג’ינג, המתמקדת בהשקעות במערכת האקולוגית של מודלים גדולים, הודיעה שהיא תשקיע 300 מיליון יואן כדי לתמוך בפיתוח קהילת הקוד הפתוח בינה מלאכותית ברחבי העולם. כל פרויקט סטארט-אפ המבוסס על מודלים בקוד פתוח (לא מוגבל למודלים בקוד פתוח של Zhipu) יכול להגיש בקשה.
הפער בין סין לארצות הברית באסטרטגיות הקוד הפתוח והקוד הסגור שלהן עבור תעשיית הבינה המלאכותית הוא במהותו הבדל מהותי בלוגיקת הפיתוח. ארצות הברית מונעת על ידי הון, ודרישות הרווח של ענקיות טכנולוגיה וקרנות הון סיכון הולידו מערכת אקולוגית סגורה של “מונופול טכנולוגי-מימוש במחיר גבוה”. גם אם Meta מנסה לפתוח את הקוד, קשה להימלט מכבלי המחסומים המסחריים. סין מסתמכת על תכנון מעולה, עם “שוויון טכנולוגי + שיתוף פעולה תעשייתי” כרעיון הליבה שלה, ובונת מערכת אקולוגית פתוחה באמצעות העצמת מדיניות, והופכת את הקוד הפתוח לתשתית בסיסית להורדת ספים טכניים וקידום שילוב של הכלכלה האמיתית. בחירה אסטרטגית זו לא רק מעצבת את הנתיבים השונים של תעשיות הבינה המלאכותית בשתי המדינות, אלא גם מבשרת על האצת המערכת האקולוגית העולמית של הבינה המלאכותית מ”תחרות מונופול” ל”פתוחה ומשתלמת”.
מספיק טוב זה מספיק טוב
המערכת האקולוגית של קוד פתוח בינה מלאכותית של סין לא רק מאיצה את פיתוח התיעוש של הבינה המלאכותית בסין ובעולם, אלא גם מכניסה את האמונה של ארצות הברית בטכנולוגיה תחילה למלכודת מביכה.
לנוכח הלחץ הגובר שמביא אפקט DeepSeek, Meta שחררה את Llama4 ב-5 באפריל, בטענה שהוא מודל השפה הגדול מרובה האופנים החזק ביותר בהיסטוריה.
עם זאת, לאחר בדיקה בפועל, זהו מודל מאכזב. אורך ההקשר של 10 מיליון טוקנים לרוב משתבש, בדיקת הכדור הראשונית קשה להשלמה, ושגיאת גודל ההשוואה 9.11 > 9.9 מתרחשת. תוך מספר ימים מהשקת המודל, גם שערוריות כמו התפטרות מנהלים ורמאות במבחנים אושרו על ידי עובדים פנימיים.
יותר חדשות מוכיחות שניתן לומר ש-Llama4 הוא מוצר שצוקרברג מיהר להעלות למדפים. אז השאלה היא, מדוע צוקרברג היה צריך להשיק אותו באפריל?
כאמור, בתעשיית הבינה המלאכותית בארה”ב יש אמונה מבלבלת בטכנולוגיה, מתוך אמונה שהמוצרים שלהם חייבים להיות החזקים והמתקדמים ביותר, ולכן הם התחילו מרוץ חימוש. עם זאת, התועלת השולית הפוחתת של אימון בינה מלאכותית גרמה ליצרנים גדולים לצרוך כמויות עצומות של עלויות, ולא רק שלא נבנה הסף הטכני, אלא הם נפלו לביצה של צווארי בקבוק כוח המחשוב.
לאחר ש-OpenAI שחררה את פונקציית יצירת התמונות של GPT-4o, אלטמן צייץ מספר ימים לאחר מכן שהמעבדים הגרפיים שלהם “נשרפים”. פחות משבוע לאחר ש-Gemini2.5 שוחררה, ראש GoogleAIStudio אמר שהם עדיין סובלים מ”מגבלות קצב”, ומפתחים יכולים לשלוח רק 20 בקשות לדקה. נראה שאף חברה לא יכולה להתמודד עם צורכי ההיסק של מודלים גדולים במיוחד.
למעשה, ארצות הברית נופלת לאי הבנה. האחראי על מכון המחקר Zhiyuan אמר: “אם מודל חדש משתמש ב-100 פעמים מהעלות כדי להגיע לציון בנצ’מרק של 10 נקודות, אז המודל החדש הזה חסר משמעות עבור יותר מ-80% מתרחישי היישום מכיוון שאין ביצועי עלות.”
חברות מודל גדולות סיניות מאיצות את המערכת האקולוגית של קוד פתוח. נראה שהן כבר לא מתחרות על המקום הראשון, אלא זכו ליותר לקוחות, במיוחד לקוחות תעשייתיים, עם גישת ה”מספיק טובה” שלהן.
בהשוואה לעשרות מיליוני התקציבים של לקוחות ממשלתיים וארגוניים, לחברות ומוסדות רבים יש צרכי AI דחופים אך אין להם כל כך הרבה פתרונות קיימים. שימוש במודלים בקוד פתוח לפיתוח פתרונות משלהם כמעט הפך לבחירה היחידה שלהם:
- Baosteel משתמשת ב”מודל גדול + מודל קטן” לתהליכי הנדסה מטלורגית מרכזיים עבור אזהרה מוקדמת חכמה של ציוד ייצור.
- “מודל השפה הגדול Coal Science Guardian ChinamjGPT” של China Coal Science and Industry Group מפחית את זמן ההשבתה של הציוד ועלויות התחזוקה ב-30% ו-20%, בהתאמה.
- Shanghai Mengbo Intelligent Internet of Things Technology יצרה פלטפורמת יישומים לאופטימיזציה של תהליכי חישול רציפים וגילוי קצה המבוססת על מודל שפה גדול וקל משקל.
- Mifei Technology מימשה חיזוי, תחזוקה וניהול חכמים של מערכות טיפול בחומרים אוטומטיות במפעלי פרוסות מוליכים למחצה המבוססים על טכנולוגיית מודל שפה גדול.
אלה הם כל המקרים המייצגים של מודלים בקוד פתוח המיושמים בתרחישים תעשייתיים.
בנוסף לשימושים תעשייתיים, המערכת האקולוגית של קוד פתוח יכולה גם לעזור ליותר מפעלים לרווחת הציבור.
מרכז שימור הטבע Shanshui מחויב להגנה על נמרים ועל מערכות אקולוגיות של רמות. מצלמות האינפרא אדום שהיא מציבה מצלמות מספר רב של תמונות או סרטונים בכל רבעון. זה מאוד לא יעיל וגוזל זמן להסתמך על זיהוי ידני של עקבות נמר שלג. Huawei Ascend משתפת פעולה עם מרכז שימור הטבע Shanshui כדי לזהות עקבות נמר שלג. Huawei פתחה את המודלים והכלים הרלוונטיים לזיהוי מיני תמונות אינפרא אדום בסנג’יאנגיואן, והורידה את הסף להשתתפות בפיתוח בינה מלאכותית ומאפשרת ליותר מוסדות מחקר והגנה המשתמשים במודל ליהנות. אנשים יכולים לעבוד יחד כדי לייעל את המודל מבחינת מערכי נתונים, עיבוד נתונים וניקוי נתונים.
אפקט ה”בזאר” של קוד פתוח
אריק ריימונד, נושא הדגל של תנועת תוכנת הקוד הפתוח, הציע מטאפורה בספרו “הקתדרלה והבזאר” משנת 1999: מודל פיתוח תוכנה מסורתי וסגור מקור דומה לבניית קתדרלה. התוכנה מתוכננת ונבנית בקפידה על ידי מומחים מעטים (אדריכלים) בסביבה מבודדת ומשוחררת למשתמשים רק לאחר סיומה הסופי; מודל פיתוח הקוד הפתוח דומה לבזאר הומה, כאוטי לכאורה אך תוסס. פיתוח תוכנה פתוח, מבוזר ואבולוציוני.
הספר מאמין שעבור סוגים רבים של פרויקטי תוכנה, במיוחד תוכנה מורכבת ברמת המערכת (כגון ליבות מערכת הפעלה), מודל הפיתוח “בזאר” פתוח, שיתופי ומבוזר, למרות שהוא עשוי להיראות כאוטי, הוא למעשה יעיל יותר, מייצר תוכנה איכותית ועמידה יותר ממודל ה”קתדרלה” המסורתי, הסגור והמרוכז. הוא יכול לגלות ולתקן שגיאות מהר יותר ולספוג טוב יותר משוב משתמשים ותרומות קהילתיות באמצעות מנגנונים כגון “שחרר מוקדם, שחרר לעתים קרובות” ומינוף ביקורת עמיתים בקנה מידה גדול (“מספיק עיניים”), ובכך לקדם איטרציה וחדשנות מהירות של תוכנה.
ההצלחה העצומה של פרויקטי קוד פתוח כמו לינוקס אימתה את דבריו של ריימונד.
תנועת הקוד הפתוח הביאה לארצות הברית ולעולם ערך עצום העולה בהרבה על ההשקעה שלה. דו”ח מחקר משנת 2024 מאוניברסיטת הרווארד קבע: “קוד פתוח השקיע 4.15 מיליארד דולר ויצר 8.8 טריליון דולר בערך עבור חברות (כלומר, כל דולר אחד שהושקע יוצר 2,000 דולר בערך). ללא קוד פתוח, ההוצאות של החברות על תוכנה יהיו פי 3.5 ממה שהן כיום.”
כיום, חברות סיניות למדו זאת. נראה שחברות בינה מלאכותית אמריקאיות שכחו זאת.
למעשה, עבור חברות מודל גדולות סיניות, גם אם הן לא לוקחות בחשבון יתרונות חברתיים, בחירה לאמץ את המערכת האקולוגית של קוד פתוח אינה לא רווחית עבור החברות עצמן.
חברות מודל גדולות רבות אמרו ל-Observer.com שקוד פתוח לא אומר לוותר על מסחור. לקוד פתוח עדיין יש את הלוגיקה של רווח של קוד פתוח. בהשוואה לשאלה האם זה קוד פתוח או לא, איך לשרת טוב יותר לקוחות מבחינה טכנית הוא הנושא המרכזי.
אם ניקח לדוגמה את Zhipu AI, היא טוענת שהיא החברה היחידה בסין שמשווה באופן מלא את OpenAI, אך בהשוואה לאסטרטגיית הקוד הסגור של OpenAI, היא אחת מהמתרגלים הנחושים ביותר של אסטרטגיית קוד פתוח בתעשייה.
Zhipu לקחה את ההובלה בפתיחת מודל ה-Chat הגדול הראשון של סין ChatGLM-6B בשנת 2023. מאז הקמתה לפני כמעט שש שנים, Zhipu פתחה יותר מ-55 מודלים, עם נפח הורדות מצטבר של כמעט 40 מיליון פעמים בקהילת הקוד הפתוח הבינלאומית.
Zhipu אמרה ל-Observer.com ש-Zhipu מקווה שאסטרטגיית הקוד הפתוח שלה תתרום לבניית בייג’ינג ל”בירת קוד פתוח עולמית” עבור בינה מלאכותית.
באופן ספציפי, ברמה המסחרית, Zhipu בחרה למשוך מערכת אקולוגית למפתחים באמצעות קוד פתוח ולספק פתרונות מותאמים אישית בתשלום ללקוחות B-end ו-G-end.
בנוסף למכירת פתרונות, מכירת ממשקי API היא גם קישור רווח חשוב.
אם ניקח לדוגמה את DeepSeek, העסק הראשון של מודל הקוד הפתוח הוא מכירת ממשקי API בעלי ביצועים גבוהים. למרות ששירותים בסיסיים ניתנים בחינם, חברות יכולות לספק שירותי API בעלי ביצועים גבוהים ולגבות תשלום בהתבסס על שימוש. תמחור ה-API עבור DeepSeek-R1 הוא 1 יואן למיליון אסימוני קלט ו-16 יואן למיליון אסימוני פלט. אם מכסת האסימונים החינמיים נוצלה או שממשק ה-API הבסיסי אינו יכול לענות על הצרכים, משתמשים נוטים להשתמש בגרסה בתשלום כדי לשמור על יציבות תהליכים עסקיים.
בהשוואה לחברות שיש להן רק שירותי מודל, Alibaba בחרה במודל מונטיזציה נוסף בקוד פתוח: חבילה של מערכת אקולוגית.
סדרת Qwen של Alibaba, כחלוצה בקוד פתוח, מושכת מפתחים להשתמש במחשוב ענן ותשתיות אחרות באמצעות קוד פתוח מלא מודלים, ויוצרת תרחיש של מעגל סגור. המודל שלהם הוא רק מבוא בשלב מוקדם, והסחורות עם מחירים מסומנים הן למעשה שירותי ענן.
היישום הגלובלי של מודלים גדולים של קוד פתוח סיני עבר מ”מעקב אחר טכנולוגיה” ל”שליטה במערכת האקולוגית”. כאשר ארצות הברית נקלעת לדילמה של “מונופול קוד סגור” ו”קוד פתוח מחוץ לשליטה”, סין בונה מחדש את ההיגיון הבסיסי של המערכת האקולוגית העולמית של קוד פתוח בינה מלאכותית באמצעות “חדשנות הסכמים + טיפוח תרחישים”. שדה הקרב האולטימטיבי של המשחק הזה אינו בתחרות של קנה מידה של פרמטרים, אלא בשוק הטריליון דולר של שילוב עמוק של טכנולוגיית AI והכלכלה האמיתית.