גל חדש של יישומי AI: Qwen3 של עליבאבא

הנוף של בינה מלאכותית (AI) נמצא בתהליך התפתחות מתמיד, עם מודלים חדשים והתקדמויות שצצות בקצב מהיר. בין ההתפתחויות האחרונות, שחרור הקוד הפתוח של עליבאבא (Alibaba) של הדור הבא של מודל טונגי צ’יאנוון (Tongyi Qianwen), Qwen3, זכה לתשומת לב משמעותית. Qwen3, המתגאה בגודל פרמטרים קטן יותר, עלויות מופחתות וביצועים משופרים בהשוואה למודלים מובילים אחרים, מיצב את עצמו כמתמודד חזק בזירה העולמית של AI.

Qwen3 בולט כמודל היברידי חלוצי בסין, המציע שילוב משכנע של ביצועים משופרים ועלויות מופחתות. עם סך של 235 מיליארד פרמטרים, הוא דורש משאבים מועטים משמעותית לפריסה בהשוואה למודלים אחרים עם יכולות דומות. יעילות עלות זו הופכת את Qwen3 לאופציה אטרקטיבית עבור ארגונים המעוניינים למנף את הכוח של מודלים שפה גדולים מבלי לקרוע את הכיס.

העצמת סוכני AI ויישומים

אחד השיאים המרכזיים של Qwen3 הוא הפוטנציאל שלו להאיץ את הפיתוח והפריסה של סוכני AI ויישומי מודלים שפה גדולים. בהערכות של יכולות סוכני מודל, Qwen3 השיג ציונים מרשימים, ועלה על מודלים מובילים אחרים. זה מצביע על כך ש-Qwen3 יכול להוריד את חסמי הכניסה לפיתוח ופריסה של סוכני AI, מה שעלול להוביל לגל של יישומים חדשניים.

הביקוש הגובר ליכולות קריאה לכלי עבודה בסוכני AI

סוכני AI משמשים יותר ויותר לאוטומציה של משימות מורכבות ולתקשורת עם העולם האמיתי. היכולות הנדרשות מסוכן AI תלויות במורכבות ובאוטונומיה של המשימות שהוא מיועד לבצע.

מערכת סוכני AI חזקה דורשת בדרך כלל את היכולות הבאות מהמודל הבסיסי:

  • הבנה ויצירה בסיסית של שפה: היכולת לפרש הוראות במדויק, להבין הקשר וליצור תגובות בשפה טבעית.

  • שימוש וקריאה לכלי עבודה: היכולת להבין ולהשתמש בכלי עבודה חיצוניים, כולל ממשקי API, כדי להשלים משימות ספציפיות.

  • חשיבה ותכנון: היכולת לפרק מטרות מורכבות למשימות משנה קטנות יותר ולבצע אותן ברצף הגיוני.

Qwen3 נותן מענה לצורך הקריטי לשיפור יכולות הקריאה לכלי עבודה בסוכני AI. הוא יכול לשלב כלי עבודה חיצוניים בדיוק, הן במצבי חשיבה והן במצבי אי-חשיבה, מה שהופך אותו למודל קוד פתוח מוביל למשימות מורכבות מבוססות סוכנים.

בהערכות של יכולות סוכני מודל, Qwen3 השיג ציון גבוה, ועלה על מודלים מובילים אחרים. זה מסמל צמצום משמעותי בחסמי הכניסה לפיתוח ופריסה של סוכני AI.

Qwen3 תומך באופן מקורי בפרוטוקול MCP ובעל יכולות קריאה לכלי עבודה חזקות. בשילוב עם מסגרת Qwen-Agent, המכילה תבניות ניתוב שיחות כלי עבודה ומנתחים, היא מפשטת את תהליך הפיתוח ומאפשרת פעולות סוכנים יעילות במכשירים ניידים ומחשבים. מפתחים יכולים להגדיר כלי עבודה זמינים המבוססים על קבצי תצורה של MCP ולשלב אותם באמצעות מסגרת Qwen-Agent או כלי עבודה מותאמים אישית אחרים. זה מאפשר פיתוח מהיר של סוכנים חכמים עם בסיסי ידע ויכולות שימוש בכלי עבודה.

יתר על כן, Qwen3 מציג ביצועים חזקים בהבנה ויצירה בסיסית של שפה, כמו גם ביכולות חשיבה.

משמעות הדבר היא, שעם יכולות מודל שוות ערך, עלות קריאת מודלים עבור סוכנים ותעשיות יישומי AI נמוכה יותר, והקריאה נוחה יותר, מה שבהכרח יקדם את הופעתם של סוכנים ויישומי AI חדשים יותר.

מחויבות לקוד פתוח

עליבאבא אישרה מחדש את מחויבותה לקהילת הקוד הפתוח בכך שהיא מציעה מגוון מגוון של מודלים של Qwen3. זה כולל שני מודלים של Mixture-of-Experts (MoE) עם 30 מיליארד ו-235 מיליארד פרמטרים, כמו גם שישה מודלים צפופים בגדלים שונים.

מודל MoE של 30 מיליארד פרמטרים משיג דחיפת ביצועים משמעותית, ומספק ביצועים דומים למודל Qwen2.5-32B מהדור הקודם. המודלים הצפופים מדגימים גם הם ביצועים משופרים, כאשר אפילו המודלים הקטנים יותר משיגים תוצאות מרשימות.

מכיוון שכל מודלי Qwen3 הם מודלים היברידיים, ניתן להגדיר ממשקי API לפי הצורך כדי להגדיר ‘תקציבי חשיבה’ (כלומר, המספר המרבי הצפוי של אסימונים לחשיבה מעמיקה) כדי לבצע דרגות שונות של חשיבה ולענות בצורה גמישה על הצרכים המגוונים של יישומי AI ותרחישים שונים עבור ביצועים ועלות. ארגונים קטנים ובינוניים ומפתחי AI יכולים לבחור באופן גמיש מודלים בהתאם לצרכיהם, מה שבהכרח יצמצם את הסף והעלות של שימוש במודלים גדולים. צוותים אלה עם קרנות וכוח אדם מוגבלים מאוד יכולים להשקיע יותר משאבים ואנרגיה בשוק ובחפירת צרכי משתמשים ונקודות כאב, כך שיוכלו לפתח יישומים חדשניים יותר.

הבסיס הטכנולוגי של עליבאבא

לאחר 16 שנות פיתוח, עליבאבא שיחזרה באופן מקיף מערכת ארכיטקטורת טכנולוגיה מלאה, מחומרה בסיסית ועד מחשוב, אחסון, רשת, עיבוד נתונים, אימון מודלים ופלטפורמות נימוקים, מה שהופך אותה לפלטפורמת מחשוב הענן המובילה באזור אסיה-פסיפיק. עליבאבא היא גם אחת מחברות הטכנולוגיה הראשונות בעולם שהשקיעו במחקר מודלים גדולים.

בעבר, ג’ואו ג’ינגרן ציין בראיון לתקשורת כי פיתוח מודלים גדולים אינו ניתן להפרדה מתמיכת מערכת הענן. בין אם מדובר באימון או בנימוקים, כל פריצת דרך במודלים גדולים, על פני השטח, היא האבולוציה של יכולות המודל, אך מאחוריה מסתתר שיתוף פעולה ושדרוג מקיפים של כל מחשוב הענן ופלטפורמת הנתונים וההנדסה. רב-אופניות היא גם דרך חשובה ל-AGI.

הכרה בינלאומית

שחרור Qwen3 זכה לתשומת לב בקנה מידה עולמי. לאחר שחרור Qwen 3 של עליבאבא, אילון מאסק הצהיר בפלטפורמת המדיה החברתית X כי גרסת בטא מוקדמת של Grok 3.5 תשוחרר למנויי SuperGrok בשבוע הבא, וטען שזהו ה-AI הראשון שיכול לענות במדויק על שאלות לגבי מנועי רקטות או טכנולוגיה אלקטרוכימית.

הנעת חדשנות ונגישות

סון מאוסונג, סגן נשיא בכיר של המכון לבינה מלאכותית באוניברסיטת צ’ינגואה ואקדמאי זר של האקדמיה האירופית למדעי הרוח והטבע, הצהיר כי בשנים האחרונות סין תורמת תרומה חזקה להתפתחות הבינה המלאכותית, במיוחד בתחום המודלים הגדולים. הופעת DeepSeek וסדרת מוצרי הקוד הפתוח מטונגי צ’יאנוון קידמו מאוד את מסלול הקוד הפתוח של מודלים גדולים מקומיים, שללא ספק יש לו משמעות רבה להקלת מונופולים טכנולוגיים, קידום שוויון טכנולוגי ושיפור הכלה של בינה מלאכותית.

נכון לעכשיו, מספר המודלים הנגזרים מ-Qwen בקהילות קוד פתוח בבית ומחוצה לה עלה על 100,000, ועלה על סדרת Llama של מודלים נגזרים, וטונגי צ’יאנוון Qwen מדורגת כקבוצת מודלי השפה הגנרטיבית הגדולה בעולם. על פי רשימת המודלים הגדולים האחרונה של קוד פתוח גלובלי של Huggingface ב-10 בפברואר 2025, עשרת המודלים הגדולים של קוד פתוח הם כולם מודלים נגזרים המבוססים על מודלים של קוד פתוח של טונגי צ’יאנוון Qwen.

סון מאוסונג מאמין שמשמעות הדבר היא שת תרבות המודלים הגדולים של סין זכתה להכרה בינלאומית, וזהו שינוי תרבותי. זה מאוד יקר ומייצג הכרה בפיתוח ובטכנולוגיה של המודלים הגדולים של סין.