שבבי העל החדשים של NVIDIA

Blackwell Ultra GB300: קפיצת מדרגה בביצועים

ה-Blackwell Ultra GB300, שצפוי להגיע לשוק במחצית השנייה של 2025, מייצג התקדמות משמעותית בהשוואה למוצרים הקודמים של NVIDIA. שבב-על חדש זה תוכנן לספק כוח מחשוב משופר ורוחב פס זיכרון מוגדל, החיוניים לעמידה בדרישות ההולכות וגדלות של יישומי AI מודרניים.

מערכת GB300 היא תחנת כוח, המשלבת 72 מעבדי NVIDIA Blackwell Ultra GPUs ו-36 מעבדי NVIDIA Grace מבוססי Arm. שילוב זה מספק 1,400 פטה-פלופס מרשימים של ביצועי FP4 AI. כדי לשים את זה בפרספקטיבה, מדובר בעלייה של פי 1.5 ביכולת מחשוב FP4 צפופה בהשוואה לקודמו, ה-Blackwell B200.

אחד השדרוגים המשמעותיים ביותר ב-GB300 הוא קיבולת הזיכרון שלו. כל GPU במערכת מצויד בזיכרון HBM3e מדהים של 288GB. זה מסתכם בסך של מעל 20TB של זיכרון GPU למערכת. עלייה משמעותית זו בזיכרון מאפשרת עיבוד של מודלים וערכות נתונים גדולים בהרבה של AI, מה שמאפשר חישובים מורכבים יותר ומשיג מהירויות עיבוד מהירות יותר.

NVIDIA ממצבת את פלטפורמת ה-Blackwell Ultra AI Factory ככזו שמציעה שיפורי ביצועים מצטברים, ולא מהפכניים, בהשוואה לשבבי Blackwell הסטנדרטיים. בעוד ששבב Ultra בודד שומר על אותם 20 פטה-פלופס של מחשוב AI כמו ה-Blackwell הסטנדרטי, הוא נהנה באופן משמעותי מזינוק של 50% בזיכרון בעל רוחב פס גבוה (HBM3e), העולה מ-192GB ל-288GB.

בבחינת קנה המידה הגדול יותר, “Superpod” DGX GB300 בקנה מידה מלא ממשיך לאכלס 288 מעבדי CPU ו-576 מעבדי GPU. תצורה זו מספקת 11.5 אקסה-פלופס של מחשוב FP4, המשקפת את הביצועים של ה-Superpod המקורי מבוסס Blackwell. עם זאת, הוא כולל עלייה של 25% בזיכרון הכולל, שמגיע כעת ל-300TB מסיביים. שיפורי זיכרון אלה מדגישים את ההתמקדות של NVIDIA בהתאמה למודלים גדולים יותר ובשיפור יעילות ההסקה של AI, במקום להתמקד אך ורק בכוח מחשוב גולמי.

במקום השוואות ישירות בין Blackwell ל-Blackwell Ultra, NVIDIA מציגה כיצד הפלטפורמה החדשה ביותר שלה משתווה לשבבי H100 משנת 2022, שעדיין נמצאים בשימוש נרחב בעומסי עבודה של AI. החברה טוענת כי ה-Blackwell Ultra מספק ביצועי הסקה של FP4 גבוהים פי 1.5 מאלה של ה-H100. עם זאת, היתרון המדהים ביותר טמון ביכולתו להאיץ את ההסקה של AI.

לדוגמה, אשכול NVL72 המריץ את DeepSeek-R1 671B, מודל שפה גדול במיוחד, יכול כעת ליצור תגובות תוך עשר שניות בלבד. מדובר בצמצום דרמטי מ-90 השניות הנדרשות במערכת H100.

NVIDIA מייחסת שיפור משמעותי זה לעלייה של פי עשרה במהירות עיבוד האסימונים. ה-Blackwell Ultra יכול להתמודד עם 1,000 אסימונים לשנייה, קפיצת מדרגה משמעותית מ-100 האסימונים לשנייה של ה-H100. נתונים אלה מראים כי בעוד שה-Blackwell Ultra עשוי שלא להציג ביצועים טובים בהרבה מקודמו המיידי, הוא מציע שיפורי יעילות משכנעים, במיוחד עבור ארגונים שעדיין משתמשים בארכיטקטורות מהדור הקודם.

Vera Rubin Superchip: הדור הבא של עיבוד AI

במבט מעבר ל-Blackwell Ultra, ל-NVIDIA יש תוכניות להציג את שבב העל Vera Rubin בסוף 2026. השבב, שנקרא על שמה של האסטרונומית המכובדת Vera Rubin, ישלב CPU (Vera) ו-GPU (Rubin) בעיצוב מותאם אישית. זה מייצג צעד משמעותי קדימה במרדף של NVIDIA אחר יכולות עיבוד AI מתקדמות.

מעבד ה-Vera, המבוסס על ארכיטקטורת Olympus של NVIDIA, צפוי לספק ביצועים כפולים מאלה של מעבדי Grace הנוכחיים. ה-GPU Rubin, לעומת זאת, יתמוך בזיכרון בעל רוחב פס גבוה מרשים של עד 288GB. קיבולת זיכרון משמעותית זו תשפר משמעותית את יכולות עיבוד הנתונים, במיוחד עבור משימות AI מורכבות.

ארכיטקטורת Vera Rubin מציגה עיצוב GPU כפול על שבב יחיד. עיצוב חדשני זה מאפשר ביצועי הסקה מרשימים של 50 פטה-פלופס FP4 לכל שבב, ומטפח עיבוד יעיל יותר והשהיה מופחתת ביישומי AI.

מעבד ה-Vera, היורש של מעבד ה-Grace, מורכב מ-88 ליבות Arm מותאמות אישית עם ריבוי הליכונים סימולטני. תצורה זו מביאה ל-176 הליכונים לכל שקע. הוא כולל גם ממשק NVLink core-to-core של 1.8TB/s, המשפר משמעותית את מהירויות העברת הנתונים בין רכיבי ה-CPU וה-GPU.

ה-Blackwell Ultra GB300 וה-Vera Rubin Superchip מייצגים התקדמות משמעותית בהשוואה לארכיטקטורות השבבים הקודמות של NVIDIA. העלייה של פי 1.5 במחשוב FP4 צפוף של ה-GB300 על פני ה-B200 מתורגמת ישירות לעיבוד יעיל יותר של עומסי עבודה של AI. זה, בתורו, מאפשר זמני אימון והסקה מהירים יותר, החיוניים להאצת פיתוח AI.

ה-Vera Rubin, עם ביצועי FP4 של 50 פטה-פלופס לכל שבב, מסמל קפיצת מדרגה משמעותית קדימה. רמת ביצועים זו מאפשרת פריסה של מודלים ויישומים מתוחכמים עוד יותר של AI, ופורצת את גבולות האפשר בתחום הבינה המלאכותית.

ציר הזמן השאפתני של NVIDIA לפיתוח, עם תוכניות להשקות שנתיות של דורות חדשים של שבבי AI, מדגיש את מסירותה לשמירה על עמדה מובילה בשוק חומרת ה-AI המתפתח במהירות. המחויבות של החברה לחדשנות ניכרת במרדף המתמיד שלה אחר פתרונות עיבוד AI חזקים ויעילים יותר. הצגת שבבי העל החדשים הללו אינה עוסקת רק בשיפורים מצטברים; מדובר באפשור עידן חדש של יכולות AI.

ההתקדמות בקיבולת הזיכרון ובמהירות העיבוד ראויות לציון במיוחד. היכולת להתמודד עם מודלים וערכות נתונים גדולים יותר היא קריטית לפיתוח מערכות AI מתוחכמות יותר. ככל שמודלים של AI ממשיכים לגדול במורכבותם, הצורך בחומרה שיכולה לעמוד בקצב הופך להיות חשוב יותר ויותר. ההתמקדות של NVIDIA ברוחב פס הזיכרון ובמהירות עיבוד האסימונים נותנת מענה ישיר לצורך זה.

המעבר להדגשת שיפורי יעילות, במיוחד עבור ארגונים העוברים מארכיטקטורות ישנות יותר, הוא מהלך אסטרטגי של NVIDIA. הוא מכיר בכך שלא כל המשתמשים יאמצו מיד את החומרה העדכנית ביותר. על ידי הדגמת שיפורי ביצועים משמעותיים בהשוואה לשבבים מהדור הקודם, NVIDIA מספקת טיעון משכנע לשדרוג.

שבב העל Vera Rubin, עם ה-CPU וה-GPU בעיצוב מותאם אישית, מייצג התקדמות ארכיטקטונית משמעותית. עיצוב ה-GPU הכפול על שבב יחיד הוא גישה חדשנית שמבטיחה לספק שיפורי ביצועים משמעותיים והשהיה מופחתת. עיצוב זה משקף את המחויבות של NVIDIA לפרוץ את גבולות עיצוב השבבים ולמקסם את הביצועים.

הענקת השם לשבב על שם האסטרונומית Vera Rubin היא מחווה הולמת לעבודתה פורצת הדרך. זה גם מחזק בעדינות את המחויבות של NVIDIA לגילוי מדעי ולחדשנות. ההתמקדות של החברה ב-AI חורגת מעבר ליישומים מסחריים; היא מקיפה גם את קידום המחקר המדעי.

בסך הכל, ההכרזה של NVIDIA על שבבי העל Blackwell Ultra GB300 ו-Vera Rubin מסמנת אבן דרך משמעותית באבולוציה של חומרת AI. שבבים חדשים אלה עומדים להאיץ את הפיתוח והפריסה של AI במגוון רחב של תעשיות. המחויבות של החברה לחדשנות וציר הזמן האגרסיבי שלה לפיתוח מצביעים על כך שאנו יכולים לצפות להתקדמות פורצת דרך עוד יותר בשנים הבאות. ההתמקדות הן בביצועים גולמיים והן בשיפורי יעילות מבטיחה ששבבים אלה יהיו רלוונטיים למגוון רחב של משתמשים, מאלה עם מערכות מתקדמות ועד לאלה שעדיין משתמשים בארכיטקטורות ישנות יותר. עתיד חומרת ה-AI נראה מזהיר, ו-NVIDIA ממצבת את עצמה בבירור בחזית התחום המרגש הזה. הזיכרון המוגדל, מהירויות העיבוד המשופרות והעיצובים החדשניים של שבבי העל החדשים הללו יסללו ללא ספק את הדרך לפריצות דרך חדשות בבינה מלאכותית, וישפיעו על מגזרים שונים ויניעו התקדמות נוספת בשנים הבאות.