שחר מפעלי הבינה המלאכותית: בלתי נמנע

המהפכה הניאוליתית: זריעת זרעי החדשנות

לפני כ-12,000 שנה, אבותינו עברו מחיי נדודים של ציידים-לקטים לחיי התיישבות חקלאיים, וגידלו צמחים ובעלי חיים למחייתם. חקלאות, או גידול חקלאי, מייצגת מפעל מזון בסיסי, המסתמך על אור שמש, מים ואוויר לגידול צמחים ובעלי חיים. המונח ‘פירמה’, שמשמעותו תשלום שכירות קבוע עבור עיבוד קרקע בימי הביניים, הפך לשם נרדף לחקלאות.

החקלאות חייבה מבנים חברתיים היררכיים לפעולות חקלאיות יעילות. הכתיבה הופיעה ככלי מנהלי, המאפשר מעקב אחר תשומות ותפוקות בתוך מפעלי מזון אלה וביסוס כללים חברתיים. עם הזמן, הכתיבה התרחבה לתחומים מגוונים ונותרה אמצעי רב עוצמה להעברת מידע מורכב.

מהרגע שהחלפנו קשתות וחניתות במעדרים, מגרפות ומחרשות, וחרטנו את הכתובות הסמליות הראשונות בחימר או באבן, הופעת הבינה המלאכותית, וכתוצאה מכך, מפעל הבינה המלאכותית, הפכה לבלתי נמנעת. זו הייתה רק שאלה של זמן.

המהפכה התעשייתית: סלילת הדרך לייצור המוני

במשך אלפי שנים, האנושות חידדה את כישוריה החקלאיים, ויצרה עודפים אשר טיפחו את הופעתו של מעמד סוחרים - אנשים העוסקים בייצור סחורות עבור אחרים, או ‘ייצור’, שמקורו בלטינית ‘עבודה ביד’. זה הוביל לפיתוח כסף, אמצעי חליפין שזיכה את הסחר חליפין והפך אותו לכלכלה המודרנית. גלובליזציה קישרה כלכלות אזוריות ולאומיות בעקבות עידן התגליות.

גלובליזציה שלאחר מכן עיצבה מחדש את החקלאות והייצור כאחד. שינוי מרכזי במפעלים, מרכזי הייצור הסטנדרטיים, כלל חלוקת תהליך הייצור לשלבים נפרדים כדי לשפר את המהירות והחזרתיות. מהפכה תעשייתית זו התרחשה במקביל לעידן הנאורות, שאופיין בשיעורי אוריינות מרקיעי שחקים, שכן מפעלים דרשו עובדים משכילים כדי למקסם את היעילות ולמזער את הפסולת. החינוך הפך לצורך, טיפוח ההכרה בזכות ההצבעה, זכויות קניין פרטי, חופש דת, בטיחות, דיבור והזכות למשפטים מהירים.

עקרונות אלה, מובנים מאליהם במאה ה-21, חייבים את היווצרותם למאה ה-18.

מפעלים הכניסו את הייצור למקומות סגורים, תוך שימוש בקיטור וחשמל להפעלת קווי הרכבה וטכניקות ייצור רזה. זה אפשר את הייצור של סחורות במחירים סבירים, והעלה את רמת החיים וטיפח את צמיחתו של מעמד ביניים, והניע התרחבות כלכלית מעבר ליכולות של חברות חקלאיות.

מהפכת הבינה המלאכותית: נתונים כגבול החדש

הופעת האינטרנט קישרה בין אנשים ויצרה משאב חדש: נתונים, הבשלה לניתוח מעמיק.

מהפכת הבינה המלאכותית נסמכה על דיגיטציה של כמויות עצומות של טקסט, תמונות, וידאו ואודיו, יחד עם כוח מחשוב סביר לעיבוד נתונים אלה. ביג דאטה, בשילוב עם GPU מקבילים מאוד ורוחב פס זיכרון גבוה, מאפשר את יצירת רשתות עצביות המקודדות את הבנתנו את העולם, ובכך מאפשרות בינה מלאכותית.

בעיקרו של דבר, ביג דאטה מספק את חומר הגלם עבור אלגוריתמי בינה מלאכותית הפועלים על מנועי GPU כדי לבנות רשתות עצביות פונקציונליות.

מרכיבים אלה חייבים להתכנס בו זמנית. בשנות השמונים, לחוקרים היו אלגוריתמים של רשתות עצביות, אך חסרו להם משאבי המחשוב והנתונים ליישם אותם. כתוצאה מכך, בינה מלאכותית נותרה ברובה תיאורטית עד ששלושת התנאים הללו התקיימו.

מפעלי בינה מלאכותית: שינוי מילולי

המונח ‘מפעל בינה מלאכותית’ הוא לא רק מטאפורה אלא תיאור מדויק של מחשב על מודרני של בינה מלאכותית הפועל במסגרת מסחרית. זה משנה באופן יסודי את המחשוב התאגידי ואת ניתוח הנתונים - הסינתזה של נתונים למידע מעשי.

מפעל הבינה המלאכותית הוא בלתי נמנע כמו המהפכה החקלאית, שבה מאמץ קולקטיבי הבטיח ייצור מזון. שינויים חברתיים ותרבותיים הנובעים ממהפכה זו העניקו לאנושות זמן פנאי להרהורים וחדשנות. כעת, מכונות יכולות לגשת ולעבד את מלוא הידע האנושי, ולאפשר חיפושים שיחתיים ויישום הפוך של אלגוריתמים של בינה מלאכותית כדי ליצור נתונים חדשים בפורמטים שונים.

לעסקים ולאנשים פרטיים תהיה גישה למפעלי בינה מלאכותית, ישירות או באמצעות הסדרי שיתוף זמן. מפעלי בינה מלאכותית אלה ייצרו רעיונות, חזונות ויגבירו את היכולות היצירתיות האישיות.

הפוטנציאל הטרנספורמטיבי של מפעלי בינה מלאכותית הוא כולל. הצ’אטבוטים, המפתחים של מנועי מחשוב מקבילים לאימון והיסק מודלים, ויוצרי מודלים כמו OpenAI, Anthropic, Google ו-Mistral מסכימים שבינה מלאכותית תעצב מחדש כל היבט בחיינו. למרות חילוקי דעות גלובליים בנושאים שונים, ההשפעה הטרנספורמטיבית של הבינה המלאכותית מוכרת באופן אוניברסלי.

ייצור תובנה ופעולה

מפעלי בינה מלאכותית ממלאים שני תפקידים עיקריים. הראשון הוא לאמן מודלים בסיסיים, המניבים תובנות לשיפור עסקי ואישי. השני, והמשמעותי יותר, כולל הזנת נתונים ושאלות חדשות למודלים אלה כדי להסיק תשובות חדשות, ליצור אסימונים חדשים ולהניע פעולה.

חלק ניכר מהדיון סביב הבינה המלאכותית התמקד באימון מודלים בסיסיים המתרחבים ללא הרף, המתהדרים במאות מיליארדי טריליוני פרמטרים ומערכי נתונים עצומים. ספירות אסימונים מצביעות על רוחב הידע, בעוד שפרמטרים משקפים את עומק ההבנה. ספירות פרמטרים קטנות יותר בשילוב עם ערכות אסימונים גדולות יותר מניבות תשובות מהירות ופשוטות יותר. לעומת זאת, ספירות פרמטרים גדולות יותר וערכות אסימונים קטנות יותר מספקות תובנות ניואנסיות יותר לתחום מוגבל. מודלים של נימוקים של שרשרת מחשבות, רב-מודאליים באופיים, משלבים מודלים מיוחדים כדי לשקול תפוקות המניעות תשומות אחרות, ויוצרים תשובות מקיפות.

מפעלי בינה מלאכותית משתמשים בכל התוכן שנוצר על ידי האנושות ונתונים סינתטיים שנוצרו על ידי מודלים של בינה מלאכותית כחומר גלם. תובנות הנגזרות מנתונים אלה מנוצלות על ידי בני אדם וסוכני בינה מלאכותית כדי להניע פעולה. במקום לעבוד במפעל, אנשים מנצלים אותו, משפרים את כישוריהם עם הידע והמהירות של מודלים של בינה מלאכותית כדי להשיג תוצאות נוספות, טובות יותר ומהירות יותר.

לדברי ג’נסן הואנג, מייסד שותף ומנכ’ל NVIDIA, ‘העולם ממהר לבנות מפעלי בינה מלאכותית גדולים ומתקדמים’. הקמת מפעל בינה מלאכותית היא הישג הנדסי יוצא דופן, הדורש משאבים עצומים, כוח אדם וחומרים.

בניית מפעל בינה מלאכותית כרוכה בהשקעה משמעותית בהון. תצורה טיפוסית כוללת NVIDIA DGX SuperPOD המבוססת על מספר מתלים של מערכות DGX, הכוללות GPU, יחידות CPU, חיבורים מהירים ואחסון.

עם מערכות DGX רבות, SuperPOD מספק ביצועים משמעותיים, המתהדרים בקיבולת זיכרון ורוחב פס ניכר. ניתן להגדיל את הביצועים על ידי הוספת מערכות נוספות.

תוכנית NVIDIA נוספת עבור מפעל בינה מלאכותית מתרכזת בפלטפורמת NVIDIA GB200 NVL72, מערכת בקנה מידה של מתלים המשלבת GPU, יחידות CPU, DPUs, SuperNICs, NVLink ו-NVSwitch, ורשתות מהירות. פלטפורמה זו מציעה תחום זיכרון GPU משותף גדול יותר עבור מודלים של בינה מלאכותית וצפיפות מחשוב גבוהה יותר, הדורשת קירור נוזלי.

ה-GB200 NVL72, המשלוח בנפח מלא, מייצג מערכת עצמאית המסוגלת לבנות מודלים ולהפיק נתונים בפורמטים שונים.

ה-GB200 NVL72 כולל צומת שרת MGX הכולל NVIDIA Grace CPU בשילוב עם Blackwell GPUs. שניים מצומתי שרת אלה יוצרים מגש מחשוב בתוך מתלה NVL72, כאשר שמונה עשר מגשי מחשוב מכילים GPUs ויחידות CPU רבות.

מערכת ה-GB200 NVL72 בקנה מידה של מתלים משלבת Grace CPUs עם Blackwell GPUs, המחוברים באמצעות חיבורי NVLink מהירים. יציאות NVLink ושבבי NVSwitch מקשרים את כל ה-GPUs בתצורת זיכרון משותפת, אידיאלית לאימון מודלים בסיסיים והיסק של שרשרת מחשבות.

מבנה NVLink, המאפשר על ידי תשעה מגשי מתג NVLink, מאפשר גישה לכל יחידות ה-GPU כמו GPU מאוחד ליישומי בינה מלאכותית.

מערכות GB200 NVL72 כוללות ליבות Arm רבות לעיבוד מארח ועוצמת עיבוד נקודה צפה משמעותית. מערכת ה-GB200 NVL72 מתהדרת בזיכרון HBM3e משמעותי המצורף ל-GPUs, עם רוחב פס מצטבר גבוה. ה-Grace CPUs כוללים זיכרון LPDDR5X, נגיש באמצעות NVLink.

ה-NVIDIA GB200 NVL72 משקף את ההשפעה הטרנספורמטיבית של ה-System/360 על עיבוד עסקאות מקוון, ההבדל העיקרי הוא יכולת ההרחבה של ה-NVL72 באמצעות חיבורי InfiniBand.

תצורות DGX SuperPOD המבוססות על מערכות NVL72 בקנה מידה של מתלים דורשות הספק ניכר אך מספקות כוח מחשוב ויכולת זיכרון עצומים על פני מספר מתלי מחשוב. ניתן להגדיל את הביצועים על ידי הוספת מתלים נוספים.

צפיפות המחשוב של מתלה NVL72 מחייבת קירור נוזלי מיוחד ותשתית מרכז נתונים, המייצגים חזרה לפרקטיקות עבר שבהן מכונות מקוררות מים ממקסמות את הביצועים.

מפעלי בינה מלאכותית ידרוש כוח מחשוב משמעותי יותר ככל שהיסק הופך לחלק בלתי נפרד מיישומים מגוונים, במיוחד עם המעבר למודלים של נימוקים של שרשרת מחשבות.

מפעלי בינה מלאכותית כוללים לא רק חומרה אלא גם מערכות ותוכנת פיתוח.

מערכות DGX GB200 ומחשבי העל של DGX SuperPOD AI דורשים ניהול ומודלים, המאפשרים באמצעות כלים כמו NVIDIA Mission Control, אשר מתזמר עומסי עבודה של בינה מלאכותית ומשחזר משרות באופן אוטומטי. Mission Control מנטר את תקינות המערכת וממטב את צריכת החשמל.

NVIDIA AI Enterprise, חבילת תוכנת המערכות, כוללת ספריות, מודלים ומסגרות המותאמות עבור NVIDIA GPUs ורשתות. מחסנית מפעל הבינה המלאכותית כוללת גם את NVIDIA Dynamo, מסגרת קוד פתוח להפעלת היסק על פני NVLink ותשתית DGX SuperPOD. DGX Expert Service and Support מסייע ללקוחות ביישום טכנולוגיות אלה, ומצמצם את הזמן לאסימון ראשון. NVIDIA מציעה תוכניות מפעל בינה מלאכותית עבור סביבת ה’תאום הדיגיטלי’ Omniverse שלה כדי לדמות ולמטב את עיצוב מרכז הנתונים.

היבט מכריע של מפעלי בינה מלאכותית הוא השינוי בחשיבה שהם יוצרים, כאשר NVIDIA נותנת עדיפות למרווח ראש לצמיחת מערכת.

לדברי גלעד שיינר, סגן נשיא בכיר לרשתות ב-NVIDIA, ‘יצירת אסימונים שווה כעת ליצירת הכנסות עבור חברות רבות’. מרכזי נתונים מתפתחים ממרכזי עלות לנכסים יצרניים.

וזה, בסופו של דבר, המהות של בניית מפעל.