Неолитната революция: Посяване на семената на иновациите
Преди приблизително 12 000 години нашите предци преминаха от номадски ловци-събирачи към уседнали земеделци, отглеждащи растения и животни за прехрана. Земеделието представлява елементарна фабрика за храна, която разчита на слънчева светлина, вода и въздух за растежа на растенията и животните. Терминът ‘firma’, обозначаващ фиксирано плащане за наем на земя за обработване през Средновековието, стана синоним на земеделие.
Земеделието наложи йерархични социални структури за ефективни земеделски операции. Писмеността се появи като административен инструмент, улесняващ проследяването на входящите и изходящите потоци в тези хранителни фабрики и установявайки обществени правила. С течение на времето писането се разшири, обхващайки разнообразни области, и остава мощен начин за предаване на сложна информация.
От момента, в който разменихме лъкове и копия за мотики, гребла и плугове, и написахме първите символични глифи в глина или камък, появата на AI, а оттам и на AI фабриката, стана неизбежна. Беше просто въпрос на време.
Индустриалната революция: Изковаване на пътя към масовото производство
В продължение на хилядолетия човечеството усъвършенства своите земеделски умения, създавайки излишъци, които насърчиха появата на търговска класа – индивиди, ангажирани с производството на стоки за други, или ‘manufacturing’, произлизащо от латинското ‘a work by hand’. Това доведе до развитието на пари, средство за размяна, което ускори бартера и го превърна в съвременната икономика. Глобализацията свърза регионални и национални икономики след Епохата на изследванията.
Последващите вълни на глобализацията промениха както земеделието, така и производството. Ключова промяна във фабриките, епицентровете на стандартизираното производство, включваше разделянето на производствения процес на отделни стъпки, за да се подобри скоростта и повторяемостта. Тази Индустриална революция съвпадна с Просвещението, характеризиращо се с нарастваща грамотност, тъй като фабриките изискваха образовани работници, за да максимизират ефективността и да минимизират отпадъците. Образованието стана необходимост, насърчавайки признаването на гражданските права, правата на частна собственост, свободата на религията, безопасността, словото и правото на бърз процес.
Тези принципи, очевидни през 21-ви век, дължат своя генезис на 18-ти век.
Фабриките пренесоха производството на закрито, използвайки пара и електричество, за да задвижват поточни линии и техники за ‘lean manufacturing’. Това позволи производството на стоки на достъпни цени, повишавайки жизнения стандарт и насърчавайки растежа на средна класа, което задвижи икономическата експанзия отвъд възможностите на земеделските общества.
AI Революцията: Данните като нов фронтир
Появата на Интернет свърза хората и генерира нов ресурс: данни, узрели за проницателен анализ.
AI революцията зависеше от дигитализацията на огромни количества текст, изображения, видео и аудио, съчетана с достъпна изчислителна мощност за обработка на тези данни. Големите данни, когато се комбинират с масивно паралелни GPU и висока честотна лента на паметта, позволяват създаването на невронни мрежи, които кодират нашето разбиране за света, като по този начин позволяват изкуствен интелект.
По същество, големите данни предоставят суровината за AI алгоритми, работещи на GPU двигатели, за да конструират функционални невронни мрежи.
Тези елементи трябва да се сближат едновременно. През 80-те години изследователите притежаваха алгоритми за невронни мрежи, но им липсваха изчислителните ресурси и данни, за да ги приложат. Следователно, AI остана до голяма степен теоретичен, докато не бяха изпълнени тези три условия.
AI Фабрики: Буквална трансформация
Терминът ‘AI фабрика’ не е просто метафора, а точно описание на модерен AI суперкомпютър, работещ в търговска среда. Той фундаментално променя корпоративните изчисления и анализа на данни – синтеза на данни в полезна информация.
AI фабриката е толкова неизбежна, колкото и земеделската революция, където колективните усилия осигуряваха производството на храна. Обществените и културни промени, произтичащи от тази революция, предоставиха на човечеството свободно време за размисъл и иновации. Сега, машините могат да имат достъп и да обработват цялото човешко познание, позволявайки разговори и обратното прилагане на AI алгоритми за генериране на нови данни в различни формати.
Бизнесите и хората ще имат достъп до AI фабрики, или директно, или чрез споразумения за споделяне на време. Тези AI фабрики ще генерират нови идеи, визии и ще усилят индивидуалните творчески възможности.
Трансформиращият потенциал на AI фабриките е всеобхватен. Чатботовете, разработчиците на паралелни изчислителни двигатели за обучение и извод на модели и създателите на модели като OpenAI, Anthropic, Google и Mistral са съгласни, че AI ще промени всеки аспект от живота ни. Въпреки глобалните разногласия по различни въпроси, трансформиращото въздействие на AI е всеобщо признато.
Производство на прозрения и действия
AI фабриките служат за две основни функции. Първата е да обучават основни модели, даващи прозрения за бизнес и личностно подобрение. Втората и по-важна функция включва подаване на нови данни и въпроси в тези модели, за да се направят нови отговори, да се генерират нови токени и да се стимулират действия.
Голяма част от дискусията около AI се фокусира върху обучението на все по-разширяващи се основни модели, които се похват със стотици милиарди до трилиони параметри и огромни набори от данни. Броят на токените показва широчината на знанията, докато параметрите отразяват дълбочината на разбирането. По-малкият брой параметри, съчетан с по-големи набори от токени, дава по-бързи и прости отговори. Обратно, по-големият брой параметри и по-малките набори от токени осигуряват по-нюансирани прозрения в ограничена област. Моделите за разсъждения с верига на мисълта, мултимодални по природа, комбинират специализирани модели, за да обмислят резултати, които стимулират други входове, генерирайки изчерпателни отговори.
AI фабриките използват цялото съдържание, създадено от човечеството, и синтетични данни, генерирани от AI моделите, като суровина. Прозренията, получени от тези данни, се използват от хора и AI агенти за стимулиране на действия. Вместо да работят във фабриката, хората се възползват от нея, допълвайки своите умения със знанията и скоростта на AI моделите, за да постигнат повече, по-добри и по-бързи резултати.
Според Дженсън Хуанг, съосновател и главен изпълнителен директор на NVIDIA, ‘Светът се надпреварва да изгражда модерни, мащабни AI фабрики.’ Създаването на AI фабрика е изключителен инженерен подвиг, който изисква огромни ресурси, работна сила и материали.
Изграждането на AI фабрика включва значителни капиталови инвестиции. Типичната конфигурация се състои от NVIDIA DGX SuperPOD, базиран на множество ракове от DGX системи, включващи GPU, CPU, високоскоростни връзки и хранилище.
С многобройни DGX системи, SuperPOD осигурява значителна производителност, похвалвайки се със значителен капацитет на паметта и честотна лента. Производителността може да бъде мащабирана чрез добавяне на повече системи.
Друг NVIDIA план за AI фабрика се центрира върху платформата NVIDIA GB200 NVL72, система за ракове, интегрираща GPU, CPU, DPU, SuperNIC, NVLink и NVSwitch и високоскоростни мрежи. Тази платформа предлага по-голям домейн на споделена GPU памет за AI модели и по-висока изчислителна плътност, изискваща течно охлаждане.
GB200 NVL72, доставян в пълен обем, представлява самостоятелна система, способна да изгражда модели и да генерира данни в различни формати.
GB200 NVL72 се състои от MGX сървърен възел, включващ NVIDIA Grace CPU, съчетан с Blackwell GPU. Два от тези сървърни възела образуват изчислителен поднос в рамките на NVL72 рака, с осемнадесет изчислителни подноса, съдържащи многобройни GPU и CPU.
Системата за ракове GB200 NVL72 комбинира Grace CPU с Blackwell GPU, свързани чрез високоскоростни NVLink връзки. NVLink портовете и NVSwitch чиповете свързват всички GPU в конфигурация със споделена памет, идеална за обучение на основни модели и извод с верига на мисълта.
NVLink тъканта, улеснена от девет NVLink превключващи подноса, позволява достъп до всички GPU матрици като унифициран GPU за AI приложения.
GB200 NVL72 системите включват многобройни Arm ядра за обработка на хост и значителна мощност за обработка на числа с плаваща запетая. GB200 NVL72 системата се похвали със значителна HBM3e памет, прикачена към GPU, с висока обща честотна лента. Grace CPU разполагат с LPDDR5X памет, достъпна чрез NVLink.
NVIDIA GB200 NVL72 отразява трансформиращото въздействие на System/360 върху онлайн обработката на транзакции, като ключовата разлика е мащабируемостта на NVL72 чрез InfiniBand връзки.
DGX SuperPOD конфигурациите, базирани на NVL72 системи за ракове, изискват значителна мощност, но осигуряват огромна изчислителна мощност и капацитет на паметта в множество изчислителни ракове. Производителността може да бъде мащабирана чрез добавяне на повече ракове.
Изчислителната плътност на NVL72 рака изисква специализирано течно охлаждане и инфраструктура на центъра за данни, представляващи връщане към минали практики, където машини с водно охлаждане максимизираха производителността.
AI фабриките ще изискват значително повече изчислителна мощност, тъй като изводът става неразделна част от разнообразни приложения, особено с преминаването към модели за разсъждения с верига на мисълта.
AI фабриките обхващат не само хардуер, но и системи и софтуер за разработка.
DGX GB200 системите и DGX SuperPOD AI суперкомпютрите изискват управление и моделиране, улеснени от инструменти като NVIDIA Mission Control, който оркестрира AI работни натоварвания и автоматично възстановява задачи. Mission Control следи здравето на системата и оптимизира консумацията на енергия.
NVIDIA AI Enterprise, пакетът системен софтуер, включва библиотеки, модели и рамки, оптимизирани за NVIDIA GPU и мрежи. AI фабричният стек разполага и с NVIDIA Dynamo, рамка с отворен код за извършване на извод в NVLink и DGX SuperPOD инфраструктура. DGX Expert Service and Support помага на клиентите при внедряването на тези технологии, намалявайки времето до първия токен. NVIDIA предлага AI фабрични планове за своята Omniverse ‘digital twin’ среда за симулиране и оптимизиране на дизайна на центъра за данни.
Ключов аспект на AI фабриките е промяната в мисленето, която те пораждат, като NVIDIA дава приоритет на пространството за растеж на системата.
Според Гилад Шайнер, старши вицепрезидент на мрежите в NVIDIA, ‘Генерирането на токени сега се равнява на генериране на приходи за много компании.’ Центровете за данни се развиват от разходни центрове в продуктивни активи.
И това, в крайна сметка, е същността на изграждането на фабрика.