Эра AI-фабрик: неизбежность через 12000 лет

В сфере искусственного интеллекта контекст играет первостепенную роль. Этот принцип отражает человеческий интеллект, что предполагает его актуальность для ИИ, учитывая, что мы создали его по нашему образу и подобию.

В настоящее время мы наблюдаем, как такие компании, как NVIDIA, отстаивают AI-фабрики – по сути, суперкомпьютеры, обрабатывающие петабайты данных для выдачи интеллектуальных ответов – как новый способ катализировать значительные сдвиги в мировой экономике и культуре.

Но как мы пришли к этому моменту? Ответ, как всегда, кроется в серии постепенных улучшений.

Прежде чем углубляться в специфику AI-фабрик и их последствий для будущего бизнеса и общества, давайте установим некоторый базовый контекст.

Неолитическая революция: посев семян инноваций

Приблизительно 12 000 лет назад наши предки перешли от кочевых охотников-собирателей к оседлым земледельцам, выращивающим растения и разводящим животных для пропитания. Сельское хозяйство, или фермерство, представляет собой рудиментарную пищевую фабрику, полагающуюся на солнечный свет, воду и воздух для роста растений и животных. Термин ‘firma’, обозначающий фиксированную плату за аренду земли для обработки в средневековье, стал синонимом сельского хозяйства.

Сельское хозяйство требовало иерархических социальных структур для эффективного ведения фермерских операций. Письменность появилась как административный инструмент, облегчающий отслеживание входящих и исходящих данных на этих пищевых фабриках и устанавливающий общественные правила. Со временем письменность расширилась, охватив различные области, и остается мощным средством передачи сложной информации.

С того момента, как мы обменяли луки и копья на мотыги, грабли и плуги, и начертали первые символические глифы на глине или камне, появление ИИ, а следовательно, и AI-фабрики, стало неизбежным. Это был всего лишь вопрос времени.

Промышленная революция: прокладывая путь к массовому производству

На протяжении тысячелетий человечество оттачивало свои сельскохозяйственные навыки, получая излишки, которые способствовали появлению класса торговцев – людей, занимающихся изготовлением товаров для других, или ‘производством’, от латинского ‘работа руками’. Это привело к развитию денег, средства обмена, которое ускорило бартер и преобразовало его в современную экономику. Глобализация объединила региональные и национальные экономики после эпохи великих географических открытий.

Последующие волны глобализации изменили как сельское хозяйство, так и производство. Ключевой сдвиг на фабриках, эпицентрах стандартизированного производства, заключался в разделении производственного процесса на отдельные этапы для повышения скорости и повторяемости. Эта промышленная революция совпала с эпохой Просвещения, характеризующейся ростом уровня грамотности, поскольку фабрикам требовались образованные рабочие для максимизации эффективности и минимизации отходов. Образование стало необходимостью, способствуя признанию избирательного права, прав частной собственности, свободы вероисповедания, безопасности, слова и права на скорый суд.

Эти принципы, самоочевидные в 21 веке, обязаны своим происхождением 18 веку.

Фабрики перенесли производство в помещения, используя пар и электричество для питания конвейерных линий и методов бережливого производства. Это позволило производить товары по доступным ценам, повышая уровень жизни и способствуя росту среднего класса, продвигая экономический рост за пределы возможностей сельскохозяйственных обществ.

AI Революция: Данные как новый рубеж

Появление Интернета объединило людей и создало новый ресурс: данные, готовые для глубокого анализа.

AI революция зависела от оцифровки огромных объемов текста, изображений, видео и аудио, а также от доступной вычислительной мощности для обработки этих данных. Большие данные в сочетании с массивно параллельными графическими процессорами и высокой пропускной способностью памяти позволяют создавать нейронные сети, которые кодируют наше понимание мира, тем самым обеспечивая искусственный интеллект.

По сути, большие данные предоставляют сырье для алгоритмов ИИ, работающих на графических процессорах, для построения функциональных нейронных сетей.

Эти элементы должны сходиться одновременно. В 1980-х годах исследователи обладали алгоритмами нейронных сетей, но им не хватало вычислительных ресурсов и данных для их реализации. Следовательно, ИИ оставался в значительной степени теоретическим, пока не были выполнены эти три условия.

AI Фабрики: Буквальная Трансформация

Термин ‘AI фабрика’ – это не просто метафора, а точное описание современного AI суперкомпьютера, работающего в коммерческой среде. Это коренным образом меняет корпоративные вычисления и анализ данных – синтез данных в полезную информацию.

AI фабрика так же неизбежна, как и сельскохозяйственная революция, где коллективные усилия обеспечивали производство продуктов питания. Общественные и культурные сдвиги, вызванные этой революцией, предоставили человечеству свободное время для размышлений и инноваций. Теперь машины могут получать доступ и обрабатывать всечеловеческие знания, позволяя проводить разговорные поиски и обратное применение алгоритмов ИИ для создания новых данных в различных форматах.

Предприятия и частные лица будут иметь доступ к AI фабрикам либо напрямую, либо посредством соглашений о разделении времени. Эти AI фабрики будут генерировать новые идеи, видения и усиливать индивидуальные творческие возможности.

Преобразующий потенциал AI фабрик всеобъемлющ. Чат-боты, разработчики параллельных вычислительных движков для обучения и вывода моделей, а также создатели моделей, такие как OpenAI, Anthropic, Google и Mistral, согласны с тем, что ИИ изменит каждый аспект нашей жизни. Несмотря на глобальные разногласия по различным вопросам, преобразующее воздействие ИИ признается повсеместно.

Производство Инсайтов и Действий

AI фабрики выполняют две основные функции. Первая – это обучение базовых моделей, дающее представление для улучшения бизнеса и личной жизни. Вторая и более важная функция включает в себя ввод новых данных и вопросов в эти модели для вывода новых ответов, создания новых токенов и стимулирования действий.

Большая часть дискуссий вокруг ИИ была сосредоточена на обучении постоянно расширяющихся базовых моделей, насчитывающих сотни миллиардов и триллионы параметров и огромные наборы данных. Количество токенов указывает на широту знаний, а параметры отражают глубину понимания. Меньшее количество параметров в сочетании с большими наборами токенов дает более быстрые и простые ответы. И наоборот, большее количество параметров и меньшие наборы токенов обеспечивают более тонкое понимание ограниченной области. Модели рассуждений по цепочке мыслей, мультимодальные по своей природе, объединяют специализированные модели для рассмотрения выходных данных, которые приводят другие входные данные, генерируя исчерпывающие ответы.

AI фабрики используют весь контент, созданный человечеством, и синтетические данные, сгенерированные моделями ИИ, в качестве сырья. Инсайты, полученные из этих данных, используются людьми и агентами ИИ для стимулирования действий. Вместо того, чтобы работать на фабрике, люди подключаются к ней, расширяя свои навыки знаниями и скоростью моделей ИИ для достижения больших, лучших и более быстрых результатов.

По словам Дженсена Хуанга, соучредителя и генерального директора NVIDIA, ‘Мир мчится к созданию современных, крупномасштабных AI фабрик’. Создание AI фабрики – это необычайный инженерный подвиг, требующий огромных ресурсов, рабочей силы и материалов.

Строительство AI фабрики влечет за собой значительные капиталовложения. Типичная конфигурация включает в себя NVIDIA DGX SuperPOD, основанную на нескольких стойках систем DGX, включающих графические процессоры, центральные процессоры, высокоскоростные соединения и хранилище.

С многочисленными системами DGX SuperPOD обеспечивает значительную производительность, обладая значительной емкостью памяти и пропускной способностью. Производительность можно масштабировать, добавляя больше систем.

Другой проект NVIDIA для AI фабрики сосредоточен на платформе NVIDIA GB200 NVL72, системе масштаба стойки, объединяющей графические процессоры, центральные процессоры, DPU, SuperNIC, NVLink и NVSwitch, а также высокоскоростную сеть. Эта платформа предлагает более крупныйобщий домен памяти графического процессора для моделей ИИ и более высокую плотность вычислений, требующую жидкостного охлаждения.

GB200 NVL72, поставляемая в полном объеме, представляет собой автономную систему, способную создавать модели и генерировать данные в различных форматах.

GB200 NVL72 состоит из серверного узла MGX, включающего ЦП NVIDIA Grace в паре с графическими процессорами Blackwell. Два из этих серверных узлов образуют вычислительный поддон в стойке NVL72, при этом восемнадцать вычислительных поддонов содержат многочисленные графические процессоры и ЦП.

Система GB200 NVL72 масштаба стойки объединяет ЦП Grace с графическими процессорами Blackwell, соединенными высокоскоростными соединениями NVLink. Порты NVLink и чипы NVSwitch связывают все графические процессоры в конфигурации с общей памятью, идеально подходящей для обучения базовой модели и вывода по цепочке мыслей.

Структура NVLink, поддерживаемая девятью поддонами коммутаторов NVLink, обеспечивает доступ ко всем кристаллам графического процессора как к единому графическому процессору для приложений ИИ.

Системы GB200 NVL72 оснащены многочисленными ядрами Arm для обработки хостов и значительной вычислительной мощностью с плавающей запятой. Система GB200 NVL72 обладает значительной памятью HBM3e, подключенной к графическим процессорам, с высокой совокупной пропускной способностью. ЦП Grace оснащены памятью LPDDR5X, доступной через NVLink.

NVIDIA GB200 NVL72 отражает преобразующее воздействие System/360 на обработку онлайн-транзакций, ключевое отличие заключается в масштабируемости NVL72 через соединения InfiniBand.

Конфигурации DGX SuperPOD, основанные на системах масштаба стойки NVL72, требуют значительной мощности, но обеспечивают огромную вычислительную мощность и емкость памяти на нескольких вычислительных стойках. Производительность можно масштабировать, добавляя больше стоек.

Вычислительная плотность стойки NVL72 требует специализированного жидкостного охлаждения и инфраструктуры центров обработки данных, что представляет собой возврат к прошлой практике, когда машины с водяным охлаждением максимизировали производительность.

AI фабрикам потребуется значительно больше вычислительной мощности, поскольку вывод становится неотъемлемой частью различных приложений, особенно с переходом к моделям рассуждений по цепочке мыслей.

AI фабрики включают в себя не только оборудование, но и системы и программное обеспечение для разработки.

Системы DGX GB200 и суперкомпьютеры AI DGX SuperPOD требуют управления и моделирования, что облегчается с помощью таких инструментов, как NVIDIA Mission Control, который координирует рабочие нагрузки AI и автоматически восстанавливает задачи. Mission Control отслеживает работоспособность системы и оптимизирует энергопотребление.

NVIDIA AI Enterprise, пакет системного программного обеспечения, включает библиотеки, модели и фреймворки, оптимизированные для графических процессоров и сетей NVIDIA. Стек AI фабрики также включает в себя NVIDIA Dynamo, фреймворк с открытым исходным кодом для запуска вывода через NVLink и инфраструктуру DGX SuperPOD. DGX Expert Service and Support помогает клиентам в реализации этих технологий, сокращая время до первого токена. NVIDIA предлагает чертежи AI фабрики для своей среды Omniverse ‘цифровой двойник’ для имитации и оптимизации проектирования центров обработки данных.

Важным аспектом AI фабрик является сдвиг в мышлении, который они порождают, при этом NVIDIA отдает приоритет запасу для роста системы.

По словам Гилада Шайнера, старшего вице-президента по сетям в NVIDIA, ‘Создание токенов теперь приравнивается к получению дохода для многих компаний’. Центры обработки данных превращаются из центров затрат в продуктивные активы.

И это, в конечном счете, является сутью строительства фабрики.