Рост RISC-V как вычислительной архитектуры, ориентированной на ИИ
Недавний взрывной рост популярности DeepSeek вызвал волну во всей индустрии ИИ, и его влияние выходит за рамки сферы искусственного интеллекта. В частности, полупроводниковая промышленность обратила на это внимание. Во время китайского Нового года академия DAMO Xuantie компании Alibaba объявила об адаптации модели дистилляции серии DeepSeek-R1, продемонстрировав сильный импульс развивающейся архитектуры набора команд с открытым исходным кодом, RISC-V, в области ИИ.
На недавней конференции Xuantie RISC-V Ecosystem Conference появились захватывающие новости: RISC-V добилась прорывов как в высокопроизводительных вычислениях, так и в области ИИ. Xuantie C930, первый процессор серверного уровня от DAMO Academy, должен начать поставки в следующем месяце. Его значительно увеличенная вычислительная мощность ИИ ускоряет развертывание комплексной экосистемы RISC-V ‘высокая производительность + ИИ’.
Может ли архитектура вычислений с открытым исходным кодом RISC-V быть идеальным партнером для ИИ с открытым исходным кодом?
Трансформация модели ИИ стимулирует инновации в вычислительной архитектуре
Опытный эксперт в области чипов объяснил, что влияние DeepSeek ощущается не только в кругах ИИ, но и глубоко внутри индустрии чипов. DeepSeek, благодаря своей высокооптимизированной конструкции, резко сократил затраты на обучение и вывод больших языковых моделей. Этот сдвиг кардинально изменил существующий баланс вычислительной мощности, памяти и межсоединений, создав значительные возможности для прорывов в вычислительной архитектуре.
Традиционно большие модели ИИ, из-за их интенсивных требований к вычислениям и памяти, лучше подходили для развертывания в облаке, а не на периферийных устройствах. Однако появление DeepSeek бросило вызов этой зависимости от высокой вычислительной мощности. За счет снижения затрат как на обучение, так и на вывод, он прокладывает путь для перехода больших моделей из облака на периферию.
В частности, сниженные вычислительные требования DeepSeek делают развертывание на одной машине осуществимым, повышая его совместимость с периферийными и конечными устройствами. Поскольку ИИ стремится проникнуть в различные отрасли и сценарии, необходимость перехода из облака на периферию становится все более критичной. Этот сдвиг необходим для удовлетворения разнообразных потребностей, таких как безопасность данных, персонализированная настройка и частное развертывание.
Можно предвидеть, что с широким внедрением технологии DeepSeek ландшафт чипов ИИ претерпит трансформацию. От крупномасштабных параллельных вычислений, зависящих от облачной инфраструктуры, чипы ИИ эволюционируют в сторону диверсифицированных, эффективных и маломощных конструкций, способных к независимой работе на периферийных устройствах.
Это побудило многих в отрасли задуматься: какая вычислительная архитектура лучше всего подходит для ИИ?
Графические процессоры (GPU) с их возможностями параллельной обработки могут быть не единственным решением. Последовательные вычисления (вычисления общего назначения) также становятся жизнеспособной основой для вычислений ИИ. Опыт отрасли показывает, что DeepSeek демонстрирует хорошую совместимость с различными вычислительными системами. Его способность быстро развертываться и выполнять эффективный вывод на ЦП вернула ЦП в центр внимания. По сравнению со специализированными GPU, CPU предлагают преимущество универсальности, упрощенного планирования, значительного снижения требований к вычислительной мощности и преимуществ однородных вычислений.
Среди ЦП восходящая звезда, RISC-V, привлекает значительное внимание.
Во время китайского Нового года DAMO Academy адаптировала модель дистилляции серии DeepSeek-R1 на чипе, работающем на процессоре RISC-V Xuantie C920. Весь процесс занял всего один час, продемонстрировав быстрый и бесшовный опыт. Это означает, что модели серии DeepSeek могут быть плавно развернуты и запущены на всем спектре платформ ЦП Xuantie и других конечных устройствах ИИ, оснащенных чипами архитектуры RISC-V.
Известность RISC-V обусловлена несколькими факторами. Во-первых, как новая архитектура набора команд, она отличается от закрытых или платных моделей лицензирования x86 и ARM, применяя подход с открытым исходным кодом. Этот дух открытого исходного кода естественным образом сочетается с ИИ. Его открытый характер привлек к участию более 1000 компаний по всему миру, способствуя быстрому росту его экосистемы, от проектирования оборудования до цепочек программных инструментов. По данным RISC-V International Foundation, на рынок уже вышло более 80 различных продуктов на базе чипов RISC-V.
Во-вторых, RISC-V предлагает замечательную гибкость и масштабируемость. Он позволяет разработчикам настраивать набор команд в соответствии с конкретными потребностями. Модульная природа его набора команд позволяет настраивать его для различных сценариев применения, что является уровнем гибкости, не имеющим аналогов в традиционных архитектурах.
Технически RISC-V также хорошо подходит для новых типов вычислений ИИ. Его векторное расширение (V-extension) может эффективно обрабатывать крупномасштабные параллельные операции, удовлетворяя требованиям эффективности вычислений ИИ. Открытая архитектура RISC-V может работать в синергии с модулями аппаратного ускорения для повышения эффективности выполнения задач ИИ. Благодаря глубокой интеграции с алгоритмами ИИ архитектура RISC-V может использоваться для разработки специализированных блоков аппаратного ускорения, оптимизирующих производительность для конкретных моделей ИИ.
Поэтому многие опытные эксперты в области чипов ожидают, что RISC-V станет родной вычислительной архитектурой эпохи ИИ.
На третьей конференции Xuantie RISC-V Ecosystem Conference, организованной DAMO Academy компании Alibaba, это ожидание наконец-то сбылось.
Первый серверный процессор Xuantie готов к поставке: слияние высокой производительности и ИИ
На конференции Ни Гуаннань, академик Китайской инженерной академии, заявил: «’Open-source RISC-V — это не только технологическая инновация, но и глобальная трансформация, которая повлияет на будущее вычислительной архитектуры’». Как архитектура набора команд чипа, ‘рожденная с открытым исходным кодом’, RISC-V продемонстрировала замечательную производительность в этом цикле полупроводниковой промышленности. Она ускорила свой прогресс от встроенных систем до сложных сценариев, таких как высокопроизводительные вычисления, предлагая новый вариант вычислительной мощности ИИ.
Среди 25 стандартов, утвержденных RISC-V International Foundation в 2024 году, более половины связаны с высокой производительностью или ИИ. Лу Дай, председатель совета директоров RISC-V International Foundation, заявил на конференции, что одним из самых захватывающих достижений в наборе команд RISC-V является Matrix extension, которое позволит RISC-V стать грозной силой в области ИИ.
Прогнозируется, что к 2030 году общая доля рынка RISC-V достигнет 20%, а его доля в ускорителях ИИ может превысить 50%.
На конференции DAMO Academy представила свой флагманский процессор следующего поколения и первый процессор серверного уровня, C930.
C930 достигает эталонной производительности вычислений общего назначения 15/ГГц в тесте SPECint2006. Что это означает? Академик Ни Гуаннань отметил, что для того, чтобы RISC-V действительно вышел на рынок высокопроизводительных вычислений, он должен достичь высокой производительности, превышающей 15, в программном тесте SPECint 2006. Таким образом, C930 представляет собой важный шаг для RISC-V.
Кроме того, C930 оснащен двумя движками: 512-bit RVV1.0 и 8 TOPS Matrix. Это объединяет вычислительную мощность общего назначения с высокой производительностью и вычислительную мощность ИИ изначально. Он также предоставляет открытый интерфейс расширения DSA для поддержки дополнительных требований к функциям.
Одновременно DAMO Academy раскрыла свои планы разработки новых членов семейства процессоров Xuantie, включая C908X, R908A и XL200, продолжая развиваться в таких направлениях, как ускорение ИИ, автомобильные приложения и высокоскоростное межсоединение. В частности, C908X позиционируется как первый специализированный процессор ИИ Xuantie, поддерживающий сверхдлинное расширение вектора RVV1.0 с разрядностью данных 4096 бит. R908A ориентирован на высокие требования к надежности автомобильных чипов. XL200 обеспечит более масштабное и высокопроизводительное многокластерное когерентное межсоединение.
Чтобы дополнить возможности процессоров Xuantie, DAMO Academy также выпустила три пакета SDK Xuantie, основанные на трех основных операционных системах: Linux, Android и RTOS. Эти SDK комплексно интегрируют накопленные за годы программные возможности Xuantie, предоставляя их отрасли в более полном, удобном и стабильном виде. Среди них Xuantie Linux SDK предлагает богатый набор подсистем, включая виртуализацию Hypervisor, структуру безопасности CoVE, структуру Xuantie AI и высокопроизводительные библиотеки операторов, облегчая разработку RISC-V в высокопроизводительных сценариях и сценариях ИИ.
Разрабатывая высокопроизводительные аппаратные и программные технологии, Xuantie также активно продвигает совместные инновации среди партнеров по восходящей и нисходящей цепочке поставок, ускоряя развертывание комплексной экосистемы RISC-V ‘высокая производительность + ИИ’.
Преданность Alibaba: RISC-V Xuantie лидирует в международном сообществе Open Source
Для тех, кто не знаком с Xuantie, вот краткое введение.
В 2018 году Alibaba учредила бренд Xuantie, сосредоточившись на направлении RISC-V. Год спустя появился первый процессор, C910, ставший самым мощным процессором RISC-V на тот момент. С тех пор Xuantie является лидером в международной экосистеме RISC-V и одним из крупнейших китайских участников международного сообщества с открытым исходным кодом. В настоящее время он занимает должности председателя или заместителя председателя в техническом комитете фонда и более чем в 10 технических подкомитетах, активно продвигая стандартизацию технологий, связанных с ИИ.
С 2019 года Xuantie выпустила 13 процессоров RISC-V, охватывающих различные сценарии, такие как высокая производительность, высокая энергоэффективность и низкое энергопотребление. К ним относятся:
- C Series (Computing): в первую очередь ориентированы на высокопроизводительные серверы, высокопроизводительные периферийные вычисления и промышленные/потребительские IPC.
- E Series (Embedded): в основном используются в высокопроизводительных MPU и различных MCU.
- R Series (Reliability & Realtime): ориентированы на высокопроизводительные SSD, коммуникации, высокопроизводительное промышленное управление, автомобилестроение и другие сценарии.
- XT-Link: IP-адрес межсоединения нескольких кластеров ЦП.
На сегодняшний день поставки процессоров Xuantie превысили 4 миллиарда единиц, что делает их одной из самых влиятельных и лидирующих на рынке серий процессоров в отечественной области RISC-V.
На протяжении всего своего развития Xuantie последовательно расширяла границы производительности RISC-V, стремясь к еще более высокой производительности. Одновременно с этим она активно внедряла ИИ, стремясь сделать RISC-V родной вычислительной архитектурой ИИ.
На уровне технологии архитектуры набора команд, используя превосходную открытость и гибкость архитектуры RISC-V, Xuantie давно настраивает расширения набора команд для приложений ИИ. Предложенный ею набор команд расширения Matrix и оптимизация основного оператора GEMM для больших моделей могут ускорить вывод и обучение ИИ, повышая энергоэффективность ИИ на периферийных устройствах.
Что касается процессоров, Xuantie C907 был первым, кто реализовал расширение Matrix, достигнув 15-кратного ускорения по сравнению с традиционными решениями. Обновленный C920 поддерживает технологии Vector 1.0 и Vector Crypto, повышая производительность GEMM более чем в 7 раз, а производительность оператора Transformer — более чем в 17 раз. Новейший флагманский процессор, C930, оснащен двумя движками: векторным и матричным, что делает его многообещающим партнером для больших моделей ИИ на периферийных устройствах.
На уровне программного стека Xuantie создала комплексную программно-аппаратную платформу RISC-V AI. Эта платформа предоставляет производителям чипов универсальную и эффективную инфраструктуру вычислений ИИ, формируя конвейерную конструкцию, ориентированную на бизнес-потребности, действительно обеспечивая удобную и глубокую оптимизацию от базового проектирования оборудования до цепочек программных инструментов верхнего уровня. Эта платформа была применена к терминальным продуктам, таким как карты транскодирования облачного видео, блоки периферийных вычислений ИИ и ноутбуки RISC-V.
В дополнение к собственной технологии команда DAMO Academy RISC-V последовательно привлекала партнеров по восходящей и нисходящей цепочке поставок для улучшения экосистемы RISC-V ‘высокая производительность + ИИ’.
На прошлогодней конференции неожиданно появился ноутбук с открытым исходным кодом RISC-V ‘Ruyi BOOK Jia Chen Edition’, продемонстрировавший стабильную и плавную работу большого коммерческого программного обеспечения. В этом году Институт программного обеспечения Китайской академии наук представил ‘Ruyi BOOK Yi Si Edition’, интеллектуальных роботов, ИИ-ПК и другие высокопроизводительные приложения RISC-V.
Среди них прототип ИИ-ПК на базе C920 успешно запустил модели с открытым исходным кодом, такие как Llama, Qwen и DeepSeek, поддерживая приложения ИИ, такие как персональные помощники ИИ, программирование ИИ и визуальное распознавание. Это демонстрирует полную ‘цепочку ИИ с открытым исходным кодом’ от архитектуры оборудования с открытым исходным кодом до операционных систем с открытым исходным кодом и моделей ИИ с открытым исходным кодом, а также снижает удельное энергопотребление вычислений на 30%.
Кроме того, Xuantie сотрудничала с партнерами для создания практических решений, таких как решения для кодирования и декодирования видео RISC-V и решения для облачных рабочих столов. Чтобы поддерживать приложения в большем количестве отраслей, Xuantie также развернула вычислительную мощность RISC-V в моноблоках, промышленном управлении ИИ, роботах и других областях.
Академик Ни Гуаннань заявил, что прагматичные инвестиции и инновации Xuantie являются решающими движущими силами для здорового развития экосистемы RISC-V.
Будущее Open Source
Успех DeepSeek является свидетельством силы открытого исходного кода. Архитектура набора команд с открытым исходным кодом RISC-V с момента своего появления более десяти лет назад наметила иной путь развития, чем закрытая x86 и лицензированная модели ARM. Она предоставила отрасли возможность внедрять инновации в архитектуры более лаконичным и открытым способом, получая все большее признание.
Она становится лучшим кандидатом на роль родной архитектуры эпохи ИИ. С одной стороны, RISC-V, с ее приверженностью открытости и непрерывной эволюции, может идти в ногу с быстрыми изменениями в ИИ. С другой стороны, сильная расширяемость RISC-V позволяет ей быть совместимой с существующими архитектурными экосистемами посредством переноса и адаптации, а также служить родной архитектурой для поддержки новых сценариев.
Как сказал Го Сунлю, руководитель отдела RISC-V в Институте программного обеспечения Китайской академии наук: «’Программный стек ИИ все еще быстро развивается. Как самая гибкая и открытая из трех основных архитектур набора команд, RISC-V, несомненно, наиболее подходит для темпов технологических инноваций в эпоху ИИ’».