Възходът на RISC-V като AI-ориентирана изчислителна архитектура
Неотдавнашната експлозивна популярност на DeepSeek предизвика вълни в цялата AI индустрия и нейното въздействие се простира отвъд сферата на изкуствения интелект. Полупроводниковата индустрия, в частност, обърна внимание. По време на Китайската Нова година, Xuantie на DAMO Academy на Alibaba обяви адаптацията си на модела за дестилация от серията DeepSeek-R1, демонстрирайки силния импулс на нововъзникващата архитектура с отворен код за инструкции, RISC-V, в областта на AI.
На неотдавнашната конференция за екосистемата Xuantie RISC-V се появиха вълнуващи новини: RISC-V постигна пробиви както във високопроизводителните изчисления, така и в AI. Xuantie C930, първият CPU от сървърен клас от DAMO Academy, е планиран да започне да се доставя следващия месец. Неговата значително подобрена изчислителна мощ за AI ускорява внедряването на цялостна RISC-V екосистема „висока производителност + AI“.
Може ли изчислителната архитектура с отворен код RISC-V да бъде идеалният партньор за AI с отворен код?
Трансформацията на AI модела подхранва иновациите в изчислителната архитектура
Опитен експерт в чип индустрията обясни, че въздействието на DeepSeek се усеща не само в AI средите, но и дълбоко в чип индустрията. DeepSeek, чрез своя високо оптимизиран дизайн, драстично намали разходите за обучение и извод на големи езикови модели. Тази промяна драстично промени съществуващия баланс на изчислителна мощ, памет и взаимосвързаност, създавайки значителни възможности за пробиви в изчислителната архитектура.
Традиционно големите AI модели, поради интензивните си изисквания за изчисления и памет, бяха по-подходящи за внедряване в облака, отколкото на крайни устройства. Пристигането на DeepSeek обаче оспори тази зависимост от висока изчислителна мощ. Чрез намаляване както на разходите за обучение, така и на разходите за извод, той проправя пътя за преминаване на големите модели от облака към периферията.
По-конкретно, намалените изчислителни изисквания на DeepSeek правят внедряването на една машина осъществимо, подобрявайки съвместимостта му с крайни и периферни устройства. Тъй като AI се стреми да проникне в различни индустрии и сценарии, необходимостта от преминаване от облака към периферията става все по-критична. Тази промяна е необходима, за да се отговори на различни нужди като сигурност на данните, персонализирано персонализиране и частно внедряване.
Предвидимо е, че с широкото приемане на технологията DeepSeek, пейзажът на AI чиповете ще претърпи трансформация. От мащабни паралелни изчисления, разчитащи на облачна инфраструктура, AI чиповете се развиват към диверсифицирани, ефективни и нискоенергийни дизайни, способни на независима работа на крайни устройства.
Това накара мнозина в индустрията да се замислят: коя изчислителна архитектура е най-подходяща за AI?
Графичните процесори (GPU), със своите възможности за паралелна обработка, може да не са единственото решение. Серийните изчисления (изчисления с общо предназначение) също се очертават като жизнеспособна основа за AI изчисления. Индустриалният опит показва, че DeepSeek показва добра съвместимост с различни изчислителни системи. Способността му да бъде бързо внедрен и да извършва ефективни изводи на CPU върна CPU в светлината на прожекторите. В сравнение със специализираните GPU, CPU предлагат предимството на гъвкавост, опростено планиране, значително намаляване на изискванията за изчислителна мощ и предимствата на хомогенните изчисления.
Сред CPU, изгряващата звезда, RISC-V, привлича значително внимание.
По време на Китайската Нова година, DAMO Academy адаптира модела за дестилация от серията DeepSeek-R1 на чип, захранван от RISC-V процесора Xuantie C920. Целият процес отне само един час, демонстрирайки бързо и безпроблемно изживяване. Това означава, че моделите от серията DeepSeek могат да бъдат безпроблемно внедрени и стартирани на пълната гама от Xuantie CPU платформи и други AI крайни устройства, оборудвани с чипове с RISC-V архитектура.
Изпъкването на RISC-V произтича от няколко фактора. Първо, като нововъзникваща архитектура на набор от инструкции, тя се отличава от затворените или платени модели за лицензиране на x86 и ARM, като възприема подход с отворен код. Този дух на отворен код се съчетава естествено с AI. Отвореният му характер привлече участието на над 1000 компании по целия свят, насърчавайки бързия растеж на неговата екосистема, от хардуерен дизайн до софтуерни вериги от инструменти. Според RISC-V International Foundation, повече от 80 различни RISC-V чип продукта вече са навлезли на пазара.
Второ, RISC-V предлага забележителна гъвкавост и мащабируемост. Тя позволява на разработчиците да персонализират набора от инструкции според специфичните нужди. Модулният характер на неговия набор от инструкции позволява персонализиране за различни сценарии на приложение, ниво на гъвкавост, несравнимо с традиционните архитектури.
Технически, RISC-V също е много подходящ за нови видове AI изчисления. Неговото векторно разширение (V-extension) може ефективно да обработва мащабни паралелни операции, отговаряйки на изискванията за ефективност на AI изчисленията. Отворената архитектура на RISC-V може да работи в синергия с модули за хардуерно ускорение, за да подобри ефективността на изпълнение на AI задачи. Чрез дълбока интеграция с AI алгоритми, RISC-V архитектурата може да се използва за проектиране на специализирани модули за хардуерно ускорение, оптимизирайки производителността за специфични AI модели.
Следователно, много опитни експерти в чип индустрията очакват, че RISC-V ще се превърне в родната изчислителна архитектура на AI ерата.
На третата конференция за екосистемата Xuantie RISC-V, организирана от DAMO Academy на Alibaba, това очакване най-накрая се сбъдна.
Първият CPU от сървърен клас на Xuantie, готов за доставка: Комбинация от висока производителност и AI
На конференцията Ни Гуаннан, академик от Китайската инженерна академия, заяви: „RISC-V с отворен код е не само технологична иновация, но и глобална трансформация, която ще повлияе на бъдещето на изчислителната архитектура“. Като архитектура на набор от инструкции за чипове, „родена с отворен код“, RISC-V демонстрира забележителна производителност в този цикъл на полупроводниковата индустрия. Той ускори напредъка си от вградени системи до сложни сценарии като високопроизводителни изчисления, предлагайки нова опция за AI изчислителна мощ.
Сред 25-те стандарта, одобрени от RISC-V International Foundation през 2024 г., повече от половината са свързани с висока производителност или AI. Лу Дай, председател на борда на директорите на RISC-V International Foundation, заяви на конференцията, че едно от най-вълнуващите постижения в набора от инструкции RISC-V е Matrix extension, което ще тласне RISC-V да се превърне в страхотна сила в областта на AI.
Предвижда се, че до 2030 г. общият пазарен дял на RISC-V ще достигне 20%, като делът му в AI ускорителите потенциално ще надхвърли 50%.
На конференцията DAMO Academy представи своя следващ флагмански процесор и първия процесор от сървърен клас, C930.
C930 постига бенчмарк за изчислителна мощ с общо предназначение от 15/GHz в бенчмарк теста SPECint2006. Какво означава това? Академик Ни Гуаннан посочи, че за да може RISC-V наистина да навлезе на пазара на високопроизводителни изчисления, той трябва да постигне висок резултат за производителност, надвишаващ 15 в софтуерния тест SPECint 2006. Следователно C930 представлява важна стъпка за RISC-V.
Освен това C930 е оборудван с двойни двигатели: 512-bit RVV1.0 и 8 TOPS Matrix. Това интегрира изчислителна мощ с общо предназначение с висока производителност с AI изчислителна мощ. Той също така предоставя отворен DSA интерфейс за разширение, за да поддържа повече изисквания за функции.
Едновременно с това DAMO Academy разкри плановете си за разработка на нови членове на семейството процесори Xuantie, включително C908X, R908A и XL200, продължавайки да се развива в посоки като AI ускорение, автомобилни приложения и високоскоростна взаимосвързаност. По-конкретно, C908X е позициониран като първият специализиран AI процесор на Xuantie, поддържащ 4096-битово ултра-дълго векторно разширение RVV1.0. R908A е насочен към изискванията за висока надеждност на чиповете от автомобилен клас. XL200 ще осигури по-мащабна, по-високопроизводителна многоклъстерна кохерентна взаимосвързаност.
За да допълни възможностите на Xuantie процесорите, DAMO Academy също пусна три Xuantie SDK, базирани на трите основни операционни системи: Linux, Android и RTOS. Тези SDK изчерпателно интегрират натрупаните софтуерни възможности на Xuantie през годините, предоставяйки ги на индустрията по по-пълен, удобен и стабилен начин. Сред тях Xuantie Linux SDK предлага богат набор от подсистеми, включително Hypervisor виртуализация, CoVE рамка за сигурност, Xuantie AI рамка и високопроизводителни библиотеки с оператори, улеснявайки развитието на RISC-V във високопроизводителни и AI сценарии.
Докато разработва високопроизводителни хардуерни и софтуерни технологии, Xuantie също така активно стимулира съвместните иновации между партньорите от индустрията нагоре и надолу по веригата, ускорявайки внедряването на цялостна RISC-V екосистема „висока производителност + AI“.
Посвещението на Alibaba: RISC-V Xuantie води международната общност с отворен код
За тези, които не са запознати с Xuantie, ето кратко въведение.
През 2018 г. Alibaba създаде марката Xuantie, фокусирайки се върху посоката RISC-V. Година по-късно се появи първият процесор, C910, като най-мощният RISC-V процесор по това време. Оттогава Xuantie е лидер в международната RISC-V екосистема и един от най-големите китайски участници в международната общност с отворен код. Понастоящем заема председателски или заместник-председателски позиции в техническия комитет на фондацията и повече от 10 технически подкомитета, като активно насърчава стандартизацията на свързаните с AI технологии.
От 2019 г. Xuantie пусна 13 RISC-V процесора, покриващи различни сценарии като висока производителност, висока енергийна ефективност и ниска консумация на енергия. Те включват:
- C Series (Computing): Предимно насочени към сървъри от висок клас, високопроизводителни периферни изчисления и индустриални/потребителски IPC.
- E Series (Embedded): Използва се главно във високопроизводителни MPU и различни MCU.
- R Series (Reliability & Realtime): Насочени към SSD от висок клас, комуникации, индустриален контрол от висок клас, автомобилостроене и други сценарии.
- XT-Link: IP за многоклъстерна взаимосвързаност на CPU.
Към днешна дата доставките на процесори Xuantie надхвърлиха 4 милиарда единици, което го прави една от най-влиятелните и водещи на пазара серии процесорни продукти в местната област RISC-V.
По време на своето развитие Xuantie последователно разширява границите на производителността на RISC-V, стремейки се към все по-висока производителност. Едновременно с това той активно прегърна AI, като се стреми да установи RISC-V като родна AI изчислителна архитектура.
На ниво технология на архитектурата на набора от инструкции, използвайки превъзходната отвореност и гъвкавост на RISC-V архитектурата, Xuantie отдавна персонализира разширения на набора от инструкции за AI приложения. Неговият предложен набор от инструкции за разширение Matrix и оптимизацията на основния оператор GEMM за големи модели могат да ускорят AI извода и обучението, подобрявайки енергийната ефективност на AI на крайни устройства.
По отношение на процесорите, Xuantie C907 беше първият, който внедри разширението Matrix, постигайки 15 пъти ускорение в сравнение с традиционните решения. Обновеният C920 поддържа технологиите Vector 1.0 и Vector Crypto, подобрявайки производителността на GEMM с над 7 пъти и производителността на оператора Transformer с над 17 пъти. Най-новият флагмански процесор, C930, разполага както с векторни, така и с матрични двойни двигатели, позиционирайки го като обещаващ партньор за големи AI модели на крайни устройства.
На ниво софтуерен стек, Xuantie създаде цялостна RISC-V AI софтуерна и хардуерна платформа от край до край. Тази платформа предоставя на производителите на чипове обща, ефективна AI изчислителна инфраструктура, формирайки конвейерен дизайн, ориентиран към бизнес нуждите, наистина позволявайки удобна и дълбока оптимизация от основния хардуерен дизайн до софтуерните вериги от инструменти от горния слой. Тази платформа е приложена към терминални продукти като карти за транскодиране на облачно видео, AI кутии за периферни изчисления и RISC-V лаптопи.
В допълнение към собствената си технология, екипът на DAMO Academy RISC-V последователно ангажира партньори от индустрията нагоре и надолу по веригата, за да подобри екосистемата „висока производителност + AI“ на RISC-V.
На миналогодишната конференция, RISC-V лаптопът с отворен код „Ruyi BOOK Jia Chen Edition“ направи изненадваща поява, демонстрирайки стабилна и гладка работа на голям търговски софтуер. Тази година Институтът по софтуер, Китайска академия на науките, допълнително представи „Ruyi BOOK Yi Si Edition“, интелигентни роботи, AI компютри и други RISC-V високопроизводителни приложения.
Сред тях прототипът на AI PC, базиран на C920, успешно стартира модели с отворен код като Llama, Qwen и DeepSeek, поддържайки AI приложения като AI лични асистенти, AI програмиране и визуално разпознаване. Това демонстрира пълна „AI верига с отворен код“ от хардуерна архитектура с отворен код до операционни системи с отворен код и AI модели с отворен код, като същевременно намалява консумацията на енергия за единица изчисления с 30%.
Освен това Xuantie си сътрудничи с партньори за изграждане на практически решения като RISC-V решения за видео кодеци и решения за облачен работен плот. За да поддържа приложения в повече индустрии, Xuantie също внедри RISC-V изчислителна мощ в компютри „всичко в едно“, индустриален AI, роботи и други области.
Академик Ни Гуаннан заяви, че прагматичните инвестиции и иновации на Xuantie са решаващи движещи сили за здравословното развитие на RISC-V екосистемата.
Бъдещето на отворения код
Успехът на DeepSeek е доказателство за силата на отворения код. Архитектурата на набора от инструкции с отворен код RISC-V, от създаването си преди повече от десетилетие, очерта различен път на развитие от затворения x86 и лицензираните модели ARM. Той представи на индустрията възможност за иновации на архитектури по по-кратък и отворен начин, спечелвайки все по-голямо признание.
Той се очертава като най-добрият кандидат за родната архитектура на AI ерата. От една страна, RISC-V, със своя ангажимент за отвореност и непрекъсната еволюция, може да бъде в крак с бързите промени в AI. От друга страна, силната разширяемост на RISC-V му позволява да бъде съвместим със съществуващите архитектурни екосистеми чрез пренасяне и адаптация, като същевременно служи като родна архитектура за поддържане на нововъзникващи сценарии.
Както каза Гуо Сонглю, ръководител на RISC-V в Института по софтуер, Китайска академия на науките: „Софтуерният стек за AI все още се развива бързо. Като най-гъвкавата и отворена от трите основни архитектури на набори от инструкции, RISC-V несъмнено е най-подходящ за темпото на технологичните иновации в AI ерата.“