Triumf ওপেন সোর্স: RISC-V i AI

Wzrost znaczenia RISC-V jako natywnej architektury obliczeniowej dla AI

Niedawna, gwałtowna popularność DeepSeek wywołała poruszenie w branży AI, a jej wpływ wykracza poza samą dziedzinę sztucznej inteligencji. Szczególnie branża półprzewodników zwróciła na to uwagę. Podczas Chińskiego Nowego Roku, Xuantie Akademii DAMO Alibaby ogłosiło adaptację modelu destylacji DeepSeek-R1, demonstrując silny impet rozwijającej się, otwartej architektury zestawu instrukcji, RISC-V, w dziedzinie AI.

Na niedawnej konferencji Xuantie RISC-V Ecosystem pojawiły się ekscytujące wiadomości: RISC-V osiągnął przełom zarówno w obliczeniach o wysokiej wydajności, jak i w AI. Xuantie C930, pierwszy procesor klasy serwerowej od DAMO Academy, ma rozpocząć dostawy w przyszłym miesiącu. Jego znacznie zwiększona moc obliczeniowa AI przyspiesza wdrażanie kompleksowego ekosystemu RISC-V “wysoka wydajność + AI”.

Czy otwarta architektura obliczeniowa RISC-V może być idealnym partnerem dla otwartej sztucznej inteligencji?

Transformacja modelu AI napędza innowacje w architekturze obliczeniowej

Doświadczony ekspert w branży chipów wyjaśnił, że wpływ DeepSeek jest odczuwalny nie tylko w kręgach AI, ale także głęboko w branży chipów. DeepSeek, dzięki wysoce zoptymalizowanej konstrukcji, drastycznie obniżył koszty szkolenia i wnioskowania dużych modeli językowych. Ta zmiana radykalnie zmieniła istniejącą równowagę mocy obliczeniowej, pamięci i połączeń międzysystemowych, stwarzając znaczące możliwości przełomów w architekturze obliczeniowej.

Tradycyjnie duże modele AI, ze względu na ich intensywne wymagania obliczeniowe i pamięciowe, były lepiej przystosowane do wdrażania w chmurze niż na urządzeniach brzegowych. Jednak pojawienie się DeepSeek zakwestionowało to uzależnienie od dużej mocy obliczeniowej. Zmniejszając zarówno koszty szkolenia, jak i wnioskowania, toruje drogę do przejścia dużych modeli z chmury na brzeg.

W szczególności, zmniejszone wymagania obliczeniowe DeepSeek umożliwiają wdrożenie na jednej maszynie, zwiększając jego kompatybilność z urządzeniami brzegowymi i końcowymi. W miarę jak AI stara się przenikać do różnych branż i scenariuszy, potrzeba przejścia z chmury na brzeg staje się coraz bardziej krytyczna. Ta zmiana jest konieczna, aby sprostać różnorodnym potrzebom, takim jak bezpieczeństwo danych, personalizacja i prywatne wdrożenia.

Można przewidzieć, że wraz z powszechnym przyjęciem technologii DeepSeek, krajobrazchipów AI ulegnie transformacji. Od wielkoskalowych obliczeń równoległych opartych na infrastrukturze chmurowej, chipy AI ewoluują w kierunku zróżnicowanych, wydajnych i energooszczędnych konstrukcji zdolnych do niezależnego działania na urządzeniach brzegowych.

To skłoniło wielu w branży do zastanowienia się: jaka architektura obliczeniowa jest najlepiej dostosowana do AI?

Procesory graficzne (GPU), ze swoimi możliwościami przetwarzania równoległego, mogą nie być jedynym rozwiązaniem. Obliczenia szeregowe (obliczenia ogólnego przeznaczenia) również stają się realną podstawą obliczeń AI. Doświadczenie branżowe pokazuje, że DeepSeek wykazuje dobrą kompatybilność z różnymi systemami obliczeniowymi. Jego zdolność do szybkiego wdrażania i wykonywania efektywnego wnioskowania na procesorach CPU przywróciła procesory CPU do centrum uwagi. W porównaniu do wyspecjalizowanych procesorów graficznych, procesory CPU oferują zaletę wszechstronności, uproszczonego harmonogramowania, znacznego zmniejszenia wymagań dotyczących mocy obliczeniowej i korzyści płynących z obliczeń jednorodnych.

Wśród procesorów CPU, wschodząca gwiazda, RISC-V, przyciąga znaczną uwagę.

Podczas Chińskiego Nowego Roku, DAMO Academy zaadaptowało model destylacji DeepSeek-R1 na chipie zasilanym procesorem RISC-V Xuantie C920. Cały proces zajął tylko godzinę, demonstrując szybkie i bezproblemowe doświadczenie. Oznacza to, że modele z serii DeepSeek mogą być płynnie wdrażane i uruchamiane na pełnej gamie platform procesorów Xuantie i innych urządzeniach końcowych AI wyposażonych w chipy architektury RISC-V.

Znaczenie RISC-V wynika z kilku czynników. Po pierwsze, jako nowa architektura zestawu instrukcji, odróżnia się od zamkniętych lub płatnych modeli licencjonowania x86 i ARM, przyjmując podejście open-source. Ten duch open-source naturalnie współgra z AI. Jego otwarta natura przyciągnęła udział ponad 1000 firm na całym świecie, wspierając szybki rozwój jego ekosystemu, od projektowania sprzętu po łańcuchy narzędzi programowych. Według RISC-V International Foundation, na rynek weszło już ponad 80 różnych produktów chipowych RISC-V.

Po drugie, RISC-V oferuje niezwykłą elastyczność i skalowalność. Pozwala programistom dostosować zestaw instrukcji do konkretnych potrzeb. Modułowa natura jego zestawu instrukcji umożliwia dostosowanie do różnych scenariuszy zastosowań, co jest poziomem elastyczności nieporównywalnym z tradycyjnymi architekturami.

Technicznie rzecz biorąc, RISC-V jest również dobrze przystosowany do nowych typów obliczeń AI. Jego rozszerzenie wektorowe (V-extension) może skutecznie obsługiwać wielkoskalowe operacje równoległe, spełniając wymagania wydajności obliczeń AI. Otwarta architektura RISC-V może współpracować z modułami akceleracji sprzętowej w celu zwiększenia wydajności wykonywania zadań AI. Dzięki głębokiej integracji z algorytmami AI, architektura RISC-V może być używana do projektowania dedykowanych jednostek akceleracji sprzętowej, optymalizując wydajność dla określonych modeli AI.

Dlatego wielu doświadczonych ekspertów w branży chipów przewiduje, że RISC-V stanie się natywną architekturą obliczeniową ery AI.

Na trzeciej konferencji Xuantie RISC-V Ecosystem, zorganizowanej przez DAMO Academy Alibaby, to oczekiwanie w końcu się spełniło.

Pierwszy procesor klasy serwerowej Xuantie gotowy do dostawy: Połączenie wysokiej wydajności i AI

Na konferencji Ni Guangnan, akademik Chińskiej Akademii Inżynierii, stwierdził: “Open-source RISC-V to nie tylko innowacja technologiczna, ale także globalna transformacja, która wpłynie na przyszłość architektury obliczeniowej”. Jako architektura zestawu instrukcji chipów “urodzona jako open-source”, RISC-V wykazał niezwykłą wydajność w tym cyklu branży półprzewodników. Przyspieszył swój postęp od systemów wbudowanych do złożonych scenariuszy, takich jak obliczenia o wysokiej wydajności, oferując nową opcję dla mocy obliczeniowej AI.

Spośród 25 standardów zatwierdzonych przez RISC-V International Foundation w 2024 roku, ponad połowa jest związana z wysoką wydajnością lub AI. Lu Dai, Przewodniczący Rady Dyrektorów RISC-V International Foundation, stwierdził na konferencji, że jednym z najbardziej ekscytujących osiągnięć w zestawie instrukcji RISC-V jest rozszerzenie Matrix, które sprawi, że RISC-V stanie się potężną siłą w dziedzinie AI.

Przewiduje się, że do 2030 roku ogólny udział RISC-V w rynku osiągnie 20%, a jego udział w akceleratorach AI może przekroczyć 50%.

Na konferencji DAMO Academy zaprezentowało swój flagowy procesor nowej generacji i pierwszy procesor klasy serwerowej, C930.

C930 osiąga wynik benchmarku mocy obliczeniowej ogólnego przeznaczenia 15/GHz w teście benchmarkowym SPECint2006. Co to oznacza? Akademik Ni Guangnan zwrócił uwagę, że aby RISC-V naprawdę wszedł na rynek obliczeń o wysokiej wydajności, musi osiągnąć wysoki wynik przekraczający 15 w teście oprogramowania SPECint 2006. Dlatego C930 stanowi kamień milowy dla RISC-V.

Ponadto C930 jest wyposażony w dwa silniki: 512-bitowy RVV1.0 i 8 TOPS Matrix. To integruje moc obliczeniową ogólnego przeznaczenia o wysokiej wydajności z mocą obliczeniową AI natywnie. Zapewnia również otwarty interfejs rozszerzeń DSA, aby obsługiwać więcej wymagań dotyczących funkcji.

Jednocześnie DAMO Academy ujawniło swoje plany rozwoju nowych członków rodziny procesorów Xuantie, w tym C908X, R908A i XL200, kontynuując ewolucję w kierunkach takich jak akceleracja AI, zastosowania motoryzacyjne i szybkie połączenia międzysystemowe. W szczególności C908X jest pozycjonowany jako pierwszy dedykowany procesor AI Xuantie, obsługujący 4096-bitowe, ultra-długie rozszerzenie wektorowe RVV1.0. R908A jest ukierunkowany na wysokie wymagania niezawodności chipów klasy motoryzacyjnej. XL200 zapewni większą skalę, wyższą wydajność połączeń międzysystemowych wielu klastrów.

Aby uzupełnić możliwości procesorów Xuantie, DAMO Academy uruchomiło również trzy zestawy SDK Xuantie oparte na trzech głównych systemach operacyjnych: Linux, Android i RTOS. Te zestawy SDK kompleksowo integrują zgromadzone przez lata możliwości oprogramowania Xuantie, udostępniając je branży w bardziej kompletny, wygodny i stabilny sposób. Wśród nich Xuantie Linux SDK oferuje bogaty zestaw podsystemów, w tym wirtualizację Hypervisor, framework bezpieczeństwa CoVE, framework Xuantie AI i biblioteki operatorów o wysokiej wydajności, ułatwiając rozwój RISC-V w scenariuszach wysokiej wydajności i AI.

Oprócz opracowywania wysokowydajnych technologii sprzętowych i programowych, Xuantie aktywnie napędza również współpracę innowacyjną między partnerami branżowymi z sektora upstream i downstream, przyspieszając wdrażanie kompleksowego ekosystemu RISC-V “wysoka wydajność + AI”.

Zaangażowanie Alibaby: RISC-V Xuantie przewodzi międzynarodowej społeczności open-source

Dla tych, którzy nie znają Xuantie, oto krótkie wprowadzenie.

W 2018 roku Alibaba założyła markę Xuantie, koncentrując się na kierunku RISC-V. Rok później pojawił się pierwszy procesor, C910, jako najpotężniejszy procesor RISC-V w tamtym czasie. Od tego czasu Xuantie jest liderem w międzynarodowym ekosystemie RISC-V i jednym z największych chińskich kontrybutorów do międzynarodowej społeczności open-source. Obecnie zajmuje stanowiska przewodniczącego lub wiceprzewodniczącego w komitecie technicznym fundacji i ponad 10 podkomitetach technicznych, aktywnie promując standaryzację technologii związanych z AI.

Od 2019 roku Xuantie wprowadziło na rynek 13 procesorów RISC-V, obejmujących różne scenariusze, takie jak wysoka wydajność, wysoka efektywność energetyczna i niskie zużycie energii. Obejmują one:

  • Seria C (Computing): Głównie ukierunkowana na serwery high-end, wysokiej klasy obliczenia brzegowe i przemysłowe/konsumenckie IPC.
  • Seria E (Embedded): Głównie używane w wysokiej klasy MPU i różnych MCU.
  • Seria R (Reliability & Realtime): Ukierunkowana na wysokiej klasy dyski SSD, komunikację, wysokiej klasy sterowanie przemysłowe, motoryzację i inne scenariusze.
  • XT-Link: IP połączeń międzysystemowych wielu klastrów CPU.

Do tej pory dostawy procesorów Xuantie przekroczyły 4 miliardy jednostek, co czyni je jedną z najbardziej wpływowych i wiodących na rynku serii produktów procesorowych w krajowej dziedzinie RISC-V.

Przez cały swój rozwój Xuantie konsekwentnie przesuwało granice wydajności RISC-V, dążąc do coraz wyższej wydajności. Jednocześnie aktywnie wykorzystuje AI, dążąc do ustanowienia RISC-V jako natywnej architektury obliczeniowej AI.

Na poziomie technologii architektury zestawu instrukcji, wykorzystując doskonałą otwartość i elastyczność architektury RISC-V, Xuantie od dawna dostosowuje rozszerzenia zestawu instrukcji do zastosowań AI. Jego proponowany zestaw instrukcji rozszerzenia Matrix i optymalizacja operatora rdzenia GEMM dla dużych modeli mogą przyspieszyć wnioskowanie i szkolenie AI, poprawiając efektywność energetyczną AI na urządzeniach brzegowych.

Jeśli chodzi o procesory, Xuantie C907 był pierwszym, który zaimplementował rozszerzenie Matrix, osiągając 15-krotne przyspieszenie w porównaniu z tradycyjnymi rozwiązaniami. Ulepszony C920 obsługuje technologie Vector 1.0 i Vector Crypto, poprawiając wydajność GEMM o ponad 7x i wydajność operatora Transformer o ponad 17x. Najnowszy flagowy procesor, C930, posiada dwa silniki: wektorowy i macierzowy, co pozycjonuje go jako obiecującego partnera dla dużych modeli AI na urządzeniach brzegowych.

Na poziomie stosu oprogramowania Xuantie stworzyło kompleksową platformę oprogramowania i sprzętu RISC-V AI. Platforma ta zapewnia producentom chipów uniwersalną, wydajną infrastrukturę obliczeniową AI, tworząc projekt potoku zorientowany na potrzeby biznesowe, naprawdę umożliwiając wygodną i głęboką optymalizację od podstawowego projektowania sprzętu po łańcuchy narzędzi programowych wyższego poziomu. Platforma ta została zastosowana w produktach terminalowych, takich jak karty do transkodowania wideo w chmurze, skrzynki obliczeniowe AI edge i laptopy RISC-V.

Oprócz własnej technologii, zespół DAMO Academy RISC-V konsekwentnie angażuje partnerów branżowych z sektora upstream i downstream w celu ulepszenia ekosystemu “wysoka wydajność + AI” RISC-V.

Na zeszłorocznej konferencji niespodziewanie pojawił się laptop open-source RISC-V “Ruyi BOOK Jia Chen Edition”, demonstrując stabilne i płynne działanie dużego oprogramowania komercyjnego. W tym roku Instytut Oprogramowania Chińskiej Akademii Nauk wprowadził ponadto “Ruyi BOOK Yi Si Edition”, inteligentne roboty, komputery AI PC i inne wysokowydajne aplikacje RISC-V.

Wśród nich prototyp AI PC oparty na C920 z powodzeniem uruchomił modele open-source, takie jak Llama, Qwen i DeepSeek, obsługując aplikacje AI, takie jak osobisty asystent AI, programowanie AI i rozpoznawanie wizualne. Demonstruje to kompletny “łańcuch open-source AI” od architektury sprzętowej open-source po systemy operacyjne open-source i modele AI open-source, jednocześnie zmniejszając zużycie energii na jednostkę obliczeniową o 30%.

Ponadto Xuantie współpracowało z partnerami w celu zbudowania praktycznych rozwiązań, takich jak rozwiązania kodeków wideo RISC-V i rozwiązania pulpitu w chmurze. Aby wspierać aplikacje w większej liczbie branż, Xuantie wdrożyło również moc obliczeniową RISC-V w komputerach all-in-one, przemysłowym AI, robotach i innych dziedzinach.

Akademik Ni Guangnan stwierdził, że pragmatyczne inwestycje i innowacje Xuantie są kluczowymi siłami napędowymi dla zdrowego rozwoju ekosystemu RISC-V.

Przyszłość Open Source

Sukces DeepSeek jest świadectwem potęgi open source. Otwarta architektura zestawu instrukcji RISC-V, od momentu jej powstania ponad dekadę temu, wytyczyła inną ścieżkę rozwoju niż zamknięty x86 i licencjonowany model ARM. Dała branży możliwość innowacji architektur w bardziej zwięzły i otwarty sposób, zyskując coraz większe uznanie.

Wyrasta na najlepszego kandydata na natywną architekturę ery AI. Z jednej strony RISC-V, dzięki swojemu zaangażowaniu w otwartość i ciągłą ewolucję, może nadążyć za szybkimi zmianami w AI. Z drugiej strony, silna rozszerzalność RISC-V pozwala mu być kompatybilnym z istniejącymi ekosystemami architektonicznymi poprzez portowanie i adaptację, a jednocześnie służyć jako natywna architektura do obsługi nowych scenariuszy.

Jak powiedział Guo Songliu, szef RISC-V w Instytucie Oprogramowania Chińskiej Akademii Nauk: “Stos oprogramowania AI wciąż szybko ewoluuje. Jako najbardziej elastyczna i otwarta z trzech głównych architektur zestawu instrukcji, RISC-V jest niewątpliwie najbardziej odpowiednia dla tempa innowacji technologicznych w erze AI”.