Der Aufstieg von RISC-V als KI-native Rechenarchitektur
Die jüngste explosionsartige Popularität von DeepSeek hat die gesamte KI-Industrie erschüttert, und seine Auswirkungen gehen über den Bereich der künstlichen Intelligenz hinaus. Insbesondere die Halbleiterindustrie hat dies zur Kenntnis genommen. Während des chinesischen Neujahrsfestes kündigte Alibabas DAMO Academy Xuantie seine Adaption des DeepSeek-R1-Serien-Destillationsmodells an und demonstrierte damit die starke Dynamik der aufstrebenden Open-Source-Befehlssatzarchitektur RISC-V im KI-Bereich.
Auf der kürzlich abgehaltenen Xuantie RISC-V Ecosystem Conference gab es aufregende Neuigkeiten: RISC-V hat sowohl im Bereich des Hochleistungsrechnens als auch im Bereich der KI Durchbrüche erzielt. Der Xuantie C930, die erste Server-CPU der DAMO Academy, soll im nächsten Monat ausgeliefert werden. Seine deutlich verbesserte KI-Rechenleistung beschleunigt die Bereitstellung eines umfassenden ‘Hochleistungs- + KI’-RISC-V-Ökosystems.
Könnte die Open-Source-Rechenarchitektur RISC-V der ideale Partner für Open-Source-KI sein?
KI-Modelltransformation treibt Innovation in der Rechenarchitektur voran
Ein erfahrener Experte in der Chipindustrie erklärte, dass die Auswirkungen von DeepSeek nicht nur in KI-Kreisen, sondern auch tiefgreifend in der Chipindustrie zu spüren sind. DeepSeek hat durch sein hochoptimiertes Design die Trainings- und Inferenzkosten großer Sprachmodelle drastisch reduziert. Diese Verschiebung hat das bestehende Gleichgewicht von Rechenleistung, Speicher und Verbindung dramatisch verändert und erhebliche Möglichkeiten für Durchbrüche in der Rechenarchitektur geschaffen.
Traditionell waren große KI-Modelle aufgrund ihrer intensiven Rechen- und Speicheranforderungen besser für die Bereitstellung in der Cloud als auf Edge-Geräten geeignet. Die Ankunft von DeepSeek hat diese Abhängigkeit von hoher Rechenleistung jedoch in Frage gestellt. Durch die Reduzierung der Trainings- und Inferenzkosten wird der Weg für große Modelle geebnet, um von der Cloud an den Rand zu wechseln.
Insbesondere die reduzierten Rechenanforderungen von DeepSeek machen die Bereitstellung auf einzelnen Maschinen machbar und verbessern die Kompatibilität mit Edge- und Endgeräten. Da KI versucht, in verschiedene Branchen und Szenarien einzudringen, wird die Notwendigkeit, von der Cloud an den Rand zu wechseln, immer wichtiger. Diese Verschiebung ist notwendig, um unterschiedliche Anforderungen wie Datensicherheit, personalisierte Anpassung und private Bereitstellung zu erfüllen.
Es ist absehbar, dass mit der weitverbreiteten Einführung der DeepSeek-Technologie die Landschaft der KI-Chips eine Transformation erfahren wird. Von groß angelegtem parallelem Rechnen, das auf Cloud-Infrastruktur angewiesen ist, entwickeln sich KI-Chips hin zu diversifizierten, effizienten und stromsparenden Designs, die in der Lage sind, unabhängig auf Edge-Geräten zu arbeiten.
Dies hat viele in der Branche dazu veranlasst, darüber nachzudenken, welche Rechenarchitektur am besten für KI geeignet ist.
GPUs mit ihren parallelen Verarbeitungsmöglichkeiten sind möglicherweise nicht die einzige Lösung. Serielles Rechnen (Allzweckrechnen) entwickelt sich ebenfalls zu einer tragfähigen Grundlage für die KI-Berechnung. Die Branchenerfahrung zeigt, dass DeepSeek eine gute Kompatibilität mit verschiedenen Rechensystemen aufweist. Seine Fähigkeit, schnell bereitgestellt zu werden und eine effektive Inferenz auf CPUs durchzuführen, hat CPUs wieder ins Rampenlicht gerückt. Im Vergleich zu spezialisierten GPUs bieten CPUs den Vorteil der Vielseitigkeit, der vereinfachten Planung, der erheblichen Reduzierung der Anforderungen an die Rechenleistung und der Vorteile des homogenen Rechnens.
Unter den CPUs zieht der aufstrebende Stern RISC-V große Aufmerksamkeit auf sich.
Während des chinesischen Neujahrsfestes adaptierte die DAMO Academy das DeepSeek-R1-Serien-Destillationsmodell auf einem Chip, der vom RISC-V-Prozessor Xuantie C920 angetrieben wird. Der gesamte Prozess dauerte nur eine Stunde und zeigte eine schnelle und nahtlose Erfahrung. Dies bedeutet, dass die Modelle der DeepSeek-Serie reibungslos auf der gesamten Palette der Xuantie-CPU-Plattformen und anderen KI-Endgeräten mit Chips der RISC-V-Architektur bereitgestellt und ausgeführt werden können.
Die Bedeutung von RISC-V beruht auf mehreren Faktoren. Erstens unterscheidet sich RISC-V als aufstrebende Befehlssatzarchitektur von den geschlossenen oder kostenpflichtigen Lizenzierungsmodellen von x86 und ARM, indem es einen Open-Source-Ansatz verfolgt. Dieser Open-Source-Geist passt natürlich zu KI. Seine Offenheit hat die Beteiligung von über 1.000 Unternehmen weltweit angezogen und das schnelle Wachstum seines Ökosystems gefördert, vom Hardwaredesign bis zu Software-Toolchains. Laut der RISC-V International Foundation sind bereits mehr als 80 verschiedene RISC-V-Chipprodukte auf den Markt gekommen.
Zweitens bietet RISC-V eine bemerkenswerte Flexibilität und Skalierbarkeit. Es ermöglicht Entwicklern, den Befehlssatz an spezifische Bedürfnisse anzupassen. Die Modularität des Befehlssatzes ermöglicht die Anpassung an verschiedene Anwendungsszenarien, ein Maß an Flexibilität, das von herkömmlichen Architekturen nicht erreicht wird.
Technisch gesehen ist RISC-V auch gut für neue Arten der KI-Berechnung geeignet. Seine Vektorerweiterung (V-Extension) kann umfangreiche parallele Operationen effektiv verarbeiten und erfüllt die Effizienzanforderungen der KI-Berechnung. Die offene Architektur von RISC-V kann in Synergie mit Hardwarebeschleunigungsmodulen arbeiten, um die Ausführungseffizienz von KI-Aufgaben zu verbessern. Durch die tiefe Integration mit KI-Algorithmen kann die RISC-V-Architektur verwendet werden, um dedizierte Hardwarebeschleunigungseinheiten zu entwerfen und die Leistung für bestimmte KI-Modelle zu optimieren.
Daher gehen viele erfahrene Experten in der Chipindustrie davon aus, dass RISC-V die native Rechenarchitektur der KI-Ära werden wird.
Auf der dritten Xuantie RISC-V Ecosystem Conference, die von Alibabas DAMO Academy veranstaltet wurde, wurde diese Erwartung endlich erfüllt.
Xuanties erste Server-CPU zur Auslieferung bereit: Eine Fusion von Hochleistung und KI
Auf der Konferenz erklärte Ni Guangnan, ein Akademiker der Chinesischen Akademie der Ingenieurwissenschaften: „Open-Source RISC-V ist nicht nur eine technologische Innovation, sondern auch eine globale Transformation, die die Zukunft der Rechenarchitektur beeinflussen wird.“ Als Chip-Befehlssatzarchitektur, die „Open Source geboren“ wurde, hat RISC-V in diesem Halbleiterindustriezyklus eine bemerkenswerte Leistung gezeigt. Es hat seinen Fortschritt von eingebetteten Systemen zu komplexen Szenarien wie Hochleistungsrechnen beschleunigt und bietet eine neue Option für dieKI-Rechenleistung.
Von den 25 Standards, die von der RISC-V International Foundation im Jahr 2024 genehmigt wurden, beziehen sich mehr als die Hälfte auf Hochleistung oder KI. Lu Dai, Vorstandsvorsitzender der RISC-V International Foundation, erklärte auf der Konferenz, dass eine der aufregendsten Weiterentwicklungen im RISC-V-Befehlssatz die Matrix-Erweiterung ist, die RISC-V zu einer starken Kraft im KI-Bereich machen wird.
Es wird prognostiziert, dass der Gesamtmarktanteil von RISC-V bis 2030 20 % erreichen wird, wobei sein Anteil an KI-Beschleunigern möglicherweise 50 % übersteigt.
Auf der Konferenz stellte die DAMO Academy ihren Flaggschiff-Prozessor der nächsten Generation und den ersten Prozessor der Serverklasse, den C930, vor.
Der C930 erreicht im SPECint2006-Benchmark-Test einen Benchmark für die allgemeine Rechenleistung von 15/GHz. Was bedeutet das? Akademiker Ni Guangnan wies darauf hin, dass RISC-V, um wirklich in den Markt für Hochleistungsrechnen einzusteigen, im SPECint 2006-Softwaretest einen Hochleistungswert von über 15 erreichen muss. Daher stellt der C930 einen Meilenstein für RISC-V dar.
Darüber hinaus ist der C930 mit zwei Engines ausgestattet: 512-Bit RVV1.0 und 8 TOPS Matrix. Dies integriert allgemeine Hochleistungsrechenleistung nativ mit KI-Rechenleistung. Es bietet auch eine offene DSA-Erweiterungsschnittstelle, um weitere Funktionsanforderungen zu unterstützen.
Gleichzeitig gab die DAMO Academy ihre Entwicklungspläne für neue Mitglieder der Xuantie-Prozessorfamilie bekannt, darunter C908X, R908A und XL200, die sich weiterhin in Richtungen wie KI-Beschleunigung, Automobilanwendungen und Hochgeschwindigkeitsverbindungen entwickeln. Insbesondere ist der C908X als Xuanties erster dedizierter KI-Prozessor positioniert und unterstützt eine ultralange Datenbitbreite von 4096 Bit RVV1.0-Vektorerweiterung. Der R908A zielt auf die hohen Zuverlässigkeitsanforderungen von Chips in Automobilqualität ab. Der XL200 wird eine größere, leistungsstärkere Multi-Cluster-kohärente Verbindung bereitstellen.
Um die Fähigkeiten der Xuantie-Prozessoren zu ergänzen, hat die DAMO Academy außerdem drei Xuantie-SDKs auf Basis der drei gängigen Betriebssysteme Linux, Android und RTOS auf den Markt gebracht. Diese SDKs integrieren umfassend die über die Jahre gesammelten Softwarefähigkeiten von Xuantie und stellen sie der Industrie in einer vollständigeren, bequemeren und stabileren Weise zur Verfügung. Unter ihnen bietet das Xuantie Linux SDK eine Vielzahl von Subsystemen, darunter Hypervisor-Virtualisierung, CoVE-Sicherheitsframework, Xuantie AI-Framework und Hochleistungs-Operatorbibliotheken, die die Entwicklung von RISC-V in Hochleistungs- und KI-Szenarien erleichtern.
Während Xuantie Hochleistungs-Hardware- und -Softwaretechnologien entwickelt, treibt es auch aktiv die kollaborative Innovation zwischen vor- und nachgelagerten Industriepartnern voran und beschleunigt die Bereitstellung eines umfassenden RISC-V-‘Hochleistungs- + KI’-Ökosystems.
Alibabas Engagement: RISC-V Xuantie führt die internationale Open-Source-Community an
Für diejenigen, die mit Xuantie nicht vertraut sind, hier eine kurze Einführung.
Im Jahr 2018 gründete Alibaba die Marke Xuantie und konzentrierte sich auf die RISC-V-Richtung. Ein Jahr später entstand der erste Prozessor, der C910, als der leistungsstärkste RISC-V-Prozessor zu dieser Zeit. Seitdem ist Xuantie führend im internationalen RISC-V-Ökosystem und einer der größten chinesischen Beitragenden zur internationalen Open-Source-Community. Es hat derzeit den Vorsitz oder den stellvertretenden Vorsitz im technischen Ausschuss der Stiftung und in mehr als 10 technischen Unterausschüssen inne und fördert aktiv die Standardisierung von KI-bezogenen Technologien.
Seit 2019 hat Xuantie 13 RISC-V-Prozessoren auf den Markt gebracht, die verschiedene Szenarien wie hohe Leistung, hohe Energieeffizienz und geringen Stromverbrauch abdecken. Diese umfassen:
- C-Serie (Computing): Hauptsächlich für High-End-Server, High-End-Edge-Computing und IPCs in Industrie- und Verbraucherqualität.
- E-Serie (Embedded): Wird hauptsächlich in High-End-MPUs und verschiedenen MCUs verwendet.
- R-Serie (Reliability & Realtime): Zielt auf High-End-SSDs, Kommunikation, High-End-Industriesteuerung, Automobil und andere Szenarien ab.
- XT-Link: Ein CPU-Multi-Cluster-Verbindungs-IP.
Bis heute haben die Auslieferungen von Xuantie-Prozessoren 4 Milliarden Einheiten überschritten, was sie zu einer der einflussreichsten und marktführenden Prozessorserien im heimischen RISC-V-Bereich macht.
Während seiner gesamten Entwicklung hat Xuantie die Leistungsgrenzen von RISC-V immer weiter verschoben und nach immer höherer Leistung gestrebt. Gleichzeitig hat es KI aktiv angenommen, mit dem Ziel, RISC-V als native KI-Rechenarchitektur zu etablieren.
Auf der Ebene der Befehlssatzarchitekturtechnologie hat Xuantie, unter Nutzung der überlegenen Offenheit und Flexibilität der RISC-V-Architektur, seit langem kundenspezifische Befehlssatzerweiterungen für KI-Anwendungen entwickelt. Seine vorgeschlagene Matrix-Erweiterungsbefehlssatz und die Optimierung des GEMM-Kernoperators für große Modelle können die KI-Inferenz und das Training beschleunigen und die Energieeffizienz von KI auf Edge-Geräten verbessern.
In Bezug auf Prozessoren war der Xuantie C907 der erste, der die Matrix-Erweiterung implementierte und eine 15-fache Beschleunigung im Vergleich zu herkömmlichen Lösungen erreichte. Der aktualisierte C920 unterstützt Vector 1.0- und Vector Crypto-Technologien, wodurch die GEMM-Leistung um mehr als das 7-fache und die Transformer-Operatorleistung um mehr als das 17-fache verbessert wird. Der neueste Flaggschiff-Prozessor, der C930, verfügt sowohl über Vektor- als auch über Matrix-Dual-Engines und positioniert ihn als vielversprechenden Partner für große KI-Modelle auf Edge-Geräten.
Auf der Software-Stack-Ebene hat Xuantie eine End-to-End-RISC-V-KI-Full-Stack-Software- und Hardwareplattform geschaffen. Diese Plattform bietet Chipherstellern eine universelle, effiziente KI-Recheninfrastruktur, die ein auf Geschäftsanforderungen ausgerichtetes Pipeline-Design bildet und eine bequeme und tiefgreifende Optimierung vom zugrunde liegenden Hardwaredesign bis zu den übergeordneten Software-Toolchains ermöglicht. Diese Plattform wurde auf Terminalprodukte wie Cloud-Videotranskodierungskarten, KI-Edge-Computing-Boxen und RISC-V-Laptops angewendet.
Zusätzlich zu seiner eigenen Technologie hat das RISC-V-Team der DAMO Academy konsequent vor- und nachgelagerte Industriepartner eingebunden, um das ‘Hochleistungs- + KI’-Ökosystem von RISC-V zu verbessern.
Auf der letztjährigen Konferenz erschien überraschend der RISC-V-Open-Source-Laptop ‘Ruyi BOOK Jia Chen Edition’, der den stabilen und reibungslosen Betrieb großer kommerzieller Software demonstrierte. In diesem Jahr stellte das Institute of Software, Chinese Academy of Sciences, die ‘Ruyi BOOK Yi Si Edition’, intelligente Roboter, KI-PCs und andere RISC-V-Hochleistungsanwendungen vor.
Unter ihnen hat der KI-PC-Prototyp auf Basis des C920 erfolgreich Open-Source-Modelle wie Llama, Qwen und DeepSeek ausgeführt und unterstützt KI-Anwendungen wie KI-Personal-Assistenten, KI-Programmierung und visuelle Erkennung. Dies demonstriert eine vollständige ‘Open-Source-KI-Vollkette’ von Open-Source-Hardwarearchitektur über Open-Source-Betriebssysteme bis hin zu Open-Source-KI-Modellen und reduziert gleichzeitig den Energieverbrauch der Recheneinheit um 30 %.
Darüber hinaus hat Xuantie mit Partnern zusammengearbeitet, um praktische Lösungen wie RISC-V-Videocodec-Lösungen und Cloud-Desktop-Lösungen zu entwickeln. Um Anwendungen in mehr Branchen zu unterstützen, hat Xuantie auch RISC-V-Rechenleistung in All-in-One-PCs, industrieller KI, Robotern und anderen Bereichen eingesetzt.
Akademiker Ni Guangnan erklärte, dass Xuanties pragmatische Investitionen und Innovationen entscheidende Triebkräfte für die gesunde Entwicklung des RISC-V-Ökosystems sind.
Die Zukunft von Open Source
Der Erfolg von DeepSeek ist ein Beweis für die Leistungsfähigkeit von Open Source. Die Open-Source-Befehlssatzarchitektur RISC-V hat seit ihrer Einführung vor über einem Jahrzehnt einen anderen Entwicklungspfad eingeschlagen als die geschlossenen x86- und die lizenzierten ARM-Modelle. Es hat der Branche die Möglichkeit gegeben, Architekturen auf prägnantere und offenere Weise zu innovieren, und gewinnt zunehmend an Anerkennung.
Es entwickelt sich zum besten Kandidaten für die native Architektur der KI-Ära. Einerseits kann RISC-V mit seinem Bekenntnis zu Offenheit und kontinuierlicher Weiterentwicklung mit den rasanten Veränderungen in der KI Schritt halten. Andererseits ermöglicht die starke Erweiterbarkeit von RISC-V die Kompatibilität mit bestehenden Architektursystemen durch Portierung und Anpassung, während es gleichzeitig als native Architektur zur Unterstützung neuer Szenarien dient.
Wie Guo Songliu, Leiter von RISC-V am Institute of Software, Chinese Academy of Sciences, sagte: „Der KI-Software-Stack entwickelt sich immer noch rasant weiter. Als flexibelste und offenste der drei gängigen Befehlssatzarchitekturen ist RISC-V zweifellos am besten für das Tempo der technologischen Innovation im KI-Zeitalter geeignet.“