開源浪潮之巔:RISC-V 與 AI 的時代交匯

開源計算架構的新篇章

當 DeepSeek 以其顛覆性的姿態震撼人工智能領域時,它所引發的漣漪效應遠不止於此。在半導體行業,這一技術突破激起了更深層次的震盪。特別值得關注的是,達摩院玄鐵團隊在春節期間宣布,其 RISC-V 架構已成功適配 DeepSeek-R1 系列蒸餾模型。這一消息迅速點燃了業界對 RISC-V 這一新興開源指令集在人工智能領域潛力的熱情。

在最近舉行的玄鐵 RISC-V 生態大會上,這一潛力得到了進一步的印證。大會上傳出的消息表明,RISC-V 不僅在高性能計算領域取得了突破,更在人工智能領域展現出強勁的勢頭。玄鐵首款伺服器級 CPU C930 即將於下月交付,其顯著提升的 AI 算力,預示著 RISC-V 正在加速佈局“高性能+AI”的全鏈路生態。

這不禁引人深思:開源的 RISC-V 算力架構,是否會成為開源 AI 的天作之合?

AI 模型變革:算力架構創新的催化劑

一位資深的晶片行業專家指出,DeepSeek 所帶來的震撼,不僅局限於 AI 領域,更波及到了整個晶片行業。DeepSeek 通過極致的深度優化,大幅降低了大模型訓練和推理的成本。這一變革打破了算力、記憶體和互聯之間原有的平衡,為算力架構的創新帶來了前所未有的機遇。

傳統觀念認為,AI 大模型需要龐大的算力和記憶體資源,因此更適合部署在雲端,而非邊緣端設備。然而,DeepSeek 的橫空出世,徹底顛覆了這一認知。它不僅降低了訓練成本,更顯著降低了推理的門檻。這使得大模型從雲端走向邊緣端成為了可能。

具體而言,DeepSeek 降低了對計算資源的需求,使得單機部署成為現實。這為更好地適配邊緣和端側設備創造了條件。隨著 AI 技術深入千行百業,覆蓋日益多樣化的應用場景,業界迫切需要將 AI 從雲端推向邊緣端,以滿足數據安全、個性化定制、私有化部署等多元化需求。

可以預見,隨著 DeepSeek 技術的普及,AI 晶片的形態將迎來重塑。AI 晶片將不再局限於依賴雲計算的大規模並行計算,而是向能夠在邊緣設備上獨立運行的低功耗晶片方向發展。AI 晶片正朝著多樣化和高效化的方向邁進。

這也引發了業界人士的深入思考:什麼樣的算力架構才能最好地適應 AI 的發展需求?

並行計算的 GPU 或許不再是唯一的答案。串行計算(通用計算)同樣可以成為 AI 計算的基礎。業界實踐表明,DeepSeek 對多種計算體系都展現出良好的支持。在 CPU 上,DeepSeek 不僅能夠快速部署,還具備出色的推理效果。這使得 CPU 重新回到了競爭的舞台。與專用的 GPU 相比,CPU 的一大優勢在於其通用性強、調度簡單,能夠大幅降低算力需求,並充分發揮同構計算的優勢。

而在 CPU 的陣營中,最引人矚目的莫過於後起之秀 RISC-V

春節期間,達摩院在搭載 RISC-V 處理器玄鐵 C920 的晶片上,對 DeepSeek-R1 系列蒸餾模型進行了適配。整個過程僅耗時 1 小時,體驗快捷流暢。這意味著,DeepSeek 系列模型將能夠順利部署並流暢運行在全系列玄鐵 CPU 平台,以及其他搭載 RISC-V 架構晶片的各類 AI 端側設備上。

RISC-V 之所以備受關注,一方面是因為它作為新興的指令集架構,有別於 x86 和 ARM 的封閉或付費授權模式,堅定地走開源開放的道路。其開源精神與 AI 的發展理念天然契合。得益於開源開放的特性,RISC-V 已經吸引了全球 1000 多家企業的參與,從硬體設計到軟體工具鏈,其生態系統正在迅速壯大。根據 RISC-V 國際基金會的數據,全球已有超過 80 種不同的 RISC-V 晶片產品推向市場。

另一方面,RISC-V 的靈活性和可擴展性也是其備受青睞的重要原因。RISC-V 允許開發者根據具體需求定制指令集。由於其指令集採用了模組化設計,開發者可以根據不同的應用場景進行定制。這種靈活性是傳統架構所無法比擬的。

從技術角度來看,RISC-V 也非常適合新型的 AI 計算。RISC-V 的向量擴展(V-extension)能夠有效處理大規模並行運算,滿足 AI 計算對高效性的要求。RISC-V 的開放架構與硬體加速模組可以協同工作,進一步提升 AI 任務的執行效率。通過與 AI 算法的深度結合,RISC-V 架構可以設計專用的硬體加速單元,實現對特定 AI 模型的優化。

因此,許多資深的晶片行業專家都對 RISC-V 寄予厚望,期待它能成為 AI 時代的原生計算架構。

在阿里達摩院主辦的第三屆玄鐵 RISC-V 生態大會上,這一期待終於迎來了曙光。

玄鐵首款伺服器級 CPU:高性能與 AI 的雙劍合璧

在大會上,中國工程院院士倪光南表示:“開源 RISC-V 不僅是一項技術創新,更是一場影響未來計算架構的全球化變革。”作為“生而開源”的晶片指令集架構,RISC-V 在本輪半導體產業週期中表現突出,正從嵌入式系統加速挺進高性能等複雜場景,並為 AI 算力提供了新的選擇。

在 RISC-V 國際基金會 2024 年批准的 25 項標準中,超過一半與高性能或 AI 相關。RISC-V 國際基金會理事會主席 Lu Dai 在大會現場表示,RISC-V 指令集最激動人心的進展之一是 Matrix 擴展,這將推動 RISC-V 成為 AI 領域令人敬畏的力量。

據預測,到 2030 年,RISC-V 的整體份額將達到 20%,在 AI 加速器中的佔比有望突破 50%。

在大會上,達摩院玄鐵推出了其新一代旗艦處理器,同時也是首款伺服器級處理器 C930

C930 的通用性能算力達到了 SPECint2006 基準測試 15/GHz 的水平。這是一個什麼樣的概念呢?倪光南院士指出,RISC-V 要真正進入高性能計算市場,其 SPECint 2006 軟體測試成績必須超過 15 分的高性能標準。因此,C930 的問世,標誌著 RISC-V 邁出了具有里程碑意義的一步。

此外,C930 還搭載了 512 bits RVV1.08 TOPS Matrix 雙引擎,將通用高性能算力與 AI 算力原生結合,並開放了 DSA 擴展接口,以支持更多特性要求。

同時,達摩院還披露了 C908X、R908A、XL200 等玄鐵處理器家族新成員的研發計劃,這些新產品將向 AI 加速、車載、高速互聯等方向持續演進。具體而言:

  • C908X 定位為玄鐵首款 AI 專用處理器,支持 4096 bits 超長數據位寬 RVV1.0 矢量擴展。
  • R908A 面向車規級晶片的高可靠性需求。
  • XL200 則將提供更大規模、更高性能的多簇一致性互聯。

為了配合玄鐵處理器的能力拓展,達摩院還基於 Linux、Android、RTOS 三套主流作業系統,推出了三套玄鐵 SDK。這些 SDK 將達摩院多年來積累的玄鐵軟體能力全面整合,以更完整、便捷、穩定的方式向行業輸出。其中,玄鐵 Linux SDK 提供了包括 Hypervisor 虛擬化、CoVE 安全框架、玄鐵 AI 框架、高性能算子庫在內的豐富子系統,助力 RISC-V 在高性能和 AI 場景的開發。

在發展高性能軟硬體技術的同時,玄鐵更積極地引領產業上下游合作夥伴協同創新,加快佈局 RISC-V“高性能+AI”的全鏈路生態。

阿里巴巴的 RISC-V 之路:玄鐵引領國際開源社群

對於不太熟悉玄鐵的讀者,這裡做一個簡單的介紹。

2018 年,阿里巴巴確立了主攻 RISC-V 方向的品牌:玄鐵。一年後,首款處理器“玄鐵”C910 問世,一舉成為當時性能最強的 RISC-V 處理器。自那時起,玄鐵便一直是國際 RISC-V 生態的引領者,也是對國際開源社群貢獻最大的中國機構之一。目前,玄鐵在 RISC-V 國際基金會技術委員會及 10 多個技術小組中擔任主席或副主席職位,積極推動著 AI 方向標準化的建設。

自 2019 年以來,玄鐵已經陸續推出了 13 款 RISC-V 處理器,覆蓋了高性能、高能效、低功耗等不同應用場景,包括:

  • C 系列(Computing):主要針對高端伺服器、高端邊緣計算和行業類、消費級 IPC。
  • E 系列(Embedded):主要應用於高端 MPU 與各類 MCU。
  • R 系列(Reliability & Realtime):面向高端 SSD、通信、高端工控、車載等場景。
  • XT-Link:CPU 多簇互聯 IP。

迄今為止,玄鐵處理器的出貨量已超過 40 億顆,成為國內 RISC-V 領域影響力和市場佔有率最大的處理器產品系列之一。

在發展過程中,玄鐵一方面持續突破 RISC-V 的性能天花板,不斷向更高性能領域進發;另一方面積極擁抱 AI,致力於推動 RISC-V 成為 AI 原生算力架構。

在指令集架構技術層面,玄鐵充分利用 RISC-V 架構優異的開放性和靈活性,很早就定制了面向 AI 應用的指令集擴展。其提出的矩陣運算(Matrix)擴展指令集,優化了大模型核心算子 GEMM,可以加速 AI 推理及訓練,提升端側 AI 的能效。

在處理器方面,玄鐵 C907 首次實現了 Matrix 擴展,較傳統方案提速 15 倍。升級版 C920 支持 Vector 1.0 和 Vector Crypto 技術,GEMM 性能指標提升超過 7 倍,Transformer 算子性能提升超過 17 倍。而最新的旗艦處理器 C930 兼具 vector 和 matrix 雙引擎,有望成為端側 AI 大模型的理想搭檔。

在軟體棧層面,玄鐵打造了端到端的 RISC-V AI 全棧軟硬體平台,為晶片廠商提供通用的、高效的 AI 算力基礎設施,形成了面向業務的流水線設計,真正實現了從底層硬體設計到上層軟體工具鏈的便捷深度優化。該平台已成功應用於雲端視頻轉碼卡、AI 邊緣計算盒子、RISC-V 筆記型電腦等終端產品。

除了自身的技術實力,達摩院 RISC-V 團隊也一直致力於引入產業上下游夥伴的力量,不斷完善 RISC-V 的“高性能+AI”生態版圖。

在去年的大會上,RISC-V 開源筆記型電腦“如意 BOOK 甲辰版”驚艷亮相,實現了大型商用軟體的穩定、流暢運行。今年,中科院軟體所進一步介紹了“如意 BOOK 乙巳版”、智能機器人、AI PC 等 RISC-V 高性能應用。

其中,基於 C920 的 AI PC 原型機已經成功運行了 Llama、Qwen、DeepSeek 等開源模型,支持 AI 個人助手、AI 編程、視覺識別等 AI 應用。可以說,這打通了從開源硬體架構到開源作業系統,再到開源 AI 模型的“開源 AI 全鏈路”,單位計算能耗還降低了 30%。

此外,玄鐵還與合作夥伴共同構建了 RISC-V 視頻編解碼方案、雲桌面解決方案等實用解決方案。為了支撐更多行業的應用,玄鐵還將 RISC-V 算力佈局到了一體機、工控 AI、機器人等領域。

倪光南院士表示,玄鐵這種務實的投入和創新,正是 RISC-V 生態健康發展的重要驅動力。

開源的未來:擁抱無限可能

DeepSeek 的成功是開源精神的勝利。開源指令集架構 RISC-V 問世十餘年來,走出了一條與封閉式的 x86 和授權模式的 ARM 截然不同的發展道路。它讓業界看到了通過更簡潔、更開放的方式進行架構創新的機遇,因此也獲得了越來越多的認可。

RISC-V 正逐漸成為 AI 時代原生架構的最佳候選。一方面,RISC-V 堅持開源開放,始終處於演進變化之中,能夠緊跟 AI 快速變化的步伐;另一方面,RISC-V 具有強大的擴展性,既可以通過移植適配與原有架構生態兼容,也可以作為原生架構支撐不斷湧現的新場景。

正如中科院軟體所 RISC-V 負責人郭松柳所言:“AI 軟體棧仍在高速演進,RISC-V 作為三大主流指令集架構中最靈活、最開放的一個,無疑最為適合 AI 時代的技術創新節奏。”