中星微電子:單晶片 DeepSeek 大模型突破

中星微電子(Vimicro)近期在人工智慧領域取得重大進展,推出最新 AI 晶片「星光智能五號」。這款尖端晶片於 4 月 30 日在福州舉行的第八屆數字中國建設峰會上亮相。此晶片的獨特之處在於其能夠獨立運行 DeepSeek 的 7B、8B 和 16B 大型模型,而無需依賴外部處理能力。這使其成為首款完全自主可控的嵌入式 AI 晶片,能夠在單個晶片上同時運行通用語言模型和視覺大型模型。

突破性架構與強化效能

「星光智能五號」晶片採用中星微自主研發的通用多核異構 GP-XPU 架構。這種創新架構在運算效率、即時效能、成本效益和安全性方面,相較於傳統的 CPU+GPU 架構具有顯著優勢。GP-XPU 架構專為優化 AI 工作負載而設計,使晶片能夠以更快的速度和更高的精度處理複雜任務。

GP-XPU 架構的主要優勢:

  • 強化效率: 該架構最大限度地利用運算資源,從而縮短處理時間並提高整體效能。
  • 即時效能: 該晶片能夠處理即時數據處理,使其適用於需要立即回應的應用。
  • 成本效益: 該晶片的設計減少了對昂貴外部組件的需求,從而提供更經濟實惠的解決方案。
  • 安全性: 該架構包含安全功能,可防止未經授權的存取和數據洩露。

國產自主與完全可控

「星光智能五號」晶片基於國產製程技術,確保對其生產和使用的完全自主和控制。這對於戰略重要部門的應用尤其重要,在這些部門中,依賴外國技術可能會帶來風險。透過使用國產組件和製造流程,中星微旨在減少對外部供應商的依賴,並加強中國在全球 AI 領域的地位。

在關鍵領域的應用:

  • 國家戰略重要性: 該晶片可以部署在關鍵基礎設施和國防系統中,提供安全可靠的 AI 處理解決方案。
  • 城市感知: 該晶片可用於智慧城市計畫,分析來自感測器和攝影機的數據,從而實現對城市環境的即時監控和管理。
  • 智能製造: 該晶片可以提高製造流程的自動化程度和效率,從而提高產品質量並降低成本。
  • 智慧農業: 該晶片可用於分析來自農業感測器和無人機的數據,從而優化作物產量和資源利用率。
  • 智能交通: 該晶片可以為先進駕駛輔助系統 (ADAS) 和自動駕駛汽車提供動力,從而提高道路安全性和效率。

打破邊緣運算障礙

「星光智能五號」晶片旨在克服邊緣運算的限制,使 AI 處理可以直接在設備上執行,而無需依賴基於雲端的資源。這是透過晶片的先進架構及其在單個晶片上運行大型 AI 模型的能力來實現的。

GP-XPU 架構組件:

  • RISC-V CPU: 高效能 RISC-V CPU 提供處理各種任務所需的通用處理能力。
  • GP-GPU: 通用 GPU 加速 AI 工作負載,從而更快地處理複雜演算法。
  • NPU: 神經處理單元 (NPU) 專為 AI 推論而設計,可優化神經網路的效能。
  • ISP: 圖像訊號處理器 (ISP) 可提高攝影機捕獲圖像的質量,從而提高視覺 AI 應用的準確性。
  • VPU: 視頻處理單元 (VPU) 加速視頻編碼和解碼,從而實現高效的視頻流傳輸和分析。
  • ECU: 加密/解密單元 (ECU) 為敏感數據提供基於硬體的安全性。

異構運算池 (HCP)

該晶片採用專用的異構運算池 (HCP) 任務調度單元和安全的記憶體管理系統,以實現各種異構核心之間運算和儲存資源的即時調度和動態共享。這顯著提高了運算效率和數據吞吐量,使晶片能夠在單個晶片上部署和運行 DeepSeek 1.5B、7B、8B 和 16B 通用大型模型和視覺大型模型。

邊緣運算能力:

  • 即時視頻分析: 該晶片可以執行視頻流中物件的即時檢測、識別和追蹤。
  • 自然語言處理: 該晶片可以處理自然語言輸入,從而實現聊天機器人和語音助理等應用。
  • 任務規劃: 該晶片可以規劃和執行複雜任務,使其適用於機器人和自動化應用。
  • 知識管理: 該晶片可以儲存和檢索知識庫中的資訊,從而實現智能決策。
  • 自動控制: 該晶片可以控制執行器和其他設備,從而實現閉環控制系統。

透過結合部署八個「星光智能五號」晶片,可以支援運行「全血」671B 參數 DeepSeek 大型模型和視覺大型模型,從而完全打破邊緣運算能力的瓶頸。

多功能 AI 晶片

「星光智能五號」晶片是一款多功能的 AI 晶片,在各種應用中表現出色。其主要優勢包括高效能、低功耗、低成本、小尺寸、強安全性和高適應性。

詳細的主要優勢:

  • 高效能: 該晶片採用運算符級 MoE 架構和 HCP 即時調度機制,將運算效率提高約 40%,數據吞吐量提高約 50%。
  • 低功耗: 該晶片的異構運算資源按需分配,從而將功耗降低至少 30%。
  • 低成本: 該晶片的「端-邊閉環架構」減少了對雲端資源的依賴,從而使綜合部署成本約為相同效能伺服器架構的 1/3。
  • 小尺寸: 嵌入該晶片的處理板僅需約名片大小的空間,即可滿足各種小型化智能設備的空間要求。
  • 強安全性: 該晶片使用記憶體分區安全隔離技術,支援高效能國產加密演算法運算,實現源級密碼保護,並具有原生數據安全功能。
  • 高適應性: 該晶片支援開放生態系統和主流 AI 框架,可無縫連接到數千個行業的各種應用場景。在工作環境適應性方面,「星光智能五號」晶片消除了基於雲端的大型運算設備對電腦室恆溫恆濕環境的依賴,並可以在各種生產和生活環境中完成高效能智能工作。

賦能「本地化智能代理」

「星光智能五號」晶片旨在賦能「本地化智能代理」,這些代理是可以在設備上獨立運作而無需依賴基於雲端資源的 AI 驅動系統。這種方法具有多項優勢,包括提高回應速度、降低成本和增強安全性。

本地化智能代理的優勢:

  • 提高回應速度: 透過在本地處理數據,晶片可以即時回應事件,而不會產生與基於雲端的處理相關的延遲。
  • 降低成本: 透過減少對雲端資源的依賴,晶片可以顯著降低 AI 部署的成本。
  • 增強安全性: 透過在本地處理數據,晶片可以保護敏感資訊免受未經授權的存取和數據洩露。

本地化智能代理的應用:

  • 智慧家居: 本地化智能代理可以控制智慧家居設備,例如燈、恆溫器和電器,從而提供更方便和高效的生活體驗。
  • 穿戴式設備: 本地化智能代理可以分析來自穿戴式感測器的數據,從而提供個人化的健康和健身建議。
  • 工業自動化: 本地化智能代理可以控制機器人和其他工業設備,從而提高製造環境中的效率和安全性。

重構 AI 部署範式

中星微的「星光智能五號」晶片有望透過實現更分散和本地化的方法來轉變 AI 部署範式。這將減少對基於雲端資源的依賴,並賦能更廣泛的應用。

新範式的關鍵優勢:

  • 降低延遲: 本地化處理消除了將數據傳輸到雲端的需求,從而降低了延遲並提高了回應速度。
  • 降低頻寬需求: 本地化處理減少了需要在網路上傳輸的數據量,從而降低了頻寬需求和成本。
  • 增強隱私: 本地化處理將敏感數據保存在設備上,從而保護其免受未經授權的存取和數據洩露。
  • 提高可靠性: 本地化處理使 AI 系統即使在網路連接中斷時也能繼續運行。

中星微技術 CEO 張韻東表示,「星光智能五號」將推動終端側和邊緣側的智能升級,大幅降低對雲端運算資源的依賴,節省系統建設成本,並探索一條符合中國國情的人工智慧技術路線。

傳統的依賴雲端的 AI 推理過程,往往面臨回應延遲大、成本高、網路環境受限等問題。該晶片透過本地化運算能力和內生安全機制,使大型模型推理可以直接在邊緣側閉環,不僅節省了雲端傳輸和儲存成本,還大大提高了回應速度,實現毫秒級回應,並透過源級密碼機制保護數據的整個生命週期。

這項技術突破為城市感知、智能製造和智能交通等場景提供了效率、能耗、成本、體積、安全性和適應性的全面優化,真正實現了數千個行業創造自主可控的智能終端。

張韻東表示:「針對中國傳統產業數位轉型的實際需求,中星微正在開發面向終端、邊緣和雲端的分布式人工智慧運算技術。在不依賴最先進半導體製程技術的情況下,我們堅持原創創新和自主可控,探索一條符合中國國情的人工智慧技術路線。」