中星微发布AI芯片:单芯片运行DeepSeek大模型

中星微电子(Vimicro)近期在人工智能领域取得了重大进展,推出了其最新的AI芯片——‘星光智能5号’。这款尖端芯片于4月30日在福州举行的第八届数字中国建设峰会上发布。这款芯片的独特之处在于,它能够独立运行DeepSeek的7B、8B和16B大型模型,而无需依赖外部处理能力。这使其成为首款完全自主可控的嵌入式AI芯片,能够同时在单个芯片上运行通用语言模型和视觉大型模型。

突破性的架构和增强的性能

‘星光智能5号’芯片采用了中星微自主研发的通用多核异构GP-XPU架构。这种创新架构在运算效率、实时性能、成本效益和安全性方面,相比传统的CPU+GPU架构有了显著的提升。GP-XPU架构专为优化AI工作负载而设计,使芯片能够以更快的速度和更高的精度处理复杂的任务。

GP-XPU架构的关键优势:

  • 增强的效率: 该架构最大限度地利用了计算资源,从而加快了处理速度并提高了整体性能。
  • 实时性能: 该芯片能够处理实时数据处理,使其适用于需要立即响应的应用程序。
  • 成本效益: 该芯片的设计减少了对昂贵的外部组件的需求,从而提供了一种更经济实惠的解决方案。
  • 安全性: 该架构集成了安全功能,可防止未经授权的访问和数据泄露。

国内生产且完全可控

‘星光智能5号’芯片基于国内生产的工艺技术,确保了对其生产和使用的完全自主性和控制权。这对于战略重要部门的应用尤为重要,在这些部门,依赖外国技术可能会带来风险。通过利用国内采购的组件和制造工艺,中星微旨在减少对外部供应商的依赖,并加强中国在全球AI领域的地位。

在关键领域的应用:

  • 国家战略重要性: 该芯片可以部署在关键基础设施和国防系统中,提供安全可靠的AI处理解决方案。
  • 城市感知: 该芯片可用于智慧城市计划,分析来自传感器和摄像头的数据,从而实现对城市环境的实时监控和管理。
  • 智能制造: 该芯片可以提高制造过程中的自动化程度和效率,从而提高产品质量并降低成本。
  • 智慧农业: 该芯片可用于分析来自农业传感器和无人机的数据,从而优化作物产量和资源利用率。
  • 智能交通: 该芯片可以为高级驾驶辅助系统(ADAS)和自动驾驶汽车提供动力,从而提高道路安全性和效率。

打破边缘计算壁垒

‘星光智能5号’芯片旨在克服边缘计算的局限性,使AI处理能够直接在设备上执行,而无需依赖基于云的资源。这可以通过芯片的先进架构及其在单个芯片上运行大型AI模型的能力来实现。

GP-XPU架构组件:

  • RISC-V CPU: 高性能RISC-V CPU提供处理各种任务所需的通用处理能力。
  • GP-GPU: 通用GPU加速AI工作负载,从而更快地处理复杂算法。
  • NPU: 神经处理单元(NPU)专为AI推理而设计,可优化神经网络的性能。
  • ISP: 图像信号处理器(ISP)增强了摄像头捕获的图像质量,从而提高了视觉AI应用程序的准确性。
  • VPU: 视频处理单元(VPU)加速了视频编码和解码,从而实现了高效的视频流和分析。
  • ECU: 加密/解密单元(ECU)为敏感数据提供基于硬件的安全性。

异构计算池(HCP)

该芯片利用专用的异构计算池(HCP)任务调度单元和安全的内存管理系统,从而能够在各种异构内核之间实时调度和动态共享计算和存储资源。这显着提高了计算效率和数据吞吐量,使芯片能够在单个芯片上部署和运行DeepSeek 1.5B、7B、8B和16B通用大型模型和视觉大型模型。

边缘计算能力:

  • 实时视频分析: 该芯片可以对视频流中的对象执行实时检测、识别和跟踪。
  • 自然语言处理: 该芯片可以处理自然语言输入,从而实现聊天机器人和语音助手等应用程序。
  • 任务规划: 该芯片可以规划和执行复杂的任务,使其适用于机器人技术和自动化应用程序。
  • 知识管理: 该芯片可以存储和检索来自知识库的信息,从而实现智能决策。
  • 自动控制: 该芯片可以控制执行器和其他设备,从而实现闭环控制系统。

通过结合部署八个’星光智能5号’芯片,可以支持’完整血统’的671B参数DeepSeek大型模型和视觉大型模型的运行,从而完全打破边缘计算能力的瓶颈。

一款多功能的AI芯片

‘星光智能5号’芯片是一款多功能的AI芯片,在各种应用中表现出色。它的主要优点包括高效、低能耗、低成本、小尺寸、强大的安全性和高适应性。

详细的关键优势:

  • 高效率: 该芯片利用操作符级别的MoE架构和HCP实时调度机制,将计算效率提高了约40%,数据吞吐量提高了约50%。
  • 低能耗: 该芯片的异构计算资源按需分配,从而将能耗降低至少30%。
  • 低成本: 该芯片的’端-边缘闭环架构’减少了对云资源的依赖,从而使综合部署成本约为具有相同性能的服务器架构的1/3。
  • 小尺寸: 嵌入该芯片的处理板仅需大约名片大小的空间,即可满足各种小型化智能设备的空间要求。
  • 强大的安全性: 该芯片使用内存分区安全隔离技术,支持高性能国内加密算法计算,实现源代码级别的密码保护,并具有原生数据安全功能。
  • 高适应性: 该芯片支持开放生态系统和主流AI框架,无缝连接到数千个行业的各种应用场景。在工作环境适应性方面,’星光智能5号’芯片消除了基于云的大型计算设备对计算机房恒温恒湿环境的依赖,可以在各种生产和生活环境中完成高性能智能工作。

赋能’本地化智能体’

‘星光智能5号’芯片旨在赋能’本地化智能体’,这些智能体是可以独立在设备上运行而无需依赖基于云的资源的AI驱动系统。这种方法具有多个优点,包括改进的响应时间、降低的成本和增强的安全性。

本地化智能体的优势:

  • 改进的响应时间: 通过在本地处理数据,该芯片可以实时响应事件,而不会出现与基于云的处理相关的延迟。
  • 降低的成本: 通过减少对云资源的依赖,该芯片可以显着降低AI部署的成本。
  • 增强的安全性: 通过在本地处理数据,该芯片可以保护敏感信息免受未经授权的访问和数据泄露。

本地化智能体的应用:

  • 智能家居: 本地化智能体可以控制智能家居设备,例如灯、恒温器和电器,从而提供更便捷和高效的生活体验。
  • 可穿戴设备: 本地化智能体可以分析来自可穿戴传感器的数据,从而提供个性化的健康和健身建议。
  • 工业自动化: 本地化智能体可以控制机器人和其他工业设备,从而提高制造环境中的效率和安全性。

重构AI部署范式

中星微的’星光智能5号’芯片有望通过实现更分散和本地化的方法来改变AI部署范式。这将减少对基于云的资源的依赖,并赋能更广泛的应用。

新范式的关键优势:

  • 降低的延迟: 本地化处理消除了将数据传输到云的需求,从而降低了延迟并提高了响应时间。
  • 更低的带宽要求: 本地化处理减少了需要通过网络传输的数据量,从而降低了带宽要求和成本。
  • 增强的隐私: 本地化处理将敏感数据保存在设备上,从而保护其免受未经授权的访问和数据泄露。
  • 提高的可靠性: 本地化处理使AI系统即使在网络连接中断时也能继续运行。

中星微技术CEO张韵东表示,’星光智能5号’将推动终端侧和边缘侧的智能化升级,大幅降低对云计算资源的依赖,节省系统建设成本,探索一条符合中国国情的人工智能技术路线。

传统的依赖于云的AI推理过程常常面临响应延迟大、成本高、网络环境限制等问题。该芯片通过本地化算力和内生安全机制,使大型模型推理直接在边缘侧闭环,不仅节省了云传输和存储成本,还大大提高了响应速度,实现毫秒级响应,并采用源级别密码机制保护数据的整个生命周期。

这项技术突破为城市感知、智能制造、智能交通等场景提供了效率、能耗、成本、体积、安全性和适应性的全面优化,真正赋能千行百业打造自主可控的智能终端。

张韵东表示:’针对中国传统行业数字化转型的实际需求,中星微正在为端、边、云开发分布式人工智能计算技术。在不依赖最先进的半导体工艺技术的情况下,我们坚持原始创新和自主可控,探索一条符合中国国情的人工智能技术路线。’