획기적인 아키텍처와 향상된 성능
Zhongxing Microelectronics(Vimicro)는 최근 ‘Starlight Intelligence No. 5’라는 최신 AI 칩을 공개하며 인공지능 분야에서 괄목할 만한 발전을 이루었습니다. 이 획기적인 칩은 4월 30일 푸저우에서 열린 제8회 디지털 중국 건설 서밋에서 공개되었습니다. 이 칩의 가장 큰 특징은 외부 처리 능력에 의존하지 않고 DeepSeek의 7B, 8B, 16B 대형 모델을 독립적으로 실행할 수 있다는 점입니다. 이는 범용 언어 모델과 시각적 대형 모델을 단일 칩에서 동시에 작동할 수 있는 최초의 완전 자율 제어형 임베디드 AI 칩입니다.
‘Starlight Intelligence No. 5’ 칩은 Zhongxing Micro의 독점적인 범용 멀티코어 이기종 GP-XPU 아키텍처를 통합하고 있습니다. 이 혁신적인 아키텍처는 운영 효율성, 실시간 성능, 비용 효율성 및 보안 측면에서 기존 CPU+GPU 아키텍처보다 상당한 개선을 제공합니다. GP-XPU 아키텍처는 AI 워크로드를 최적화하도록 특별히 설계되어 칩이 복잡한 작업을 더 빠른 속도와 정확성으로 처리할 수 있도록 합니다.
GP-XPU 아키텍처의 주요 장점:
- 향상된 효율성: 이 아키텍처는 컴퓨팅 자원의 활용을 극대화하여 처리 시간을 단축하고 전반적인 성능을 향상시킵니다.
- 실시간 성능: 이 칩은 실시간 데이터 처리가 가능하여 즉각적인 응답이 필요한 애플리케이션에 적합합니다.
- 비용 효율성: 칩 설계는 고가의 외부 구성 요소에 대한 필요성을 줄여 보다 경제적인 솔루션을 제공합니다.
- 보안: 이 아키텍처는 무단 액세스 및 데이터 침해로부터 보호하는 보안 기능을 통합하고 있습니다.
국내 생산 및 완전 제어 가능
‘Starlight Intelligence No. 5’ 칩은 국내에서 생산된 공정 기술을 기반으로 하여 생산 및 사용에 대한 완전한 자율성과 제어를 보장합니다. 이는 외국 기술에 대한 의존이 위험을 초래할 수 있는 전략적으로 중요한 분야의 애플리케이션에 특히 중요합니다. Zhongxing Micro는 국내에서 조달한 구성 요소와 제조 공정을 활용함으로써 외부 공급업체에 대한 의존도를 줄이고 글로벌 AI 환경에서 중국의 입지를 강화하는 것을 목표로 합니다.
주요 부문에서의 응용:
- 국가 전략적 중요성: 이 칩은 중요 인프라 및 방어 시스템에 배포되어 안전하고 안정적인 AI 처리 솔루션을 제공할 수 있습니다.
- 도시 인지: 이 칩은 스마트 시티 이니셔티브에서 센서 및 카메라의 데이터를 분석하여 도시 환경의 실시간 모니터링 및 관리를 가능하게 하는 데 사용될 수 있습니다.
- 지능형 제조: 이 칩은 제조 공정에서 자동화와 효율성을 향상시켜 제품 품질을 개선하고 비용을 절감할 수 있습니다.
- 스마트 농업: 이 칩은 농업 센서 및 드론의 데이터를 분석하여 작물 수확량과 자원 활용을 최적화하는 데 사용될 수 있습니다.
- 지능형 교통: 이 칩은 첨단 운전자 지원 시스템(ADAS) 및 자율 주행 차량에 전력을 공급하여 도로 안전과 효율성을 향상시킬 수 있습니다.
엣지 컴퓨팅 장벽 허물기
‘Starlight Intelligence No. 5’ 칩은 엣지 컴퓨팅의 한계를 극복하도록 설계되어 클라우드 기반 리소스에 의존하지 않고도 장치에서 직접 AI 처리를 수행할 수 있습니다. 이는 칩의 고급 아키텍처와 단일 칩에서 대형 AI 모델을 실행할 수 있는 능력을 통해 달성됩니다.
GP-XPU 아키텍처 구성 요소:
- RISC-V CPU: 고성능 RISC-V CPU는 광범위한 작업을 처리하는 데 필요한 범용 처리 능력을 제공합니다.
- GP-GPU: 범용 GPU는 AI 워크로드를 가속화하여 복잡한 알고리즘의 더 빠른 처리를 가능하게 합니다.
- NPU: 신경 처리 장치(NPU)는 AI 추론을 위해 특별히 설계되어 신경망의 성능을 최적화합니다.
- ISP: 이미지 신호 프로세서(ISP)는 카메라로 캡처한 이미지의 품질을 향상시켜 시각적 AI 애플리케이션의 정확도를 향상시킵니다.
- VPU: 비디오 처리 장치(VPU)는 비디오 인코딩 및 디코딩을 가속화하여 효율적인 비디오 스트리밍 및 분석을 가능하게 합니다.
- ECU: 암호화/해독 장치(ECU)는 민감한 데이터에 대한 하드웨어 기반 보안을 제공합니다.
이기종 컴퓨팅 풀 (HCP)
이 칩은 전용 이기종 컴퓨팅 풀(HCP) 작업 스케줄링 장치와 안전한 메모리 관리 시스템을 사용하여 다양한 이기종 코어 간의 컴퓨팅 및 스토리지 리소스의 실시간 스케줄링과 동적 공유를 가능하게 합니다. 이를 통해 컴퓨팅 효율성과 데이터 처리량이 크게 향상되어 칩이 단일 칩에서 DeepSeek 1.5B, 7B, 8B 및 16B 범용 대형 모델과 시각적 대형 모델을 배포하고 실행할 수 있습니다.
엣지 컴퓨팅 기능:
- 실시간 비디오 분석: 이 칩은 비디오 스트림에서 객체의 실시간 감지, 인식 및 추적을 수행할 수 있습니다.
- 자연어 처리: 이 칩은 자연어 입력을 처리하여 챗봇 및 음성 비서와 같은 애플리케이션을 가능하게 합니다.
- 작업 계획: 이 칩은 복잡한 작업을 계획하고 실행할 수 있어 로봇 공학 및 자동화 애플리케이션에 적합합니다.
- 지식 관리: 이 칩은 지식 기반에서 정보를 저장하고 검색하여 지능적인 의사 결정을 가능하게 합니다.
- 자동 제어: 이 칩은 액추에이터 및 기타 장치를 제어하여 폐쇄 루프 제어 시스템을 가능하게 합니다.
여덟 개의 ‘Starlight Intelligence No. 5’ 칩을 함께 배포함으로써 ‘풀 블러드’ 671B 파라미터 DeepSeek 대형 모델과 시각적 대형 모델의 작동을 지원할 수 있어 엣지에서의 컴퓨팅 성능 병목 현상을 완전히 해소합니다.
다재다능한 AI 칩
‘Starlight Intelligence No. 5’ 칩은 다양한 애플리케이션에서 뛰어난 다재다능한 AI 칩입니다. 주요 장점으로는 높은 효율성, 낮은 에너지 소비, 저렴한 비용, 작은 크기, 강력한 보안 및 높은 적응성이 있습니다.
자세한 주요 장점:
- 높은 효율성: 이 칩은 연산자 수준의 MoE 아키텍처와 HCP 실시간 스케줄링 메커니즘을 활용하여 컴퓨팅 효율성을 약 40% 향상시키고 데이터 처리량을 약 50% 향상시킵니다.
- 낮은 에너지 소비: 칩의 이기종 컴퓨팅 리소스는 필요에 따라 할당되어 에너지 소비를 최소 30% 줄입니다.
- 저렴한 비용: 칩의 ‘엔드-엣지 폐쇄 루프 아키텍처’는 클라우드 리소스에 대한 의존도를 줄여 동일한 성능의 서버 아키텍처 비용의 약 1/3에 해당하는 포괄적인 배포 비용을 절감합니다.
- 작은 크기: 칩이 내장된 처리 보드는 명함 크기의 공간만 필요하므로 다양한 소형 지능형 장치의 공간 요구 사항을 충족할 수 있습니다.
- 강력한 보안: 이 칩은 메모리 파티션 보안 격리 기술을 사용하고 고성능 국내 암호화 알고리즘 계산을 지원하며 소스 수준의 암호 보호를 달성하고 고유한 데이터 보안 기능을 갖추고 있습니다.
- 높은 적응성: 이 칩은 개방형 생태계와 주류 AI 프레임워크를 지원하여 수천 개의 산업 분야에서 다양한 애플리케이션 시나리오에 원활하게 연결됩니다. 작업 환경 적응성 측면에서 ‘Starlight Intelligence No. 5’ 칩은 클라우드 기반 대형 컴퓨팅 장비의 컴퓨터 실의 일정한 온도 및 습도 환경에 대한 의존도를 없애고 다양한 생산 및 생활 환경에서 고성능 지능형 작업을 완료할 수 있습니다.
‘로컬화된 지능형 에이전트’ 지원
‘Starlight Intelligence No. 5’ 칩은 클라우드 기반 리소스에 의존하지 않고 장치에서 독립적으로 작동할 수 있는 AI 기반 시스템인 ‘로컬화된 지능형 에이전트’를 지원하도록 설계되었습니다. 이 접근 방식은 향상된 응답 시간, 비용 절감 및 강화된 보안을 포함한 여러 가지 장점을 제공합니다.
로컬화된 지능형 에이전트의 장점:
- 향상된 응답 시간: 칩은 데이터를 로컬에서 처리하여 클라우드 기반 처리와 관련된 지연 없이 실시간으로 이벤트에 응답할 수 있습니다.
- 비용 절감: 칩은 클라우드 리소스에 대한 의존도를 줄여 AI 배포 비용을 크게 낮출 수 있습니다.
- 강화된 보안: 칩은 데이터를 로컬에서 처리하여 무단 액세스 및 데이터 침해로부터 민감한 정보를 보호할 수 있습니다.
로컬화된 지능형 에이전트의 응용:
- 스마트 홈: 로컬화된 지능형 에이전트는 조명, 온도 조절 장치 및 가전 제품과 같은 스마트 홈 장치를 제어하여 보다 편리하고 효율적인 생활 경험을 제공할 수 있습니다.
- 웨어러블 장치: 로컬화된 지능형 에이전트는 웨어러블 센서의 데이터를 분석하여 개인화된 건강 및 피트니스 권장 사항을 제공할 수 있습니다.
- 산업 자동화: 로컬화된 지능형 에이전트는 로봇 및 기타 산업 장비를 제어하여 제조 환경에서 효율성과 안전성을 향상시킬 수 있습니다.
AI 배포 패러다임 재구성
Zhongxing Micro의 ‘Starlight Intelligence No. 5’ 칩은 보다 분산되고 로컬화된 접근 방식을 가능하게 함으로써 AI 배포 패러다임을 변화시킬 태세를 갖추고 있습니다. 이는 클라우드 기반 리소스에 대한 의존도를 줄이고 더 광범위한 응용 프로그램을 지원할 것입니다.
새로운 패러다임의 주요 이점:
- 지연 시간 감소: 로컬화된 처리는 데이터를 클라우드로 전송할 필요성을 없애 지연 시간을 줄이고 응답 시간을 향상시킵니다.
- 낮은 대역폭 요구 사항: 로컬화된 처리는 네트워크를 통해 전송해야 하는 데이터의 양을 줄여 대역폭 요구 사항과 비용을 낮춥니다.
- 향상된 개인 정보 보호: 로컬화된 처리는 민감한 데이터를 장치에 보관하여 무단 액세스 및 데이터 침해로부터 보호합니다.
- 향상된 안정성: 로컬화된 처리를 통해 네트워크 연결이 중단된 경우에도 AI 시스템이 계속 작동할 수 있습니다.
Zhongxing Micro Technology의 CEO인 Zhang Yundong에 따르면 ‘Starlight Intelligence No. 5’는 최종 측과 에지 측의 지능형 업그레이드를 촉진하고 클라우드 컴퓨팅 리소스에 대한 의존도를 크게 줄이며 시스템 구축 비용을 절감하고 중국의 국가 조건에 맞는 인공지능 기술 경로를 모색할 것입니다.
클라우드에 의존하는 기존의 AI 추론 프로세스는 종종 큰 응답 지연, 높은 비용 및 네트워크 환경에 대한 제한과 같은 문제에 직면합니다. 이 칩은 로컬화된 컴퓨팅 성능과 고유한 보안 메커니즘을 통해 대형 모델 추론이 에지 측에서 직접 폐쇄 루프될 수 있도록 하여 클라우드 전송 및 스토리지 비용을 절감할 뿐만 아니라 응답 속도를 크게 향상시켜 밀리초 수준의 응답을 달성하고 소스 수준의 암호 메커니즘으로 수명 주기 전반에 걸쳐 데이터를 보호합니다.
이러한 기술적 혁신은 도시 인지, 지능형 제조 및 지능형 교통과 같은 시나리오에 대한 효율성, 에너지 소비, 비용, 볼륨, 보안 및 적응성을 포괄적으로 최적화하여 수천 개의 산업이 자율적이고 제어 가능한 지능형 터미널을 만들 수 있도록 진정으로 지원합니다.
Zhang Yundong은 ‘중국의 전통 산업의 디지털 전환의 실제 요구에 대응하여 Zhongxing Micro는 최종, 에지 및 클라우드를 위한 분산 인공 지능 컴퓨팅 기술을 개발하고 있습니다. 최첨단 반도체 공정 기술에 의존하지 않고 독창적인 혁신과 독립적인 제어를 고집하며 중국의 국가 조건에 맞는 인공 지능 기술 경로를 모색합니다.’라고 말했습니다.