Puce IA DeepSeek : Zhongxing Micro révolutionne l'IA

Zhongxing Microelectronics, également connue sous le nom de Vimicro, a récemment franchi une étape importante dans le domaine de l’intelligence artificielle en présentant sa dernière puce IA, la ‘Starlight Intelligence No. 5’. Cette puce de pointe a été dévoilée lors du 8e Sommet sur la construction de la Chine numérique à Fuzhou, le 30 avril. Ce qui distingue cette puce, c’est sa capacité à exécuter indépendamment les grands modèles 7B, 8B et 16B de DeepSeek, sans dépendre d’une puissance de traitement externe. Cela en fait la première puce IA embarquée entièrement autonome et contrôlable capable d’exploiter simultanément des modèles de langage à usage général et de grands modèles visuels sur une seule puce.

Architecture révolutionnaire et performances améliorées

La puce ‘Starlight Intelligence No. 5’ intègre l’architecture GP-XPU hétérogène multicœur à usage général, propriété de Zhongxing Micro. Cette architecture innovante offre des améliorations substantielles par rapport aux architectures CPU+GPU traditionnelles en termes d’efficacité opérationnelle, de performances en temps réel, de rentabilité et de sécurité. L’architecture GP-XPU est spécialement conçue pour optimiser les charges de travail de l’IA, permettant à la puce de gérer des tâches complexes avec une plus grande rapidité et précision.

Avantages clés de l’architecture GP-XPU :

  • Efficacité améliorée : L’architecture maximise l’utilisation des ressources informatiques, ce qui entraîne des temps de traitement plus rapides et une amélioration des performances globales.
  • Performances en temps réel : La puce est capable de gérer le traitement des données en temps réel, ce qui la rend adaptée aux applications qui nécessitent des réponses immédiates.
  • Rentabilité : La conception de la puce réduit le besoin de composants externes coûteux, ce qui se traduit par une solution plus abordable.
  • Sécurité : L’architecture intègre des fonctions de sécurité qui protègent contre les accès non autorisés et les violations de données.

Produite localement et entièrement contrôlable

La puce ‘Starlight Intelligence No. 5’ est basée sur une technologie de processus produite localement, garantissant une autonomie et un contrôle complets sur sa production et son utilisation. Ceci est particulièrement important pour les applications dans les secteurs d’importance stratégique où la dépendance à la technologie étrangère pourrait poser des risques. En utilisant des composants et des processus de fabrication d’origine nationale, Zhongxing Micro vise à réduire la dépendance à l’égard des fournisseurs externes et à renforcer la position de la Chine dans le paysage mondial de l’IA.

Applications dans les secteurs clés :

  • Importance stratégique nationale : La puce peut être déployée dans les infrastructures critiques et les systèmes de défense, fournissant une solution de traitement de l’IA sécurisée et fiable.
  • Perception urbaine : La puce peut être utilisée dans les initiatives de villes intelligentes pour analyser les données des capteurs et des caméras, permettant une surveillance et une gestion en temps réel des environnements urbains.
  • Fabrication intelligente : La puce peut améliorer l’automatisation et l’efficacité des processus de fabrication, améliorant la qualité des produits et réduisant les coûts.
  • Agriculture intelligente : La puce peut être utilisée pour analyser les données des capteurs agricoles et des drones, optimisant les rendements des cultures et l’utilisation des ressources.
  • Transport intelligent : La puce peut alimenter des systèmes avancés d’aide à la conduite (ADAS) et des véhicules autonomes, améliorant ainsi la sécurité et l’efficacité sur les routes.

Briser la barrière du Edge Computing

La puce ‘Starlight Intelligence No. 5’ est conçue pour surmonter les limitations du edge computing, permettant le traitement de l’IA directement sur les appareils sans dépendre des ressources basées sur le cloud. Ceci est réalisé grâce à l’architecture avancée de la puce et à sa capacité à exécuter de grands modèles d’IA sur une seule puce.

Composants de l’architecture GP-XPU :

  • CPU RISC-V : Un CPU RISC-V haute performance fournit la puissance de traitement à usage général nécessaire pour gérer un large éventail de tâches.
  • GP-GPU : Un GPU à usage général accélère les charges de travail de l’IA, permettant un traitement plus rapide des algorithmes complexes.
  • NPU : Une unité de traitement neuronal (NPU) est spécialement conçue pour l’inférence de l’IA, optimisant les performances des réseaux neuronaux.
  • ISP : Un processeur de signal d’image (ISP) améliore la qualité des images capturées par les caméras, améliorant ainsi la précision des applications d’IA visuelle.
  • VPU : Une unité de traitement vidéo (VPU) accélère l’encodage et le décodage vidéo, permettant une diffusion et une analyse vidéo efficaces.
  • ECU : Une unité de cryptage/décryptage (ECU) fournit une sécurité matérielle pour les données sensibles.

Pool de calcul hétérogène (HCP)

La puce utilise une unité de planification des tâches de pool de calcul hétérogène (HCP) dédiée et un système de gestion de la mémoire sécurisé pour permettre la planification en temps réel et le partage dynamique des ressources informatiques et de stockage entre les différents cœurs hétérogènes. Cela améliore considérablement l’efficacité du calcul et le débit des données, permettant à la puce de déployer et d’exécuter les modèles DeepSeek 1.5B, 7B, 8B et 16B à usage général et les grands modèles visuels sur une seule puce.

Capacités du Edge Computing :

  • Analyse vidéo en temps réel : La puce peut effectuer une détection, une reconnaissance et un suivi en temps réel des objets dans les flux vidéo.
  • Traitement du langage naturel : La puce peut traiter les entrées en langage naturel, permettant des applications telles que les chatbots et les assistants vocaux.
  • Planification des tâches : La puce peut planifier et exécuter des tâches complexes, ce qui la rend adaptée aux applications de robotique et d’automatisation.
  • Gestion des connaissances : La puce peut stocker et récupérer des informations à partir de bases de connaissances, permettant une prise de décision intelligente.
  • Contrôle automatique : La puce peut contrôler les actionneurs et autres appareils, permettant des systèmes de contrôle en boucle fermée.

En déployant huit puces ‘Starlight Intelligence No. 5’ conjointement, il est possible de prendre en charge le fonctionnement des grands modèles DeepSeek à 671B paramètres ‘full-blood’ et des grands modèles visuels, brisant complètement le goulot d’étranglement de la puissance de calcul à la périphérie.

Une puce IA polyvalente

La puce ‘Starlight Intelligence No. 5’ est une puce IA polyvalente qui excelle dans une variété d’applications. Ses principaux avantages incluent une efficacité élevée, une faible consommation d’énergie, un faible coût, une petite taille, une forte sécurité et une grande adaptabilité.

Principaux avantages en détail :

  • Efficacité élevée : La puce utilise une architecture MoE au niveau de l’opérateur et un mécanisme de planification en temps réel HCP pour améliorer l’efficacité du calcul d’environ 40 % et le débit des données d’environ 50 %.
  • Faible consommation d’énergie : Les ressources informatiques hétérogènes de la puce sont allouées à la demande, réduisant la consommation d’énergie d’au moins 30 %.
  • Faible coût : L’’architecture en boucle fermée extrémité-périphérie’ de la puce réduit la dépendance aux ressources cloud, ce qui se traduit par un coût de déploiement global qui représente environ 1/3 de celui d’une architecture de serveur avec les mêmes performances.
  • Petite taille : La carte de traitement intégrée à la puce ne nécessite qu’un espace d’environ la taille d’une carte de visite, ce qui peut répondre aux exigences d’espace de divers appareils intelligents miniaturisés.
  • Forte sécurité : La puce utilise la technologie d’isolation de sécurité des partitions de mémoire, prend en charge les calculs d’algorithme de cryptage national haute performance, réalise une protection par mot de passe au niveau de la source et possède des fonctionnalités de sécurité des données natives.
  • Haute adaptabilité : La puce prend en charge les écosystèmes ouverts et les principaux frameworks d’IA, se connectant de manière transparente à divers scénarios d’application dans des milliers de secteurs. En termes d’adaptabilité à l’environnement de travail, la puce ‘Starlight Intelligence No. 5’ élimine la dépendance des équipements informatiques à grande échelle basés sur le cloud à l’égard de l’environnement à température et humidité constantes de la salle informatique, et peut effectuer un travail intelligent de haute performance dans divers environnements de production et de vie.

Autonomiser les ‘agents intelligents localisés’

La puce ‘Starlight Intelligence No. 5’ est conçue pour autonomiser les ‘agents intelligents localisés’, qui sont des systèmes alimentés par l’IA qui peuvent fonctionner indépendamment sur les appareils sans dépendre des ressources basées sur le cloud. Cette approche offre plusieurs avantages, notamment des temps de réponse améliorés, des coûts réduits et une sécurité renforcée.

Avantages des agents intelligents localisés :

  • Temps de réponse améliorés : En traitant les données localement, la puce peut répondre aux événements en temps réel, sans le délai associé au traitement basé sur le cloud.
  • Coûts réduits : En réduisant la dépendance aux ressources cloud, la puce peut réduire considérablement le coût des déploiements d’IA.
  • Sécurité renforcée : En traitant les données localement, la puce peut protéger les informations sensibles contre les accès non autorisés et les violations de données.

Applications des agents intelligents localisés :

  • Maisons intelligentes : Les agents intelligents localisés peuvent contrôler les appareils de maison intelligente, tels que les lumières, les thermostats et les appareils électroménagers, offrant une expérience de vie plus pratique et efficace.
  • Appareils portables : Les agents intelligents localisés peuvent analyser les données des capteurs portables, fournissant des recommandations personnalisées en matière de santé et de forme physique.
  • Automatisation industrielle : Les agents intelligents localisés peuvent contrôler les robots et autres équipements industriels, améliorant ainsi l’efficacité et la sécurité dans les environnements de fabrication.

Reconstruire le paradigme du déploiement de l’IA

La puce ‘Starlight Intelligence No. 5’ de Zhongxing Micro est sur le point de transformer le paradigme du déploiement de l’IA en permettant une approche plus distribuée et localisée. Cela réduira la dépendance aux ressources basées sur le cloud et permettra à un plus large éventail d’applications.

Principaux avantages du nouveau paradigme :

  • Latence réduite : Le traitement localisé élimine le besoin de transmettre des données au cloud, réduisant ainsi la latence et améliorant les temps de réponse.
  • Besoins en bande passante inférieurs : Le traitement localisé réduit la quantité de données qui doivent être transmises sur le réseau, ce qui réduit les besoins en bande passante et les coûts.
  • Confidentialité renforcée : Le traitement localisé conserve les données sensibles sur l’appareil, les protégeant ainsi contre les accès non autorisés et les violations de données.
  • Fiabilité améliorée : Le traitement localisé permet aux systèmes d’IA de continuer à fonctionner même lorsque la connexion réseau est interrompue.

Selon Zhang Yundong, PDG de Zhongxing Micro Technology, la ‘Starlight Intelligence No. 5’ favorisera la mise à niveau intelligente du côté terminal et du côté périphérique, réduira considérablement la dépendance aux ressources informatiques cloud, réduira les coûts de construction du système et explorera une voie technologique d’intelligence artificielle conforme aux conditions nationales de la Chine.

Le processus de raisonnement d’IA traditionnel qui repose sur le cloud est souvent confronté à des problèmes tels que des délais de réponse importants, des coûts élevés et des restrictions sur l’environnement réseau. La puce permet au raisonnement de grands modèles d’être directement en boucle fermée du côté périphérique grâce à une puissance de calcul localisée et à des mécanismes de sécurité endogènes, ce qui permet non seulement d’économiser les coûts de transmission et de stockage dans le cloud, mais aussi d’améliorer considérablement la vitesse de réponse, d’atteindre une réponse de niveau milliseconde et de protéger les données tout au long de leur cycle de vie grâce à un mécanisme de mot de passe au niveau de la source.

Cette percée technologique offre une optimisation complète de l’efficacité, de la consommation d’énergie, du coût, du volume, de la sécurité et de l’adaptabilité pour des scénarios tels que la perception urbaine, la fabrication intelligente et le transport intelligent, permettant véritablement à des milliers de secteurs de créer des terminaux intelligents autonomes et contrôlables.

Zhang Yundong a déclaré : ‘En réponse aux besoins réels de la transformation numérique dans les industries traditionnelles chinoises, Zhongxing Micro développe une technologie de calcul d’intelligence artificielle distribuée pour l’extrémité, la périphérie et le cloud. Sans dépendre de la technologie de processus semi-conducteur la plus avancée, nous insistons sur l’innovation originale et le contrôle indépendant, et explorons une voie technologique d’intelligence artificielle conforme aux conditions nationales de la Chine.’