Triomphe Open Source : RISC-V et IA

L’Ascension de RISC-V en tant qu’Architecture Informatique Native pour l’IA

La récente popularité explosive de DeepSeek a envoyé des ondes de choc à travers l’industrie de l’IA, et son impact s’étend au-delà du simple domaine de l’intelligence artificielle. L’industrie des semi-conducteurs, en particulier, a pris note. Pendant le Nouvel An chinois, l’Académie DAMO Xuantie d’Alibaba a annoncé son adaptation du modèle de distillation de la série DeepSeek-R1, démontrant la forte dynamique de l’architecture de jeu d’instructions open-source émergente, RISC-V, dans le domaine de l’IA.

Lors de la récente conférence sur l’écosystème Xuantie RISC-V, des nouvelles passionnantes ont émergé : RISC-V a réalisé des percées à la fois dans le calcul haute performance et l’IA. Le Xuantie C930, le premier CPU de classe serveur de l’Académie DAMO, devrait commencer à être livré le mois prochain. Sa puissance de calcul IA considérablement améliorée accélère le déploiement d’un écosystème RISC-V complet ‘haute performance + IA’.

L’architecture informatique open-source RISC-V pourrait-elle être le partenaire idéal pour l’IA open-source ?

La Transformation des Modèles d’IA Alimente l’Innovation dans l’Architecture Informatique

Un expert chevronné de l’industrie des puces a expliqué que l’impact de DeepSeek se fait sentir non seulement dans les cercles de l’IA, mais aussi profondément dans l’industrie des puces. DeepSeek, grâce à sa conception hautement optimisée, a considérablement réduit les coûts de formation et d’inférence des grands modèles de langage. Ce changement a radicalement modifié l’équilibre existant entre la puissance de calcul, la mémoire et l’interconnexion, créant des opportunités significatives pour des percées dans l’architecture informatique.

Traditionnellement, les grands modèles d’IA, en raison de leurs besoins intensifs en calcul et en mémoire, étaient mieux adaptés au déploiement dans le cloud plutôt que sur des appareils périphériques. Cependant, l’arrivée de DeepSeek a remis en question cette dépendance à une puissance de calcul élevée. En réduisant à la fois les coûts de formation et d’inférence, il ouvre la voie à la transition des grands modèles du cloud vers la périphérie.

Plus précisément, les exigences de calcul réduites de DeepSeek rendent le déploiement sur une seule machine possible, améliorant sa compatibilité avec les appareils périphériques et finaux. Alors que l’IA cherche à pénétrer diverses industries et scénarios, la nécessité de passer du cloud à la périphérie devient de plus en plus critique. Ce changement est nécessaire pour répondre à divers besoins tels que la sécurité des données, la personnalisation et le déploiement privé.

Il est prévisible qu’avec l’adoption généralisée de la technologie DeepSeek, le paysage des puces IA subira une transformation. Des puces IA, qui reposaient sur une infrastructure cloud pour le calcul parallèle à grande échelle, évoluent vers des conceptions diversifiées, efficaces et à faible consommation d’énergie, capables de fonctionner indépendamment sur des appareils périphériques.

Cela a incité de nombreux acteurs de l’industrie à se demander : quelle architecture informatique est la mieux adaptée à l’IA ?

Les GPU, avec leurs capacités de traitement parallèle, ne sont peut-être pas la seule solution. Le calcul séquentiel (calcul à usage général) émerge également comme une base viable pour le calcul de l’IA. L’expérience de l’industrie démontre que DeepSeek présente une bonne compatibilité avec divers systèmes informatiques. Sa capacité à être rapidement déployé et à effectuer une inférence efficace sur les CPU a ramené les CPU sur le devant de la scène. Par rapport aux GPU spécialisés, les CPU offrent l’avantage de la polyvalence, une planification simplifiée, une réduction significative des besoins en puissance de calcul et les avantages du calcul homogène.

Parmi les CPU, l’étoile montante, RISC-V, attire une attention considérable.

Pendant le Nouvel An chinois, l’Académie DAMO a adapté le modèle de distillation de la série DeepSeek-R1 sur une puce alimentée par le processeur RISC-V Xuantie C920. L’ensemble du processus n’a pris qu’une heure, démontrant une expérience rapide et transparente. Cela signifie que les modèles de la série DeepSeek peuvent être déployés et exécutés en douceur sur toute la gamme des plateformes CPU Xuantie et d’autres appareils périphériques d’IA équipés de puces d’architecture RISC-V.

La proéminence de RISC-V découle de plusieurs facteurs. Premièrement, en tant qu’architecture de jeu d’instructions émergente, elle se distingue des modèles de licence fermés ou payants de x86 et ARM en adoptant une approche open-source. Cet esprit open-source s’aligne naturellement avec l’IA. Sa nature ouverte a attiré la participation de plus de 1 000 entreprises dans le monde, favorisant une croissance rapide de son écosystème, de la conception matérielle aux chaînes d’outils logiciels. Selon la RISC-V International Foundation, plus de 80 produits de puces RISC-V différents sont déjà entrés sur le marché.

Deuxièmement, RISC-V offre une flexibilité et une évolutivité remarquables. Il permet aux développeurs de personnaliser le jeu d’instructions en fonction de besoins spécifiques. La nature modulaire de son jeu d’instructions permet une personnalisation pour différents scénarios d’application, un niveau de flexibilité inégalé par les architectures traditionnelles.

Techniquement, RISC-V est également bien adapté aux nouveaux types de calcul de l’IA. Son extension vectorielle (V-extension) peut gérer efficacement les opérations parallèles à grande échelle, répondant aux exigences d’efficacité du calcul de l’IA. L’architecture ouverte de RISC-V peut fonctionner en synergie avec des modules d’accélération matérielle pour améliorer l’efficacité d’exécution des tâches d’IA. Grâce à une intégration profonde avec les algorithmes d’IA, l’architecture RISC-V peut être utilisée pour concevoir des unités d’accélération matérielle dédiées, optimisant les performances pour des modèles d’IA spécifiques.

Par conséquent, de nombreux experts chevronnés de l’industrie des puces prévoient que RISC-V deviendra l’architecture informatique native de l’ère de l’IA.

Lors de la troisième conférence sur l’écosystème Xuantie RISC-V organisée par l’Académie DAMO d’Alibaba, cette attente s’est enfin concrétisée.

Le Premier CPU de Classe Serveur de Xuantie Prêt à Être Livré : Une Fusion de Haute Performance et d’IA

Lors de la conférence, Ni Guangnan, académicien de l’Académie chinoise d’ingénierie, a déclaré : “L’open-source RISC-V n’est pas seulement une innovation technologique, mais aussi une transformation mondiale qui influencera l’avenir de l’architecture informatique.” En tant qu’architecture de jeu d’instructions de puce “née open-source”, RISC-V a démontré des performances remarquables dans ce cycle de l’industrie des semi-conducteurs. Il a accéléré sa progression des systèmes embarqués aux scénarios complexes tels que le calcul haute performance, offrant une nouvelle option pour la puissance de calcul de l’IA.

Parmi les 25 normes approuvées par la RISC-V International Foundation en 2024, plus de la moitié sont liées à la haute performance ou à l’IA. Lu Dai, président du conseil d’administration de la RISC-V International Foundation, a déclaré lors de la conférence que l’une des avancées les plus intéressantes dans le jeu d’instructions RISC-V est l’extension Matrix, qui propulsera RISC-V à devenir une force formidable dans le domaine de l’IA.

Il est prévu que d’ici 2030, la part de marché globale de RISC-V atteindra 20 %, sa part dans les accélérateurs d’IA pouvant dépasser 50 %.

Lors de la conférence, l’Académie DAMO a dévoilé son processeur phare de nouvelle génération, et le premier processeur de classe serveur, le C930.

Le C930 atteint un benchmark de puissance de calcul à usage général de 15/GHz dans le test de benchmark SPECint2006. Qu’est-ce que cela signifie ? L’académicien Ni Guangnan a souligné que pour que RISC-V entre véritablement sur le marché du calcul haute performance, il doit obtenir un score de haute performance supérieur à 15 dans le test logiciel SPECint 2006. Par conséquent, le C930 représente une étape importante pour RISC-V.

De plus, le C930 est équipé de deux moteurs : RVV1.0 512 bits et Matrix 8 TOPS. Cela intègre nativement la puissance de calcul haute performance à usage général avec la puissance de calcul de l’IA. Il fournit également une interface d’extension DSA ouverte pour prendre en charge davantage d’exigences de fonctionnalités.

Simultanément, l’Académie DAMO a divulgué ses plans de développement pour de nouveaux membres de la famille de processeurs Xuantie, notamment les C908X, R908A et XL200, continuant d’évoluer dans des directions telles que l’accélération de l’IA, les applications automobiles et l’interconnexion à haut débit. Plus précisément, le C908X est positionné comme le premier processeur IA dédié de Xuantie, prenant en charge une extension vectorielle RVV1.0 de 4096 bits de largeur de données ultra-longue. Le R908A est destiné aux exigences de haute fiabilité des puces de qualité automobile. Le XL200 fournira une interconnexion cohérente multi-cluster à plus grande échelle et plus performante.

Pour compléter les capacités des processeurs Xuantie, l’Académie DAMO a également lancé trois SDK Xuantie basés sur les trois systèmes d’exploitation grand public : Linux, Android et RTOS. Ces SDK intègrent de manière exhaustive les capacités logicielles accumulées par Xuantie au fil des ans, les fournissant à l’industrie de manière plus complète, pratique et stable. Parmi eux, le SDK Xuantie Linux offre un riche ensemble de sous-systèmes, notamment la virtualisation Hypervisor, le framework de sécurité CoVE, le framework Xuantie AI et les bibliothèques d’opérateurs haute performance, facilitant le développement de RISC-V dans les scénarios haute performance et IA.

Tout en développant des technologies matérielles et logicielles haute performance, Xuantie encourage également activement l’innovation collaborative entre les partenaires industriels en amont et en aval, accélérant le déploiement d’un écosystème RISC-V complet ‘haute performance + IA’.

Le Dévouement d’Alibaba : RISC-V Xuantie Mène la Communauté Internationale Open-Source

Pour ceux qui ne connaissent pas Xuantie, voici une brève introduction.

En 2018, Alibaba a créé la marque Xuantie, se concentrant sur la direction RISC-V. Un an plus tard, le premier processeur, le C910, est apparu comme le processeur RISC-V le plus puissant de l’époque. Depuis lors, Xuantie a été un leader dans l’écosystème international RISC-V et l’un des plus grands contributeurs chinois à la communauté internationale open-source. Il occupe actuellement des postes de président ou de vice-président au sein du comité technique de la fondation et de plus de 10 sous-comités techniques, promouvant activement la normalisation des technologies liées à l’IA.

Depuis 2019, Xuantie a lancé 13 processeurs RISC-V, couvrant divers scénarios tels que la haute performance, la haute efficacité énergétique et la faible consommation d’énergie. Ceux-ci inclus:

  • Série C (Computing) : Ciblant principalement les serveurs haut de gamme, le calcul périphérique haut de gamme et les IPC de qualité industrielle/grand public.
  • Série E (Embedded) : Principalement utilisé dans les MPU haut de gamme et divers MCU.
  • Série R (Reliability & Realtime) : Ciblant les SSD haut de gamme, les communications, le contrôle industriel haut de gamme, l’automobile et d’autres scénarios.
  • XT-Link : Un IP d’interconnexion multi-cluster CPU.

À ce jour, les expéditions de processeurs Xuantie ont dépassé 4 milliards d’unités, ce qui en fait l’une des séries de produits de processeurs les plus influentes et les plus leaders du marché dans le domaine national du RISC-V.

Tout au long de son développement, Xuantie a constamment repoussé les limites de performance de RISC-V, s’efforçant d’atteindre des performances toujours plus élevées. Simultanément, il a activement adopté l’IA, visant à établir RISC-V comme une architecture informatique native pour l’IA.

Au niveau de la technologie de l’architecture du jeu d’instructions, tirant parti de l’ouverture et de la flexibilité supérieures de l’architecture RISC-V, Xuantie a longtemps personnalisé les extensions de jeu d’instructions pour les applications d’IA. Son jeu d’instructions d’extension Matrix proposé et l’optimisation de l’opérateur de base GEMM pour les grands modèles peuvent accélérer l’inférence et la formation de l’IA, améliorant l’efficacité énergétique de l’IA sur les appareils périphériques.

En termes de processeurs, le Xuantie C907 a été le premier à implémenter l’extension Matrix, atteignant une accélération de 15x par rapport aux solutions traditionnelles. Le C920 mis à niveau prend en charge les technologies Vector 1.0 et Vector Crypto, améliorant les performances GEMM de plus de 7x et les performances de l’opérateur Transformer de plus de 17x. Le dernier processeur phare, le C930, est doté de deux moteurs vectoriels et matriciels, ce qui en fait un partenaire prometteur pour les grands modèles d’IA sur les appareils périphériques.

Au niveau de la pile logicielle, Xuantie a créé une plateforme logicielle et matérielle complète d’IA RISC-V de bout en bout. Cette plateforme fournit aux fabricants de puces une infrastructure de calcul d’IA polyvalente et efficace, formant une conception de pipeline orientée vers les besoins de l’entreprise, permettant véritablement une optimisation pratique et approfondie de la conception matérielle sous-jacente aux chaînes d’outils logiciels de la couche supérieure. Cette plateforme a été appliquée à des produits terminaux tels que des cartes de transcodage vidéo cloud, des boîtiers de calcul périphérique IA et des ordinateurs portables RISC-V.

En plus de sa propre technologie, l’équipe RISC-V de l’Académie DAMO a constamment engagé des partenaires industriels en amont et en aval pour améliorer l’écosystème ‘haute performance + IA’ de RISC-V.

Lors de la conférence de l’année dernière, l’ordinateur portable open-source RISC-V ‘Ruyi BOOK Jia Chen Edition’ a fait une apparition surprise, démontrant un fonctionnement stable et fluide des grands logiciels commerciaux. Cette année, l’Institut du logiciel de l’Académie chinoise des sciences a présenté en outre le ‘Ruyi BOOK Yi Si Edition’, des robots intelligents, des PC IA et d’autres applications RISC-V haute performance.

Parmi eux, le prototype de PC IA basé sur le C920 a exécuté avec succès des modèles open-source tels que Llama, Qwen et DeepSeek, prenant en charge des applications d’IA telles que les assistants personnels IA, la programmation IA et la reconnaissance visuelle. Cela démontre une ‘chaîne complète d’IA open-source’ complète, de l’architecture matérielle open-source aux systèmes d’exploitation open-source et aux modèles d’IA open-source, tout en réduisant la consommation d’énergie de calcul unitaire de 30 %.

De plus, Xuantie a collaboré avec des partenaires pour construire des solutions pratiques telles que des solutions de codec vidéo RISC-V et des solutions de bureau cloud. Pour prendre en charge les applications dans davantage d’industries, Xuantie a également déployé la puissance de calcul RISC-V dans les PC tout-en-un, l’IA de contrôle industriel, les robots et d’autres domaines.

L’académicien Ni Guangnan a déclaré que l’investissement pragmatique et l’innovation de Xuantie sont des moteurs cruciaux pour le développement sain de l’écosystème RISC-V.

L’Avenir de l’Open Source

Le succès de DeepSeek témoigne de la puissance de l’open source. L’architecture de jeu d’instructions open-source RISC-V, depuis sa création il y a plus de dix ans, a tracé une voie de développement différente du modèle x86 fermé et du modèle ARM sous licence. Il a présenté à l’industrie une opportunité d’innover dans les architectures de manière plus concise et ouverte, gagnant une reconnaissance croissante.

Il apparaît comme le meilleur candidat pour l’architecture native de l’ère de l’IA. D’une part, RISC-V, avec son engagement envers l’ouverture et l’évolution continue, peut suivre le rythme des changements rapides de l’IA. D’autre part, la forte extensibilité de RISC-V lui permet d’être compatible avec les écosystèmes architecturaux existants grâce au portage et à l’adaptation, tout en servant d’architecture native pour prendre en charge les scénarios émergents.

Comme l’a déclaré Guo Songliu, responsable de RISC-V à l’Institut du logiciel de l’Académie chinoise des sciences : “La pile logicielle de l’IA est encore en évolution rapide. En tant qu’architecture de jeu d’instructions la plus flexible et la plus ouverte des trois architectures grand public, RISC-V est sans aucun doute la plus adaptée au rythme de l’innovation technologique à l’ère de l’IA.”