El auge de RISC-V como arquitectura de computación nativa para IA
La reciente y explosiva popularidad de DeepSeek ha causado revuelo en toda la industria de la IA, y su impacto se extiende más allá del ámbito de la inteligencia artificial. La industria de los semiconductores, en particular, ha tomado nota. Durante el Año Nuevo Chino, la Academia DAMO de Alibaba, Xuantie, anunció su adaptación del modelo de destilación de la serie DeepSeek-R1, mostrando el fuerte impulso de la emergente arquitectura de conjunto de instrucciones de código abierto, RISC-V, en el dominio de la IA.
En la reciente Conferencia del Ecosistema Xuantie RISC-V, surgieron noticias emocionantes: RISC-V ha logrado avances tanto en computación de alto rendimiento como en IA. El Xuantie C930, la primera CPU de nivel de servidor de la Academia DAMO, comenzará a entregarse el próximo mes. Su potencia de computación de IA significativamente mejorada acelera la implementación de un ecosistema RISC-V integral de ‘alto rendimiento + IA’.
¿Podría la arquitectura de computación de código abierto RISC-V ser el socio ideal para la IA de código abierto?
La transformación del modelo de IA impulsa la innovación en la arquitectura de computación
Un experto experimentado en la industria de los chips explicó que el impacto de DeepSeek se siente no solo en los círculos de IA, sino también profundamente dentro de la industria de los chips. DeepSeek, a través de su diseño altamente optimizado, ha reducido drásticamente los costos de entrenamiento e inferencia de los modelos de lenguaje grandes. Este cambio ha alterado drásticamente el equilibrio existente de potencia de computación, memoria e interconexión, creando oportunidades significativas para avances en la arquitectura de computación.
Tradicionalmente, los modelos de IA grandes, debido a sus intensivos requisitos de computación y memoria, eran más adecuados para su implementación en la nube que en dispositivos perimetrales. Sin embargo, la llegada de DeepSeek ha desafiado esta dependencia de la alta potencia de computación. Al reducir los costos de entrenamiento e inferencia, está allanando el camino para que los modelos grandes pasen de la nube al borde.
Específicamente, las reducidas demandas computacionales de DeepSeek hacen que la implementación en una sola máquina sea factible, mejorando su compatibilidad con dispositivos perimetrales y finales. A medida que la IA busca penetrar en diversas industrias y escenarios, la necesidad de pasar de la nube al borde se vuelve cada vez más crítica. Este cambio es necesario para satisfacer diversas necesidades, como la seguridad de los datos, la personalización individual y la implementación privada.
Es previsible que, con la adopción generalizada de la tecnología DeepSeek, el panorama de los chips de IA experimente una transformación. Desde la computación paralela a gran escala que depende de la infraestructura de la nube, los chips de IA están evolucionando hacia diseños diversificados, eficientes y de bajo consumo capaces de operar de forma independiente en dispositivos perimetrales.
Esto ha llevado a muchos en la industria a reflexionar: ¿qué arquitectura de computación es la más adecuada para la IA?
Las GPU, con sus capacidades de procesamiento paralelo, pueden no ser la única solución. La computación en serie (computación de propósito general) también está emergiendo como una base viable para la computación de IA. La experiencia de la industria demuestra que DeepSeek exhibe una buena compatibilidad con varios sistemas informáticos. Su capacidad para implementarse rápidamente y realizar inferencias efectivas en CPU ha devuelto a las CPU al centro de atención. En comparación con las GPU especializadas, las CPU ofrecen la ventaja de la versatilidad, la programación simplificada, la reducción significativa de los requisitos de potencia de computación y los beneficios de la computación homogénea.
Entre las CPU, la estrella en ascenso, RISC-V, está atrayendo una atención significativa.
Durante el Año Nuevo Chino, la Academia DAMO adaptó el modelo de destilación de la serie DeepSeek-R1 en un chip impulsado por el procesador RISC-V Xuantie C920. Todo el proceso tomó solo una hora, demostrando una experiencia rápida y fluida. Esto significa que los modelos de la serie DeepSeek se pueden implementar y ejecutar sin problemas en toda la gama de plataformas de CPU Xuantie y otros dispositivos finales de IA equipados con chips de arquitectura RISC-V.
La prominencia de RISC-V se debe a varios factores. En primer lugar, como arquitectura de conjunto de instrucciones emergente, se distingue de los modelos de licencia cerrados o pagados de x86 y ARM al adoptar un enfoque de código abierto. Este espíritu de código abierto se alinea naturalmente con la IA. Su naturaleza abierta ha atraído la participación de más de 1,000 empresas en todo el mundo, fomentando un rápido crecimiento en su ecosistema, desde el diseño de hardware hasta las cadenas de herramientas de software. Según la Fundación Internacional RISC-V, más de 80 productos de chips RISC-V diferentes ya han entrado en el mercado.
En segundo lugar, RISC-V ofrece una flexibilidad y escalabilidad notables. Permite a los desarrolladores personalizar el conjunto de instrucciones de acuerdo con necesidades específicas. La naturaleza modular de su conjunto de instrucciones permite la personalización para diferentes escenarios de aplicación, un nivel de flexibilidad incomparable con las arquitecturas tradicionales.
Técnicamente, RISC-V también es adecuado para nuevos tipos de computación de IA. Su extensión vectorial (V-extension) puede manejar eficazmente operaciones paralelas a gran escala, satisfaciendo las demandas de eficiencia de la computación de IA. La arquitectura abierta de RISC-V puede funcionar en sinergia con módulos de aceleración de hardware para mejorar la eficiencia de ejecución de las tareas de IA. A través de una integración profunda con algoritmos de IA, la arquitectura RISC-V se puede utilizar para diseñar unidades de aceleración de hardware dedicadas, optimizando el rendimiento para modelos de IA específicos.
Por lo tanto, muchos expertos experimentados en la industria de los chips anticipan que RISC-V se convertirá en la arquitectura de computación nativa de la era de la IA.
En la tercera Conferencia del Ecosistema Xuantie RISC-V organizada por la Academia DAMO de Alibaba, esta expectativa finalmente se hizo realidad.
La primera CPU de nivel de servidor de Xuantie lista para su entrega: una fusión de alto rendimiento e IA
En la conferencia, Ni Guangnan, académico de la Academia China de Ingeniería, declaró: “RISC-V de código abierto no es solo una innovación tecnológica, sino también una transformación global que influirá en el futuro de la arquitectura de computación”. Como una arquitectura de conjunto de instrucciones de chip ‘nacida de código abierto’, RISC-V ha demostrado un rendimiento notable en este ciclo de la industria de semiconductores. Ha acelerado su progreso desde sistemas integrados hasta escenarios complejos como la computación de alto rendimiento, ofreciendo una nueva opción para la potencia de computación de IA.
Entre los 25 estándares aprobados por la Fundación Internacional RISC-V en 2024, más de la mitad están relacionados con el alto rendimiento o la IA. Lu Dai, presidente de la Junta Directiva de la Fundación Internacional RISC-V, declaró en la conferencia que uno de los avances más emocionantes en el conjunto de instrucciones RISC-V es la extensión Matrix, que impulsará a RISC-V a convertirse en una fuerza formidable en el campo de la IA.
Se predice que para 2030, la cuota de mercado general de RISC-V alcanzará el 20%, y su cuota en aceleradores de IA podría superar el 50%.
En la conferencia, la Academia DAMO presentó su procesador insignia de próxima generación, y el primer procesador de nivel de servidor, el C930.
El C930 alcanza un punto de referencia de potencia de computación de propósito general de 15/GHz en la prueba de referencia SPECint2006. ¿Qué significa esto? El académico Ni Guangnan señaló que para que RISC-V ingrese verdaderamente al mercado de la computación de alto rendimiento, debe lograr una puntuación de alto rendimiento superior a 15 en la prueba de software SPECint 2006. Por lo tanto, el C930 representa un paso histórico para RISC-V.
Además, el C930 está equipado con motores duales: RVV1.0 de 512 bits y Matrix de 8 TOPS. Esto integra la potencia de computación de alto rendimiento de propósito general con la potencia de computación de IA de forma nativa. También proporciona una interfaz de extensión DSA abierta para admitir más requisitos de funciones.
Simultáneamente, la Academia DAMO reveló sus planes de desarrollo para nuevos miembros de la familia de procesadores Xuantie, incluidos el C908X, R908A y XL200, que continúan evolucionando en direcciones como la aceleración de IA, las aplicaciones automotrices y la interconexión de alta velocidad. Específicamente, el C908X se posiciona como el primer procesador de IA dedicado de Xuantie, compatible con una extensión vectorial RVV1.0 de ancho de bits de datos ultralargo de 4096 bits. El R908A está dirigido a los requisitos de alta confiabilidad de los chips de grado automotriz. El XL200 proporcionará una interconexión coherente de múltiples clústeres de mayor escala y mayor rendimiento.
Para complementar las capacidades de los procesadores Xuantie, la Academia DAMO también ha lanzado tres SDK de Xuantie basados en los tres sistemas operativos principales: Linux, Android y RTOS. Estos SDK integran exhaustivamente las capacidades de software acumuladas de Xuantie a lo largo de los años, proporcionándolas a la industria de una manera más completa, conveniente y estable. Entre ellos, el SDK de Xuantie Linux ofrece un rico conjunto de subsistemas, que incluyen virtualización Hypervisor, marco de seguridad CoVE, marco Xuantie AI y bibliotecas de operadores de alto rendimiento, lo que facilita el desarrollo de RISC-V en escenarios de alto rendimiento e IA.
Mientras desarrolla tecnologías de hardware y software de alto rendimiento, Xuantie también está impulsando activamente la innovación colaborativa entre los socios de la industria upstream y downstream, acelerando la implementación de un ecosistema RISC-V integral de ‘alto rendimiento + IA’.
La dedicación de Alibaba: RISC-V Xuantie lidera la comunidad internacional de código abierto
Para aquellos que no están familiarizados con Xuantie, aquí hay una breve introducción.
En 2018, Alibaba estableció la marca Xuantie, centrándose en la dirección RISC-V. Un año después, el primer procesador, el C910, surgió como el procesador RISC-V más potente en ese momento. Desde entonces, Xuantie ha sido un líder en el ecosistema internacional RISC-V y uno de los mayores contribuyentes chinos a la comunidad internacional de código abierto. Actualmente ocupa cargos de presidente o vicepresidente en el comité técnico de la fundación y en más de 10 subcomités técnicos, promoviendo activamente la estandarización de tecnologías relacionadas con la IA.
Desde 2019, Xuantie ha lanzado 13 procesadores RISC-V, que cubren varios escenarios, como alto rendimiento, alta eficiencia energética y bajo consumo de energía. Éstos incluyen:
- Serie C (Computación): Dirigido principalmente a servidores de gama alta, computación perimetral de gama alta e IPC de grado industrial/consumidor.
- Serie E (Integrado): Utilizado principalmente en MPU de gama alta y varias MCU.
- Serie R (Fiabilidad y tiempo real): Dirigido a SSD de gama alta, comunicaciones, control industrial de gama alta, automoción y otros escenarios.
- XT-Link: Una IP de interconexión de múltiples clústeres de CPU.
Hasta la fecha, los envíos de procesadores Xuantie han superado los 4 mil millones de unidades, lo que la convierte en una de las series de productos de procesadores más influyentes y líderes en el mercado en el campo nacional de RISC-V.
A lo largo de su desarrollo, Xuantie ha superado constantemente los límites de rendimiento de RISC-V, esforzándose por un rendimiento cada vez mayor. Simultáneamente, ha adoptado activamente la IA, con el objetivo de establecer RISC-V como una arquitectura de computación de IA nativa.
A nivel de tecnología de arquitectura de conjunto de instrucciones, aprovechando la superior apertura y flexibilidad de la arquitectura RISC-V, Xuantie ha personalizado durante mucho tiempo extensiones de conjunto de instrucciones para aplicaciones de IA. Su propuesta de conjunto de instrucciones de extensión Matrix y la optimización del operador central GEMM para modelos grandes pueden acelerar la inferencia y el entrenamiento de IA, mejorando la eficiencia energética de la IA en dispositivos perimetrales.
En términos de procesadores, el Xuantie C907 fue el primero en implementar la extensión Matrix, logrando una aceleración de 15x en comparación con las soluciones tradicionales. El C920 actualizado es compatible con las tecnologías Vector 1.0 y Vector Crypto, mejorando el rendimiento de GEMM en más de 7x y el rendimiento del operador Transformer en más de 17x. El último procesador insignia, el C930, cuenta con motores duales vectoriales y matriciales, lo que lo posiciona como un socio prometedor para modelos de IA grandes en dispositivos perimetrales.
A nivel de pila de software, Xuantie ha creado una plataforma de hardware y software de IA RISC-V de extremo a extremo. Esta plataforma proporciona a los fabricantes de chips una infraestructura de computación de IA de propósito general y eficiente, formando un diseño de canalización orientado a las necesidades comerciales, lo que realmente permite una optimización conveniente y profunda desde el diseño de hardware subyacente hasta las cadenas de herramientas de software de capa superior. Esta plataforma se ha aplicado a productos terminales como tarjetas de transcodificación de video en la nube, cajas de computación perimetral de IA y computadoras portátiles RISC-V.
Además de su propia tecnología, el equipo de la Academia DAMO RISC-V ha involucrado constantemente a socios de la industria upstream y downstream para mejorar el ecosistema de ‘alto rendimiento + IA’ de RISC-V.
En la conferencia del año pasado, la computadora portátil de código abierto RISC-V ‘Ruyi BOOK Jia Chen Edition’ hizo una aparición sorpresa, demostrando un funcionamiento estable y fluido de software comercial grande. Este año, el Instituto de Software de la Academia China de Ciencias presentó además el ‘Ruyi BOOK Yi Si Edition’, robots inteligentes, PC con IA y otras aplicaciones RISC-V de alto rendimiento.
Entre ellos, el prototipo de PC con IA basado en el C920 ha ejecutado con éxito modelos de código abierto como Llama, Qwen y DeepSeek, compatible con aplicaciones de IA como asistentes personales de IA, programación de IA y reconocimiento visual. Esto demuestra una ‘cadena completa de IA de código abierto’ completa, desde la arquitectura de hardware de código abierto hasta los sistemas operativos de código abierto y los modelos de IA de código abierto, al tiempo que reduce el consumo de energía de la unidad de computación en un 30%.
Además, Xuantie ha colaborado con socios para construir soluciones prácticas como soluciones de códec de video RISC-V y soluciones de escritorio en la nube. Para admitir aplicaciones en más industrias, Xuantie también ha implementado la potencia de computación RISC-V en PC todo en uno, IA de control industrial, robots y otros campos.
El académico Ni Guangnan declaró que la inversión pragmática y la innovación de Xuantie son fuerzas impulsoras cruciales para el desarrollo saludable del ecosistema RISC-V.
El futuro del código abierto
El éxito de DeepSeek es un testimonio del poder del código abierto. La arquitectura de conjunto de instrucciones de código abierto RISC-V, desde su inicio hace más de una década, ha trazado un camino de desarrollo diferente al de los modelos x86 cerrados y ARM con licencia. Ha presentado a la industria una oportunidad para innovar arquitecturas de una manera más concisa y abierta, ganando un reconocimiento cada vez mayor.
Está emergiendo como el mejor candidato para la arquitectura nativa de la era de la IA. Por un lado, RISC-V, con su compromiso con la apertura y la evolución continua, puede seguir el ritmo de los rápidos cambios en la IA. Por otro lado, la fuerte extensibilidad de RISC-V le permite ser compatible con los ecosistemas arquitectónicos existentes a través de la portabilidad y la adaptación, al tiempo que sirve como una arquitectura nativa para admitir escenarios emergentes.
Como dijo Guo Songliu, jefe de RISC-V en el Instituto de Software de la Academia China de Ciencias: “La pila de software de IA todavía está evolucionando rápidamente. Como la más flexible y abierta de las tres arquitecturas de conjunto de instrucciones principales, RISC-V es sin duda la más adecuada para el ritmo de la innovación tecnológica en la era de la IA”.