Triunfo Open Source: RISC-V e IA

A Ascensão do RISC-V como uma Arquitetura de Computação Nativa de IA

A recente popularidade explosiva do DeepSeek enviou ondas de choque por toda a indústria de IA, e seu impacto se estende além do reino da inteligência artificial. A indústria de semicondutores, em particular, tomou nota. Durante o Ano Novo Chinês, a DAMO Academy Xuantie da Alibaba anunciou sua adaptação do modelo de destilação da série DeepSeek-R1, mostrando o forte impulso da emergente arquitetura de conjunto de instruções de código aberto, RISC-V, no domínio da IA.

Na recente Conferência do Ecossistema Xuantie RISC-V, surgiram notícias empolgantes: o RISC-V alcançou avanços tanto em computação de alto desempenho quanto em IA. O Xuantie C930, a primeira CPU de nível de servidor da DAMO Academy, está programado para começar a ser entregue no próximo mês. Seu poder de computação de IA significativamente aprimorado acelera a implantação de um ecossistema RISC-V abrangente de ‘alto desempenho + IA’.

Poderia a arquitetura de computação de código aberto RISC-V ser o parceiro ideal para a IA de código aberto?

A Transformação do Modelo de IA Impulsiona a Inovação na Arquitetura de Computação

Um especialista experiente na indústria de chips explicou que o impacto do DeepSeek é sentido não apenas nos círculos de IA, mas também profundamente na indústria de chips. O DeepSeek, através de seu design altamente otimizado, reduziu drasticamente os custos de treinamento e inferência de modelos de linguagem grandes. Essa mudança alterou drasticamente o equilíbrio existente de poder de computação, memória e interconexão, criando oportunidades significativas para avanços na arquitetura de computação.

Tradicionalmente, grandes modelos de IA, devido aos seus requisitos intensivos de computação e memória, eram mais adequados para implantação na nuvem do que em dispositivos de borda. No entanto, a chegada do DeepSeek desafiou essa dependência de alto poder de computação. Ao reduzir os custos de treinamento e inferência, está abrindo caminho para que grandes modelos façam a transição da nuvem para a borda.

Especificamente, as demandas computacionais reduzidas do DeepSeek tornam a implantação em uma única máquina viável, aumentando sua compatibilidade com dispositivos de borda e finais. À medida que a IA busca penetrar em diversos setores e cenários, a necessidade de se mover da nuvem para a borda se torna cada vez mais crítica. Essa mudança é necessária para atender a diversas necessidades, como segurança de dados, personalização e implantação privada.

É previsível que, com a adoção generalizada da tecnologia DeepSeek, o cenário dos chips de IA passará por uma transformação. De computação paralela em larga escala dependente da infraestrutura em nuvem, os chips de IA estão evoluindo para designs diversificados, eficientes e de baixo consumo de energia, capazes de operação independente em dispositivos de borda.

Isso levou muitos na indústria a ponderar: qual arquitetura de computação é mais adequada para IA?

As GPUs, com suas capacidades de processamento paralelo, podem não ser a única solução. A computação serial (computação de propósito geral) também está emergindo como uma base viável para a computação de IA. A experiência da indústria demonstra que o DeepSeek exibe boa compatibilidade com vários sistemas de computação. Sua capacidade de ser rapidamente implantado e realizar inferência eficaz em CPUs trouxe as CPUs de volta aos holofotes. Em comparação com GPUs especializadas, as CPUs oferecem a vantagem da versatilidade, agendamento simplificado, redução significativa nos requisitos de poder de computação e os benefícios da computação homogênea.

Entre as CPUs, a estrela em ascensão, RISC-V, está atraindo atenção significativa.

Durante o Ano Novo Chinês, a DAMO Academy adaptou o modelo de destilação da série DeepSeek-R1 em um chip alimentado pelo processador RISC-V Xuantie C920. Todo o processo levou apenas uma hora, demonstrando uma experiência rápida e perfeita. Isso significa que os modelos da série DeepSeek podem ser implantados e executados sem problemas em toda a gama de plataformas de CPU Xuantie e outros dispositivos finais de IA equipados com chips de arquitetura RISC-V.

O destaque do RISC-V decorre de vários fatores. Primeiramente, como uma arquitetura de conjunto de instruções emergente, ele se distingue dos modelos de licenciamento fechado ou pago do x86 e ARM, adotando uma abordagem de código aberto. Este espírito de código aberto se alinha naturalmente com a IA. Sua natureza aberta atraiu a participação de mais de 1.000 empresas em todo o mundo, promovendo um rápido crescimento em seu ecossistema, desde o design de hardware até as cadeias de ferramentas de software. De acordo com a RISC-V International Foundation, mais de 80 produtos de chip RISC-V diferentes já entraram no mercado.

Em segundo lugar, o RISC-V oferece flexibilidade e escalabilidade notáveis. Ele permite que os desenvolvedores personalizem o conjunto de instruções de acordo com necessidades específicas. A natureza modular de seu conjunto de instruções permite a personalização para diferentes cenários de aplicação, um nível de flexibilidade incomparável pelas arquiteturas tradicionais.

Tecnicamente, o RISC-V também é adequado para novos tipos de computação de IA. Sua extensão vetorial (V-extension) pode lidar efetivamente com operações paralelas em larga escala, atendendo às demandas de eficiência da computação de IA. A arquitetura aberta do RISC-V pode funcionar em sinergia com módulos de aceleração de hardware para aprimorar a eficiência de execução de tarefas de IA. Através da integração profunda com algoritmos de IA, a arquitetura RISC-V pode ser usada para projetar unidades de aceleração de hardware dedicadas, otimizando o desempenho para modelos de IA específicos.

Portanto, muitos especialistas experientes na indústria de chips preveem que o RISC-V se tornará a arquitetura de computação nativa da era da IA.

Na terceira Conferência do Ecossistema Xuantie RISC-V, organizada pela DAMO Academy da Alibaba, essa expectativa finalmente se concretizou.

A Primeira CPU de Nível de Servidor da Xuantie Pronta para Entrega: Uma Fusão de Alto Desempenho e IA

Na conferência, Ni Guangnan, um acadêmico da Academia Chinesa de Engenharia, afirmou: “O RISC-V de código aberto não é apenas uma inovação tecnológica, mas também uma transformação global que influenciará o futuro da arquitetura de computação”. Como uma arquitetura de conjunto de instruções de chip “nascida de código aberto”, o RISC-V demonstrou um desempenho notável neste ciclo da indústria de semicondutores. Ele acelerou seu progresso de sistemas embarcados para cenários complexos, como computação de alto desempenho, oferecendo uma nova opção para o poder de computação de IA.

Entre os 25 padrões aprovados pela RISC-V International Foundation em 2024, mais da metade está relacionada a alto desempenho ou IA. Lu Dai, Presidente do Conselho de Administração da RISC-V International Foundation, afirmou na conferência que um dos avanços mais empolgantes no conjunto de instruções RISC-V é a extensão Matrix, que impulsionará o RISC-V a se tornar uma força formidável no campo da IA.

Prevê-se que, até 2030, a participação de mercado geral do RISC-V atingirá 20%, com sua participação em aceleradores de IA potencialmente excedendo 50%.

Na conferência, a DAMO Academy revelou seu processador principal de próxima geração, e o primeiro processador de nível de servidor, o C930.

O C930 atinge um benchmark de poder de computação de propósito geral de 15/GHz no teste de benchmark SPECint2006. O que isso significa? O acadêmico Ni Guangnan apontou que, para o RISC-V realmente entrar no mercado de computação de alto desempenho, ele deve atingir uma pontuação de alto desempenho superior a 15 no teste de software SPECint 2006. Portanto, o C930 representa um passo importante para o RISC-V.

Além disso, o C930 é equipado com motores duplos: RVV1.0 de 512 bits e Matrix de 8 TOPS. Isso integra o poder de computação de alto desempenho de propósito geral com o poder de computação de IA nativamente. Ele também fornece uma interface de extensão DSA aberta para suportar mais requisitos de recursos.

Simultaneamente, a DAMO Academy divulgou seus planos de desenvolvimento para novos membros da família de processadores Xuantie, incluindo o C908X, R908A e XL200, continuando a evoluir em direções como aceleração de IA, aplicações automotivas e interconexão de alta velocidade. Especificamente, o C908X está posicionado como o primeiro processador de IA dedicado da Xuantie, suportando uma extensão vetorial RVV1.0 de largura de bit de dados ultra-longa de 4096 bits. O R908A é direcionado aos requisitos de alta confiabilidade de chips de nível automotivo. O XL200 fornecerá interconexão coerente multi-cluster de maior escala e maior desempenho.

Para complementar as capacidades dos processadores Xuantie, a DAMO Academy também lançou três SDKs Xuantie baseados nos três principais sistemas operacionais: Linux, Android e RTOS. Esses SDKs integram de forma abrangente os recursos de software acumulados da Xuantie ao longo dos anos, fornecendo-os à indústria de uma forma mais completa, conveniente e estável. Entre eles, o Xuantie Linux SDK oferece um rico conjunto de subsistemas, incluindo virtualização Hypervisor, framework de segurança CoVE, framework Xuantie AI e bibliotecas de operadores de alto desempenho, facilitando o desenvolvimento do RISC-V em cenários de alto desempenho e IA.

Ao desenvolver tecnologias de hardware e software de alto desempenho, a Xuantie também está impulsionando ativamente a inovação colaborativa entre parceiros da indústria upstream e downstream, acelerando a implantação de um ecossistema RISC-V abrangente de ‘alto desempenho + IA’.

A Dedicação da Alibaba: RISC-V Xuantie Lidera a Comunidade Internacional de Código Aberto

Para aqueles que não estão familiarizados com o Xuantie, aqui está uma breve introdução.

Em 2018, a Alibaba estabeleceu a marca Xuantie, focando na direção RISC-V. Um ano depois, o primeiro processador, o C910, surgiu como o processador RISC-V mais poderoso da época. Desde então, a Xuantie tem sido líder no ecossistema internacional RISC-V e um dos maiores contribuidores chineses para a comunidade internacional de código aberto. Atualmente, ocupa cargos de presidente ou vice-presidente no comitê técnico da fundação e em mais de 10 subcomitês técnicos, promovendo ativamente a padronização de tecnologias relacionadas à IA.

Desde 2019, a Xuantie lançou 13 processadores RISC-V, cobrindo vários cenários, como alto desempenho, alta eficiência energética e baixo consumo de energia. Esses incluem:

  • Série C (Computing): Principalmente direcionado a servidores de ponta, computação de borda de ponta e IPCs de nível industrial/consumidor.
  • Série E (Embedded): Principalmente usado em MPUs de ponta e vários MCUs.
  • Série R (Reliability & Realtime): Direcionado a SSDs de ponta, comunicações, controle industrial de ponta, automotivo e outros cenários.
  • XT-Link: Um IP de interconexão multi-cluster de CPU.

Até o momento, os embarques de processadores Xuantie excederam 4 bilhões de unidades, tornando-se uma das séries de produtos de processador mais influentes e líderes de mercado no campo doméstico RISC-V.

Ao longo de seu desenvolvimento, a Xuantie tem consistentemente ultrapassado os limites de desempenho do RISC-V, buscando um desempenho cada vez maior. Simultaneamente, tem abraçado ativamente a IA, com o objetivo de estabelecer o RISC-V como uma arquitetura de computação de IA nativa.

No nível da tecnologia de arquitetura de conjunto de instruções, aproveitando a abertura e flexibilidade superiores da arquitetura RISC-V, a Xuantie há muito tempo personaliza extensões de conjunto de instruções para aplicações de IA. Seu conjunto de instruções de extensão Matrix proposto e a otimização do operador principal GEMM para modelos grandes podem acelerar a inferência e o treinamento de IA, melhorando a eficiência energética da IA em dispositivos de borda.

Em termos de processadores, o Xuantie C907 foi o primeiro a implementar a extensão Matrix, alcançando uma aceleração de 15x em comparação com as soluções tradicionais. O C920 atualizado suporta as tecnologias Vector 1.0 e Vector Crypto, melhorando o desempenho do GEMM em mais de 7x e o desempenho do operador Transformer em mais de 17x. O mais recente processador principal, o C930, apresenta motores duplos vetoriais e matriciais, posicionando-o como um parceiro promissor para grandes modelos de IA em dispositivos de borda.

No nível da pilha de software, a Xuantie criou uma plataforma de software e hardware de IA RISC-V ponta a ponta. Esta plataforma fornece aos fabricantes de chips uma infraestrutura de computação de IA de propósito geral e eficiente, formando um design de pipeline orientado para as necessidades de negócios, permitindo verdadeiramente uma otimização conveniente e profunda, desde o design de hardware subjacente até as cadeias de ferramentas de software de camada superior. Esta plataforma foi aplicada a produtos terminais, como placas de transcodificação de vídeo em nuvem, caixas de computação de borda de IA e laptops RISC-V.

Além de sua própria tecnologia, a equipe RISC-V da DAMO Academy tem consistentemente envolvido parceiros da indústria upstream e downstream para aprimorar o ecossistema de ‘alto desempenho + IA’ do RISC-V.

Na conferência do ano passado, o laptop de código aberto RISC-V ‘Ruyi BOOK Jia Chen Edition’ fez uma aparição surpresa, demonstrando operação estável e suave de software comercial grande. Este ano, o Instituto de Software da Academia Chinesa de Ciências introduziu ainda mais o ‘Ruyi BOOK Yi Si Edition’, robôs inteligentes, PCs de IA e outras aplicações de alto desempenho RISC-V.

Entre eles, o protótipo de PC de IA baseado no C920 executou com sucesso modelos de código aberto como Llama, Qwen e DeepSeek, suportando aplicações de IA como assistentes pessoais de IA, programação de IA e reconhecimento visual. Isso demonstra uma ‘cadeia completa de IA de código aberto’, desde a arquitetura de hardware de código aberto até os sistemas operacionais de código aberto e modelos de IA de código aberto, ao mesmo tempo em que reduz o consumo de energia da unidade de computação em 30%.

Além disso, a Xuantie colaborou com parceiros para construir soluções práticas, como soluções de codec de vídeo RISC-V e soluções de desktop em nuvem. Para suportar aplicações em mais setores, a Xuantie também implantou poder de computação RISC-V em PCs all-in-one, IA de controle industrial, robôs e outros campos.

O acadêmico Ni Guangnan afirmou que o investimento pragmático e a inovação da Xuantie são forças motrizes cruciais para o desenvolvimento saudável do ecossistema RISC-V.

O Futuro do Código Aberto

O sucesso do DeepSeek é uma prova do poder do código aberto. A arquitetura de conjunto de instruções de código aberto RISC-V, desde sua criação há mais de uma década, traçou um caminho de desenvolvimento diferente do x86 fechado e dos modelos ARM licenciados. Ele apresentou à indústria uma oportunidade de inovar arquiteturas de uma forma mais concisa e aberta, ganhando reconhecimento crescente.

Está emergindo como o melhor candidato para a arquitetura nativa da era da IA. Por um lado, o RISC-V, com seu compromisso com a abertura e evolução contínua, pode acompanhar as rápidas mudanças na IA. Por outro lado, a forte extensibilidade do RISC-V permite que ele seja compatível com os ecossistemas arquitetônicos existentes através de portabilidade e adaptação, ao mesmo tempo em que serve como uma arquitetura nativa para suportar cenários emergentes.

Como Guo Songliu, chefe do RISC-V no Instituto de Software da Academia Chinesa de Ciências, disse: “A pilha de software de IA ainda está evoluindo rapidamente. Como a mais flexível e aberta das três principais arquiteturas de conjunto de instruções, o RISC-V é, sem dúvida, o mais adequado para o ritmo da inovação tecnológica na era da IA”.