Ryzen AI 395 Esmaga Intel em IA

AMD Ryzen AI Max+ 395: Esmagando o Lunar Lake da Intel em Cargas de Trabalho de IA

A AMD revelou as alegações de desempenho para o seu Ryzen AI Max+ 395, demonstrando uma vantagem significativa sobre as CPUs Lunar Lake focadas na eficiência da Intel, especificamente o Core Ultra 7 258V, numa variedade de benchmarks de IA. Uma postagem recente no blog da empresa destaca as capacidades do novo chip Zen 5 + RDNA 3.5, afirmando uma liderança de desempenho de até 12,2 vezes em determinadas cargas de trabalho de IA.

Frente a Frente: Ryzen AI Max+ 395 vs. Core Ultra 7 258V

Para demonstrar a proeza do Ryzen AI Max+ 395, a AMD conduziu uma série de testes, colocando-o contra o Core Ultra 7 258V da Intel (equipado com gráficos Arc 140V). Os benchmarks focaram-se em vários modelos de linguagem grandes (LLMs) e configurações de LLM, incluindo modelos proeminentes como DeepSeek R1 e Llama.

Uma Nota sobre as Configurações de Memória:

Para garantir uma comparação justa, os tamanhos dos modelos foram limitados a 16 GB. Essa restrição foi implementada para levar em conta as limitações de memória dos laptops equipados com Lunar Lake, que estão atualmente disponíveis com um máximo de 32 GB de memória. Os sistemas de teste utilizados foram:

  • Ryzen AI Max+ 395: Asus ROG Flow Z13 com 64 GB de memória.
  • Core Ultra 7 258V: Asus Zenbook S14 com 32 GB de memória.

Desempenho do DeepSeek R1: Uma Vantagem Significativa

Nos benchmarks do DeepSeek R1, o chip Ryzen demonstrou uma liderança dominante. Os resultados, medidos em tokens por segundo, foram os seguintes:

  • Distill Qwen 1.5b: Até 2,1 vezes mais rápido que o equivalente da Intel.
  • Distill Qwen 7b: Até 2,2 vezes mais rápido.
  • Distill Llama 8b: Até 2,1 vezes mais rápido.
  • Distill Qwen 14b: Até 2,2 vezes mais rápido.

Benchmarks Phi 4 e Llama 3.2: Mantendo o Domínio

O Ryzen AI Max+ 395 continuou a superar o Core Ultra 7 258V em testes usando os modelos Phi 4 e Llama 3.2:

  • Phi 4 Mini Instruct 3.8b: Até 2,1 vezes mais rápido.
  • Phi 4 14b: Até 2,2 vezes mais rápido.
  • Llama 3.2 3b Instruct: Até 2,1 vezes mais rápido.

Tempo até o Primeiro Token: Uma Métrica Chave

A AMD também se concentrou na métrica ‘tempo até o primeiro token’, um indicador crucial de capacidade de resposta em aplicações de IA. Nestes benchmarks, o Ryzen AI Max+ 395 apresentou vantagens ainda mais substanciais:

  • DeepSeek R1 Distill Qwen 14b: Até 12,2 vezes mais rápido.
  • Mesmo nos cenários em que a vantagem de desempenho do chip Zen 5 foi menos pronunciada (Phi 4 Mini Instruct 3.8b e Llama 3.2 3b Instruct), o chip AMD ainda manteve uma vantagem de velocidade de 4x sobre o Core Ultra 7 258V.

Modelos de Visão de IA: Estendendo Ainda Mais a Liderança

O domínio de desempenho do Ryzen AI Max+ 395 estendeu-se aos modelos de visão de IA, novamente usando a abordagem de benchmarking ‘tempo até o primeiro token’:

  • IBM Granite Vision 3.2 2B: Até 7 vezes mais rápido que o 258V.
  • Google Gemma 3.4b: Até 4,6 vezes mais rápido.
  • Google Gemma 3 12b: Até 6 vezes mais rápido.

Vantagens Arquiteturais: A Fonte do Desempenho Superior

Os impressionantes números de desempenho demonstrados pelo Ryzen AI Max+ 395 da AMD são em grande parte atribuídos a várias vantagens arquiteturais chave:

  • Gráficos Integrados Poderosos: O chip gráfico integrado dentro da CPU Ryzen AI Max possui 40 unidades de computação (CUs) RDNA 3.5, fornecendo desempenho que rivaliza com soluções gráficas discretas.
  • Maior Contagem de Núcleos: O Ryzen AI Max+ 395 apresenta oito núcleos de CPU a mais do que o Core Ultra 7 258V, contribuindo para capacidades de processamento aprimoradas.
  • TDP Configurável: O chip Ryzen tem um TDP (Thermal Design Power) configurável significativamente mais alto, avaliado em até 120W, permitindo maior margem de desempenho.

Considerações sobre o Consumo de Energia:

É importante reconhecer que o Ryzen AI Max+ 395 consome significativamente mais energia do que o Core Ultra 7 258V, que tem uma potência turbo máxima de 37W. No entanto, apesar desta diferença, ambos os chips visam o mesmo segmento de mercado e são projetados para laptops finos e leves.

Olhando para o Futuro: Competição com a Série RTX 50 da NVIDIA

O cenário da computação móvel está em constante evolução, e o próximo desafio para as novas APUs móveis da AMD provavelmente virá das GPUs móveis da série RTX 50 da NVIDIA. Embora os relatórios sugiram potenciais problemas na cadeia de suprimentos e atrasos para o lançamento dessas GPUs nos próximos laptops para jogos da série RTX 50, elas representarão, sem dúvida, a principal concorrência da AMD em termos de desempenho bruto, independentemente das diferenças de formato.

Indicações Iniciais Contra GPUs Discretas:

Curiosamente, a AMD já fez alegações sobre o desempenho superior de IA do Ryzen AI Max+ 395 em comparação com a GPU para laptop RTX 4090 da NVIDIA, sugerindo uma forte posição competitiva mesmo contra soluções gráficas discretas. É uma declaração preventiva, e que certamente deixará aqueles que aguardam análises independentes muito animados.

Aprofundando-se nos Resultados dos Benchmarks

Os dados de benchmark fornecidos pintam um quadro claro do foco da AMD no desempenho de IA. A escolha de modelos e configurações destaca a crescente importância do processamento de IA eficiente e responsivo nas tarefas de computação modernas.

Modelos de Linguagem Grandes (LLMs):

O uso de DeepSeek R1 e Llama, dois LLMs proeminentes, demonstra a capacidade do Ryzen AI Max+ 395 de lidar com tarefas complexas de processamento de linguagem natural. A métrica ‘tokens por segundo’ é uma medida padrão de desempenho nesta área, indicando a rapidez com que o processador pode gerar texto ou processar entradas baseadas em linguagem.

Destilação (Distillation):

A inclusão de versões ‘Distill’ dos modelos (por exemplo, Distill Qwen 1.5b) sugere um foco na eficiência do modelo. A destilação é uma técnica usada para criar versões menores e mais rápidas de modelos maiores, mantendo grande parte de sua precisão. Isso é particularmente relevante para dispositivos móveis, onde o consumo de energia e as restrições de memória são críticos.

Phi 4 e Llama 3.2:

A adição dos modelos Phi 4 e Llama 3.2 fornece uma perspetiva mais ampla sobre o desempenho do chip em diferentes arquiteturas de IA e tamanhos de modelo.

Tempo até o Primeiro Token (TTFT):

A ênfase no ‘tempo até o primeiro token’ é particularmente notável. O TTFT mede a latência entre a entrada de um utilizador e a resposta inicial do modelo de IA. Um TTFT mais baixo traduz-se numa experiência de utilizador mais responsiva e interativa, o que é crucial para aplicações como chatbots, tradução em tempo real e conclusão de código.

Modelos de Visão de IA:

A inclusão de modelos de visão de IA (IBM Granite Vision e Google Gemma) demonstra a versatilidade do Ryzen AI Max+ 395. Esses modelos são usados para tarefas como reconhecimento de imagem, deteção de objetos e análise de vídeo. O forte desempenho nestes benchmarks sugere a adequação do chip para aplicações além do processamento de linguagem.

A Importância das Vantagens Arquiteturais

As decisões arquiteturais da AMD desempenham um papel crucial nas diferenças de desempenho observadas.

Gráficos Integrados (RDNA 3.5):

A poderosa unidade gráfica integrada é um diferenciador chave. Ao contrário das soluções gráficas integradas tradicionais, que muitas vezes lutam com cargas de trabalho exigentes, a arquitetura RDNA 3.5 fornece um aumento significativo no desempenho, permitindo que o Ryzen AI Max+ 395 lide com tarefas de IA de forma mais eficaz. As 40 CUs representam uma capacidade computacional substancial.

Contagem de Núcleos:

A maior contagem de núcleos (oito núcleos a mais do que o Core Ultra 7 258V) fornece uma vantagem geral em cargas de trabalho multithread. Embora o processamento de IA dependa frequentemente da GPU, a CPU ainda desempenha um papel na gestão de tarefas e no tratamento de certos aspetos da computação.

TDP Configurável:

O TDP mais alto permite maior flexibilidade na gestão de energia. Embora signifique maior consumo de energia, também permite que o chip opere em velocidades de clock mais altas e sustente o desempenho por períodos mais longos, particularmente em cargas de trabalho de IA exigentes. A capacidade de configurar o TDP até 120W fornece uma vantagem significativa sobre a potência turbo máxima mais restrita de 37W do Core Ultra 7 258V. Este é um fator crucial para alcançar as vantagens de desempenho observadas.

O Cenário da Computação Móvel: Um Campo de Batalha em Mutação

A competição entre a AMD e a Intel no espaço móvel intensificou-se nos últimos anos, com ambas as empresas a ultrapassar os limites de desempenho e eficiência. A introdução do Lunar Lake representou o foco da Intel na eficiência energética, enquanto o Ryzen AI Max+ 395 da AMD prioriza claramente o desempenho, particularmente em cargas de trabalho de IA.

A próxima batalha com as GPUs móveis da série RTX 50 da NVIDIA será um teste significativo para a AMD. Embora a NVIDIA tenha tradicionalmente dominado o mercado de gráficos móveis de ponta, os avanços da AMD em gráficos integrados e capacidades de processamento de IA posicionam-na como um forte concorrente. Os problemas relatados na cadeia de suprimentos que a NVIDIA enfrenta podem potencialmente dar à AMD uma vantagem em termos de disponibilidade e penetração no mercado.

As alegações de desempenho superior de IA contra a GPU para laptop RTX 4090 são ousadas, mas, se comprovadas, representariam uma mudança significativa no cenário competitivo. Isso indicaria que a solução integrada da AMD pode competir com, e potencialmente superar, soluções gráficas discretas em certas aplicações focadas em IA. Esta seria uma grande conquista e poderia ter implicações significativas para o futuro da computação móvel. A ênfase no desempenho de IA é uma indicação clara da direção que a indústria está a tomar. À medida que a IA se torna cada vez mais integrada em aplicações do dia a dia, a procura por processadores que possam lidar com essas cargas de trabalho de forma eficiente e eficaz continuará a crescer.