AMD Ryzen AI MAX+ 395: 노트북 AI 성능의 새로운 리더

얇고 가벼운 노트북의 성능 재정의

Ryzen AI MAX+ 395는 최첨단 기술을 기반으로 제작되었습니다. 핵심에는 AMD의 ‘Zen 5’ CPU 코어가 있어 강력하고 효율적인 처리 백본을 제공합니다. 그러나 진정한 혁신은 50 AI TOPS(초당 테라 연산) 이상의 성능을 자랑하는 XDNA 2 NPU(Neural Processing Unit)의 통합에 있습니다. 이 전용 AI 엔진은 AMD의 RDNA 3.5 아키텍처 기반의 통합 GPU(40개의 Compute Unit 탑재)와 결합되어 프리미엄 얇고 가벼운 노트북의 잠재력을 변화시킵니다.

이 강력한 조합은 32GB에서 최대 128GB의 통합 메모리에 이르는 전례 없는 메모리 구성을 허용합니다. 핵심 기능인 **AMD Variable Graphics Memory (VGM)**는 이 통합 메모리의 최대 96GB를 VRAM으로 동적으로 할당할 수 있도록 합니다. 이러한 유연성은 상당한 메모리 리소스를 필요로 하는 까다로운 AI 워크로드를 처리하는 데 중요합니다.

소비자에게 AI 제공: 로컬 LLM의 힘

AMD의 초점은 단순한 처리 능력을 넘어 사용자가 실용적이고 일상적인 애플리케이션에서 AI의 잠재력을 활용할 수 있도록 지원하는 것입니다. 대표적인 예가 LM Studio와 같은 llama.cpp 기반 애플리케이션에 대한 지원입니다. 이 소프트웨어는 게이트웨이 역할을 하여 사용자가 전문적인 기술 전문 지식 없이도 노트북에서 직접 대규모 언어 모델(LLM)을 실행할 수 있도록 합니다. 이러한 AI 기술의 민주화는 사용자가 새로운 AI 텍스트 및 비전 모델을 쉽게 실험하고 배포할 수 있는 가능성을 열어줍니다.

벤치마킹 우위: 실제 성능 향상

AMD의 내부 벤치마크는 Ryzen AI MAX+ 395의 성능에 대한 설득력 있는 그림을 보여줍니다. 테스트는 64GB의 통합 메모리와 통합 Radeon 8060S GPU가 장착된 ASUS ROG Flow Z13 노트북을 사용하여 수행되었습니다. 결과는 Intel Arc 140V 그래픽 카드를 탑재한 노트북보다 상당한 성능 우위를 보여주었습니다.

LLM이 텍스트를 생성할 수 있는 속도를 측정하는 토큰 처리량 측면에서 Ryzen AI MAX+ 395는 최대 2.2배 향상을 보여주었습니다. 이러한 테스트는 경쟁 노트북과의 호환성을 보장하기 위해 신중하게 설계되었으며, 16GB 메모리 풋프린트(32GB 온패키지 메모리가 있는 노트북의 경우 일반적) 내에서 작동할 수 있는 LLM에 중점을 두었습니다.

이러한 성능 이점은 특정 모델 유형에 국한되지 않았습니다. 다음을 포함한 다양한 LLM에서 일관되게 유지되었습니다.

  • Chain-of-thought 모델: DeepSeek R1 Distills와 같습니다.
  • 표준 모델: Microsoft Phi 4와 같습니다.
  • 다양한 매개변수 크기: 다양한 모델 복잡성에서 다재다능함을 보여줍니다.

응답성 재정의: 첫 번째 토큰까지의 시간

원시 처리량 외에도 AI 모델의 응답성은 부드럽고 상호 작용적인 사용자 경험에 매우 중요합니다. 여기서 “첫 번째 토큰까지의 시간” 메트릭이 사용되며, 이는 모델이 입력을 받은 후 얼마나 빨리 출력을 생성하기 시작하는지를 나타냅니다.

Ryzen AI MAX+ 395는 이 영역에서 더욱 극적인 이점을 보여주었습니다.

  • 더 작은 모델(예: Llama 3.2 3b Instruct): 경쟁 제품보다 최대 4배 빠릅니다.
  • 더 큰 70억 및 80억 매개변수 모델(예: DeepSeek R1 Distill Qwen 7b, DeepSeek R1 Distill Llama 8b): 최대 9.1배까지 속도가 향상됩니다.
  • 140억 매개변수 모델: Ryzen AI MAX+ 395로 구동되는 ASUS ROG Flow Z13은 Intel Core Ultra 258V 프로세서가 장착된 노트북보다 최대 12.2배 더 빠른 것으로 보고되었습니다.

이러한 수치는 노트북에서 AI 모델의 상호 작용 기능이 크게 향상되어 거의 즉각적인 응답과 보다 유연한 사용자 경험을 제공한다는 것을 강조합니다.

텍스트를 넘어: 멀티모달 AI의 힘 발휘

Ryzen AI MAX+ 395의 기능은 텍스트 기반 LLM을 넘어 확장됩니다. 또한 텍스트 처리와 함께 비전 기능을 통합하는 멀티모달 모델을 처리하는 데 탁월합니다. 이러한 모델은 이미지를 분석하고 시각적 콘텐츠를 기반으로 응답을 제공하여 새로운 범위의 애플리케이션을 열 수 있습니다.

AMD는 다음과 같은 모델에서 프로세서의 성능을 보여주는 데이터를 제시했습니다.

  • IBM Granite Vision: IBM Granite Vision 3.2 3b에서 최대 7배 빠릅니다.
  • Google Gemma 3: Google Gemma 3 4b에서 최대 4.6배, Google Gemma 3 12b에서 최대 6배 빠릅니다.

특히 64GB 메모리가 장착된 ASUS ROG Flow Z13은 더 큰 Google Gemma 3 27B Vision 모델도 실행할 수 있어 플랫폼이 가장 까다로운 멀티모달 워크로드도 처리할 수 있음을 보여주었습니다.

실제 애플리케이션: 의료 진단에서 코드 생성까지

이러한 발전의 실제적인 의미는 광범위합니다. 시연에서는 모델이 스톡 CT 스캔 이미지를 분석하고 장기를 식별하며 진단을 제공하는 의료 진단에서 비전 모델의 잠재력을 보여주었습니다. 이는 AI가 의료 전문가가 더 빠르고 정확한 평가를 내릴 수 있도록 지원할 수 있는 잠재력을 강조합니다.

또 다른 매력적인 애플리케이션은 코드 생성에 있습니다. AMD는 DeepSeek R1 Distill Qwen 32b(6비트 정밀도)와 같은 대규모 언어 모델을 실행하여 Pong과 같은 간단한 게임을 매우 짧은 시간 내에 코딩할 수 있는 기능을 시연했습니다. 이는 AI가 소프트웨어 개발을 가속화하고 개발자에게 강력한 코딩 지원 도구를 제공할 수 있는 잠재력을 보여줍니다.

성능 최적화: 잠재력 최대한 발휘

Ryzen AI 300 시리즈 프로세서가 장착된 노트북에서 LLM 워크로드로 최적의 성능을 얻으려면 AMD는 다음과 같은 구체적인 권장 사항을 제공합니다.

  1. 드라이버 업데이트: 최신 AMD Software: Adrenalin Edition 드라이버가 설치되어 있는지 확인합니다. 이 드라이버는 최신 기능과 최적화를 활성화하는 데 중요합니다.
  2. Variable Graphics Memory (VGM): VGM을 활성화하고 “High”로 설정합니다. 이를 통해 시스템은 통합 그래픽에 메모리를 동적으로 할당하여 토큰 처리량을 높이고 더 큰 AI 모델을 사용할 수 있습니다.
  3. LM Studio 설정: LM Studio 내에서 매개변수를 수동으로 선택하고 “GPU Offload”를 “MAX”로 설정합니다. 이렇게 하면 GPU가 AI 처리에 완전히 활용됩니다.
  4. 양자화:
    • 일반적인 사용을 위해 AMD는 Q4 K M 양자화를 제안합니다.
    • 코딩 작업의 경우 Q6 또는 Q8 양자화를 권장합니다.

이러한 권장 사항을 따르면 사용자는 Ryzen AI 기반 노트북의 잠재력을 최대한 활용하고 고급 AI 모델의 혁신적인 힘을 경험할 수 있습니다.

AI의 미래를 위한 플랫폼

본질적으로 AMD Ryzen AI MAX+ 395 프로세서는 단순한 성능 업그레이드 그 이상입니다. 사용자가 휴대 가능하고 접근 가능한 폼 팩터에서 최첨단 AI 기술을 경험할 수 있도록 지원하는 플랫폼입니다. 게임, 생산성 또는 빠르게 진화하는 AI 세계 탐험 등 이 프로세서는 얇고 가벼운 노트북에서 가능한 것을 재정의하는 것을 목표로 합니다. 이전에는 이러한 휴대용 장치에서 상상할 수 없었던 방식으로 사용자가 AI 모델과 상호 작용할 수 있도록 새로운 가능성을 열어줍니다. 원시 처리 능력과 결합된 사용자 친화성에 대한 초점은 Ryzen AI MAX+ 395를 AI가 우리 일상 생활에 매끄럽게 통합되는 미래를 향한 중요한 단계로 자리매김합니다.