혁신의 원동력
Ryzen AI MAX+ 395는 최첨단 기술을 기반으로 제작되었습니다. ‘Zen 5’ CPU 코어, 50 AI TOPS 이상의 강력한 XDNA 2 NPU, 그리고 40개의 AMD RDNA 3.5 Compute Unit으로 구동되는 거대한 통합 GPU를 활용합니다. 이러한 고성능 구성 요소의 조합은 얇고 가벼운 디자인의 제약 조건 내에서 전례 없는 수준의 처리 능력을 제공합니다. Ryzen AI Max+ 395는 32GB부터 최대 128GB의 통합 메모리 구성을 제공합니다. 핵심 기능은 AMD의 Variable Graphics Memory로, 통합 메모리의 상당 부분(최대 96GB)을 VRAM으로 변환할 수 있습니다.
로컬 AI: 미래는 지금
Ryzen AI MAX+ 395의 가장 매력적인 측면 중 하나는 까다로운 소비자 AI 워크로드를 탁월한 효율성으로 처리할 수 있다는 것입니다. 대표적인 예는 LM Studio에서의 성능입니다. LM Studio는 전문적인 기술 지식 없이도 누구나 최신 언어 모델을 로컬에서 실행할 수 있는 사용자 친화적인 애플리케이션입니다. 이를 통해 사용자는 노트북에서 직접 최첨단 AI 텍스트 및 비전 모델과 상호 작용할 수 있는 가능성의 세계를 열 수 있습니다. ‘Strix Halo’ 플랫폼을 통해 AMD는 이 분야에서 리더십을 공고히 하여 사용자가 이전에는 상상할 수 없었던 방식으로 소형 장치에서 AI를 경험할 수 있도록 지원합니다.
메모리: 병목 현상 해소
얇고 가벼운 카테고리의 많은 경쟁 프로세서는 온 패키지 메모리 용량에 의해 제한되며, 종종 최대 32GB로 제한됩니다. 이는 일부 대규모 언어 모델(LLM)을 실행하는 데는 충분할 수 있지만, 더 까다로운 AI 애플리케이션에는 심각한 병목 현상을 야기합니다. 그러나 Ryzen AI MAX+ 395는 이러한 장벽을 돌파합니다.
벤치마킹 우수성: 실제 성능
Ryzen AI MAX+ 395의 성능 이점을 진정으로 이해하려면 64GB 통합 메모리가 장착된 ASUS ROG Flow Z13을 사용한 실제 벤치마크를 고려하십시오. 일반적으로 32GB 노트북을 제공하는 경쟁업체와의 공정한 비교를 위해 LLM 크기는 16GB 공간에 맞는 모델로 제한되었습니다.
결과는 놀랍습니다.
토큰 처리량: Ryzen AI MAX+ 395로 구동되는 ASUS ROG Flow Z13은 Intel Arc 140V를 탑재한 노트북보다 최대 2.2배 높은 토큰 처리량을 달성했습니다. 이러한 성능 향상은 다양한 모델 유형 및 매개변수 크기에서 놀랍도록 일관되게 유지되었습니다.
첫 번째 토큰까지의 시간: 이 지표는 AI 모델의 응답성을 측정하는 데 중요합니다. Ryzen AI MAX+ 395는 Llama 3.2 3b Instruct와 같은 소형 모델에서 경쟁 제품보다 최대 4배 빠른 상당한 이점을 보여주었습니다.
모델 크기에 따른 확장: LLM의 크기가 커질수록 성능 격차는 더욱 커집니다. DeepSeek R1 Distill Qwen 7b 및 DeepSeek R1 Distill Llama 8b와 같은 70억 및 80억 매개변수 모델을 사용했을 때 Ryzen AI MAX+ 395는 최대 9.1배 더 빨랐습니다. 140억 매개변수 모델을 처리할 때 ASUS ROG Flow Z13은 Intel Core Ultra 258V 기반 노트북보다 무려 12.2배 더 빨랐습니다. 이는 10배 이상의 차이입니다.
이는 명확한 추세를 보여줍니다. LLM이 클수록 Ryzen AI MAX+ 395의 성능 이점이 더욱 두드러집니다. 모델과의 대화형 교환에 참여하든 수천 개의 토큰을 포함하는 복잡한 요약 작업을 할당하든, AMD 기반 시스템은 훨씬 더 빠르고 반응성이 뛰어난 경험을 제공합니다. 이점은 프롬프트 길이에 정비례합니다. 즉, 작업이 까다로울수록 이점이 커집니다.
텍스트를 넘어: 멀티모달 AI 수용
AI의 진화는 텍스트 전용 LLM을 넘어섰습니다. 비전 어댑터와 시각적 추론 기능을 통합한 고성능 멀티모달 모델의 부상은 환경을 변화시키고 있습니다. 예를 들어 IBM Granite Vision과 최근 출시된 Google Gemma 3 제품군 모델은 모두 차세대 AMD AI PC에 고급 비전 기능을 제공합니다. 이러한 모델은 Ryzen AI MAX+ 395 프로세서에서 매우 잘 실행됩니다.
비전 모델로 작업할 때 ‘첫 번째 토큰까지의 시간’ 지표는 모델이 입력 이미지를 분석하는 데 걸리는 시간을 효과적으로 나타냅니다. Ryzen AI MAX+ 395는 이 영역에서 인상적인 성능 향상을 제공합니다.
- IBM Granite Vision 3.2 3b에서 최대 7배 더 빠릅니다.
- Google Gemma 3 4b에서 최대 4.6배 더 빠릅니다.
- Google Gemma 3 12b에서 최대 6배 더 빠릅니다.
또한 ASUS ROG Flow Z13의 64GB 메모리 옵션을 사용하면 현재 최첨단(SOTA) 비전 모델로 널리 알려진 Google Gemma 3 27B Vision 모델을 쉽게 실행할 수 있습니다.
실제 응용 프로그램: AI를 사용한 코딩
또 다른 매력적인 예는 DeepSeek R1 Distill Qwen 32b 모델을 6비트 정밀도로 실행하는 것입니다. 이 구성을 통해 사용자는 약 5분이라는 놀랍도록 짧은 시간 안에 고전 게임을 코딩할 수 있어 AI 기반 개발의 실질적인 잠재력을 보여줍니다.
LLM 성능 최적화
AMD Ryzen AI 300 시리즈 프로세서에서 LLM의 성능을 최대화하려면 몇 가지 주요 단계를 권장합니다.
드라이버 업데이트: 최신 AMD Software: Adrenalin Edition 드라이버를 사용하고 있는지 확인하십시오.
Variable Graphics Memory (VGM): 이러한 프로세서가 장착된 AMD 노트북에는 VGM이 있습니다. VGM을 활성화하고, 특히 ‘High’로 설정하는 것은 LLM 워크로드에 적극 권장됩니다. 이렇게 하면 토큰 처리량이 향상되고 더 큰 모델을 효율적으로 실행할 수 있습니다. VGM 옵션은 AMD Software: Adrenalin Edition의 성능 > 튜닝 탭을 통해 액세스할 수 있습니다.
수동 매개변수 선택: LLM을 실행할 때 ‘manually select parameters’를 선택하고 GPU Offload 설정을 ‘MAX’로 설정합니다.
양자화: AMD는 일상적인 사용에는 Q4 K M 양자화를, 코딩 작업에는 Q6 또는 Q8을 사용할 것을 권장합니다.
모바일 AI의 새로운 시대
AMD Ryzen AI MAX+ 395 프로세서는 얇고 가벼운 노트북의 기능에 대한 패러다임 전환을 나타냅니다. 최첨단 하드웨어와 지능형 소프트웨어 최적화를 결합하여 AMD는 사용자가 휴대성이 뛰어나고 강력하며 사용자 친화적인 방식으로 최첨단 AI 모델을 경험할 수 있는 플랫폼을 만들었습니다. 이 프로세서는 단순히 더 빠른 속도에 관한 것이 아닙니다. 창의적인 작업에서 복잡한 문제 해결에 이르기까지 광범위한 작업을 위해 고급 AI 모델과 원활하게 상호 작용할 수 있는 새로운 모바일 AI 경험 시대를 여는 것입니다. Ryzen AI MAX+ 395는 얇고 가벼운 폼 팩터에서 가능한 것을 진정으로 재정의하여 휴대성과 고성능 컴퓨팅 간의 경계를 허뭅니다. 한때 데스크톱 시스템이나 클라우드 서비스에 국한되었던 강력한 AI 모델을 로컬에서 실행할 수 있는 기능은 이동 중에도 혁신과 생산성을 위한 전례 없는 기회를 열어줍니다. 게임, 콘텐츠 제작 또는 일상적인 생산성 등 어떤 분야에서든 이 칩은 게임 체인저입니다.