텐센트, 딥시크-R1 능가하는 AI 추론 모델 공개

강화 학습 활용

Tencent의 Hunyuan T1의 핵심은 대규모 강화 학습 활용에 있습니다. DeepSeek의 R1 모델의 초석이기도 한 이 기술은 AI가 반복적인 상호 작용과 피드백을 통해 추론 능력을 학습하고 향상시킬 수 있도록 합니다. 이 접근 방식은 인간이 시행착오를 통해 학습하는 방식을 반영하여 모델이 시간이 지남에 따라 이해 및 의사 결정 프로세스를 개선할 수 있도록 합니다.

벤치마크 성능: 정면 비교

경쟁이 치열한 AI 세계에서 벤치마크 테스트는 모델의 기능을 나타내는 중요한 지표 역할을 합니다. Hunyuan T1은 몇 가지 주요 벤치마크에서 강력한 성능을 보여주었습니다.

  • MMLU Pro: 모델의 전반적인 지식 기반을 평가하는 MMLU(Massive Multitask Language Understanding) Pro 벤치마크에서 T1은 87.2라는 인상적인 점수를 달성했습니다. 이는 DeepSeek-R1의 84점을 능가하지만 89.3점을 기록한 OpenAI의 o1에는 약간 못 미칩니다.

  • AIME 2024: AIME(American Invitational Mathematics Examination) 2024에서 T1은 78.2점으로 수학적 능력을 입증했습니다. 이는 R1의 79.8점 바로 뒤에 있고 o1의 79.2점보다 약간 앞서 복잡한 문제 해결에서 경쟁 우위를 보여줍니다.

  • C-Eval: 중국어 능력에 있어서 T1은 진정으로 빛을 발합니다. C-Eval 제품군 평가에서 91.8점이라는 놀라운 점수를 얻어 R1의 점수와 일치하고 o1의 87.8점을 능가했습니다. 이는 T1이 중국어의 뉘앙스를 이해하고 처리하는 데 강점이 있음을 강조합니다.

가격: 경쟁 우위

성능 외에도 가격은 AI 모델의 채택 및 접근성에 중요한 역할을 합니다. Tencent의 T1은 DeepSeek의 제품과 일치하는 경쟁력 있는 가격 구조를 제공합니다.

  • 입력: T1은 입력 토큰 100만 개당 1위안(약 0.14달러)을 청구합니다. 이 요금은 R1의 주간 요금과 동일하며 주간 출력 요금보다 훨씬 낮습니다.

  • 출력: 출력의 경우 T1은 토큰 100만 개당 4위안입니다. R1의 주간 출력 요금은 더 높지만(토큰 100만 개당 16위안), 야간 요금은 T1의 가격과 일치합니다.

이러한 경쟁력 있는 가격 책정 전략은 T1을 비용 효율적인 AI 솔루션을 찾는 기업과 개발자에게 매력적인 옵션으로 만듭니다.

하이브리드 아키텍처: 새로운 접근 방식

Tencent는 T1 아키텍처에 혁신적인 접근 방식을 채택하여 Google의 Transformer와 Mamba를 결합한 하이브리드 모델을 업계 최초로 채택했습니다. 이 독특한 조합은 다음과 같은 몇 가지 이점을 제공합니다.

  • 비용 절감: 순수 Transformer 아키텍처와 비교하여 하이브리드 접근 방식은 Tencent가 주장하는 바와 같이 “훈련 및 추론 비용을 크게 절감”합니다. 이는 대규모 AI 모델 배포의 중요한 요소인 메모리 사용량을 최적화하여 달성됩니다.

  • 향상된 긴 텍스트 처리: T1은 “긴 텍스트 정보를 캡처하는 기능을 보장하면서 리소스 소비를 크게 줄일 수 있다”고 자랑합니다. 이는 디코딩 속도가 200% 증가하여 긴 문서와 복잡한 데이터 세트를 처리하는 데 특히 적합합니다.

실제 테스트: 강점과 약점

기술 블로그에서 수행한 독립적인 테스트는 T1의 기능과 한계에 대한 추가 통찰력을 제공합니다.

  • NCJRYDS: NCJRYDS의 R1과의 직접 비교에서 T1은 강점과 약점을 모두 보여주었습니다. 고대 중국 시를 작곡하는 데는 부족했지만 다양한 맥락에서 중국어를 해석하는 데 탁월했습니다. 이는 모델의 창의적인 글쓰기 기술이 더 개선되어야 함에도 불구하고 언어에 대한 미묘한 이해를 강조합니다.

  • GoPlayAI: 또 다른 블로그인 GoPlayAI는 T1에 네 가지 수학 문제를 제시했습니다. 이 모델은 세 가지를 성공적으로 해결했지만 가장 어려운 문제에는 어려움을 겪었고 결국 5분간의 처리 후에도 정답을 제공하지 못했습니다. 이는 T1이 강력한 수학적 능력을 가지고 있지만 예외적으로 복잡한 문제에 직면했을 때 한계에 직면할 수 있음을 시사합니다.

핵심 수익원으로서의 AI

Tencent는 AI를 미래 성장의 핵심 축으로 전략적으로 포지셔닝하고 있습니다. DeepSeek-R1을 클라우드 플랫폼과 Yuanbao 챗봇에 통합하고 자체 Hunyuan 모델과 함께 통합하는 것은 다양한 AI 솔루션을 제공하려는 회사의 노력을 보여줍니다.

‘더블 코어’ 전략

Tencent의 회장 겸 CEO인 Pony Ma Huateng은 DeepSeek이 ‘독립적이고 진정으로 오픈 소스이며 무료인 제품’을 만드는 데 전념하는 것에 대해 공개적으로 감탄을 표했습니다. 이러한 정서는 AI 영역에서 DeepSeek의 모델과 자체 Yuanbao 모델을 모두 활용하는 Tencent의 ‘더블 코어’ 전략을 반영합니다. 이 접근 방식은 내부 개발 타이틀과 독립 스튜디오의 타이틀을 모두 홍보하여 역동적이고 경쟁적인 생태계를 조성하는 비디오 게임 산업에서 Tencent의 성공적인 전략을 반영합니다.

강화 학습에 대한 심층 분석

Hunyuan T1과 DeepSeek-R1 모두에서 대규모 강화 학습을 사용하는 것은 더 자세히 살펴볼 가치가 있습니다. 이 기술은 AI 에이전트가 환경으로부터 받은 피드백을 기반으로 자신의 행동을 최적화하는 방법을 배우는 순차적 의사 결정과 관련된 작업에 특히 적합합니다.

AI 추론의 맥락에서 강화 학습은 다음과 같은 작업에 적용될 수 있습니다.

  • 게임 플레이: 전략적 계획과 장기적인 의사 결정이 중요한 Go 또는 체스와 같은 복잡한 게임에서 AI 에이전트가 탁월하도록 훈련합니다.

  • 로봇 공학: 로봇이 복잡한 환경을 탐색하고, 물체와 상호 작용하고, 변화하는 조건에 적응해야 하는 작업을 수행할 수 있도록 합니다.

  • 자연어 처리: 대화 관리 및 텍스트 요약과 같은 작업을 포함하여 인간 언어를 이해하고 생성하는 AI 모델의 능력을 향상시킵니다.

강화 학습을 활용함으로써 T1과 R1은 단순한 패턴 인식을 넘어선 복잡한 추론 문제를 해결할 수 있습니다. 최적의 결과를 얻기 위해 전략을 적극적으로 학습하고 조정할 수 있습니다.

하이브리드 아키텍처의 중요성

Tencent가 Google의 Transformer와 Mamba를 결합한 하이브리드 아키텍처를 선구적으로 사용한 것은 AI 모델 설계의 중요한 발전을 나타냅니다.

  • Transformer: 주의 메커니즘으로 유명한 Transformer 아키텍처는 자연어 처리에 혁명을 일으켰습니다. 이를 통해 모델은 정보를 처리할 때 입력 시퀀스의 다른 부분에 집중할 수 있으므로 단어 간의 컨텍스트와 관계를 더 잘 이해할 수 있습니다.

  • Mamba: 반면에 Mamba는 Transformer의 한계, 특히 긴 시퀀스 처리의 한계를 해결하는 보다 최근의 아키텍처입니다. 메모리 사용량과 계산 비용 측면에서 향상된 효율성을 제공하므로 많은 양의 데이터를 처리하는 데 적합합니다.

이 두 아키텍처를 결합함으로써 T1은 Transformer의 컨텍스트 이해와 Mamba의 효율성이라는 두 가지 장점을 모두 활용하는 것을 목표로 합니다. 이 하이브리드 접근 방식은 AI 추론, 특히 길고 복잡한 텍스트를 처리하는 작업에서 새로운 가능성을 열 수 있습니다.

Tencent의 AI 추진의 광범위한 의미

Tencent의 AI 분야에 대한 공격적인 추진은 글로벌 기술 환경에 더 광범위한 영향을 미칩니다.

  • 경쟁 심화: DeepSeek-R1의 강력한 경쟁자로 T1이 등장하면서 AI 추론 분야의 경쟁이 심화됩니다. 이러한 경쟁은 더 강력하고 효율적인 AI 모델의 개발을 가속화하고 추가 혁신을 주도할 가능성이 높습니다.

  • AI의 민주화: T1에 대한 Tencent의 경쟁력 있는 가격 책정 전략은 AI의 민주화에 기여하여 더 광범위한 기업과 개발자가 고급 AI 기능에 더 쉽게 접근할 수 있도록 합니다. 이는 다양한 산업 분야에서 AI 기반 애플리케이션 및 서비스의 급증으로 이어질 수 있습니다.

  • 중국의 AI 야망: AI 분야에서 Tencent의 발전은 이 분야에서 중국의 커져가는 야망을 강조합니다. 중국은 AI 기술의 글로벌 리더가 되는 것을 목표로 AI 연구 개발에 막대한 투자를 하고 있습니다.

  • 윤리적 고려 사항: AI 모델이 더욱 강력해짐에 따라 개발 및 배포를 둘러싼 윤리적 고려 사항이 점점 더 중요해지고 있습니다. AI가 책임감 있게 사용되고 사회에 이익이 되도록 편견, 공정성, 투명성 및 책임과 같은 문제를 해결해야 합니다.

Hunyuan T1의 출시는 Tencent의 AI 여정에서 중요한 이정표입니다. 모델의 강력한 성능, 경쟁력 있는 가격 및 혁신적인 아키텍처는 빠르게 진화하는 AI 추론 분야에서 강력한 경쟁자로 자리매김합니다. Tencent가 AI 연구 개발에 계속 투자함에 따라 이 혁신적인 기술의 미래를 형성하는 데 중요한 역할을 할 준비가 되어 있습니다.