AI 전장: DeepSeek R1이 촉발한 글로벌 반응

2025년 초, 인공지능(AI) 분야에서 지각 변동을 일으킨 사건이 발생했습니다. 바로 중국의 DeepSeek 팀이 개발한 DeepSeek-R1이 공개된 것입니다. 6,710억 개의 파라미터를 가진 이 오픈 소스 언어 모델은 수학, 프로그래밍, 논리 추론과 같은 중요한 영역에서 OpenAI의 선두 모델과 경쟁하며 빠르게 강력한 경쟁자로 자리매김했습니다. DeepSeek-R1은 강화 학습을 활용하여 복잡한 문제를 해결하는 능력이 특히 주목받았습니다. 또한 MIT 라이선스를 채택하여 상업적 장벽을 허물면서 업계에 큰 파장을 일으켰습니다. DeepSeek-R1의 등장은 기술 업계는 물론 금융 시장에도 영향을 미쳐 출시 후 일주일 만에 AI 주식의 상당한 하락을 초래한 것으로 알려졌습니다.

DeepSeek-R1은 중국의 고급 언어 모델 분야에서 오픈 소스 AI 운동의 상당한 도약을 의미했습니다. 이러한 예상치 못한 도전은 미국과 중국의 글로벌 AI 리더들에게 기술 및 시장 포지셔닝 전략을 가속화하도록 촉발했습니다. 이는 DeepSeek-R1 모델을 중심으로 AI 경쟁을 시작했습니다.

AI 분야의 주요 플레이어인 Meta, Google, OpenAI, Anthropic, Alibaba 및 Baidu가 이러한 새로운 경쟁에 어떻게 대응했는지 살펴보겠습니다.

Meta: LLaMA 4로 규모와 효율성 활용

오픈 소스 모델 커뮤니티의 선두 주자인 Meta는 DeepSeek R1에 대응하여 LLaMA 4를 출시했습니다. 2025년 4월, Meta는 Cloudflare와 같은 플랫폼을 통해 API 액세스를 제공하는 가장 강력한 모델인 LLaMA 4를 출시했습니다. LLaMA 4는 MoE (Mixture-of-Experts) 아키텍처를 사용하여 모델을 하위 모델로 나누고 각 추론 중에 일부만 활성화합니다. 이 설계는 대규모 파라미터와 추론 효율성의 균형을 맞춥니다.

LLaMA 4 시리즈는 총 1,090억 개의 파라미터 중 170억 개의 활성 파라미터만 사용하여 단일 H100 카드에서 실행할 수 있는 "Scout"를 포함한 여러 하위 모델을 제공합니다. "Maverick" 모델은 총 4,000억 개의 파라미터 (128명의 전문가)를 가지지만 여전히 170억 개의 활성 파라미터만 필요하므로 DGX 클러스터가 필요합니다. 이 설계를 통해 LLaMA 4는 최대 1,000만 개의 토큰 컨텍스트 창을 지원할 수 있으므로 이러한 기능을 제공하는 최초의 오픈 소스 모델 중 하나입니다. 이는 긴 문서를 요약하고 대규모 코드 저장소를 분석하는 데 특히 유용합니다.

LLaMA 4는 MoE 아키텍처 덕분에 빠른 응답 시간을 유지하고 이미지, 오디오 및 비디오에 대한 다중 모드 입력을 지원합니다. Meta는 DeepSeek가 추론 기능에 집중하는 동안 개방형 소스 부문에서 입지를 강화하기 위해 효율성 전략을 선택하여 다중 모드 기능을 강화하고 운영을 간소화했습니다.

Google: 자율 지능 에이전트로의 Gemini 진화

OpenAI와 DeepSeek의 복합적인 압력에 직면한 Google은 기술 혁신 전략을 선택했습니다. 2025년 2월, Google은 "지능형 에이전트" 기능을 향한 움직임을 알리는 Flash, Pro 및 Lite 버전의 Gemini 2.0 시리즈를 도입했습니다.

Gemini 2.0의 에이전트 기능은 상당한 발전을 나타냅니다. 이 모델은 여러 모드를 이해하고 검색 엔진, 코드 샌드박스 및 웹 검색을 적극적으로 사용할 수 있습니다. Google의 Project Mariner를 통해 AI 기반 Chrome 브라우저 작업을 수행하여 AI가 양식을 작성하고 버튼을 클릭할 수 있습니다.

Google은 또한 에이전트 생태계를 지원하기 위해 서로 다른 지능형 에이전트가 통신하고 협업할 수 있도록 하는 Agent2Agent 프로토콜을 도입했습니다. 또한 타사 개발자의 참여를 장려하기 위해 Agent Garden이라는 도구 및 개발 키트를 만들었습니다.

Google은 DeepSeek 및 OpenAI와의 파라미터 경쟁에 집중하는 대신 AI가 도구 기반 및 자율적 기능으로 진화함에 따라 지능형 에이전트 협업에 집중하여 차세대 핵심 시나리오를 재정의하고 있습니다. Gemini의 진화는 단순한 모델 업그레이드가 아닌 전략적 전환을 나타냅니다.

OpenAI: 신뢰성과 리더십을 위한 모델 반복 및 에코시스템 통합

OpenAI는 DeepSeek R1에 대응하여 모델 반복 및 제품 배포를 가속화했습니다. 2025년 2월, OpenAI는 GPT-4의 중간 버전인 GPT-4.5를 출시하여 논리적 일관성과 사실적 정확성을 개선하는 동시에 GPT-5의 길을 열었습니다.

GPT-4.5는 사고 사슬 추론을 포함하지 않는 마지막 주요 모델로 간주됩니다. GPT-5는 실험적 추론 모델 o3-mini와 GPT 시리즈의 기능을 결합하여 통합된 "일반 인지 모델"을 만듭니다. OpenAI는 또한 GPT-5가 고도로 조정 가능한 지능 수준과 도구 사용 기능을 갖출 것이라고 밝혔습니다.

OpenAI는 사용자가 오픈 소스 대안으로 전환할 위험을 줄이기 위해 ChatGPT의 무료 사용자가 GPT-5의 기본 버전을 사용하도록 허용하고 유료 사용자는 더 고급 기능에 액세스할 수 있도록 결정했습니다. 이 전략은 광범위한 커버리지로 사용자의 참여를 유지하는 것을 목표로 합니다.

OpenAI는 또한 플러그인, 브라우저 및 코드 실행기와 같은 기능을 별도로 유지하는 대신 GPT 코어 모델에 통합하여 "완전한 기능을 갖춘 AI"를 만들고 있습니다. OpenAI는 지능 밀도를 체계적으로 통합하고 높여 R1의 도전에 대응하고 있습니다.

Anthropic: 혼합 추론 및 사고 예산으로 강력한 지능 심화

Anthropic은 2025년 2월에 "혼합 추론"과 "사고 예산"에 중점을 둔 Claude 3.7 Sonnet을 출시했습니다. 사용자는 빠른 응답을 위해 "표준 모드"를 선택하거나 더 깊고 단계별 사고를 위해 "확장 모드"를 활성화할 수 있습니다.

이 방법은 어려운 작업에 직면했을 때 사람들이 "더 많이 생각하는 것"과 유사하며 AI가 정확도를 높이기 위해 더 오래 추론할 수 있도록 합니다. Anthropic은 또한 사용자가 추론 깊이와 호출 비용의 균형을 맞추기 위해 "사고 시간"을 설정할 수 있도록 합니다.

Claude 3.7은 프로그래밍 및 추론과 같은 까다로운 작업에서 이전 버전인 3.5보다 성능이 뛰어나며 추론 프로세스의 투명성에 중점을 두는 업계의 몇 안 되는 모델 중 하나입니다. 또한 코드 기능은 최신 평가에서 70.3%의 정확도를 달성했습니다.

Claude 3.7은 파라미터 스태킹을 추구하는 대신 설명 가능하고 안정적이며 사용자 정의 가능한 사고 패턴을 가진 모델을 만드는 데 중점을 두어 "제어 가능한 지능"에 대한 Anthropic의 약속을 보여줍니다. Anthropic은 R1 중심의 "추론 경쟁"에서 자체 속도로 꾸준히 발전하고 있습니다.

Alibaba: Qwen으로 중국 오픈 소스 에코시스템 구축

Alibaba의 Damo Academy는 DeepSeek R1이 출시된 지 불과 일주일 만에 Qwen 모델 제품군을 빠르게 업데이트하여 2025년 2월에 Qwen 2.5 시리즈를 출시하고 4월 말에 새로운 Qwen 3 시리즈를 출시하여 강력한 제품 응답성과 전략적 비전을 입증했습니다.

Qwen 3 시리즈는 6억 개에서 2,350억 개의 파라미터에 이르는 모델 버전을 포함합니다. MoE 아키텍처를 사용하여 더 적은 컴퓨팅 리소스를 사용하면서 모델 성능을 유지합니다. 플래그십 모델인 Qwen3-235B-A22B는 활성화 파라미터를 최적화하여 4개의 고성능 GPU만 있으면 배포할 수 있으므로 기업이 대규모 모델을 구현하는 데 대한 진입 장벽을 크게 낮출 수 있습니다. 여러 표준 테스트에서 Qwen 3의 전체 성능은 DeepSeek R1, OpenAI o1 및 Gemini 2.5 Pro와 같은 최고의 국제 모델의 성능을 능가합니다.

Alibaba는 기술 경쟁력 외에도 오픈 소스 에코시스템 구축에 큰 중점을 둡니다. Qwen 3는 Apache 2.0 라이선스에 따라 완전히 오픈 소스화되었으며 오픈 가중치, 교육 코드 및 배포 도구를 제공하여 다국어 (119개 언어) 및 다중 모드 애플리케이션을 지원하여 글로벌 개발자가 직접 사용하고 사용자 정의할 수 있는 기본 모델을 만드는 것을 목표로 합니다.

Alibaba의 "기술 + 에코시스템" 전략은 DeepSeek의 가벼운 혁신 스타일을 보완합니다. 하나는 빠른 반복과 선도적인 추론을 강조하는 반면 다른 하나는 에코시스템 구축과 규모와 다양성의 균형을 강조합니다. Qwen은 국내 시장에서 오픈 소스 대규모 모델의 "에코시스템 허브"로 점차 자리매김하고 있으며 DeepSeek로 인한 산업 혼란에 대한 꾸준한 대응입니다.

Baidu: ERNIE Bot 업그레이드로 다중 모드 및 플러그인 도구 강화

Baidu는 3월에 주력 모델인 ERNIE Bot를 크게 업그레이드하여 ERNIE Bot 4.5와 ERNIE X1을 공개 테스트용으로 출시했습니다. ERNIE X1은 AI의 복잡한 작업을 이해, 계획 및 실행하는 능력을 향상시키는 데 중점을 둔 "심층 사고 모델"로 포지셔닝됩니다.

ERNIE 4.5는 텍스트, 이미지, 오디오 및 비디오의 공동 모델링을 지원하는 Baidu의 최초의 기본 다중 모드 대규모 모델입니다. 이 버전은 또한 환각 생성을 크게 줄이고 코드 이해 및 논리적 추론을 개선하여 여러 중국 시나리오 작업에서 GPT-4.5 수준을 능가합니다.

Baidu는 더욱 유용한 "AI 도구 에코시스템"을 구축하고 있습니다. X1 모델은 검색, 문서 Q&A, PDF 읽기, 코드 실행, 이미지 인식, 웹 액세스 및 비즈니스 정보 쿼리 기능을 사용하여 AI의 "실질적인 능력"을 진정으로 실현하여 Google Gemini의 에이전트 경로를 반영합니다.

Baidu는 또한 2025년 6월 말까지 ERNIE 모델의 일부 파라미터를 오픈 소스화하고 엔터프라이즈급 고객과의 애플리케이션 통합을 더욱 확장할 것이라고 발표했습니다. ERNIE 시리즈는 폐쇄 루프 제품에서 API 및 플러그인 시스템을 통해 개발자와 기업을 유치하는 플랫폼 에코시스템으로 전환되고 있습니다.

Baidu는 오픈 소스 공간에서 R1 및 Qwen과 직접 경쟁하는 대신 중국 콘텐츠, 검색 서비스 및 지식 그래프에 대한 깊은 축적을 활용하여 검색, 사무실 및 정보 흐름과 같은제품 시나리오와 모델을 심층적으로 통합하여 더욱 현지화된 AI 제품 포트폴리오를 만들고 있습니다.

요약하자면 DeepSeek R1의 출시는 단순한 기술적 돌파구 그 이상이었습니다. 글로벌 AI 분야의 촉매제였습니다. 이는 거대 기업이 추론 성능을 개선하도록 강요하고, 국내 기업이 오픈 소스를 위해 경쟁하도록 자극하고, 미국 기업이 에이전트, 통합 및 다중 모드 개발을 가속화하도록 촉발했습니다.

중국과 미국 AI 거대 기업의 대응은 다르지만 목표는 동일합니다. 더 강력하고 안정적이며 유연한 대규모 모델을 만들고 기술, 에코시스템 및 사용자의 세 가지 경쟁에서 승리하는 것입니다. 이 과정은 아직 끝나지 않았습니다. GPT-5, Gemini 3, Claude 4, 심지어 DeepSeek R2 및 Qwen 4가 차례로 출시됨에 따라 글로벌 AI는 "나선형 상승"의 새로운 단계에 진입하고 있습니다.

엔터프라이즈 사용자와 개발자에게 이 경쟁은 더 많은 선택, 더 낮은 비용, 더 강력한 대규모 모델 도구를 제공할 것입니다. 글로벌 AI 기능은 전례 없는 속도로 확산되고 민주화되고 있으며 다음 획기적인 기술 발전이 이미 진행 중일 수 있습니다.