DeepSeek 해부: 중국 AI 강자의 부상

DeepSeek은 상대적인 무명에서 글로벌 AI 대화의 초점으로 빠르게 부상한 이름으로, 기술 및 금융 부문 내에서 격렬한 논쟁과 추측을 불러일으켰습니다. 이 신흥 세력 배후의 중국 AI 연구소는 기존 질서를 파괴하여 분석가들이 AI 경쟁에서 미국의 지배력 지속 가능성과 현재 AI 칩 수요의 장기적인 생존 가능성에 의문을 제기하게 했습니다. 그러나 DeepSeek을 현재의 위상으로 끌어올린 핵심 요소는 무엇일까요?

DeepSeek의 기원: 헤지 펀드에서 AI 연구소로

DeepSeek의 기원은 양적 금융의 세계와 깊이 얽혀 있습니다. 이 회사는 데이터 기반 거래 결정을 내리는 데 AI를 활용하는 것으로 유명한 중국 헤지 펀드인 High-Flyer Capital Management의 지원을 받습니다.

저장대학교 재학 시절 거래 경력이 있는 AI 열성가인 량원펑은 2015년 High-Flyer를 공동 설립했습니다. 2019년에는 금융 애플리케이션을 위한 AI 알고리즘 개발 및 구현에 특화된 헤지 펀드인 High-Flyer Capital Management를 출시했습니다.

2023년 High-Flyer는 핵심 금융 사업과 독립적으로 운영되는 전용 AI 연구소인 DeepSeek을 인큐베이션했습니다. 그 후 High-Flyer를 주요 투자자로 하여 연구소는 별도의 법인으로 분사되었고 DeepSeek이라는 이름을 유지했습니다.

DeepSeek은 처음부터 모델 훈련을 용이하게 하기 위해 자체 데이터 센터 클러스터 구축을 우선시했습니다. 그러나 중국에서 운영되는 다른 AI 회사와 마찬가지로 DeepSeek은 첨단 하드웨어에 대한 미국의 수출 제한으로 인해 어려움을 겪었습니다. 결과적으로 회사는 최신 모델을 훈련하기 위해 미국 회사에서 쉽게 사용할 수 있는 H100 칩의 성능이 낮은 변형인 Nvidia H800 칩을 사용해야 했습니다.

DeepSeek의 기술 팀은 젊음과 역동성으로 유명합니다. 이 회사는 중국 최고의 대학에서 박사급 AI 연구원을 적극적으로 채용합니다. 또한 DeepSeek은 컴퓨터 과학 전문 지식이 없는 사람들을 포함하여 다양한 배경을 가진 사람들을 고용하여 기술이 광범위한 주제를 효과적으로 이해하고 처리할 수 있도록 한다고 The New York Times는 보도했습니다.

DeepSeek의 AI 모델: 현상 타파

DeepSeek은 2023년 11월에 DeepSeek Coder, DeepSeek LLM 및 DeepSeek Chat이라는 초기 모델 제품군을 공개했습니다. 그러나 AI 업계의 관심을 진정으로 사로잡은 것은 봄에 출시된 차세대 DeepSeek-V2 모델 제품군이었습니다.

텍스트와 이미지를 모두 분석할 수 있는 다용도 시스템인 DeepSeek-V2는 다양한 AI 벤치마크에서 인상적인 성능을 입증했습니다. 특히, 당시 사용 가능한 경쟁 모델에 비해 훨씬 낮은 비용으로 이 성능을 달성했습니다. 이로 인해 ByteDance 및 Alibaba를 포함한 DeepSeek의 국내 경쟁업체는 일부 모델의 가격을 인하하고 다른 모델은 완전히 무료로 제공하게 되었습니다.

DeepSeek V3는 Meta의 Llama와 같은 다운로드 가능한 오픈 소스 모델과 OpenAI의 GPT-4o와 같이 API를 통해서만 액세스할 수 있는 “폐쇄형” 모델 모두에 비해 우수한 성능을 보여주었습니다.

마찬가지로 주목할 만한 것은 DeepSeek의 R1 “추론” 모델입니다. 1월에 출시된 DeepSeek은 R1이 주요 벤치마크에서 OpenAI의 o1 모델과 비슷한 성능을 달성한다고 주장합니다.

추론 모델인 R1은 자체 검사 메커니즘을 통합하여 표준 모델과 관련된 일반적인 함정 중 일부를 완화합니다. 추론 모델은 솔루션에 도달하는 데 약간 더 긴 처리 시간(수초에서 수분)이 필요할 수 있지만 물리학, 과학 및 수학과 같은 영역에서 더 큰 신뢰성을 나타내는 경향이 있습니다.

그러나 R1 및 DeepSeek V3를 포함한 DeepSeek의 모델은 응답이 “핵심 사회주의 가치”와 일치하는지 확인하는 중국 인터넷 규제 기관의 감독을 받습니다. 예를 들어 DeepSeek의 챗봇 앱에서 R1은 천안문 광장 또는 대만의 자치권에 대한 질문을 해결하지 않습니다.

3월에 DeepSeek의 웹사이트 트래픽은 1,650만 건을 초과했습니다. Similarweb의 편집장인 David Carr에 따르면 트래픽이 2월에 비해 25% 감소했지만 DeepSeek은 일일 방문 수 측면에서 2위를 차지했습니다. 그러나 이 수치는 3월에 5억 명 이상의 주간 활성 사용자를 넘어선 ChatGPT에 비하면 여전히 미미한 수준입니다.

AI 환경에 대한 파괴적인 접근 방식

DeepSeek의 비즈니스 모델은 다소 불가사의합니다. 이 회사는 제품과 서비스 가격을 시장 가치보다 훨씬 낮게 책정하고 일부는 무료로 제공하기도 합니다. 또한 벤처 캐피털 회사의 상당한 관심에도 불구하고 외부 자금 조달을 거부했습니다.

DeepSeek은 극심한 비용 경쟁력이 효율성 측면에서 획기적인 발전을 이루었기 때문이라고 설명합니다. 그러나 일부 전문가들은 회사가 제공한 수치의 정확성에 의문을 제기했습니다.

그럼에도 불구하고 개발자들은 DeepSeek의 모델을 수용했는데, 이는 전통적인 의미에서 오픈 소스는 아니지만 상업적 용도로 사용할 수 있는 허용 라이선스에 따라 사용할 수 있습니다. Hugging Face의 CEO인 Clem Delangue에 따르면 플랫폼의 개발자는 R1의 파생 모델을 500개 이상 만들어 총 250만 건의 다운로드를 기록했습니다.

더 크고 확고한 경쟁자에 대한 DeepSeek의 성공은 “AI를 뒤엎는” 동시에 “과대 광고”라고 설명되었습니다. 이 회사의 성과는 부분적으로 1월에 Nvidia 주가가 18% 하락한 원인이 되었고 OpenAI CEO인 Sam Altman으로부터 공개적인 반응을 이끌어냈습니다. 3월에 미국 상무부 국은 DeepSeek을 정부 장치에서 금지했다고 Reuters는 보도했습니다.

Microsoft는 기업을 위한 AI 서비스를 통합하는 플랫폼인 Azure AI Foundry 서비스에 DeepSeek을 통합했습니다. Meta의 1분기 실적 발표에서 CEO인 Mark Zuckerberg는 DeepSeek이 Meta의 AI 지출에 미치는 잠재적 영향에 대한 질문을 받았을 때 AI 인프라에 대한 투자가 회사의 “전략적 이점”으로 계속될 것이라고 말했습니다. 3월에 OpenAI는 DeepSeek을 “국가 보조” 및 “국가 통제”로 규정하고 미국 정부가 해당 모델 금지를 고려할 것을 권고했습니다.

Nvidia의 4분기 실적 발표에서 CEO인 Jensen Huang은 DeepSeek의 “뛰어난 혁신”을 강조하면서 추론 모델에는 훨씬 더 많은 컴퓨팅 성능이 필요하여 Nvidia에 도움이 된다고 언급했습니다.

반대로 한국과 뉴욕 주를 포함한 일부 회사, 국가 및 정부는 정부 장치에서 DeepSeek 사용을 금지했습니다.

5월에 Microsoft 부회장 겸 사장인 Brad Smith는 상원 청문회에서 데이터 보안 및 잠재적 선전에 대한 우려로 인해 Microsoft 직원이 DeepSeek을 사용하는 것이 금지되어 있다고 증언했습니다.

DeepSeek의 불확실한 미래

DeepSeek의 미래 궤적은 불확실합니다. 모델 개선이 더 예상되지만 미국 정부는 인식되는 유해한 외국 영향력에 대해 점점 더 경계하는 것으로 보입니다. 3월에 The Wall Street Journal은 미국이 정부 장치에서 DeepSeek을 금지할 가능성이 높다고 보도했습니다.

DeepSeek의 급속한 부상은 경쟁 역학과 파괴적인 혁신의 잠재력에 대한 재평가를 촉구하면서 AI 산업의 기반을 확실히 흔들었습니다. 증가하는 감시와 규제 문제에 직면하여 현재의 추진력을 유지할 수 있을지는 두고 봐야 합니다. 향후 몇 년은 글로벌 AI 환경에 대한 DeepSeek의 장기적인 영향력을 결정하는 데 중추적인 역할을 할 것입니다. 기술 발전, 지정학적 고려 사항 및 윤리적 우려의 복잡한 상호 작용을 탐색하는 능력이 궁극적으로 그 유산을 정의할 것입니다. AI 세계는 면밀히 지켜볼 것입니다.

DeepSeek 이야기는 빠르게 진화하는 인공 지능 세계에서 새로운 플레이어가 빠르게 등장하여 기존 질서에 도전할 수 있음을 상기시켜 줍니다. 혁신적인 기술과 전통적인 비즈니스 모델을 파괴하려는 의지로 추진된 회사의 성공은 업계의 관심을 끌었습니다. DeepSeek이 계속 개발하고 범위를 확장함에 따라 AI의 미래를 형성하는 데 중요한 역할을 할 것입니다.

DeepSeek의 기원: 헤지 펀드에서 AI 연구소로

DeepSeek은 상대적인 무명에서 글로벌 AI 대화의 초점으로 빠르게 부상한 이름으로, 기술 및 금융 부문 내에서 격렬한 논쟁과 추측을 불러일으켰습니다. 이 신흥 세력 배후의 중국 AI 연구소는 기존 질서를 파괴하여 분석가들이 AI 경쟁에서 미국의 지배력 지속 가능성과 현재 AI 칩 수요의 장기적인 생존 가능성에 의문을 제기하게 했습니다. 그러나 DeepSeek을 현재의 위상으로 끌어올린 핵심 요소는 무엇일까요?

DeepSeek의 기원은 양적 금융의 세계와 깊이 얽혀 있습니다. 이 회사는 데이터 기반 거래 결정을 내리는 데 AI를 활용하는 것으로 유명한 중국 헤지 펀드인 High-Flyer Capital Management의 지원을 받습니다.

저장대학교 재학 시절 거래 경력이 있는 AI 열성가인 량원펑은 2015년 High-Flyer를 공동 설립했습니다. 2019년에는 금융 애플리케이션을 위한 AI 알고리즘 개발 및 구현에 특화된 헤지 펀드인 High-Flyer Capital Management를 출시했습니다.

2023년 High-Flyer는 핵심 금융 사업과 독립적으로 운영되는 전용 AI 연구소인 DeepSeek을 인큐베이션했습니다. 그 후 High-Flyer를 주요 투자자로 하여 연구소는 별도의 법인으로 분사되었고 DeepSeek이라는 이름을 유지했습니다.

DeepSeek은 처음부터 모델 훈련을 용이하게 하기 위해 자체 데이터 센터 클러스터 구축을 우선시했습니다. 그러나 중국에서 운영되는 다른 AI 회사와 마찬가지로 DeepSeek은 첨단 하드웨어에 대한 미국의 수출 제한으로 인해 어려움을 겪었습니다. 결과적으로 회사는 최신 모델을 훈련하기 위해 미국 회사에서 쉽게 사용할 수 있는 H100 칩의 성능이 낮은 변형인 Nvidia H800 칩을 사용해야 했습니다.

DeepSeek의 기술 팀은 젊음과 역동성으로 유명합니다. 이 회사는 중국 최고의 대학에서 박사급 AI 연구원을 적극적으로 채용합니다. 또한 DeepSeek은 컴퓨터 과학 전문 지식이 없는 사람들을 포함하여 다양한 배경을 가진 사람들을 고용하여 기술이 광범위한 주제를 효과적으로 이해하고 처리할 수 있도록 한다고 The New York Times는 보도했습니다.

DeepSeek의 AI 모델: 현상 타파

DeepSeek은 2023년 11월에 DeepSeek Coder, DeepSeek LLM 및 DeepSeek Chat이라는 초기 모델 제품군을 공개했습니다. 그러나 AI 업계의 관심을 진정으로 사로잡은 것은 봄에 출시된 차세대 DeepSeek-V2 모델 제품군이었습니다.

텍스트와 이미지를 모두 분석할 수 있는 다용도 시스템인 DeepSeek-V2는 다양한 AI 벤치마크에서 인상적인 성능을 입증했습니다. 특히, 당시 사용 가능한 경쟁 모델에 비해 훨씬 낮은 비용으로 이 성능을 달성했습니다. 이로 인해 ByteDance 및 Alibaba를 포함한 DeepSeek의 국내 경쟁업체는 일부 모델의 가격을 인하하고 다른 모델은 완전히 무료로 제공하게 되었습니다.

DeepSeek V3는 Meta의 Llama와 같은 다운로드 가능한 오픈 소스 모델과 OpenAI의 GPT-4o와 같이 API를 통해서만 액세스할 수 있는 "폐쇄형" 모델 모두에 비해 우수한 성능을 보여주었습니다.

마찬가지로 주목할 만한 것은 DeepSeek의 R1 "추론" 모델입니다. 1월에 출시된 DeepSeek은 R1이 주요 벤치마크에서 OpenAI의 o1 모델과 비슷한 성능을 달성한다고 주장합니다.

추론 모델인 R1은 자체 검사 메커니즘을 통합하여 표준 모델과 관련된 일반적인 함정 중 일부를 완화합니다. 추론 모델은 솔루션에 도달하는 데 약간 더 긴 처리 시간(수초에서 수분)이 필요할 수 있지만 물리학, 과학 및 수학과 같은 영역에서 더 큰 신뢰성을 나타내는 경향이 있습니다.

그러나 R1 및 DeepSeek V3를 포함한 DeepSeek의 모델은 응답이 "핵심 사회주의 가치"와 일치하는지 확인하는 중국 인터넷 규제 기관의 감독을 받습니다. 예를 들어 DeepSeek의 챗봇 앱에서 R1은 천안문 광장 또는 대만의 자치권에 대한 질문을 해결하지 않습니다.

3월에 DeepSeek의 웹사이트 트래픽은 1,650만 건을 초과했습니다. Similarweb의 편집장인 David Carr에 따르면 트래픽이 2월에 비해 25% 감소했지만 DeepSeek은 일일 방문 수 측면에서 2위를 차지했습니다. 그러나 이 수치는 3월에 5억 명 이상의 주간 활성 사용자를 넘어선 ChatGPT에 비하면 여전히 미미한 수준입니다.

AI 환경에 대한 파괴적인 접근 방식

DeepSeek의 비즈니스 모델은 다소 불가사의합니다. 이 회사는 제품과 서비스 가격을 시장 가치보다 훨씬 낮게 책정하고 일부는 무료로 제공하기도 합니다. 또한 벤처 캐피털 회사의 상당한 관심에도 불구하고 외부 자금 조달을 거부했습니다.

DeepSeek은 극심한 비용 경쟁력이 효율성 측면에서 획기적인 발전을 이루었기 때문이라고 설명합니다. 그러나 일부 전문가들은 회사가 제공한 수치의 정확성에 의문을 제기했습니다.

그럼에도 불구하고 개발자들은 DeepSeek의 모델을 수용했는데, 이는 전통적인 의미에서 오픈 소스는 아니지만 상업적 용도로 사용할 수 있는 허용 라이선스에 따라 사용할 수 있습니다. Hugging Face의 CEO인 Clem Delangue에 따르면 플랫폼의 개발자는 R1의 파생 모델을 500개 이상 만들어 총 250만 건의 다운로드를 기록했습니다.

더 크고 확고한 경쟁자에 대한 DeepSeek의 성공은 "AI를 뒤엎는" 동시에 "과대 광고"라고 설명되었습니다. 이 회사의 성과는 부분적으로 1월에 Nvidia 주가가 18% 하락한 원인이 되었고 OpenAI CEO인 Sam Altman으로부터 공개적인 반응을 이끌어냈습니다. 3월에 미국 상무부 국은 DeepSeek을 정부 장치에서 금지했다고 Reuters는 보도했습니다.

Microsoft는 기업을 위한 AI 서비스를 통합하는 플랫폼인 Azure AI Foundry 서비스에 DeepSeek을 통합했습니다. Meta의 1분기 실적 발표에서 CEO인 Mark Zuckerberg는 DeepSeek이 Meta의 AI 지출에 미치는 잠재적 영향에 대한 질문을 받았을 때 AI 인프라에 대한 투자가 회사의 "전략적 이점"으로 계속될 것이라고 말했습니다. 3월에 OpenAI는 DeepSeek을 "국가 보조" 및 "국가 통제"로 규정하고 미국 정부가 해당 모델 금지를 고려할 것을 권고했습니다.

Nvidia의 4분기 실적 발표에서 CEO인 Jensen Huang은 DeepSeek의 "뛰어난 혁신"을 강조하면서 추론 모델에는 훨씬 더 많은 컴퓨팅 성능이 필요하여 Nvidia에 도움이 된다고 언급했습니다.

반대로 한국과 뉴욕 주를 포함한 일부 회사, 국가 및 정부는 정부 장치에서 DeepSeek 사용을 금지했습니다.

5월에 Microsoft 부회장 겸 사장인 Brad Smith는 상원 청문회에서 데이터 보안 및 잠재적 선전에 대한 우려로 인해 Microsoft 직원이 DeepSeek을 사용하는 것이 금지되어 있다고 증언했습니다.

DeepSeek의 불확실한 미래

DeepSeek의 미래 궤적은 불확실합니다. 모델 개선이 더 예상되지만 미국 정부는 인식되는 유해한 외국 영향력에 대해 점점 더 경계하는 것으로 보입니다. 3월에 The Wall Street Journal은 미국이 정부 장치에서 DeepSeek을 금지할 가능성이 높다고 보도했습니다.

DeepSeek의 급속한 부상은 경쟁 역학과 파괴적인 혁신의 잠재력에 대한 재평가를 촉구하면서 AI 산업의 기반을 확실히 흔들었습니다. 증가하는 감시와 규제 문제에 직면하여 현재의 추진력을 유지할 수 있을지는 두고 봐야 합니다. 향후 몇 년은 글로벌 AI 환경에 대한 DeepSeek의 장기적인 영향력을 결정하는 데 중추적인 역할을 할 것입니다. 기술 발전, 지정학적 고려 사항 및 윤리적 우려의 복잡한 상호 작용을 탐색하는 능력이 궁극적으로 그 유산을 정의할 것입니다. AI 세계는 면밀히 지켜볼 것입니다.

DeepSeek 이야기는 빠르게 진화하는 인공 지능 세계에서 새로운 플레이어가 빠르게 등장하여 기존 질서에 도전할 수 있음을 상기시켜 줍니다. 혁신적인 기술과 전통적인 비즈니스 모델을 파괴하려는 의지로 추진된 회사의 성공은 업계의 관심을 끌었습니다. DeepSeek이 계속 개발하고 범위를 확장함에 따라 AI의 미래를 형성하는 데 중요한 역할을 할 것입니다.