중국 오픈소스의 융합
지난 2월, 중국의 오픈소스 거대 모델인 DeepSeek가 전 세계 140개 국가 및 지역의 애플리케이션 마켓 다운로드 차트에서 1위를 차지했을 때 OpenAI는 DeepSeek가 ChatGPT에서 추출한 데이터를 허가 없이 사용했다는 의혹을 공개적으로 제기했습니다.
OpenAI의 명성을 회복하기보다는 이 비난은 전 세계 연구자들로부터 광범위한 조롱을 받았습니다.
이제 ‘증류’ 버프를 완전히 수용한 또 다른 경쟁자가 등장했습니다.
4월 13일, 쿤룬 완웨이는 Skywork-OR1(Open Reasoner 1) 시리즈 모델을 출시하여 동일한 규모의 알리바바 Qwen-32B를 능가하고 DeepSeek-R1과 일치했습니다.
자금력이 제한적인 쿤룬 완웨이가 어떻게 SOTA 수준의 거대 모델을 만들 수 있을까요? 공식적인 설명은 그들의 모델이 DeepSeek-R1-Distill-Qwen-7B와 DeepSeek-R1-Distill-Qwen-32B를 기반으로 한다는 것입니다.
이름에서 알 수 있듯이 DeepSeek의 모델은 알리바바의 Qwen 시리즈 모델을 증류했습니다.
쿤룬 완웨이는 훌륭한 오픈소스 모델을 활용하면서 오픈소스 커뮤니티에도 기여하고 있습니다. 모델 가중치만 오픈소스로 공개한 DeepSeek와 달리 쿤룬 완웨이는 데이터 세트와 훈련 코드도 오픈소스로 공개하여 ‘진정한 오픈소스’의 개념에 더 가깝습니다. 이는 모든 사용자가 모델 훈련 과정을 복제할 수 있다는 의미입니다.
쿤룬 완웨이의 성과는 오픈소스의 가장 중요한 측면을 보여줍니다. 사용자에게 무료로 쉽게 사용할 수 있는 제품을 제공할 뿐만 아니라 더 많은 개발자가 선배들의 어깨 위에 서서 기술을 빠르고 비용 효율적으로 발전시킬 수 있도록 합니다.
사실, 작년의 거대 모델 사전 훈련의 병목 현상에 대한 업계 논의 속에서 중국 거대 모델의 반복 속도는 올해 가속화되었고 점점 더 많은 회사가 오픈소스에 투자하고 있습니다.
알리바바 클라우드의 통이 첸원은 설날 전날 새로운 시각 모델 Qwen2.5-VL을 오픈소스로 공개했고 3월 초에는 새로운 추론 모델 QwQ-32B를 출시하고 오픈소스로 공개하여 오픈소스로 공개된 날 글로벌 주류 AI 오픈소스 커뮤니티 Hugging Face의 트렌드 목록에서 1위를 차지했습니다.
Stepwise는 약 한 달 만에 3개의 멀티모달 거대 모델을 오픈소스로 공개했으며, 가장 최근 모델은 제어 가능한 모션 진폭과 렌즈 움직임으로 비디오 생성을 지원하고 특정 특수 효과 생성 기능도 제공하는 이미지-비디오 모델 Step-Video-TI2V입니다.
Zhipu는 4월에 기본, 추론 및 사색 모델을 포함하는 32B/9B 시리즈 GLM 모델을 MIT 라이선스 계약에 따라 오픈소스로 공개한다고 발표했습니다.
한때 폐쇄적이었던 바이두조차도 6월 30일에 Wenxin 거대 모델을 완전히 오픈소스로 공개할 것이라고 발표했습니다.
국내 오픈소스 생태계의 성장과 비교하여 미국 거대 모델 회사는 여전히 주로 폐쇄형에 집중하고 있어 중국 거대 모델이 해외로 진출할 수 있는 드문 기회를 제공했습니다. DeepSeek를 통해 인도네시아 교육 회사 Ruangguru는 저렴한 비용으로 교육 모델을 최적화할 수 있었습니다. 싱가포르 B2B 여행 기술 회사 Atlas는 Qwen을 지능형 고객 서비스 시스템에 통합하여 연중무휴 다국어 지원을 달성했습니다.
미국은 왜 폐쇄형이고 중국은 오픈소스인가?
미국 AI 산업의 폐쇄형 성향과 중국 AI의 개방성 증가는 양국의 AI 개발 환경의 차이에서 비롯된 불가피한 결과입니다.
미국 AI 산업은 주로 기술 대기업과 VC(벤처 자본가)가 주도하며 AI로부터의 자본 수익에 대한 막대한 기대를 갖고 있습니다. 따라서 미국 AI 모델 회사는 일반적으로 기술 리더십을 추구하고 특정 수준의 시장 독점을 달성한 다음 막대한 이익을 창출한다는 강력한 믿음을 갖고 있으며, 그들의 생태계는 자연스럽게 폐쇄형으로 기울어집니다.
OpenAI의 개발 역사를 예로 들어 보면 설립 초기에는 비영리 단체로 시작했지만 이후 점점 더 폐쇄적으로 변했습니다. GPT-1은 완전히 오픈소스였고, GPT-2는 부분적으로 오픈소스였으며 완전히 오픈소스로 공개되기 전에 반대에 부딪혔으며, GPT-3는 공식적으로 폐쇄형으로 전환되었고, GPT-4는 모델 아키텍처와 훈련 데이터가 완전히 기밀로 유지되고 심지어 기업 사용자의 API 호출 빈도를 제한하는 등 폐쇄형 전략을 더욱 강화했습니다.
OpenAI는 소스 코드를 닫는 것이 규정 준수 및 기술 남용 통제를 기반으로 한다고 말했지만 시장에서는 OpenAI의 폐쇄형 전환의 획기적인 사건은 Microsoft와의 수천억 달러 규모의 협력에 도달하여 GPT-3를 Azure 클라우드 서비스에 내장하여 ‘기술-자본’ 폐쇄 루프를 형성한 것이라고 일반적으로 믿고 있습니다.
Microsoft는 작년 10월 재무 보고서에서 OpenAI에 대한 투자를 처음 공개했을 때 ‘OpenAIGlobal, LLC에 총 130억 달러의 투자 약정을 투자했으며 투자는 지분법을 사용하여 회계 처리됩니다.’라고 밝혔습니다.
소위 지분법은 Microsoft의 OpenAI에 대한 투자가 순수한 자선 연구보다는 수익 획득을 목표로 한다는 점으로도 이해할 수 있습니다. 분명히 폐쇄형 생태계를 통해 고가의 API를 판매하는 것이 OpenAI의 현재 가장 큰 수익원이며 OpenAI가 오픈소스를 꺼리는 가장 큰 장애물이 되었습니다.
OpenAI의 ‘분할’에서 설립된 Anthropic은 처음부터 폐쇄형 경로를 택하기로 결정했으며 대규모 모델 제품인 Claude는 폐쇄형 모델을 완전히 채택했습니다.
미국의 유일한 오픈소스 리더인 META의 Llama조차도 오픈소스로 공개할 때 두 가지 안티-친구 조항을 추가했습니다.
- 오픈소스 모델은 META가 승인하기 전에 월간 활성 사용자 수가 7억 명을 초과하는 제품 및 서비스에 사용할 수 없습니다.
- Llama 모델의 출력 콘텐츠는 다른 대규모 언어 모델을 훈련하고 개선하는 데 사용할 수 없습니다.
오픈소스 모델의 경우에도 Meta의 핵심 목적은 기술 포용성보다는 자체 AI 생태계를 구축하는 것임을 알 수 있습니다.
미국은 자본 수준에서 오픈소스를 보완으로 하는 폐쇄형 기반의 AI 전략을 선택했는데, 이는 순전히 상업적인 고려 사항이라고 할 수 있습니다. 대조적으로 중국의 하향식 최상위 설계는 처음부터 오픈소스를 중요하게 생각했으며, 독립적 통제 개념에 따른 업계 우선 경로를 반영합니다.
일찍이 2017년에 중국 정부는 AI와 경제 및 사회의 심층 통합을 가속화하고 AI 개발의 선점 우위를 구축하기 위해 배포할 것을 명확하게 제안하는 ‘차세대 인공 지능 개발 계획’을 발표했습니다. 2021년에는 오픈소스 관련 콘텐츠가 중국의 ‘14차 5개년 계획’에 명시적으로 포함되어 지방 정부의 기술 혁신을 적극적으로 추진했습니다.
중국 과학 아카데미의 학자인 메이 홍은 언어 모델의 미래 개발은 오픈소스 플랫폼에 의존해야 한다고 말했습니다. 개방된 환경에서만 다양한 산업의 사용자를 위한 데이터 업로드 및 비즈니스 통합의 보안 및 신뢰성을 보장할 수 있습니다.
작년 12월 산업 정보 기술부 및 기타 4개 부서에서 발표한 ‘중소기업의 디지털 역량 강화를 위한 특별 행동 계획(2025-2027)’은 Open Atom Open Source Foundation이 기업의 기술 장벽을 낮추기 위해 재현 가능하고 홍보하기 쉬운 훈련 프레임워크, 테스트 도구 및 기타 리소스를 제공하기 위해 ‘중소기업 AI 오픈소스 특별 프로젝트’를 설립하도록 명확하게 지원합니다.
보다 현실적인 문제는 미국의 잠재적인 기술 봉쇄로 인해 중국은 AI 분야에서 단순히 추종자가 될 수 없으며 독립적인 국내 생태계를 구축해야 한다는 것입니다. 미국이 폐쇄형을 주요 초점으로 삼아 이미 구축한 생태계에서 또 다른 폐쇄형 생태계를 구축하는 것은 문을 닫고 차를 만드는 것과 같습니다. 오픈소스 생태계만이 AI 산업의 발전을 빠르게 도울 수 있습니다.
최고 수준의 지원 외에도 다양한 지방 정부가 오픈소스 생태계에 실제 돈을 투자했습니다.
Zhipu와 Beijing State-owned Assets가 공동으로 설립한 대규모 모델 생태계 투자에 초점을 맞춘 Z Fund는 전 세계 AI 오픈소스 커뮤니티의 개발을 지원하기 위해 3억 위안을 투자할 것이라고 발표했습니다. 오픈소스 모델(Zhipu 오픈소스 모델에 국한되지 않음)을 기반으로 한 모든 스타트업 프로젝트가 신청할 수 있습니다.
AI 산업에 대한 중국과 미국의 오픈소스 및 폐쇄형 전략의 차이는 근본적으로 개발 논리의 근본적인 차이입니다. 미국은 자본에 의해 주도되며 기술 대기업과 VC의 이윤 추구 요구가 ‘기술 독점-고가 실현’의 폐쇄형 생태계를 낳았습니다. Meta가 오픈소스를 시도하더라도 상업적 장벽의 족쇄에서 벗어나기가 어렵습니다. 중국은 ‘기술 형평성 + 산업 협력’을 핵심 개념으로 하는 최상위 설계에 의존하며 정책 권한 부여를 통해 개방형 생태계를 구축하여 오픈소스를 기술 장벽을 낮추고 실물 경제의 통합을 촉진하는 기본 인프라로 만듭니다. 이러한 전략적 선택은 양국의 AI 산업의 다른 경로를 형성할 뿐만 아니라 글로벌 AI 생태계가 ‘독점 경쟁’에서 ‘개방적이고 윈-윈’으로 가속화될 것임을 예고합니다.
충분히 좋은 것이 충분히 좋다
중국의 AI 오픈소스 생태계는 중국과 세계의 AI 산업화 발전을 가속화할 뿐만 아니라 미국의 기술 우선주의 신념을 어색한 함정에 빠뜨리고 있습니다.
DeepSeek 효과로 인한 압력이 증가함에 따라 Meta는 4월 5일에 Llama4를 출시하여 역사상 가장 강력한 멀티모달 거대 모델이라고 주장했습니다.
그러나 실제 테스트 후에는 실망스러운 모델입니다. 1천만 개의 토큰의 컨텍스트 길이는 종종 잘못되고 초기 볼 테스트는 완료하기 어렵고 9.11 > 9.9 비교 크기 오류가 발생합니다. 모델 출시 후 며칠 만에 임원 사임 및 테스트 부정 행위와 같은 스캔들도 내부 직원에 의해 확인되었습니다.
더 많은 뉴스는 Llama4가 Zuckerberg가 서둘러 선반에 올린 제품이라고 말할 수 있음을 증명합니다. 그렇다면 Zuckerberg는 왜 4월에 출시해야 했을까요?
앞서 언급했듯이 미국 AI 산업은 제품이 가장 강력하고 가장 진보되어야 한다고 믿는 혼란스러운 기술 신념을 갖고 있어 군비 경쟁을 시작했습니다. 그러나 AI 훈련의 한계 효력이 감소함에 따라 대규모 제조업체는 막대한 비용을 소비하고 기술 장벽이 구축되지 않았을 뿐만 아니라 컴퓨팅 능력 병목 현상의 수렁에 빠졌습니다.
OpenAI가 GPT-4o의 이미지 생성 기능을 출시한 후 Altman은 며칠 후 GPU가 ‘소진’되고 있다고 트윗했습니다. Gemini2.5가 출시된 지 일주일도 채 안 되어 GoogleAIStudio의 책임자는 여전히 ‘속도 제한’으로 어려움을 겪고 있으며 개발자는 분당 20개의 요청만 보낼 수 있다고 말했습니다. 어떤 회사도 초거대 모델의 추론 요구 사항에 대처할 수 없는 것 같습니다.
사실 미국은 오해에 빠지고 있습니다. Zhiyuan Research Institute의 담당자는 ‘새로운 모델이 10점 벤치마크 점수 증가를 실행하기 위해 100배의 비용을 사용하는 경우 비용 성능이 없기 때문에 이 새로운 모델은 80% 이상의 응용 시나리오에서 의미가 없습니다.’라고 말했습니다.
중국 대규모 모델 회사는 오픈소스 생태계를 가속화하고 있습니다. 그들은 더 이상 1위를 놓고 경쟁하는 것이 아니라 ‘충분히 좋은’ 접근 방식으로 더 많은 고객, 특히 산업 고객을 확보했습니다.
정부 및 기업 고객의 수천만 달러 예산과 비교하여 많은 회사와 기관은 긴급한 AI 요구 사항이 있지만 기존 솔루션이 많지 않습니다. 오픈소스 모델을 사용하여 자체 솔루션을 개발하는 것이 거의 유일한 선택이 되었습니다.
- Baosteel은 생산 장비의 지능형 조기 경고를 위해 주요 야금 엔지니어링 프로세스에 ‘대규모 모델 + 소규모 모델’을 사용합니다.
- China Coal Science and Industry Group의 ‘Coal Science Guardian Large Model ChinamjGPT’는 장비 가동 중지 시간과 유지 보수 비용을 각각 30%와 20% 줄입니다.
- Shanghai Mengbo Intelligent Internet of Things Technology는 경량 대규모 모델을 기반으로 에지 절단 감지 및 연속 어닐링 로 프로세스 최적화 응용 플랫폼을 만들었습니다.
- Mifei Technology는 대규모 모델 기술을 기반으로 반도체 웨이퍼 팹에서 자동 재료 처리 시스템의 지능형 예측, 유지 보수 및 관리를 실현했습니다.
이들은 모두 산업 시나리오에서 구현되는 오픈소스 모델의 대표적인 사례입니다.
산업 용도 외에도 오픈소스 생태계는 더 많은 공익 사업을 도울 수 있습니다.
Shanshui Nature Conservation Center는 설표와 고원 생태계 보호에 전념하고 있습니다. 그것이 설정하는 적외선 카메라는 매 분기마다 많은 사진이나 비디오를 찍습니다. 설표 흔적을 수동으로 식별하는 데 의존하는 것은 매우 비효율적이고 시간이 많이 걸립니다. Huawei Ascend는 Sanjiangyuan에서 적외선 이미지 종 식별을 위한 관련 모델 및 도구를 오픈소스로 공개하여 AI 개발에 참여하기 위한 장벽을 낮추고 모델을 사용하는 더 많은 연구 및 보호 기관이 혜택을 누릴 수 있도록 합니다. 사람들은 데이터 세트, 데이터 처리 및 데이터 정리 측면에서 모델을 최적화하기 위해 함께 작업할 수 있습니다.
오픈소스의 ‘바자’ 효과
오픈소스 소프트웨어 운동의 기수인 에릭 레이먼드는 1999년 저서 ‘대성당과 바자’에서 은유를 제안했습니다. 전통적인 폐쇄형 소프트웨어 개발 모델은 대성당을 건설하는 것과 같습니다. 소프트웨어는 고립된 환경에서 소수의 전문가(건축가)가 신중하게 설계하고 구축하고 최종적으로 완료된 후에만 사용자에게 출시됩니다. 오픈소스 개발 모델은 번화하고 겉보기에 혼란스럽지만 활기찬 바자와 같습니다. 소프트웨어 개발은 개방적이고 분산되어 있으며 진화적입니다.
이 책은 많은 유형의 소프트웨어 프로젝트, 특히 복잡한 시스템 수준의 소프트웨어(예: 운영 체제 커널)의 경우 개방적이고 협력적이며 분산된 ‘바자’ 개발 모델은 혼란스러워 보일 수 있지만 실제로 기존의 폐쇄적이고 중앙 집중식 ‘대성당’ 모델보다 더 효율적이고 더 높은 품질을 생성하며 더 강력한 소프트웨어를 생성합니다. ‘조기에 릴리스, 자주 릴리스’와 같은 메커니즘과 대규모 동료 검토(‘충분한 눈알’)를 활용하여 오류를 더 빠르고 더 잘 발견하고 수정하며 사용자 피드백과 커뮤니티 기여를 더 잘 흡수하여 소프트웨어의 빠른 반복과 혁신을 촉진할 수 있습니다.
Linux와 같은 오픈소스 프로젝트의 엄청난 성공은 Raymond의 요점을 입증했습니다.
오픈소스 운동은 미국과 세계에 자체 투자액을 훨씬 능가하는 막대한 가치를 가져다주었습니다. 하버드 대학교의 2024년 연구 보고서에 따르면 ‘오픈소스는 41억 5천만 달러를 투자하여 회사에 8조 8천억 달러의 가치를 창출했습니다(즉, 투자된 1달러당 2,000달러의 가치를 창출합니다). 오픈소스가 없으면 소프트웨어에 대한 기업 지출은 지금보다 3.5배 더 많을 것입니다.’
오늘날 중국 기업은 이를 배웠습니다. 미국 AI 회사는 잊어버린 것 같습니다.
사실 중국 대규모 모델 회사의 경우 사회적 이익을 고려하지 않더라도 오픈소스 생태계를 수용하기로 선택하는 것은 회사 자체에 수익성이없습니다.
많은 대규모 모델 회사가 Observer.com에 오픈소스가 상업화를 포기하는 것을 의미하지 않는다고 말했습니다. 오픈소스에는 여전히 오픈소스의 이익 논리가 있습니다. 오픈소스 여부와 비교하여 고객에게 기술적으로 더 나은 서비스를 제공하는 방법이 핵심 문제입니다.
Zhipu AI를 예로 들어 보면 중국에서 OpenAI를 완전히 벤치마킹하는 유일한 회사라고 주장하지만 OpenAI의 폐쇄형 전략과 비교하여 업계에서 오픈소스 전략을 가장 단호하게 실천하는 회사 중 하나입니다.
Zhipu는 2023년에 중국 최초의 Chat 대규모 모델 ChatGLM-6B를 오픈소스로 공개하는 데 앞장섰습니다. 설립된 지 거의 6년 동안 Zhipu는 55개 이상의 모델을 오픈소스로 공개했으며 국제 오픈소스 커뮤니티에서 누적 다운로드 횟수가 거의 4천만 회에 달합니다.
Zhipu는 Observer.com에 Zhipu가 오픈소스 전략이 베이징을 인공 지능을 위한 ‘글로벌 오픈소스 자본’으로 구축하는 데 기여하기를 희망한다고 말했습니다.
구체적으로 상업적 수준에서 Zhipu는 오픈소스를 통해 개발자 생태계를 유치하고 B-end 및 G-end 고객에게 유료 맞춤형 솔루션을 제공하기로 선택했습니다.
솔루션 판매 외에도 API 판매도 중요한 이익 연결 고리입니다.
DeepSeek를 예로 들어 보면 오픈소스 모델의 첫 번째 비즈니스는 고성능 API 판매입니다. 기본 서비스는 무료이지만 회사는 고성능 API 서비스를 제공하고 사용량에 따라 요금을 부과할 수 있습니다. DeepSeek-R1의 API 가격은 백만 입력 토큰당 1위안, 백만 출력 토큰당 16위안입니다. 무료 토큰 할당량이 소진되거나 기본 API가 요구 사항을 충족할 수 없는 경우 사용자는 비즈니스 프로세스의 안정성을 유지하기 위해 유료 버전을 사용하는 경향이 있습니다.
모델 서비스만 제공하는 회사와 비교하여 Alibaba는 또 다른 오픈소스 수익 창출 모델인 에코시스템 번들을 선택했습니다.
오픈소스 개척자인 Alibaba의 Qwen 시리즈는 완전 모달 오픈소스를 통해 개발자가 클라우드 컴퓨팅 및 기타 인프라를 사용하도록 유도하여 폐쇄 루프 시나리오를 형성합니다. 그들의 모델은 초기 단계의 소개일 뿐이고 표시된 가격이 있는 상품은 실제로 클라우드 서비스입니다.
중국 오픈소스 대규모 모델의 글로벌화 응용은 ‘기술 추종’에서 ‘에코시스템 우위’로 전환되었습니다. 미국이 ‘폐쇄형 독점’과 ‘통제 불능 오픈소스’의 딜레마에 빠졌을 때 중국은 ‘계약 혁신 + 시나리오 육성’을 통해 글로벌 AI 오픈소스 생태계의 기본 논리를 재구성하고 있습니다. 이 게임의 궁극적인 전장은 매개변수 규모 경쟁이 아니라 AI 기술과 실물 경제의 심층적 통합이라는 수조 달러 규모의 시장에 있습니다.