AI 갈림길: 중국 '리틀 타이거' 진화 탐색

웅대한 비전에서 전략적 전환으로

중국 ‘AI 리틀 타이거’ 중 하나인 바이촨 인텔리전트 (Baichuan Intelligent) CEO의 최근 사내 서신은 창립 2주년을 맞아 전략적 전환을 강조했습니다. 우선순위는 의료 애플리케이션으로 좁혀질 것입니다. 이는 혁신적인 애플리케이션을 갖춘 OpenAI와 유사한 획기적인 기초 모델을 만들겠다는 초기 미션과 극명한 대조를 이루었습니다.

마찬가지로 또 다른 ‘리틀 타이거’인 01.AI의 설립자인 리카이푸 (Li Kaifu)는 1월에 그의 회사가 ‘작지만 아름다운’ 접근 방식을 채택할 것이라고 발표했습니다. 이는 AGI의 도래를 가속화하기 위한 AI 2.0 플랫폼을 구축하겠다는 웅대한 비전에서 눈에 띄는 변화였습니다.

이러한 전략적 후퇴는 추측을 불러일으켰으며 일부 관측통은 이러한 ‘리틀 타이거’가 ‘병든 고양이’처럼 변하고 있다고 제안했습니다. 끊임없이 변화하는 환경에서 이러한 기업은 어떻게 미래를 확보할 수 있을까요?

이 질문에 답하기 위해 Zhiwei 편집팀은 대형 모델 기술 전문가, 금융 및 의료 분야의 AI 전문가, 주요 기업의 AI 기술 전문가를 포함한 다양한 전문가의 의견을 구했습니다.

DeepSeek 효과와 전략 변화

AI 환경은 시장을 뒤흔든 DeepSeek의 폭발적인 인기 이후 극적으로 바뀌었습니다. 강력한 전사와 같이 DeepSeek은 환경을 파괴하여 많은 AI 기업이 입지를 재평가하고 다른 길을 추구하도록 강요했습니다.

그러나 이러한 변화는 많은 사람들이 깨달은 것보다 훨씬 이전부터 시작되었습니다. 대형 모델 기술 전문가인 Wang Wenguang에 따르면 일부 중국 AI 기업은 DeepSeek V3 및 R1 출시 이전에도 대형 모델 학습 추구를 포기하기 시작했습니다. 비용이 너무 높았고 이러한 기업은 DeepSeek V2.5 및 Alibaba의 Qwen 70B와 같은 무료로 사용 가능한 오픈 소스 대안과 경쟁할 수 없다고 느꼈습니다.

AI 기술 서비스 기업의 전문가인 Liang He는 ‘리틀 타이거’의 대부분이 2024년 중반에도 여전히 대형 모델을 학습시키고 있었지만 투자는 이미 크게 감소했다고 덧붙였습니다. 2025년 1월 DeepSeek R1이 출시되면서 많은 소규모 기업이 따라갈 수 없다는 것을 깨달았습니다.

이러한 갑작스러운 변화로 인해 ‘리틀 타이거’의 방향이 크게 바뀌어 AGI 개발에서 벗어나 보다 전문화된 접근 방식으로 이동했습니다.

바이촨과 01.AI는 대형 모델 사전 학습을 포기하고 각각 의료 AI와 산업 애플리케이션에 집중하고 있습니다. MiniMax는 B2B 운영을 줄이고 C-end 비디오 생성 및 기타 애플리케이션으로 해외 시장에 집중하고 있습니다. Zhipu, Moonshot AI 및 StepUp은 여전히 오픈 소스 커뮤니티에서 활동하고 있지만 DeepSeek R1보다 성능이 뛰어난 새로운 모델을 생산하지 못했습니다. Zhipu는 상당한 자금과 정부-기업 파트너십을 확보하여 생존을 보장했습니다. Moonshot AI의 주요 제품인 Kimi는 Yuanbao에 의해 입지가 위협받아 점점 더 어색한 위치에 놓이게 되었습니다.

전반적으로 ‘리틀 타이거’는 ‘상상력이 부족하다’고 여겨지는 B2B SaaS 시장으로 점점 더 수렴되고 있습니다.

B2B 시장의 매력과 한계

01.AI는 최근 다양한 산업 분야를 위한 원스톱 엔터프라이즈 대형 모델 플랫폼을 만들기 위해 DeepSeek을 완전히 통합하겠다는 의사를 발표했습니다. 그러나 이러한 움직임은 회의적인 시각으로 받아들여지고 있습니다.

금융 AI 전문가인 Jiang Shao는 DeepSeek의 등장 이후 광범위한 초점, 기술 경쟁력 부족, 제한된 상용화 기능으로 인해 01.AI의 미래가 불확실하다고 믿습니다.

Wang Wenguang은 이러한 감정을 반영하여 원스톱 대형 모델 플랫폼의 기술적 진입 장벽이 상대적으로 낮다고 지적했습니다.

Wang은 약 6개월 만에 그러한 플랫폼을 독립적으로 개발하여 개인 채널을 통해 판매한 경험을 공유했습니다. 그는 회사가 이 제품으로 수익을 내는 것은 어렵지만 솔로 벤처로 수익을 낼 수 있다고 주장했습니다.

Wang은 대형 모델 서비스를 제공하지만 기술 플랫폼이 없는 여러 B2B 회사와 협력합니다. 그는 라이선스당 약 40,000~50,000위안의 저렴한 비용으로 플랫폼을 제공하여 대기업보다 상당히 저렴합니다.

그의 플랫폼인 KAF (Knowledge-based Agent Factory)는 지식 그래프, 벡터 데이터베이스 및 검색 엔진을 사용하여 대형 모델 및 에이전트 애플리케이션을 제공합니다. 사용자는 프롬프트 및 모델 관리를 통해 코딩 없이 사용자 지정 지식 도우미 또는 에이전트를 만들 수 있습니다. Wang은 시장에서 유사한 플랫폼이 널리 퍼져있어 복제하기 쉽다고 언급했습니다.

Wang에 따르면 B2B 대형 모델 애플리케이션을 개발하려는 회사는 숙련된 개인의 소규모 팀을 고용하거나 외부 AI 회사와 협력하여 빠르게 제품을 만들 수 있습니다. 이 접근 방식은 대형 모델을 학습시키는 것보다 훨씬 저렴합니다.

플랫폼 모델 외에도 통합 솔루션은 하드웨어, 소프트웨어 및 실행 환경을 제공하여 즉시 사용 가능한 기능을 제공합니다. Ping An Insurance의 기술 플랫폼 그룹 책임자인 Zhang Sensen은 통합 솔루션이 특히 기술 배포 기능이 제한된 정부 및 교육 기관에서 실행 가능한 시장을 가지고 있다고 믿습니다. 이러한 솔루션은 사용 편의성과 기술 자율성을 우선시하여 데이터 보안, 개인 정보 보호 규정 준수 및 하드웨어-소프트웨어 최적화와 같은 이점을 제공합니다. 또한 국내에서 생산된 칩을 사용하여 제한을 우회하고 효율성을 높일 수 있습니다. 비용에 민감하고 ROI에 초점을 맞춘 기업은 통합 솔루션이 더 긴 수명 주기를 가지고 있기 때문에 매력적이라고 ​​생각할 수 있습니다.

국내 SaaS 시장은 역사적으로 높은 사용자 지정 요구 사항, 일반적이고 균질화된 제품, 치열한 경쟁, 저가 전략 및 단기 수익 창출에 대한 초점과 같은 문제에 직면해 왔습니다. 이 시장의 고객은 종종 낮은 수준의 디지털화를 가지고 있으며 지불 의사가 제한적입니다.

대조적으로 국제 SaaS 시장은 전문화를 강조하며 기업은 특정 영역에 집중하고 지불 의사가 더 높은 대규모 및 중규모 고객에게 심층적인 서비스를 제공합니다.

대형 모델 필드는 이러한 추세를 반영합니다. 국제 SaaS 시장의 최근 이벤트는 이를 보여줍니다.

  • 2025년 2월 MongoDB는 임베딩 및 순위 재지정 모델에 초점을 맞춘 17개월 된 AI 스타트업인 Voyage AI를 2억 2천만 달러에 인수했습니다.
  • 2024년 Amazon은 2년 된 AI 에이전트 스타트업인 Adept와 기술 라이선스 계약을 발표했으며 일부 Adept 회원은 Amazon의 AGI 팀에 합류했습니다.

이러한 스타트업은 대형 모델 기술 내에서 특정 틈새 시장에 집중하여 성공을 거두었습니다. 이러한 예는 중국에서는 드뭅니다. 많은 중소기업은 대기업이 자신의 공간에 진입하는 것을 끊임없이 경계해야 합니다.

B2B 시장에서 광범위한 경험을 바탕으로 Wang Wenguang은 그 가혹한 현실을 설명했습니다. 그는 원스톱 플랫폼에 대한 큰 시장이 있지만 파편화되어 있다고 언급했습니다. 운영 비용이 낮은 소규모 기업은 경쟁력 있는 가격을 제공하여 대기업보다 저렴하게 판매할 수 있습니다. 이는 애플리케이션 서비스 가격을 낮춥니다. 대기업조차도 다른 스타트업과 기존 통합업체와의 경쟁에 직면해 있습니다. 대기업은 자체 대형 모델과 브랜드 이점을 가질 수 있지만 유사한 B2B 비즈니스 전략에 직면해 있습니다.

Wang은 ‘나도 DeepSeek을 사용하고 많은 다른 회사들도 DeepSeek을 사용하고 있으므로 차별화가 없습니다. 중국에는 너무 많은 클라우드 공급업체가 있으므로 적어도 그만큼의 경쟁자가 있을 것입니다. 국내 B2B 시장은 항상 이랬습니다. 생존하려면 강력한 연결, 좋은 서비스 또는 저렴한 가격을 가져야 합니다.’라고 말했습니다.

Liang He는 01.AI의 현재 선택과 미래 전망에 대한 간결한 평가를 제공했습니다.

  • 리카이푸는 01.AI의 사업을 B2B 애플리케이션으로 완전히 전환하고 원스톱 엔터프라이즈 대형 모델 플랫폼을 홍보하기로 한 결정은 상업적으로 건전하지만 치열한 경쟁으로 이어질 것입니다.
  • 01.AI가 대기업보다 저렴한 대형 모델 제품을 제공해야 하는 이유는 애플리케이션 레이어에서 고유한 이점이 부족하기 때문입니다.
  • 01.AI의 B2B로의 이동은 상상력의 상실과 덜 ‘섹시한’ 프로젝트를 의미합니다. 이는 2017년 AI의 이전 물결에서 많은 컴퓨터 비전 회사의 운명과 유사합니다.
  • 01.AI는 해외 시장을 탐색하면 기회를 얻을 수 있습니다.

01.AI와 비교하여 바이촨의 미래에 대한 의견은 덜 비관적입니다.

그러나 바이촨의 의료 분야 진출은 특히 데이터에서 고유한 이점이 부족합니다.

Jiang Shao는 바이촨의 의료 분야로의 전환은 단순히 생존하는 방법이라고 말했습니다. 그러나 01.AI와 비교하여 바이촨은 적어도 틈새 시장에 진출하려고 시도하고 있습니다.

Zhang Sensen은 의료 데이터를 가진 회사가 기술 회사보다 의료 대형 모델을 개발하는 것에 대해 더 낙관적이라고 말했습니다. 이는 산업별 대형 모델을 만들려는 모든 회사에 적용됩니다. 의료 대형 모델을 만드는 데 있어 주요 과제는 모델 자체가 아닌 데이터에 있습니다. 중국에는 DeepSeek을 사용하여 자체적으로 대형 모델을 미세 조정할 수 있는 훌륭한 병원이 많이 있습니다.

의료 데이터를 효과적으로 얻으려면 어떻게 해야 할까요? Jiang Shao는 AI 기술 스타트업이 데이터에서 이점이 부족하다고 말했습니다. 의료 대형 모델을 만들려면 병원에 IT 서비스를 이미 제공하는 회사와 협력해야 할 수 있습니다.

보도에 따르면 ‘리틀 타이거’ 중 하나는 국내 대형 의사 교환 포럼과 독점적으로 파트너십을 맺어 의사 교환에서 생성된 방대한 사례를 사용하여 모델을 학습시키고 있습니다.

틈새 시장에 대한 더 낙관적인 전망 외에도 업계 전문가는 바이촨 설립자인 Wang Xiaochuan에 대한 희망을 가지고 있습니다.

Liang He는 Wang Xiaochuan이 의료 분야를 전문으로 성공할지 여부는 그가 이상을 추구할지 돈을 벌기를 원하는지에 달려 있다고 믿습니다. 그는 Wang이 획기적인 의료 AI 연구 결과를 만들어 이상을 추구하는 경향이 더 있다고 믿습니다.

Wang Wenguang은 이 시장의 시대에 뒤떨어진 성격을 강조했습니다. 단기 상용화를 목표로 한다면 의료 분야도 전반적인 B2B 시장과 마찬가지로 경쟁이 치열하다고 말했습니다. 많은 기업이 지식 그래프, 벡터 검색 및 대형 모델을 의료 애플리케이션에 사용할 수 있습니다.

Zhiwei가 의료 AI 전문가와 논의한 바에 따르면 의료 연구 자체에는 상당한 지식 격차가 있으며 새로운 지식이 빠르게 증가하고 있습니다. 따라서 대형 모델을 사용하여 의료 기본 연구를 수행할 수 있는 상당한 잠재력이 있습니다. 예를 들어 단백질 구조 예측을 위한 AlphaFold 모델은 전 세계 180만 명 이상의 과학자가 생체 재생 가능 물질 개발 및 유전 연구 발전을 포함한 연구를 가속화하는 데 사용하고 있다고 Meis Medical은 밝혔습니다.

이상을 추구하거나 돈을 벌거나 의료 AI 스타트업은 일반 의료 대형 모델을 만들지 여부에 대한 질문에도 직면해 있습니다.

Zhang Sensen은 국내 시장에서 일반 의료 대형 모델에 대한 획기적인 발전이 없었으며, 주로 대규모 데이터 수집 및 애플리케이션을 위한 강력한 의료 장비에 대한 의존 때문이라고 말했습니다. 중국의 많은 의료 시설이 널리 보급되지 않아 AI가 정확한 진단을 내리기가 어렵습니다. 그러나 Mayo Clinic과 같은 일부 강력한 병원은 자체 대형 모델 출시를 모색하기 시작했습니다. 단기적으로 수익 기회를 보기는 어렵지만 이러한 유형의 대형 모델은 장기적으로 의료 산업에 심오한 영향을 미칠 수 있습니다.

의료 산업은 또한 완전 자동화된 진단의 문제에 직면해 있으며, 특히 국내 시장에서는 장비가 부족하고 AI가 기존 진단 방법을 완전히 대체할 수 없습니다. 특히 외딴 지역에서는 의료 장비가 널리 보급되지 않아 의료 기술을 완전히 포괄하기가 어려워 완전 자동화된 진단은 여전히 중요한 과제입니다.

의료 산업은 엄격한 라이선스 및 규정 준수 요구 사항을 가지고 있으며 대형 모델은 의료 분야에 진출할 때 규정 준수 문제를 해결해야 합니다. 미래의 C-end 의료 서비스는 의사의 기술과 AI를 결합하여 특히 젊은 세대의 진단 및 치료 효율성을 향상시킬 수 있습니다.

마지막으로 국내 B2B 시장의 특성을 무시하더라도 대형 모델 애플리케이션 경쟁은 To B 시장에서 생존하기 어렵게 만듭니다. Wang Wenguang은 대형 모델 To B 제품에 대한 설계 모델이 여전히 탐색되고 있지만 결국 수렴될 것이라고 말했습니다. 이는 중국뿐만 아니라 OpenAI, Anthropic 및 Google과 같은 실리콘 밸리 기술 회사에서도 마찬가지입니다. 모델 자체의 성능에 큰 차이가 없는 한 이 시장에서 돈을 벌 수 없으며 결국 모든 사람이 같은 수준에 있게 될 것입니다.

이것이 DeepSeek R1이 중국이 아닌 해외, 특히 실리콘 밸리 기술 회사에 가장 큰 영향을 미친 이유입니다. 미국 주식 시장은 R1 출시 후 변동성이 커지고 하락하기 시작했습니다. 핵심 논리는 간단합니다. 실리콘 밸리의 대형 모델은 중국에 따라 잡혔습니다. 이를 능가하지는 않더라도 격차를 넓힐 수 없기 때문에 주가 하락으로 이어지는 높은 평가를 뒷받침할 수 없었습니다.

물론 To B 시장이 고객을 유치하는 또 다른 방법이 있습니다. 오픈 소스입니다. 오픈 소스의 주요 수익 모델에는 유료 수준 기능, 클라우드 호스팅 및 오픈 소스 기술을 기반으로 하는 엔터프라이즈 수준 컨설팅 및 교육과 같은 부가 가치 서비스 제공이 포함됩니다.

오픈 소스 대형 모델의 가장 직접적인 효과는 기술 대중화를 촉진하는 것입니다. Zhang Sensen은 DeepSeek의 오픈 소스가 회사의 대형 모델 애플리케이션을 크게 가속화했다고 말했습니다. 고위 경영진은 대형 모델의 애플리케이션을 매우 지지합니다. 대형 모델이 실제 애플리케이션, 특히 인간 개입을 줄이고 효율성을 높이는 데 뛰어난 성능을 발휘함에 따라 지원이 계속 증가할 것입니다.

데이터 품질이 가장 우수한 산업인 금융 산업은 항상 AI에서 풍부한 기술 축적을 가지고 있으며 빠르게 따라갈 수 있습니다. DeepSeek에 관계없이 금융은 AI 기술을 구현할 것입니다. 그러나 DeepSeek을 사용하면 AI는 금융 산업의 핵심 비즈니스를 가능하게 할 뿐만 아니라 이전에 수행하기 어려웠던 일상적인 사무 작업 및 운영에도 사용됩니다.

운영 비용은 매우 높았습니다. 예를 들어 근본 원인 분석에는 이전에 기존 운영 모니터링 및 AIOps와 소규모 모델 교육이 필요했습니다. 이제 DeepSeek은 지식 기반과 함께 사용하여 모니터링, 경보, 셀프 서비스 분석 및 추적 가능성, 자동화된 처리 및 안정성 향상을 처리하기 위한 애플리케이션 계획을 생성할 수 있으며 이는 AIOps보다 더 유연합니다.

또한 AI의 운영 범위가 넓어지고 상호 작용과 주도성에 대한 고려가 커졌습니다. 주도성이라는 것은 AI가 운영을 사전에 수행할 수 있도록 하는 것을 의미합니다. 규칙, 인간 또는 심지어 개인적인 경험에 의존하는 것에서 인간 경험 수준이 운영 기능 수준을 결정하는 경우 더 가벼운 AI 모델을 사용하여 이제 이를 직접 달성할 수 있습니다.

DeepSeek의 환각률은 여전히 높지만 다른 유사한 모델과 크게 다르지 않더라도 추론 및 실용적인 애플리케이션 기능은 환각의 부정적인 영향을 상쇄할 수 있습니다. 이 문제는 RAG 및 관련 기술을 사용하여 미세 조정 및 최적화를 통해 점진적으로 개선될 것입니다.

Alibaba의 대형 모델 기술 전문가인 Gao Peng은 DeepSeek의 영향이 대기업과 중소기업에 따라 다르다고 믿습니다.

Alibaba에서 내부적으로 사용하는 대형 모델은 항상 업계에서 가장 진보된 모델이었으므로 DeepSeek의 등장은 큰 영향을 미치지 않았습니다. Alibaba는 성능 평가 및 비교를 위해 DeepSeek을 사용하며 기술적인 영감을 더 많이 제공합니다. 추론에서 DeepSeek의 구현은 비교적 빠르며 기술적인 세부 사항이 더 일반적입니다. DeepSeek은 Qianwen의 영향을 받기도 했습니다.

대조적으로 DeepSeek은 중소기업에 더 큰 영향을 미칩니다. 이전에는 DeepSeek의 효과를 달성하면서 저렴한 비용으로 개인 배포를 제공할 수 있는 모델이 없었기 때문입니다. DeepSeek이 출시된 후 많은 기업이 DeepSeek 통합 기계를 판매하기 시작했습니다. 그러나 DeepSeek은 특정 표준에 따라 많은 오픈 소스 모델 통합 기계에 비해 가장 저렴하지 않습니다.

어쨌든 국내 오픈 소스 대형 모델은 현재 번성하고 있으며 전 세계적으로 경쟁할 수 있습니다. 그러나 Ping An Insurance의 대형 모델 구현을 기반으로 Zhang Sensen은 오픈 소스 대형 모델에는 여전히 극복할 수 없는 제한이 있다고 믿습니다.

우리에게 DeepSeek은 주로 큰 비용 이점이 있습니다. 기능면에서는 추론, 일반화 능력 및 상황 이해 측면에서 운영 시나리오에서 다른 모델보다 나을 수 있습니다. 그러나 DeepSeek은 금융 위험 통제와 같은 더 복잡한 시나리오에서는 잘 수행되지 않습니다. 이는 다른 모델과 함께 보다 자세한 미세 조정 또는 최적화가 필요하기 때문입니다. 따라서 모델 성능을 더욱 향상시키기 위해서는 특정 애플리케이션 시나리오에 기반한 대상 미세 조정이 필요합니다.

Ping An의 자체 개발 대형 모델은 기본 기초 대형 모델과 은행, 보험 및 기타 비즈니스를 담당하는 도메인 모델의 두 레이어로 나뉩니다. 내부적으로 사용되는 대형 모델은 전문 지식 분야, 특히 금융 및 의료와 같은 특정 분야에서 모델이 더 정확한 경우 DeepSeek보다 성능이 좋습니다. 그러나 DeepSeek은 여전히 추론 능력에서 강력한 이점을 가지고 있습니다. 일부 시나리오에서는 DeepSeek을 사용하여 소규모 시도를 통해 실행할 수 있는지 확인하려고 합니다.

이 점에서는 Alibaba Qianwen, Baidu Wenxin 및 Zhipu ChatGLM과 DeepSeek 사이에 큰 차이가 없습니다. 판단은 이러한 모델이 추론 능력과 지식 기반 구조에서 DeepSeek과 큰 차이가 없다는 사실에 근거합니다.

전반적으로 오픈 소스 대형 모델의 영향은 현재 제한적이며 경쟁 속도가 치열합니다.

To C 시장의 위험

To B 시장의 경쟁이 치열하다고 해서 To C 경로가 더 많은 희망을 제공한다는 의미는 아닙니다.

대형 모델에 대한 To C 시장의 경쟁도 매우 치열하지만 To B 시장과는 매우 다릅니다.

시장 환경은 끊임없이 변화하고 있습니다.

To C의 수익 창출은 어렵습니다.

가장 인기 있는 애플리케이션이 반드시 가장 많은 수익을 창출하는 것은 아닙니다. 예를 들어 ChatGPT는 가장 높은 수익을 올리고 있지만 OpenAI는 여전히 연간 50억 달러의 손실을 보고 있는 반면 ChatGPT의 많은 ‘모방’ 애플리케이션은 빠른 수익성을 달성했을 가능성이 높습니다. DeepSeek이 인기를 얻은 후 모방자와 위조자가 쏟아져 나왔습니다.

C-end 시장에서 ‘리틀 타이거’의 상황을 관찰하는 것도 낙관적이지 않습니다. Zhiwei와 업계 전문가 간의 통신은 일반적으로 대규모 제조업체가 생존 압력을 크게 가할 것이라고 믿습니다.

Jiang Shao는 소비자 시장에서 ‘리틀 타이거’ 중 가장 실적이 좋은 것은 Moonshot AI의 Kimi라고 말했습니다. 그러나 현재 Tencent의 Yuanbao가 1위, DeepSeek가 2위, Doubao가 3위를 차지하고 있습니다. 상위 3개 회사가 시장 점유율의 대부분을 차지하고 있습니다. Tencent의 Yuanbao는 WeChat 생태계의 도움으로 많은 고객 트래픽을 확보했으며 DeepSeek은 기술 혁신과 여러 시나리오에서 뛰어난 성능으로 두각을 나타냈습니다.

Liang He는 Kimi의 대형 모델 기술이 경쟁자와 크게 다르지 않으므로 무료로만 제공할 수 있어 Moonshot가 상용화하기가 매우 어렵다고 말했습니다. To C 애플리케이션으로서 Yuanbao 및 Doubao와 어떻게 다른지 명확하지 않습니다. 또한 Doubao는 Byte의 다른 비즈니스에서 지원을 받을 수 있고 Yuanbao는 Tencent의 다른 비즈니스에서 지원을 받을 수 있습니다. 그들은 이러한 애플리케이션을 지원하기 위해 1,000억 달러를 투자할 수 있습니다.

Jiang Shao는 C-end 사용자는 제품 사용 편의성에 더 관심을 갖고 Tencent와 Byte가 더 잘한다고 덧붙였습니다. 물론 Alibaba도 기회가 있습니다. Alibaba는 AI를 사용하여 채팅 및 상호 작용을 수행하고 짧은 비디오 플랫폼에서 Douyin을 대체하는 것을 목표로 하는 ‘AI Listening’이라는 애플리케이션을 개발하고 있습니다. Douyin은 많은 제작자를 유치하여 고품질 콘텐츠를 생성하지만 AI 채팅 애플리케이션은 보다 개인화되고 상호 작용적인 경험을 제공하여 사용자 그룹을 유치할 수 있는 잠재력이 있습니다. 두 가지의 차이점은 콘텐츠 제작과 상호 작용에 있습니다. Alibaba가 이를 돌파할 수 있다면 반전을 일으킬 기회도 있지만 Tencent가 따라할지는 말하기 어렵습니다.

MiniMax에 관해서는 업계 의견이 약간 다릅니다.

Liang He는 MiniMax의 Conch AI가 현재 좋은 수익을 올리고 있다고 믿습니다. 그들은 자신의 길을 찾았지만 이 길이 MiniMax가 평가를 충분히 높일 수 있을지는 아직 알 수 없습니다. 애플리케이션 지향성 때문에 MiniMax는 DeepSeek이 출시된 후 더 편안합니다. 그들이 DeepSeek의 모델을 사용하면 모델의 연구 개발 비용이 절감되고 애플리케이션은 계속 수익을 창출할 수 있으며 훨씬 더 많은 수익을 창출할 수 있습니다.

Jiang Shao는 MiniMax가 나중에 인기 있는 APP를 만들 수 있다면 기회가 있을 것이지만 Alibaba가 그것을 초과하고 먼저 인기 있는 APP를 만들 수 있으므로 MiniMax가 기회가 있다고 해도 확률은 높지 않다고 믿습니다.

궁극적으로 제품 차별화는 여전히 C-end 애플리케이션의 돌파구입니다.

a16z의 최신 보고서 ‘Top 100 Gen AI Consumer Apps’에 따르면 사용량이 적은 많은 애플리케이션이 실제로 더 나은 수익을 올리고 있습니다. 식물 식별 및 영양과 같이 다재다능성이 떨어지는 일부 제품은 일반 제품보다 유료 사용자를 더 많이 유치합니다.

일반 AI 제품을 차별화하기는 어렵습니다. 사용자는 지불 의사가 낮고 수익 주기가 길어 대기업에서 살아남을 수 없습니다.

또한 차별화가 수직적으로 충분히 깊지 않으면 용량 업그레이드를 통해 기본 대형 모델에 의해 내부화되기도 쉽습니다. 예를 들어 최근 GPT-4o의 이미지 생성 기능은 Midjourney와 같은 텍스트-이미지 스타트업에 차원 축소 타격을 가했습니다. 이 적용 범위 기능은 종종 무작위적이고 예측할 수 없으며 속담처럼 ‘당신을 파괴하는 것은 당신과 관련이 없습니다.’

경쟁자를 픽셀 수준으로 모방하고 기본 대형 모델을 빠르게 업그레이드하면 C-end AI 스타트업의 풍경은 거의 항상 짧은 시간 동안만 유지됩니다.

극도로 낮은 성공 확률을 포착하는 방법에 대해서는 업계 전문가가 만장일치로 ‘따를 경험이 기본적으로 없다’고 믿습니다.

‘리틀 타이거’가 오늘날의 곤경에 빠진 것은 기본 대형 모델에 너무 많이 투자하고 이 트랙에서 생존하고 탁월하는 데 필요한 인력, 재정 자원 및 물적 자원을 과소 평가하여 애플리케이션 트랙에서 차별화하기가 어렵기 때문입니다.

이제 ‘리틀 타이거’는 AGI 공격에 대한 결심이 점점 줄어들고 있으며 리카이푸는 DeepSeek, Ali 및 Byte만 국내 기본 대형 모델에 남을 것이라고 공개적으로 밝혔습니다.

이와 관련하여 Zhiwei와 소통한 업계 전문가는 기본적으로 이 견해에 동의합니다.

Jiang Shao는 대형 모델 기술에 계속 노력하고 있는 AI 스타트업은 기본적으로 죽을 것이라고 말했습니다. 가장 유망한 것은 확실히 DeepSeek이고 두 번째는 Alibaba이고 세 번째는 ByteDance입니다. 1위는 트래픽의 50%-80%를 얻을 것으로 예상되며 후자는 트래픽의 10%를 얻을 수 있습니다. 핵심은 누가 AGI를 먼저 만드는지, 누가 최종 승자인지에 있습니다.

DeepSeek은 현재 대형 모델 분야에서 가장 경쟁력이 있으며 실제 애플리케이션에서 기술 혁신과 성능이 완벽합니다. Alibaba와 ByteDance도 특히 플랫폼 간 애플리케이션 및 데이터 리소스에서 강력한 경쟁력을 가지고 있습니다. 순위는 주로 기본 기술, 컴퓨팅 성능, 데이터 리소스 및 실제 애플리케이션에서 각 회사의 혁신 기능을 기반으로 합니다.

Zhipu 및 Kimi 팀은 기본 모델의 기능을 계속 향상시키는 것이 미래라고 굳게 믿습니다. 대조적으로 시장 수요의 변화와 애플리케이션 시나리오의 다양성이 증가함에 따라 기본 모델을 단순히 강화하는 경로는 제한될 수 있으며 보다 유연하고 적응 가능한 모델 개발 경로가 시장에서 더 경쟁력이 있을 수 있다고 믿습니다.

대형 모델 기술 경쟁은 극도로 치열하며 막대한 투자를 한 회사는 결국 혁신, 컴퓨팅 성능, 데이터 및 최적화에서 명확한 돌파구를 가져야 경쟁력을 유지할 수 있습니다. 기술 발전을 따라가지 못하거나 시장 수요에 대처할 수 없는 다른 회사는 점차 제거될 것입니다.

Liang He는 DeepSeek, Ali 및 Byte만 국내 기본 대형 모델 회사에 남을 것이라고 말했습니다. 이는 이 세 회사가 연구 개발에 슈퍼 리소스를 투자할 수 있는 강점과 결단력을 가지고 있다는 사실에 근거합니다. Byte의 경우 대형 모델의 기회를 놓칠 수 없으며 그렇지 않으면 전체에 큰 영향을 미칠 것입니다. 그리고 DeepSeek의 기술은 Byte에 너무 많은 장벽이 없지만 DeepSeek은 현재 R&D 효율성에서 더 큰 이점을 가지고 있습니다. Alibaba의 Qianwen 오픈 소스 모델 자체는 높은 수준에 있습니다. DeepSeek이 인기를 얻기 전에 Qianwen과 Llama는 기본적으로 서로 쫓고 있었습니다. Alibaba의 경우 Qianwen 모델은 수익을 창출하지 못할 수 있지만 관련 클라우드 비즈니스는 수익을 창출할 수 있으며 Byte도 비슷하며 대형 모델 기술을 계속 사용하여 Douyin 및 기타 앱의 경험을 지속적으로 최적화할 수 있습니다. AI 스타트업의 경우 모델 자체가 수익을 창출하지 못하면 생존의 근본을 건드립니다.

Wang Wenguang은 DeepSeek의 이점은 주로 기술적 이상주의에 있다고 말했습니다. 춘절 전후 2~3개월 동안 DeepSeek의 트래픽은 엄청났습니다. 상용화하려는 경우 곧 세계 최고에 도달할 것이고 Doubao와 같은 다른 대형 모델은 기회가 없을 것입니다. DeepSeek이 최근 오픈 소스 주에 인프라 관련 최적화 방법을 오픈 소스하지 않는 한 이를 통해 미래에 돈을 벌 수 있으므로 다른 사람은 기회가 없습니다. DeepSeek은 자금을 지원받지 않았으며 투자자의 영향을 받을 필요가 없습니다. 기술적 이상주의와 재능은 가장 큰 장벽입니다. OpenAI와 비교하여 OpenAI가 지금 볼 수 있는 결과는 기본적으로 Altman과 Ilya 간의 분쟁이 발생하기 전의 연구 결과입니다. 적어도 혁신 포인트는 결정되었습니다. 이제 원래 이상주의자 팀이 떠난 후 OpenAI 자체는 거의 혁신이 없습니다. 현재 OpenAI의 혁신은 Deep Research와 같은 애플리케이션 수준에서 더 많이 이루어지고 있습니다. 애플리케이션 수준에서 혁신에 대한 장벽이 없으므로 경쟁자와 경쟁해야 합니다.

대규모 공장 AI 기술 전문가인 Wang Mu는 돈, 재능 및 하드웨어가 없으면 대형 모델 사전 학습에 노력을 낭비할 필요가 없다고 Zhiwei에게 말했습니다. DeepSeek은 이미 2021년에 10,000 카드 클러스터를 보유했으며 돈이 부족하지 않습니다. 대조적으로 다른 중소기업은 이 조건을 거의 조합할 수 없습니다.

Gao Peng은 AI 스타트업이 생존하기를 원한다면 여전히 애플리케이션으로 전환해야 한다고 말했습니다. 1~2년 전에도 그렇게 생각했는데 이제 전환하기에는 너무 늦었을 수 있습니다. 다음에 제거될 AI 회사의 첫 번째 배치는 기본 대형 모델을 만드는 회사입니다. 대형 모델 학습은 실제로 복잡한 세부 사항이 많고 경험 축적에 매우 의존합니다. Transformer 아키텍처의 내부 세부 사항은 일반적으로 잘 이해되지만 오픈 소스 또는 폐쇄 소스 모델의 논문은 기본적으로 데이터가 어떻게 준비되고 데이터 세부 사항이 무엇인지, 데이터 규모가 얼마나 큰지, 데이터 품질이 얼마나 좋은지 알려주지 않습니다. 업계에 통일된 표준이 없습니다.

오픈 소스 오픈 하프는 항상 대형 모델 트랙에서 전형적인 관행이었습니다. 현재 코드, 가중치, 데이터 세트 및 학습 프로세스를 완전히 공개하는 대형 모델은 거의 없습니다. 더 잘 알려진 것은 OLMo, BLOOM 등입니다.

그러나 애플리케이션으로 전환하더라도 생존할 수 있을까요? 이전의 To B 트랙 및 To C 트랙 분석에서 AI 스타트업이 애플리케이션에서 자체 산업 장벽을 형성하기는 거의 어렵습니다. 이와 관련하여 Gao Peng은 자체 산업 장벽을 형성하는 데 핵심은 어떤 데이터를 가지고 있는지에 있다고 말했습니다. 모델은 누구나 사용할 수 있습니다. 데이터는 두 가지 측면으로 나뉩니다. 하나는 기업가의 현장 경험이고 다른 하나는 수중에 있는 데이터입니다.

기업 문화의 관점에서 Gao Peng은 기본 대형 모델의 연구 개발에는 실험 정신과 엔지니어링의 노력이 필요하다고 믿습니다. “이전에는 많은 국내 AI 스타트업이 너무 떠들썩했습니다. 기술을 할 때는 먼저 은밀하게 한 다음 눈에 띄게 홍보해야 합니다. 일부 팀은 학계로 더 많이 구성되어 있지만 학계 사람들은 때때로 기술을 너무 이론적으로 연구합니다. 재능이나 팀 측면에서 대형 모델 팀의 성공은 주로 보스가 대형 모델을 이해하는지 여부에 달려 있습니다. 보스가 대형 모델 기술을 이해하지 못하거나 지속하려는 믿음이 없다면 수익을 창출하지 못하기 때문에 전혀 작동하지 않습니다. DeepSeek의 성공은 주로 하향식 조직 모드에 의존합니다. 보스는 기술적 세부 사항을 아주 잘 이해하고 모두를 이끌어 함께합니다. 이 모델을 충족하는 국내 모델은 너무 적습니다.”

국내 기본 대형 모델의 최종 승자 예측에 대한 업계의 뜨거운 논의에 대해 Gao Peng은 이 판단이 너무 이르다고 믿습니다. “경쟁에 참여할 수 있는 플레이어의 기술 경로는 크게 다르지 않을 것입니다. Transformer 아키텍처를 따르고 자세한 최적화를 수행하십시오. Mamba와 RWKV도 희망이 있습니다. 핵심은 꾸준히 일을 하는 것이고 시간이 모든 것을 증명할 것입니다. 최종 승자와 상위 3위는 말하기 쉽지 않습니다. 대형 모델 기술 스택은 매우 복잡한 것이며 침묵 속에서 한 가지 일을 하고 있는 많은 사람들이 있는지 누가 알겠습니까. 그러나 시간이 아직 오지 않았습니다.”

모델 승자를 판단하기 어려운 현재 상황에서 데이터는 가장 중요한 해자가 되었습니다. Sequoia Capital의 파트너인 Konstantine Buhler는 OpenAI가 ChatGPT에서 저지른 한 가지 실수는 답글 편집을 허용하지 않은 것이라고 말했습니다. 이를 통해 피드백 루프에서 더 높은 품질의 데이터를 제공하고 더 깊은 해자를 구축할 수 있었을 것입니다.

데이터가 AI의 도움으로 특정 산업을 더 발전시킬 수 있는지 또는 현재 새로운 비즈니스 기회를 가져올 수 있는지도 매우 중요합니다. Zhang Sensen은 AI 착륙의 성숙도가 금융 및 인터넷 산업에 더 가깝다고 말했습니다. AI 오피스, AI 정부 업무 및 AI 전자 상거래에 더 낙관적입니다. 주로 높은 수준의 디지털화와 성능의 높은 확실성에 기반합니다.

“전자 상거래는 비교적 성숙하지만 AI는 특히 상품 추천, 고객 서비스 및 물류 최적화에서 전자 상거래의 효율성을 계속 향상시킬 것입니다. AI는 보다 정확한 시장 분석 및 의사 결정 최적화를 통해 전자 상거래 플랫폼의 효율성을 향상시킬 수 있습니다. 이 효율성 향상은 오프라인 소매의 연속일 뿐만 아니라 특히 국경 간 전자 상거래 분야에서 새로운 형태의 전자 상거래를 가져올 것이며 AI는 폭발적인 성장을 도울 것입니다.”

“대조적으로 금융 산업은 2024년에 실적 폭발을 경험했으며 AI 비즈니스가 심화됨에 따라 2025년에도 여전히 성장할 여지가 많습니다.”

“AI 착륙이 성숙하지 않은 산업, 특히 스마트 제조를 살펴보면 많은 사용자 지정된 사항이 있고 각 기업에서 생산하는 제품이 다르며 통일된 표준이 없습니다. 따라서 기업은 AI 작업 자동화를 홍보하기가 어렵고 데이터 가격이 매우 높으며 정밀도 요구 사항도 매우 높습니다. 산업용 소프트웨어는 기본적으로 스마트 제조 착륙을 위한 가장 초기 솔루션 방향이지만 더 나은 효과가 있습니다. 그러나 제조 산업의 AI 업그레이드에는 역사적 부담이 있습니다. 대부분의 제조 산업의 데이터 및 정보화 수준이 충분하지 않아 AI를 수행할 때 데이터가 부족하며 특히 비정상적인 샘플 수집이 거의 존재하지 않습니다. 복잡성도 높습니다. 예를 들어 장비 유형이 많고 데이터 표준이 일관성이 없어 알고리즘 전송성이 떨어지고 종종 온도, 재료 또는 예측할 수 없는 변수의 영향과 같은 몇 가지 주요 요소를 무시합니다. 또한 기업은 센서 데이터에 대한 관심에 편차가 있습니다. 다양한 센서 고장 데이터에 대해 기업은 주로 생산 결과에 영향을 미치는 데이터에 중점을 둡니다. 실제로 이러한 엣지 센서 데이터는 미래에 전체 제조 산업의 혁신과 상용화를 활용할 수 있는 받침점이 될 가능성이 높습니다. AI는 이러한 데이터 분석을 통해 잠재적인 최적화 기회를 발견하여 전체 산업의 발전을 촉진할 수 있습니다.”

“또한 제조 산업의 능력 요구 사항은 다른 산업과도 다릅니다. 문제에 대한 실시간 처리가 필요하며 대형 모델의 대기 시간은 여기에서 받아들이기 어렵습니다. 따라서 스마트 제조는 단기적으로 투자 수익이 없습니다. 물론 국가는 이 산업의 AI를 확실히 지원할 것입니다. 향후 5년 안에 대규모 증가가 발생할 수 있으며 로봇과 AI가 이중 조합이 될 것입니다.”

결국 스타트업의 경우 기본 대형 모델