Ernie 4.5: 멀티모달 파워하우스
이미지, 오디오, 비디오를 포괄하는 광범위한 멀티모달 기능을 갖춘 Ernie 4.5는 OpenAI의 GPT-4o보다 우수한 성능을 입증했습니다. Baidu가 WeChat 플랫폼에 발표한 성명에 따르면, 이러한 성능은 CCBench 및 OCRBench를 포함한 다양한 벤치마크 플랫폼에서 관찰되었습니다. 또한, 회사는 Ernie 4.5 기반 모델의 텍스트 처리 능력이 DeepSeek V3를 능가할 뿐만 아니라 일련의 벤치마크 평가를 기반으로 OpenAI의 GPT-4.5와 거의 비슷한 수준의 성능을 달성한다고 주장합니다.
Baidu의 선구자 역할과 경쟁 심화
Baidu는 중국 내에서 LLM을 도입한 최초의 주요 중국 기술 회사라는 차별점을 가지고 있습니다. 이러한 선구적인 움직임은 2023년 3월 OpenAI의 ChatGPT 출시로 인한 흥분감에 힘입어 이루어졌습니다. 그러나 지난 2년 동안 Baidu의 초기 이점은 중국의 다른 신흥 AI 업체들에 의해 점점 더 경쟁이 심화되고 있습니다. 검색 대기업의 최근 중국 AI 시장에서의 입지를 강화하기 위한 전략적 움직임은 DeepSeek가 오픈 소스 트렌드를 촉발한 시점에 이루어졌습니다. 동시에 Alibaba, Tencent, ByteDance와 같은 업계 거대 기업들은 각자의 AI 모델을 위해 비즈니스 및 소비자 사용자를 적극적으로 추구하고 있습니다.
Ernie X1: 성능 및 가격
Baidu는 새로 도입된 추론 모델인 Ernie X1에 대한 구체적인 벤치마크 결과를 공개하지 않았지만, 회사는 ‘절반 가격에 DeepSeek R1과 동등한 성능을 제공한다’고 밝혔습니다. 이 성명은 비용 효율성 측면에서 상당한 경쟁 우위를 시사합니다.
Ernie X1의 기능을 통합하려는 기업의 경우 API(응용 프로그래밍 인터페이스) 액세스 가격은 다음과 같이 구성됩니다. 백만 입력 토큰당 2위안(약 0.28달러) 및 백만 출력 토큰당 8위안. 반면 DeepSeek는 현재 R1 추론 모델로 구동되는 DeepSeek-reasoner에 대해 백만 입력 토큰당 0.55달러, 백만 출력 토큰당 2.19달러를 부과합니다. 항저우에 기반을 둔 스타트업인 DeepSeek는 최근 수요 급증에 대응하여 API 가격을 인상했습니다.
Baidu의 오픈 소스로의 전환
Baidu의 설립자, 회장 겸 CEO인 Robin Li Yanhong은 지난달 Ernie 4.5의 미래에 관한 주목할 만한 발표를 했습니다. 그는 6월 30일부터 모델이 오픈 소스로 공개될 것이라고 밝혔습니다. 이 결정은 이전에 폐쇄형 AI 개발을 강력하게 지지했던 그의 접근 방식에서 180도 전환한 것입니다.
Li는 2월 분석가와의 실적 발표에서 이러한 전략적 변화에 대해 자세히 설명하면서 ‘DeepSeek에서 배운 한 가지는 최고의 모델을 오픈 소스화하면 채택에 큰 도움이 될 수 있다는 것입니다.’라고 말했습니다. 그는 또한 ‘모델이 오픈 소스일 때 사람들은 자연스럽게 호기심으로 인해 모델을 사용해 보고 싶어하며, 이는 더 광범위한 채택을 유도하는 데 도움이 됩니다.’라고 설명했습니다. 오픈 소스 개발의 이점에 대한 이러한 인정은 경쟁적인 AI 환경에서 Baidu의 진화하는 전략을 강조합니다.
AI 발전 속 Baidu의 사업 성과
Baidu가 인공 지능 분야에서 주목할 만한 진전을 이루었음에도 불구하고 회사의 전반적인 사업은 광고 수익 약화로 인해 역풍을 맞고 있습니다. 최근 재무 보고서에 따르면 Baidu의 4분기 총 수익은 전년 대비 2% 감소했습니다. 또한 연간 매출도 1% 감소했습니다. 이러한 수치는 Baidu가 최첨단 AI 기술에 대한 투자와 강력한 재무 성과 유지 필요성 사이에서 균형을 유지하는 데 직면한 어려움을 강조합니다.
핵심 측면에 대한 확장
보다 포괄적인 이해를 제공하기 위해 Baidu의 발표와 중국 AI 환경의 광범위한 맥락의 몇 가지 중요한 측면을 더 자세히 살펴보겠습니다.
멀티모달리티의 중요성:
Ernie 4.5와 Ernie X1 모두에서 ‘멀티모달’ 기능에 대한 강조는 매우 중요합니다. 기존 LLM은 주로 텍스트 기반 처리에 중점을 두었습니다. 그러나 이미지, 오디오, 비디오 등 다양한 양식의 정보를 처리하고 이해하는 능력은 광범위한 새로운 가능성을 열어줍니다. 여기에는 다음이 포함됩니다.
- 향상된 이미지 인식: AI 모델은 이제 이미지의 객체를 식별할 뿐만 아니라 객체 간의 맥락과 관계를 이해할 수 있습니다.
- 향상된 오디오 전사 및 분석: 음성 언어를 더 정확하게 전사하고 오디오 녹음에서 감정 및 의도와 같은 뉘앙스를 감지합니다.
- 비디오 이해: 비디오 콘텐츠를 분석하여 장면, 동작을 식별하고 향후 이벤트를 예측합니다.
오픈 소스 논쟁:
Robin Li가 Ernie 4.5를 오픈 소스화하기로 한 결정은 폐쇄형 소스와 오픈 소스 AI 개발 간의 지속적인 논쟁에서 중요한 발전입니다.
- 폐쇄형 소스: 이 접근 방식을 지지하는 사람들은 기술에 대한 더 나은 제어를 허용하여 책임감 있는 사용을 보장하고 오용을 방지한다고 주장합니다. 또한 기업이 지적 재산을 보호하고 경쟁 우위를 유지할 수 있습니다.
- 오픈 소스: 오픈 소스 개발 옹호자들은 협업을 촉진하고 혁신을 가속화하며 투명성을 증진한다고 믿습니다. 이를 통해 전 세계 연구자와 개발자가 AI 기술 발전에 기여할 수 있습니다.
적어도 Ernie 4.5에 대한 Baidu의 오픈 소스화로의 전환은 오픈 소스 운동의 증가하는 모멘텀과 잠재적 이점에 대한 인식을 시사합니다.
경쟁 환경:
중국의 AI 경쟁은 치열하며 수많은 기업이 주도권을 놓고 경쟁하고 있습니다.
- Alibaba: Alibaba의 Tongyi Qianwen LLM은 주요 경쟁자이며 회사는 전자 상거래, 클라우드 컴퓨팅 및 물류를 포함한 다양한 사업부에 AI를 적극적으로 통합하고 있습니다.
- Tencent: Tencent의 Hunyuan LLM은 또 다른 중요한 업체이며 회사는 AI를 활용하여 소셜 미디어 플랫폼, 게임 제공 및 클라우드 서비스를 강화하고 있습니다.
- ByteDance: TikTok의 모회사인 ByteDance도 AI에 막대한 투자를 하고 있으며, 이를 활용하여 추천 알고리즘을 강화하고 신제품을 개발하고 있습니다.
- DeepSeek: DeepSeek는 LLM 분야에서 강력한 경쟁자입니다.
가격의 영향:
DeepSeek의 가격을 절반으로 낮춘 Ernie X1에 대한 Baidu의 공격적인 가격 책정 전략은 시장 점유율을 확보하려는 의도를 분명히 보여줍니다. 이러한 가격 전쟁은 AI 기술을 보다 접근 가능하고 저렴하게 만들어 기업과 소비자에게 잠재적으로 이익이 될 수 있습니다.
더 광범위한 의미:
Baidu의 AI 발전과 중국 시장의 치열한 경쟁은 광범위한 영향을 미칩니다.
- 기술 발전: 혁신의 빠른 속도는 더 넓은 기능을 갖춘 점점 더 정교한 AI 모델의 개발을 주도하고 있습니다.
- 경제적 영향: AI는 다양한 산업을 변화시키고 생산성을 높이며 새로운 일자리를 창출하고 잠재적으로 세계 경제 환경을 재편할 준비가 되어 있습니다.
- 사회적 영향: AI의 광범위한 채택은 편견, 개인 정보 보호 및 일자리 대체와 관련된 문제를 포함하여 해결해야 할 중요한 윤리적, 사회적 문제를 제기합니다.
Baidu 전략에 대한 추가 설명
Baidu의 전략은 기술 혁신과 시장 포지셔닝을 모두 포괄하는 다면적인 것으로 보입니다.
1. 기술적 우수성:
- 멀티모달리티에 집중: Baidu는 멀티모달 AI 모델 개발을 명확하게 우선시하고 있으며, 이 기술이 새로운 응용 프로그램과 기능을 잠금 해제할 수 있는 잠재력을 인식하고 있습니다.
- 지속적인 개선: Ernie 4.5 및 Ernie X1의 출시는 AI 성능의 한계를 지속적으로 확장하는 Baidu의 지속적인 연구 개발에 대한 의지를 보여줍니다.
- 오픈 소스 수용: Ernie 4.5를 오픈 소스화하기로 한 결정은 더 넓은 AI 커뮤니티와 협력하고 해당 분야의 집단적 발전에 기여하려는 의지를 나타냅니다.
2. 시장 포지셔닝:
- 경쟁력 있는 가격: Ernie X1의 공격적인 가격 책정은 경쟁이 치열한 LLM 환경에서 사용자를 유치하고 시장 점유율을 확보하기 위한 전략적 움직임입니다.
- 기업 타겟팅: API 액세스에 대한 초점은 Baidu가 AI를 운영에 통합하려는 기업을 적극적으로 타겟팅하고 있음을 시사합니다.
- 약점 해결: 회사는 AI 발전을 활용하여 제품을 다양화하고 새로운 수익원을 모색함으로써 광고 수익 감소와 같은 문제를 인정하고 해결하고 있습니다.
3. 장기 비전:
- AI 리더십: Baidu의 행동은 중국뿐만 아니라 글로벌 AI 환경에서 리더가 되려는 분명한 야망을 시사합니다.
- 변혁적 기술: 회사는 AI를 비즈니스를 재편하고 더 광범위한 사회적 진보에 기여할 수 있는 잠재력을 가진 변혁적 기술로 보는 것 같습니다.
- 적응성: 오픈 소스 개발로의 전환에서 알 수 있듯이 Baidu의 전략을 기꺼이 조정하려는 의지는 AI 산업의 진화하는 역학에 대한 민첩성과 대응력을 보여줍니다.
본질적으로 Baidu는 야심 찬 목표를 달성하기 위해 기술 혁신과 전략적 시장 책략을 결합하여 AI 혁명의 주요 세력으로 자리매김하고 있습니다. 회사의 발전과 중국 AI 시장의 지속적인 경쟁은 전 세계 AI의 미래에 중대한 영향을 미치므로 면밀히 주시할 것입니다.