AI 도입의 높은 비용
BofA 글로벌 리서치의 분석가인 Brad Sills와 Carly Liu에 따르면, AI 애플리케이션과 관련된 비용은 광범위한 구현을 저해하는 주요 장애물입니다. 1월 28일 화요일에 발표된 그들의 보고서는 비용 절감의 획기적인 발전이 가격을 더욱 낮추어 채택률을 증가시킬 수 있다고 제안합니다.
DeepSeek의 1월 27일 월요일 발표는 AI 업계에 충격을 주어 여러 AI 회사의 주식 하락을 초래했습니다. 회사는 2,048개의 Nvidia H800 칩을 사용하여 단 558만 달러에 파운데이션 모델을 훈련할 수 있는 능력을 공개했습니다. 이 수치는 수천 개의 Nvidia AI 칩을 사용하는 OpenAI 및 Anthropic의 추정 비용인 1억 달러에서 10억 달러와는 극명한 대조를 이룹니다.
eSIMple의 CTO인 Roy Benesh는 DeepSeek의 성과의 혁신적인 잠재력을 강조하면서 소규모 회사, 개별 개발자, 심지어 연구원까지 막대한 비용을 들이지 않고도 AI의 힘을 활용할 수 있도록 한다고 밝혔습니다. 이러한 접근성 증가는 혁신적인 아이디어와 기술 개발을 촉진하여 해당 분야에서 더 큰 경쟁력을 가져올 수 있습니다. 결과적으로 고객은 새로운 옵션의 혜택을 누릴 수 있으며 기존 AI 회사는 가격을 낮추고 기술 발전을 가속화할 가능성이 높습니다.
BofA 분석가들은 기존 AI 애플리케이션과 관련된 비용의 예를 제공했습니다. Microsoft의 365 Copilot Chat은 요청의 복잡성에 따라 프롬프트당 1센트에서 30센트 사이의 요금을 부과합니다. Salesforce의 Service Cloud용 Agentforce는 전환당 2달러의 고정 요금을 부과합니다.
BofA는 DeepSeek가 제시한 558만 달러라는 수치가 연구, 실험, 아키텍처, 알고리즘 및 데이터와 관련된 비용을 제외하여 다소 오해의 소지가 있다고 인정했지만, 분석가들은 저렴한 훈련 방법의 타당성을 보여주는 스타트업의 혁신의 중요성을 강조했습니다.
사전 훈련 대 추론: 비용 이해
OpenAI의 GPT-4o 및 Google의 Gemini와 같은 파운데이션 AI 모델은 일반적인 지식을 개발하기 위해 전체 인터넷과 같은 방대한 양의 데이터에 노출되는 사전 훈련이라는 프로세스를 거칩니다. 그러나 이러한 모델을 특정 회사 및 산업에 더욱 관련성 있고 유용하게 만들기 위해 기업은 자체 데이터를 사용하여 추가로 훈련하거나 미세 조정해야 합니다.
AI 모델이 미세 조정되면 사용자 프롬프트를 처리하고 관련 응답을 생성할 수 있습니다. 그러나 모델을 프롬프트하고 응답을 얻는 프로세스는 새로운 데이터를 사용하여 이해하고 분석하는 데 관련된 수수료인 추론 비용을 발생시킵니다.
대부분의 회사가 파운데이션 모델 훈련 비용을 부담하지 않는다는 점에 유의하는 것이 중요합니다. 이 책임은 OpenAI, Google, Meta, Amazon, Microsoft, Anthropic, Cohere, Hugging Face, Mistral AI, Stability AI, xAI, IBM, Nvidia, 특정 연구소, Baidu 및 Alibaba와 같은 중국 기술 대기업을 포함한 이러한 모델의 개발자에게 있습니다.
기업은 주로 AI 워크로드를 처리하는 데 드는 추론 비용을 부담하며, 이는 AI 관련 비용의 대부분을 구성합니다.
중국과의 연결: DeepSeek의 추론 비용 및 개인 정보 보호 문제
DeepSeek는 실리콘 밸리 회사에 비해 훨씬 저렴한 비용으로 자체 추론 서비스를 제공합니다. 그러나 이러한 서비스를 사용할 때 염두에 두어야 할 몇 가지 고려 사항이 있습니다.
DeepSeek의 개인 정보 보호 정책에 따르면 사용자 정보는 중국에 있는 서버에 저장됩니다. 회사는 또한 법적 의무를 준수하고 공익을 위해 또는 사용자와 다른 사람들의 중요한 이익을 보호하기 위해 작업을 수행할 것이라고 명시합니다.
중국의 국가 정보법, 특히 7조는 모든 조직과 시민이 법에 따라 국가 정보 활동을 지원, 지원 및 협력하고 알고 있는 국가 정보 업무 비밀을 보호해야 한다고 규정합니다.
Appvance의 CEO인 Kevin Surace는 중국에서 사용자로부터 데이터를 수집하는 것이 일반적인 관행이라고 언급하면서 개인 정보 보호에 대한 우려를 제기했습니다. 그는 사용자에게 주의를 기울일 것을 권고했습니다.
PYMNTS가 실시한 실험에서 DeepSeek의 챗봇은 1989년 천안문 광장 시위가 중국 정치에 어떻게 영향을 미쳤는지 설명해 달라는 요청을 받았습니다. 챗봇은 “죄송합니다. 아직 이 유형의 질문에 어떻게 접근해야 할지 잘 모르겠습니다.”라고 응답했습니다.
Presearch의 CEO인 Tim Enneking은 DeepSeek가 중국에 위치한 100% 중국 소유 회사라고 지적했습니다. 그는 챗봇이 천안문 광장이나 중국 고위 정부 인사에 대한 정보를 제공할 수 없다는 점은 기술의 객관성에 한계가 있음을 시사한다고 언급했습니다. Enneking은 기술의 흥미로운 잠재력을 인정하면서도 통제에 대한 우려를 표명했습니다.
그러나 Enneking은 또한 DeepSeek 모델의 오픈 소스 특성을 강조했는데, 이는 정부 및 기업 통제를 제거하기 위해 수정할 수 있습니다. 그는 회사의 엔지니어링 창의성이 소규모 회사와 국가가 생성형 AI 환경에 참여하고 성공할 수 있는 기회를 창출한다고 믿습니다.
모든 사람을 위한 추론 비용 절감 가능성
DeepSeek의 저렴한 비용으로 파운데이션 모델을 훈련하는 혁신적인 접근 방식은 AI 컴퓨팅 비용을 계속 절감하고 규모를 확장할 수 있는 Microsoft와 같은 회사에 긍정적인 영향을 미칩니다. Sills와 Liu에 따르면 컴퓨팅 비용이 낮아지면 AI 지원 제품의 마진이 향상될 수 있습니다.
별도의 연구 노트에서 BofA 분석가 Alkesh Shah, Andrew Moss 및 Brad Sills는 AI 컴퓨팅 비용이 낮아지면 자동차에서 스마트폰에 이르기까지 다양한 분야에서 더 광범위한 AI 서비스가 가능해질 수 있다고 제안했습니다.
OpenAI와 같은 파운데이션 모델 개발자가 DeepSeek만큼 낮은 훈련 비용을 즉시 달성할 가능성은 낮지만, 분석가들은 DeepSeek의 혁신적인 훈련 및 훈련 후 기술이 경쟁 프런티어 모델 개발자에 의해 효율성을 높이기 위해 채택될 것이라고 믿습니다. 그러나 그들은 현재 모델이 AI 에이전트의 기반을 형성하므로 여전히 상당한 투자가 필요하다고 강조합니다.
장기적으로 분석가들은 챗봇, 코파일럿 및 에이전트가 더 똑똑하고 저렴해짐에 따라 기업의 AI 채택이 가속화될 것으로 예상합니다. 이를 제본스 패러독스라고 합니다.
Microsoft CEO인 Satya Nadella는 X에서 AI가 더 효율적이고 접근성이 높아짐에 따라 제본스 패러독스가 작용하고 있다고 말했습니다. 그는 이것이 AI 사용량 급증으로 이어져 우리가 충분히 얻을 수 없는 상품으로 바뀔 것이라고 믿습니다.
파운데이션 모델과 그 영향에 대한 더 깊은 이해
최신 AI의 중추인 파운데이션 모델은 기업이 운영하고 기술과 상호 작용하는 방식을 혁신하고 있습니다. 이러한 모델은 방대한 데이터 세트에서 훈련을 받아 자연어 처리에서 이미지 인식에 이르기까지 광범위한 작업을 수행할 수 있습니다. 그러나 이러한 모델의 개발 및 배포에는 훈련 비용, 추론 비용, 데이터 개인 정보 보호 및 윤리적 고려 사항을 포함한 복잡한 상호 작용이 필요합니다.
파운데이션 모델 이해
핵심적으로 파운데이션 모델은 방대한 데이터 세트에서 훈련된 대규모 신경망입니다. 이 훈련 프로세스를 통해 데이터 내의 패턴과 관계를 학습하여 다양한 작업을 놀라운 정확도로 수행할 수 있습니다. 파운데이션 모델의 몇 가지 예는 다음과 같습니다.
- GPT-4o: OpenAI에서 개발한 강력한 언어 모델로, 인간 품질의 텍스트를 생성하고, 언어를 번역하고, 질문에 포괄적으로 답변할 수 있습니다.
- Google의 Gemini: 텍스트, 이미지 및 오디오를 포함한 다양한 유형의 데이터를 처리하고 이해할 수 있는 다중 모드 AI 모델입니다.
이러한 모델은 특정 작업에 국한되지 않고 광범위한 애플리케이션에 적용할 수 있어 기업에 다재다능한 도구입니다.
사전 훈련 및 미세 조정의 역할
파운데이션 모델 개발에는 일반적으로 사전 훈련과 미세 조정이라는 두 가지 주요 단계가 포함됩니다.
- 사전 훈련: 이 단계에서 모델은 일반적인 지식과 언어 기술을 학습하기 위해 전체 인터넷과 같은 대규모 데이터 세트에서 훈련됩니다. 이 프로세스는 모델이 텍스트를 이해하고 생성하고, 언어를 번역하고, 기타 기본 작업을 수행할 수 있는 능력을 갖추게 합니다.
- 미세 조정: 이 단계에서 사전 훈련된 모델은 특정 작업 또는 산업과 관련된 더 작고 더 구체적인 데이터 세트에서 추가로 훈련됩니다. 이 프로세스를 통해 모델은 애플리케이션의 특정 요구 사항에 맞게 지식과 기술을 조정할 수 있습니다.
예를 들어 사전 훈련된 언어 모델은 고객 문의에 효과적으로 응답할 수 있는 챗봇을 만들기 위해 고객 서비스 상호 작용 데이터 세트에서 미세 조정할 수 있습니다.
훈련 및 추론 비용
파운데이션 모델과 관련된 비용은 훈련 비용과 추론 비용이라는 두 가지 주요 범주로 나눌 수 있습니다.
- 훈련 비용: 이러한 비용에는 파운데이션 모델을 훈련하는 데 필요한 컴퓨팅 리소스, 데이터 및 전문 지식이 포함됩니다. 대규모 파운데이션 모델을 훈련하는 것은 매우 비쌀 수 있으며 종종 수백만 달러의 투자가 필요합니다.
- 추론 비용: 이러한 비용에는 훈련된 모델을 사용하여 예측을 하거나 출력을 생성하는 데 필요한 컴퓨팅 리소스가 포함됩니다. 추론 비용은 모델의 크기와 복잡성, 처리되는 데이터 양 및 사용되는 인프라에 따라 달라질 수 있습니다.
DeepSeek의 혁신은 파운데이션 모델과 관련된 훈련 비용을 크게 줄여 더 광범위한 기업 및 조직에서 더 쉽게 접근할 수 있도록 하는 데 있습니다.
개인 정보 보호 및 윤리적 문제 해결
파운데이션 모델을 사용하면 데이터 개인 정보 보호 및 윤리적 고려 사항에 대한 중요한 질문이 제기됩니다. 파운데이션 모델은 민감하거나 개인 정보가 포함될 수 있는 대규모 데이터 세트에서 훈련됩니다. 이러한 모델이 사용자 개인 정보를 존중하고 편견을 피하면서 책임감 있고 윤리적인 방식으로 사용되도록 하는 것이 중요합니다.
이러한 문제를 해결하기 위한 몇 가지 전략은 다음과 같습니다.
- 데이터 익명화: 사용자 개인 정보를 보호하기 위해 훈련 데이터에서 개인 정보를 제거하거나 마스킹합니다.
- 편향 감지 및 완화: 모델이 유해한 고정 관념이나 차별적 관행을 영속화하지 않도록 훈련 데이터의 편향을 식별하고 해결합니다.
- 투명성 및 책임성: 모델 작동 방식과 사용 방법에 대한 명확한 정보를 제공하고 오류 또는 의도하지 않은 결과가 발생할 경우 책임성을 위한 메커니즘을 구축합니다.
파운데이션 모델이 더 널리 보급됨에 따라 이러한 개인 정보 보호 및 윤리적 문제를 사전에 해결하여 사회에 유익하게 사용되도록 하는 것이 필수적입니다.
파운데이션 모델의 미래
파운데이션 모델은 빠르게 진화하고 있으며 사회에 미칠 수 있는 잠재적 영향은 막대합니다. 앞으로 우리는 다음을 기대할 수 있습니다.
- 더 강력하고 다재다능한 모델: 연구자들이 새로운 아키텍처와 훈련 기술을 계속 개발함에 따라 파운데이션 모델은 더욱 강력하고 다재다능해져 더 넓은 범위의 작업을 더 큰 정확도로 수행할 수 있습니다.
- 접근성 증가: 훈련 비용이 감소하고 클라우드 기반 AI 플랫폼이 더 널리 보급됨에 따라 파운데이션 모델은 모든 규모의 기업에서 더 쉽게 접근할 수 있게 됩니다.
- 새로운 애플리케이션 및 사용 사례: 파운데이션 모델은 의료에서 금융, 교육에 이르기까지 다양한 산업 분야에서 새롭고 혁신적인 사용 사례에 계속 적용될 것입니다.
파운데이션 모델의 부상은 인공 지능 분야에서 패러다임 전환을 나타냅니다. 그들의 능력, 비용 및 윤리적 고려 사항을 이해함으로써 우리는 그들의 힘을 활용하여 더 나은 미래를 만들 수 있습니다.
AI 민주화에 대한 DeepSeek의 기여
파운데이션 모델 훈련 비용을 크게 줄인 DeepSeek의 업적은 AI 민주화에서 중추적인 순간을 의미합니다. DeepSeek는 진입 장벽을 낮춤으로써 더 광범위한 조직과 개인이 AI 혁명에 참여할 수 있도록 지원합니다.
소규모 기업에 미치는 영향
소규모 기업은 자체 AI 모델을 개발하고 배포할 자원과 전문 지식이 부족한 경우가 많습니다. DeepSeek의 비용 효율적인 파운데이션 모델은 이러한 기업에 이전에는 접근할 수 없었던 최첨단 AI 기술에 대한 액세스를 제공합니다. 이것은 경쟁의 장을 평준화하여 소규모 기업이 더 크고 더 확고한 회사와 더 효과적으로 경쟁할 수 있도록 합니다.
예를 들어 소규모 전자 상거래 기업은 DeepSeek의 모델을 사용하여 고객에게 제품 추천을 개인화하고, 고객 서비스를 개선하거나, 마케팅 캠페인을 자동화할 수 있습니다.
개별 개발자의 역량 강화
DeepSeek의 모델은 또한 개별 개발자와 연구자가 새로운 AI 애플리케이션과 혁신을 탐색할 수 있도록 지원합니다. 저렴한 파운데이션 모델에 액세스하면 개발자가 다양한 아이디어를 실험하고, 새로운 AI 기반 도구를 개발하고, AI 기술 발전에 기여할 수 있습니다.
이것은 더 많은 사람들이 AI 개발에 참여할 수 있는 기회를 가질 때 혁신의 급증으로 이어질 수 있습니다.
오픈 소스 협업의 잠재력
DeepSeek의 오픈 소스 접근 방식은 AI 커뮤니티에서 협업과 혁신을 더욱 촉진합니다. DeepSeek는 모델을 대중에게 공개함으로써 개발자가 모델 개선에 기여하고, 버그를 식별하고 수정하고, 새로운 기능을 개발하도록 장려합니다.
이러한 협업적 접근 방식은 AI 기술 개발을 가속화하고 모든 사람에게 유익하게 사용되도록 할 수 있습니다.
AI 도입 가속화
DeepSeek는 AI 비용을 낮춤으로써 다양한 산업 분야에서 AI 도입을 가속화하고 있습니다. AI가 더 저렴하고 접근성이 높아짐에 따라 더 많은 기업이 운영에 통합하여 생산성, 효율성 및 혁신을 높일 수 있습니다.
이것은 세계 경제에 심오한 영향을 미쳐 성장을 촉진하고 새로운 기회를 창출할 수 있습니다.
더 포용적인 AI 생태계
AI를 민주화하려는 DeepSeek의 노력은 더 많은 사람들이 AI 개발 및 사용에 참여할 수 있는 더 포용적인 AI 생태계에 기여하고 있습니다. 이것은 AI가 소수의 사람들만이 아닌 사회의 모든 구성원에게 유익한 방식으로 사용되도록 하는 데 도움이 될 수 있습니다.
DeepSeek는 소규모 기업, 개별 개발자 및 연구자에게 힘을 실어줌으로써 더 다양하고 혁신적인 AI 환경을 조성하고 있습니다.