DeepSeek:推动企业AI采纳的变革

DeepSeek是一家冉冉升起的中国AI初创公司,它以大幅折扣的基础模型而声名鹊起。这一举措有可能彻底改变企业对AI的采用,因为它解决了最重要的障碍之一:成本。

AI采纳的高成本

美国银行全球研究的分析师Brad Sills和Carly Liu认为,与AI应用相关的费用是阻碍其广泛实施的主要障碍。他们在1月28日星期二发布的报告表明,成本降低方面的突破可能会进一步降低价格,从而提高采用率。

DeepSeek于1月27日星期一发布的公告在AI行业引起了震动,导致多家AI公司的股价下跌。该公司透露,它有能力使用2048个Nvidia H800芯片,仅用558万美元训练一个基础模型。这个数字与OpenAI和Anthropic的估计成本形成了鲜明对比,后者从1亿美元到10亿美元不等,并涉及使用数千个Nvidia的AI芯片。

eSIMple的首席技术官Roy Benesh强调了DeepSeek成就的变革潜力,他说,它使较小的公司、个人开发者,甚至研究人员都能够在不产生过高成本的情况下利用AI的力量。这种可访问性的提高可以促进创新思想和技术的发展,从而提高该领域的竞争力。因此,客户可以从新的选择中受益,而老牌AI公司可能会降低价格并加速技术进步。

美国银行的分析师提供了与现有AI应用相关的成本示例。微软的365 Copilot Chat每次提示收费在1美分到30美分之间,具体取决于请求的复杂程度。Salesforce的Agentforce for Service Cloud每次转换收费2美元的固定费用。

虽然美国银行承认DeepSeek提出的558万美元的数字在某种程度上具有误导性,因为它排除了与研究、实验、架构、算法和数据相关的成本,但分析师强调了这家初创公司在证明成本较低的培训方法的可行性方面的创新意义。

预训练与推理:理解成本

基础AI模型,例如OpenAI的GPT-4o和Google的Gemini,需要经过一个称为预训练的过程,在该过程中,它们会接触到大量数据,例如整个互联网,以发展通用知识。但是,为了使这些模型与特定公司和行业更相关、更有用,企业需要使用自己的数据进一步训练或微调它们。

一旦AI模型经过微调,它就可以处理用户提示并生成相关的响应。但是,提示模型并获得响应的过程会产生推理成本,即与使用新数据来理解和分析模型相关的费用。

重要的是要注意,大多数公司不承担培训基础模型的费用。此责任由这些模型的开发者承担,包括OpenAI、Google、Meta、Amazon、Microsoft、Anthropic、Cohere、Hugging Face、Mistral AI、Stability AI、xAI、IBM、Nvidia、某些研究实验室以及中国科技巨头如百度和阿里巴巴。

企业主要承担处理AI工作负载的推理成本,这构成了AI相关费用的主要部分。

中国联系:DeepSeek的推理成本和隐私问题

与硅谷公司相比,DeepSeek以明显更低的成本提供自己的推理服务。但是,使用这些服务时需要牢记某些注意事项。

根据DeepSeek的隐私政策,用户信息存储在位于中国的服务器上。该公司还声明,它将遵守法律义务,并以公共利益执行任务或保护其用户和其他人的切身利益。

中国的国家情报法,特别是第7条,规定所有组织和公民都必须按照法律支持、协助和配合国家情报工作,并保护他们所了解的国家情报工作秘密。

Appvance首席执行官Kevin Surace对隐私表示担忧,他说,从用户那里收集数据在中国是一种常见做法。他建议用户谨慎行事。

在PYMNTS进行的一项实验中,DeepSeek的聊天机器人被要求解释1989年天安门广场抗议活动如何影响中国政治。聊天机器人回答说:’对不起,我还不确定如何处理这类问题。’

Presearch首席执行官Tim Enneking指出,DeepSeek是一家100%的中国公司,位于中国。他指出,聊天机器人无法提供有关天安门广场或中国高级政府官员的信息,这表明该技术的客观性存在局限性。虽然Enneking承认该技术令人兴奋的潜力,但他对它的控制表示担忧。

但是,Enneking还强调了DeepSeek模型的开源性质,这允许进行修改以消除政府和公司的控制。他认为,该公司的工程创造力为较小的公司和国家创造了参与和成功于生成式AI领域的机会。

DeepSeek降低所有人推理成本的潜力

DeepSeek以较低的成本培训基础模型的创新方法对微软等公司具有积极意义,这些公司可以继续降低AI计算的成本并扩大规模。Sills和Liu认为,较低的计算成本可以提高AI支持产品的利润率。

在另一份研究报告中,美国银行的分析师Alkesh Shah、Andrew Moss和Brad Sills表示,较低的AI计算成本可以支持从汽车到智能手机等各个领域的更广泛的AI服务。

虽然像OpenAI这样的基础模型开发者不太可能立即实现与DeepSeek一样低的培训成本,但分析师认为,DeepSeek的创新培训和后期培训技术将被竞争的前沿模型开发者采用,以提高效率。但是,他们强调,当前的模型仍然需要大量投资,因为它们构成了AI代理的基础。

从长远来看,分析师预计,随着聊天机器人、副驾驶和代理变得更智能、更便宜,企业将加速采用AI,这种现象被称为杰文斯悖论。

微软首席执行官Satya Nadella在X上回应了这种观点,他说,随着AI变得更高效和更易于访问,杰文斯悖论正在发挥作用。他认为,这将导致AI使用量激增,将其转变为我们无法获得足够的商品。

深入了解基础模型及其影响

基础模型是现代AI的骨干,正在彻底改变企业的运营方式以及与技术的交互方式。这些模型经过大量数据集的训练,具有执行各种任务的能力,从自然语言处理到图像识别。但是,这些模型的开发和部署涉及复杂的因素相互作用,包括培训成本、推理成本、数据隐私和道德考量。

理解基础模型

从本质上讲,基础模型是在海量数据集上训练的大型神经网络。此培训过程使它们能够学习数据中的模式和关系,从而使它们能够以惊人的准确性执行各种任务。基础模型的一些示例包括:

  • **GPT-4o:**由OpenAI开发的强大语言模型,能够生成人类质量的文本,翻译语言,并以全面的方式回答问题。
  • **Google的Gemini:**一种多模态AI模型,可以处理和理解各种类型的数据,包括文本、图像和音频。

这些模型不限于特定任务,而是可以适应各种应用,使其成为企业的通用工具。

预训练和微调的作用

基础模型的开发通常涉及两个关键阶段:预训练和微调。

  • **预训练:**在此阶段,模型在海量数据集上进行训练,例如整个互联网,以学习通用知识和语言技能。此过程使模型能够理解和生成文本,翻译语言以及执行其他基本任务。
  • **微调:**在此阶段,预训练模型在与特定任务或行业相关的较小、更具体的数据集上进一步训练。此过程使模型能够使其知识和技能适应应用的特定需求。

例如,可以在客户服务交互的数据集上微调预训练的语言模型,以创建一个可以有效响应客户咨询的聊天机器人。

培训和推理的成本

与基础模型相关的成本可以分为两个主要类别:培训成本和推理成本。

  • **培训成本:**这些成本包括培训基础模型所需的计算资源、数据和专业知识。培训大型基础模型可能非常昂贵,通常需要数百万美元的投资。
  • **推理成本:**这些成本包括使用经过训练的模型进行预测或生成输出所需的计算资源。推理成本可能会因模型的大小和复杂性、正在处理的数据量以及正在使用的基础架构而异。

DeepSeek的创新在于它能够显着降低与基础模型相关的培训成本,从而使更广泛的企业和组织可以访问它们。

解决隐私和道德问题

基础模型的使用提出了关于数据隐私和道德考量的重要问题。基础模型在海量数据集上进行训练,这些数据集可能包含敏感或个人信息。至关重要的是要确保以负责任和合乎道德的方式使用这些模型,尊重用户隐私并避免偏见。

解决这些问题的一些策略包括:

  • **数据匿名化:**从培训数据中删除或屏蔽个人信息以保护用户隐私。
  • **偏见检测和缓解:**识别和解决培训数据中的偏见,以确保该模型不会延续有害的刻板印象或歧视性做法。
  • **透明度和问责制:**提供关于模型如何工作以及如何使用的明确信息,并建立问责制机制以防出现错误或意外后果。

随着基础模型变得越来越普遍,必须积极主动地解决这些隐私和道德问题,以确保它们用于造福社会。

基础模型的未来

基础模型正在迅速发展,它们对社会的潜在影响是巨大的。未来,我们可以期待看到:

  • **更强大和通用的模型:**随着研究人员继续开发新的架构和培训技术,基础模型将变得更加强大和通用,能够以更高的准确性执行更广泛的任务。
  • **更高的可访问性:**随着培训成本的降低和基于云的AI平台变得越来越普遍,各种规模的企业都可以更容易地访问基础模型。
  • **新的应用和用例:**基础模型将继续应用于各个行业中新的和创新的用例,从医疗保健到金融再到教育。

基础模型的兴起代表了人工智能领域的一场范式转变。通过了解它们的能力、成本和道德考量,我们可以利用它们的力量来创造更美好的未来。

DeepSeek对AI民主化的贡献

DeepSeek在显着降低培训基础模型的成本方面的成就标志着AI民主化的关键时刻。通过降低准入门槛,DeepSeek正在使更广泛的组织和个人能够参与AI革命。

对小型企业的影响

小型企业通常缺乏开发和部署自己的AI模型的资源和专业知识。DeepSeek的具有成本效益的基础模型为这些企业提供了以前无法企及的尖端AI技术。这可以创造公平的竞争环境,使小型企业能够更有效地与规模更大、更成熟的公司竞争。

例如,一家小型电子商务企业可以使用DeepSeek的模型来个性化其客户的产品推荐,改善其客户服务或自动化其营销活动。

个人开发者的赋权

DeepSeek的模型还使个人开发者和研究人员能够探索新的AI应用和创新。通过访问负担得起的基础模型,开发者可以尝试不同的想法,开发新的AI驱动的工具,并为AI技术的进步做出贡献。

这可能会导致创新浪潮,因为越来越多的人有机会参与AI的开发。

开源协作的潜力

DeepSeek的开源方法进一步促进了AI社区的协作和创新。通过向公众提供其模型,DeepSeek鼓励开发者为其改进做出贡献,识别和修复错误以及开发新功能。

这种协作方法可以加速AI技术的开发,并确保它用于造福所有人。

加速AI采用

通过降低AI的成本,DeepSeek正在加速AI在各个行业的采用。随着AI变得更经济实惠和更容易访问,更多的企业将能够将其集成到其运营中,从而提高生产力、效率和创新。

这可能会对全球经济产生深远的影响,从而推动增长并创造新的机会。

更加包容的AI生态系统

DeepSeek为AI民主化所做的努力正在促进一个更加包容的AI生态系统,更多的人有机会参与AI的开发和使用。这有助于确保以一种造福社会所有成员的方式使用AI,而不仅仅是少数人。

通过增强小型企业、个人开发者和研究人员的能力,DeepSeek正在培养一个更加多元化和创新的AI前景。