需求激增与迅速反应
DeepSeek 在 1 月下旬的突然出现,给整个技术领域带来了震动,Amazon 与其他同行一样,发现自己正在迅速调整以适应这个新来者的影响。内部文件和消息来源揭示了这家中国 AI 模型如何影响 Amazon 的产品更新、销售策略,甚至是内部开发工作。
最初的冲击波以请求激增的形式出现。许多公司强烈要求通过 Amazon 的 Bedrock 开发工具访问 DeepSeek 的模型。这促使 Amazon 以不同寻常的速度采取行动,迅速将 DeepSeek 添加到 Bedrock 平台。虽然一些员工认为审批过程异常迅速,但 Amazon 的领导层将其定义为对明确客户需求的快速响应。首席执行官 Andy Jassy 后来向投资者强调了这种敏捷性,突出了公司致力于满足客户需求的承诺。
这种响应能力突显了快节奏的 AI 世界中的一个更广泛的趋势。即使是最大的科技公司也无法免受新发现的颠覆性潜力。Amazon 与 OpenAI、Google、Meta 和 Microsoft 等竞争对手一样,被迫适应由 DeepSeek 塑造的不断变化的格局。
然而,Amazon 坚称其核心战略保持不变。一位公司发言人重申,他们的重点一直是提供通过 AWS 安全访问尖端模型的途径,使客户能够控制他们的数据并构建定制的生成式 AI 应用程序。
驾驭隐私格局
DeepSeek 令人印象深刻的性能和成本效益是不可否认的,但它的到来也引发了疑问。该模型强大的功能和低廉的价格在市场上引起了轰动,导致投资者仔细审查美国科技公司在计算基础设施方面的大量投资。
Amazon 的回应是多方面的。在继续集成 DeepSeek 相关功能(例如最近在 Bedrock 上推出了 DeepSeek 推理模型的完全托管服务)的同时,该公司还专注于教育和差异化。
在内部,讨论围绕着如何定位 Amazon 的产品以对抗 DeepSeek。该战略的一个关键方面是强调隐私和安全。
强调安全性和选择
AWS 员工的内部指南鼓励他们在与客户互动时强调与 DeepSeek 相关的潜在隐私和安全问题。这些指南建议:
- 提醒客户“模型选择”的重要性。
- 将 AWS 的 Nova AI 模型作为可行的替代方案进行推销。
- 将 Bedrock 推广为访问 AI 模型的更安全、更私密的平台。
该指南明确指出,Bedrock 确保客户数据既不与模型提供商共享,也不用于增强基础模型。Amazon 预计大多数客户将选择 DeepSeek 模型的开源版本,而不是中国公司直接提供的版本,从而进一步降低潜在的隐私风险。
该指南还提请注意 DeepSeek 的隐私政策,其中指出用户数据可能会被收集并存储在中国的服务器上。这强化了 AWS 积极意识到并解决与 DeepSeek 相关的隐私问题的信息。
利用 Nova 的优势
除了隐私之外,AWS 还在其竞争定位中利用其自身 Nova AI 模型的优势。内部指南强调:
- 根据第三方基准数据,Nova 模型与 DeepSeek 的模型相比表现出更快的性能。
- Nova 模型受益于 AWS 更强大的“负责任的 AI”标准,从而增强了其安全性。
虽然承认 Nova 与 DeepSeek 的 V3 模型(纯文本模型)相比,与 R1 推理模型更具可比性,但该指南强调了 Nova 更广泛的功能,包括图像和视频理解。
内部协作与学习
DeepSeek 的到来在 Amazon 内部引发了一系列活动。在 DeepSeek 首次亮相后的几天内,一个名为“Deepseek-interest”的内部 Slack 频道迅速吸引了 1,300 多名员工。该频道成为讨论、提问和观察的中心。
一些员工对 DeepSeek 受到的相对有限的抵制表示惊讶,考虑到它的中国血统和潜在的安全隐患。其他人则寻求在 AWS 的内部芯片开发平台 Neuron 上支持 DeepSeek 模型。还有报道称,客户抱怨在使用 Bedrock 上的 DeepSeek 时遇到错误。
为了解决激增的兴趣并提供指导,Amazon 在 1 月下旬组织了一次内部 DeepSeek 学习会议。本次会议涵盖了 AWS 的信息传递、竞争定位以及与 DeepSeek 的关键区别。
适应与发展
在积极整合和响应 DeepSeek 的同时,Amazon 也在采取措施管理潜在风险。现在不鼓励员工在他们的工作计算机上使用 DeepSeek,并收到警告,不要与 DeepSeek 的应用程序共享机密信息,这反映了在工作中使用 ChatGPT 的预防措施。
AI 领域创新的快速步伐在以下事实中显而易见:一些 Amazon 员工已经在展望 DeepSeek 之外。内部 Slack 频道内的讨论已转向其他中国 AI 产品,例如阿里巴巴的 Qwen,这表明人们对不断发展的格局保持着持续的关注。一位员工甚至评论说 DeepSeek“已经是过去的一天”,突显了进步的无情步伐。
DeepSeek 的技术影响
Amazon 不仅仅是在应对 DeepSeek 的市场存在;它还在研究其底层技术。目前正在努力分析 DeepSeek 的训练技术,目的是将其中的一些技术应用于 AWS 自己的推理模型(目前正在开发中)。
如前所述,AWS 一直在开发自己的推理模型。然而,DeepSeek 的出现注入了一种紧迫感,加速了该项目的进展。
在一次财报电话会议上,首席执行官 Andy Jassy 承认 Amazon 对 DeepSeek 训练方法的几个方面“印象深刻”。他特别提到“翻转强化训练的顺序”和某些“推理优化”作为感兴趣的领域。
关注推理
Amazon 开发 DeepSeek R1 推理模型的直接竞争对手,突显了该公司致力于保持 AI 创新前沿的承诺。以 DeepSeek 为例的推理能力的快速发展,凸显了这一领域的重要性。
通过创建自己的推理模型,AWS 旨在:
- 提供 DeepSeek R1 的有竞争力的替代方案。
- 解决与使用来自外国实体的模型相关的潜在隐私和安全问题。
- 利用其自身的专业知识和基础设施,有可能超越 DeepSeek 的能力。
更广泛的影响
Amazon 对 DeepSeek 的反应提供了一个有价值的案例研究,说明了大型科技公司如何驾驭 AI 动态且通常不可预测的世界。它表明:
- 敏捷性的必要性: 快速适应新发展和客户需求的能力至关重要。
- 差异化的重要性: 在竞争激烈的环境中,突出独特的优势并解决潜在的弱点至关重要。
- 持续关注隐私和安全: 随着 AI 模型变得越来越强大,对数据隐私和安全的担忧至关重要。
- 不断追求创新: 研究和学习竞争对手,同时投资于内部研发,对于保持领先地位至关重要。
DeepSeek 的故事提醒我们,AI 格局处于不断变化之中。新的参与者出现,技术不断发展,公司必须适应才能保持竞争力。Amazon 的反应,以快速整合、战略定位和内部学习相结合为特征,反映了这种不断变化的环境所带来的挑战和机遇。其自身推理模型的持续开发进一步强调了 Amazon 不仅致力于响应市场变化,而且致力于塑造 AI 的未来。