中国AI初创DeepSeek挑战美国领导地位

中国AI新星:Deepseek的崛起

美国在人工智能领域的领导地位正面临来自中国的挑战。一家名为Deepseek的中国初创公司,以其惊人的低预算和高效的AI模型,引起了全球的关注。这家总部位于杭州的公司,发布了几款开源人工智能模型,这些模型在性能上可以与OpenAI相媲美,同时在效率和成本方面更具优势。这无疑给美国在AI领域的霸主地位敲响了警钟。

人工智能领域正在上演一场“大卫对歌利亚”的较量。一方面,美国投入巨资,启动了“星际之门”计划,承诺投入5000亿美元,并得到科技巨头的支持,在美国各地建立数据中心。另一方面,一家敢于挑战的中国初创公司,以极低的预算训练出了令人印象深刻的开源模型。Deepseek的出现,打破了人们对AI研发的传统认知,证明了创新和效率的重要性。

Deepseek的突破性模型

Deepseek本周早些时候发布了其R1模型,该公司声称,该模型在性能上达到了甚至超越了OpenAI去年发布的o1模型。o1模型主要用于解决推理和数学问题。Deepseek已将其模型公开发布,评论员对其处理编码和推理等任务的能力印象深刻。R1的发布紧随该公司12月份的一项声明,即其大型语言模型V3仅使用了价值560万美元的计算能力进行训练,远低于据报道用于训练GPT-4的1亿美元以上。Deepseek表示,其V3模型在主要基准测试中与OpenAI和Anthropic的模型性能相当。

Andrej Karpathy,一位曾在特斯拉和OpenAI从事人工智能工作的专家,赞扬了Deepseek以“玩笑般的预算”训练其前沿人工智能的能力。这充分说明了Deepseek在技术上的突破和创新。

这些声明使Deepseek脱颖而出,成为中国竞争激烈的人工智能领域的领头羊。Deepseek40岁的创始人梁文锋,在周一会见了中国国务院总理李强,与一群行业领军人物一同出席了会议。《南华早报》报道了这一消息,进一步提升了Deepseek的知名度。

Deepseek的成功表明,尽管被禁止使用训练人工智能模型的黄金标准英伟达芯片,中国科技行业正在全球人工智能竞赛中找到自己的定位。这不仅是对美国芯片禁令的有力回击,也展示了中国在人工智能领域的巨大潜力。

Deepseek的崛起之路

Deepseek总部位于杭州,脱胎于中国量化对冲基金高鹄资本。据《南华早报》报道,截至2019年,高鹄资本管理着100亿元人民币(合今天的14亿美元)的资产。该基金于2023年分拆出Deepseek,将其定位为一家人工智能初创公司,专注于开发模型和构建人工智能产品。

Deepseek创始人梁文锋在浙江大学学习人工智能,之后共同创立了高鹄资本。高鹄资本雄厚的资金实力使其能够在2022年美国实施限制之前抢购数千枚英伟达人工智能芯片。这使得Deepseek比许多规模较小的竞争对手更具优势,使其能够继续开发和训练模型,而其他人工智能初创公司则在争夺处理能力。

人工智能专家对Deepseek与OpenAI的ChatGPT和Anthropic的Claude的性能差异持不同看法,认为中国人工智能模型在特定硬件配置下符合基准,但在其他情况下则表现不佳。但Deepseek专注于以更高效、更低成本的方式实现OpenAI和Anthropic所取得的成就。这家初创公司的模型使用了许多智能软件创新技术,以绕过其“专家混合”模型的限制,在该模型中,人工智能的不同部分被训练来处理特定类型的问题。

另一个不同之处在于,Deepseek的模型是开源的,可以在不同类型的硬件上使用。更重要的是,该模型会展示其如何得出答案,这与OpenAI的o1不同。这对于那些因美国开发的高昂模型而望而却步的客户来说可能已经足够了,特别是那些在世界其他地区,现在受到限制而无法获得大量美国计算资源的客户。

美国对中国人工智能的担忧

如果美国官员如愿以偿,一家中国公司将不可能生产出领先的人工智能模型。自2022年以来,美国一直控制着向中国销售先进人工智能芯片,阻止中国公司获得训练前沿人工智能模型所需的处理器。英伟达和英特尔等芯片制造商曾试图为中国市场生产符合美国要求的处理器,但华盛顿进一步收紧了规则。

这使得中国人工智能公司几乎没有选择:

  • 依赖禁令生效前进口的美国制造芯片
  • 利用从第三方地点运送芯片的灰色市场走私团伙
  • 依赖中国境外的数据中心
  • 或者转向华为等公司的中国制造替代品

(华为声称其人工智能芯片的性能优于英伟达的A100处理器,但据报道,这家中国科技巨头在可靠地大规模生产芯片方面遇到了困难)。

梁文锋去年告诉中国媒体36氪:“对我们来说,钱从来都不是问题;对先进芯片运输的禁令才是问题。”除了芯片出口禁令外,拜登政府还禁止美国对中国人工智能进行投资。

尽管如此,中国已经培育了一个充满活力和多样化的人工智能领域。百度、阿里巴巴和字节跳动等大型科技公司正在开发自己的基础模型,并向企业和普通用户提供新的人工智能服务。像MiniMax和Moonshot AI这样的中国人工智能初创公司已经发布了以消费者为中心的服务,甚至在美国市场取得了成功。

然而,中国的人工智能领域非常拥挤,这意味着各公司都在进行价格战以排挤竞争对手。在2024年全年,阿里巴巴和字节跳动等公司将价格大幅削减了高达90%,以推广其模型并超越竞争对手。

中国在人工智能领域的成功令美国感到不安,这意味着为保护美国在人工智能领域的领导地位而采取的广泛措施并未奏效。“我以为我们对芯片的限制会让他们落后,”谷歌前首席执行官埃里克·施密特去年11月在哈佛大学肯尼迪学院的一次演讲中表示。

ChatGPT的开发者已经对中国发出了警报。上周,OpenAI在一份政策文件中声称,“估计有1750亿美元的全球资金等待投资于人工智能项目。”OpenAI表示:“如果美国没有吸引到这些资金,它们将流向中国支持的项目,从而加强中国共产党在全球的影响力。”OpenAI希望它很快就能获得其中的一些资金。周二,OpenAI首席执行官萨姆·奥特曼、软银首席执行官孙正义和甲骨文联合创始人拉里·埃里森宣布了“星际之门计划”,该计划承诺在美国各地投资5000亿美元用于人工智能基础设施。

Deepseek的开源策略

Deepseek的开源策略是其成功的关键因素之一。通过开源其模型,Deepseek不仅降低了使用门槛,还吸引了全球开发者的参与,从而加速了模型的迭代和优化。这种开放的模式与OpenAI的封闭模式形成了鲜明对比,也为其他人工智能公司提供了新的发展思路。

Deepseek的崛起,不仅是对美国人工智能领导地位的挑战,也是对传统人工智能发展模式的挑战。它证明了创新、效率和开放的重要性,也预示着人工智能领域将迎来更加多元化和竞争激烈的未来。