那个无人预料到的竞争者
多年来,叙事似乎已成定局:美国独创,中国复制。Silicon Valley 孕育突破,而太平洋彼岸的工厂则大量生产成本更低、或许不那么精致的版本。这种令人安心的剧本,常被概括为“美国创新,中国迭代”(或更不客气的说法是“模仿”),主导了人们对世界两大经济体的看法,尤其是在人工智能(Artificial Intelligence)这个高风险领域。在AI领域,财大气粗的美国科技巨头掌握着庞大的资源和人才,这种陈词滥调感觉尤其真实。中国公司似乎陷入了一场永无止境的追赶游戏。
然后,一月来临。并非来自某个庞大的科技园区,而是来自一家名为 High-Flyer 的对冲基金的分支机构,一家名为 DeepSeek 的杭州初创公司,带来了一场震动全球科技格局的冲击。他们发布了 R1,一个“推理”大型语言模型(LLM)。令人震惊的不仅仅是它似乎凭空出现;而是 R1 在性能基准上明显达到了 OpenAI 的 o1 模型的水平,而 o1 模型本身也才在几个月前首次亮相。更令人惊叹的是其效率。据报道,R1 的前身 V3 的最终“训练运行”成本仅为 600 万美元。与投入数千万甚至数亿美元训练竞争对手美国模型的成本相比,这个数字,正如前 Tesla AI 科学家 Andrej Karpathy 所说,是“一个笑话般的预算”。DeepSeek 不仅仅是迭代;它进行了创新,而且是大刀阔斧地、以极低的成本进行了创新。
市场震荡与 Silicon Valley 的反思
这个消息像一枚重磅炸弹落在 Wall Street。随着 DeepSeek 的 R1 在下载排行榜上飙升,持有大量 Big Tech 股票的投资者陷入恐慌。老牌巨头突然显得脆弱不堪。在一场剧烈的抛售中,像 Nvidia 和 Microsoft 这样的中坚力量市值蒸发超过 1 万亿美元。美国主导地位的根基动摇了。
冲击波超出了交易大厅。像 OpenAI 的 CEO Sam Altman 这样的领导者进行了公开反思,公开考虑战略性地转向开源模型。这正是 DeepSeek 所走的道路,将其模型代码公开并允许修改,从本质上降低了用户的进入门槛和成本。其中隐含的承认很明显:这家来自杭州的后起之秀迫使 Silicon Valley AI 核心机构进行了根本性的反思。
“我们很多人,包括我自己,都搞错了,” George Washington University 政治学助理教授、敏锐的 ChinAI 时事通讯作者 Jeffrey Ding 承认道。对中国“前沿突破”能力的低估突然变得显而易见。旧的叙事正在瓦解。
觉醒的国度:中国的兴奋与认可
在美国科技界弥漫着不安情绪的同时,一股民族自豪感和兴奋感席卷了中国。DeepSeek 创始人 Liang Wenfeng 获得了高调认可,在二月份与中国国家主席 Xi Jinping 及其他私营部门巨头的一次会议上获得了一个令人垂涎的席位,与 Alibaba 创始人 Jack Ma 和 Huawei 创始人 Ren Zhengfei 等传奇人物同处一室。这不仅仅是认可;这是一个强烈的信号。
中国大型企业迅速行动,以利用这一突破。电动汽车巨头 BYD 和家电巨头 Midea 宣布计划将 DeepSeek 强大且具成本效益的 AI 集成到他们的产品线中。这项技术不仅仅是基准测试的冠军;它正被迅速编织进中国工业的肌理。
这种技术乐观主义的激增,与最近笼罩中国的经济悲观情绪形成了鲜明对比。“DeepSeek 可能单枪匹马地启动经济,其方式是政府从未想出如何做到的,” 咨询公司 DGA–Albright Stonebridge Group 的技术政策负责人 Paul Triolo 评论道。它代表了本土创新和市场验证的有力结合。
DeepSeek 之外:深入了解中国的 AI 格局
DeepSeek 的惊人崛起并非孤立事件,而是中国一个充满活力且快速发展的 AI 行业的最新显现,这个行业在很大程度上被许多西方观察家低估了。像 Alibaba 和 ByteDance(TikTok 的母公司)这样的老牌科技巨头一直在开发和发布自己的 AI 模型,其中一些在特定的推理基准上已经超越了西方同行。
此外,一个充满活力的、由更小、更专业的 AI 公司组成的生态系统正在蓬勃发展。连续几波创业公司涌现:
- 早期的“小龙”专注于机器学习和计算机视觉,包括像 SenseTime 和 Megvii 这样最初引起全球关注的公司。
- 随着生成式 AI 成为焦点,重心转向了“AI 老虎”——像 Baichuan、Moonshot、MiniMax 和 Zhipu 这样的公司。
- 现在,一个通常被称为最新“龙”的新群体正在掀起波澜,特别是一组位于杭州的六家初创公司,DeepSeek 就是其中之一。
投资者情绪也反映了这种复苏。在经历了一段谨慎期后,资本正在回流中国科技领域。衡量在香港上市科技公司的关键指标 Hang Seng Tech Index 年初至今已飙升 35%。引领这轮反弹的股票包括:
- Alibaba,一个基础性参与者,现在深度参与 AI 开发和开源生态系统。
- Kuaishou,令人印象深刻的文本到视频 AI 模型 Kling 的创造者。
- SMIC,中国指定的半导体制造“国家冠军”,对于生产像 Huawei 这样的公司所需的 AI 芯片越来越关键。
历史的回响:中国久经考验的‘快速跟随者’策略
尽管 DeepSeek 在 LLM 这一复杂领域的突破让许多人措手不及,但经验丰富的中国经济轨迹观察者认识到了熟悉的模式。AI 很可能成为中国利用其独特优势迅速实现对等,甚至可能占据主导地位的最新行业,就像它在其他关键行业所做的那样。
考虑以下证据:
- 可再生能源: 中国制造商主导着全球太阳能电池板和风力涡轮机市场,降低了成本,加速了世界的绿色转型。
- 电动汽车: 中国已成为世界上最大的汽车出口国,这得益于其国内 EV 品牌的成功。即使是西方公司生产的 EV 也常常严重依赖中国制造的电池。
- 其他前沿领域: 在无人机、先进机器人技术和生物技术的某些领域,中国公司是全球领导者,而不仅仅是跟随者。
西方高管有时会轻视这些成功,主要将其归因于不公平的优势,如巨额政府补贴、知识产权盗窃、非法走私或违反出口管制。虽然这些因素可能发挥了作用,但中国技术崛起的更根本、更持久的驱动力往往被忽视:
- 一个能够快速高效地扩大生产规模的庞大制造基地。
- 一种制度化的渴望,学习和适应外国技术和商业模式。
- 一个深厚且不断扩大的熟练人才库,尤其是在工程和科学领域。
- 一个积极主动的政府,不仅充当监管者,而且是关键行业的战略支持者、协调者和国家啦啦队长。
正如经济学家、《The New China Playbook》的作者 Keyu Jin 所解释的那样,中国的创新者通常擅长**“量身定制的问题解决”**,而不是美国创新生态系统更具特征的“突破性、系统性思维”。这种对有针对性的、务实的、“足够好”的创新的关注,使中国能够掌握并大规模生产先进技术,其价格点可为全球市场所接受。DeepSeek 就是例证——以惊人的成本效益实现了接近最先进的性能。当西方公司在努力应对 AI 进步的天文数字成本时,中国正将自己定位为提供世界大部分地区所需要的:强大且负担得起的 AI。
克服障碍:从落后者到领导者?
考虑到不久前的过去,当前的 AI 激增甚至更加引人注目。就在两年前,中国的 AI 雄心似乎受到了严重阻碍。从 2020 年开始,北京发起了一场全面的监管运动,旨在遏制其国内科技行业被认为的过度行为和权力。这次打击给该行业带来了寒意,使曾经多产的中国科技 IPO 渠道枯竭,并对数据隐私实施了更严格的控制。
OpenAI 的 ChatGPT 在 2022 年底的推出,鲜明地突显了明显的差距。随后发布的中国 LLM 在性能上普遍落后于 ChatGPT,即使在处理其母语时也是如此。加剧这些挑战的是美国严格的出口管制,旨在阻止中国公司获取被认为是训练和运行复杂 LLM 所必需的高端 Nvidia AI 芯片。美国拥有不可逾越领先优势的说法似乎很稳固。
然而,根据像 Jeffrey Ding 这样的观察者的说法,一个微妙的转变始于 2024 年秋季。“你开始看到差距在缩小,”他指出,特别是在开源 AI 社区内部。中国公司开始战略性地优化更小、更高效的模型,这些模型可以在不需要最先进、受限制的硬件的情况下进行有效训练。由监管和限制所激发的必要性,似乎正在孕育一种不同类型的创新——一种专注于效率和可及性的创新。
杭州:中国 AI 的活力熔炉
这场 AI 复兴的核心是杭州市。历史上以电子商务巨头 Alibaba 的总部而闻名,杭州已成为中国当前 AI 热潮无可争议的热点。它的成功源于多种因素的独特融合。
“它的优势在于远离北京,可以避免各种官僚程序,” AI 咨询公司 Proem 的创始人 Grace Shao 解释说。同时,“靠近上海以获取国际资本和人才的好处”至关重要。也许最重要的是,杭州拥有“得益于 Alibaba、NetEase 和其他公司培养了几十年深厚技术生态系统的极其强大的人才库”。
Alibaba 本身在培育这种环境方面发挥了重要作用,特别是通过其对开源开发的支持。很能说明问题的是,在著名的开源 AI 社区平台 Hugging Face 上列出的许多表现最佳的 LLM,都是使用 Alibaba 自己的 Tongyi Qianwen 模型作为基础进行训练的。
除了 DeepSeek,杭州还涌现出其他创新的 AI 驱动型企业,它们正在开辟独特的细分市场:
- Unitree Robotics: 其灵活、会跳舞的机器人在今年的电视春节联欢晚会上成为特色表演者,吸引了数亿观众,从而获得了全国性的声誉。
- Game Science: 制作了视觉效果惊人的动作角色扮演游戏《Black Myth: Wukong》,该游戏成为 2024 年销售最快的视频游戏之一,展示了先进的图形和 AI 驱动的游戏玩法。
- Manycore: 一家专注于“空间智能”的公司,致力于复杂的 3D 渲染技术,这对于增强现实、虚拟现实和高级模拟至关重要。
解构激增:中国 AI 加速的剖析
中国的 AI 行业是如何实现如此快速的追赶, defying 预期并克服重大障碍的?几个关键因素汇聚在一起:
- 巨大的规模: 中国的庞大规模提供了无与伦比的优势。Grace Shao 指出,当无处不在的超级应用 WeChat 的运营商 Tencent 集成了 DeepSeek 的 LLM 时,瞬间将其暴露给了超过十亿的潜在用户。这一举动单枪匹马地将这家初创公司推向了全国的聚光灯下,并提供了宝贵的真实世界使用数据。
- 政府的协调与信号: 国家扮演着关键的、多方面的角色。通过有针对性的政策、法规和补贴,官员们培养了一个“国家协调”的创新体系。私营部门通常与高层发出的优先事项保持一致。Paul Triolo 将政府的部分职能描述为“啦啦队”。他强调,“当 Liang Wenfeng 与 Premier Li Qiang 和 President Xi Jinping 会面时,这就是一个信号。” 确实,那次二月份的高层会议起到了催化剂的作用,引发了 DeepSeek 的广泛采用,首先是与国家相关的电信公司,然后是科技和消费巨头,最后得到了地方政府的拥护。
- 出口管制的意外后果: 具有讽刺意味的是,美国对先进芯片销售的限制可能无意中刺激了国内创新。“资金对我们来说从来都不是问题;先进芯片的禁运才是问题,” Liang Wenfeng 去年告诉中国媒体。多年来,优质外国芯片的易得性可以说扼杀了中国的本土半导体产业。然而,美国的限制,“动员了整个国家去追求前沿技术,”经济学家 Keyu Jin 表示。电信巨头 Huawei,尽管面临着自身严峻的美国压力,已成为中国替代性先进芯片供应链的领导者。其 Ascend AI 芯片,虽然可能尚未达到 Nvidia 的顶级水平,但已证明足以胜任关键任务,如“推理”——在实际应用中运行已训练好的 AI 模型——使像 DeepSeek 这样的初创公司能够有效地部署其创新。
- 深厚的人才储备: 中国的大学正在培养大量积极进取的工程师,他们渴望在 AI 前沿工作。虽然像 DeepSeek 这样公司的一些关键人员接受过西方培训,但 Triolo 强调了一个重要趋势:“Liang Wenfeng 出去招募了这些顶尖人才——没有西方经验、没有在 MIT 和 Stanford 接受过培训的年轻人。” 他补充说,西方 CEO 们常常“对中国二、三、四线大学培养出来的人才质量感到震惊。在美国大学里,你找不到那种数量的那种人才。” 这种可及人才的深度为快速扩展 AI 企业提供了关键资源。
- 不断演变的创业心态: 观察家们也注意到中国年轻一代科技创始人(通常被称为“90后”)的态度可能发生了转变。Grace Shao 认为,虽然老一辈可能专注于“可以复制,但要做得更好”的模式,但今天的企业家越来越“谈论开源是一种哲学选择。中国可以创新,而不仅仅是复制。” 这反映了日益增长的自信心和为全球技术共享做出根本性贡献的愿望。
挥之不去的障碍:资本难题
尽管取得了令人瞩目的技术进步和像 DeepSeek 这样的公司的成功,但中国的 AI 行业仍然面临重大障碍,特别是在融资和市场准入方面。中国科技初创公司通常缺乏其美国同行所拥有的稳健资本化途径。
2020 年代初的科技整顿显著抑制了中国的风险投资环境,而该环境本就比 Silicon Valley 的要不成熟。国内 VC 公司相对较少,与美国日益加剧的地缘政治紧张关系导致外国风险投资者大幅撤资。(DeepSeek 依赖其对冲基金母公司 High-Flyer 的融资模式是证明这一规则的例外)。
此外,进入公开市场也面临挑战。中国证券交易所历来对上市未盈利的初创公司持谨慎态度。有一段时间,New York 是中国科技 IPO 的热门目的地,但来自 Washington 和北京的日益严格的审查已基本扼杀了这条途径。“资本市场就是如此不发达、不成熟且缺乏流动性,” Paul Triolo 直言不讳地说。“这是一个大问题。它让北京的人们夜不能寐。”
认识到这一瓶颈,中国领导人在三月份设定国家经济优先事项的“两会”政治会议上发出了调整方向的信号。他们宣布计划设立一个**“国家创业投资引导基金”**,旨在动员 1 万亿元人民币(约合 1380 亿美元)投向包括 AI 在内的战略性“硬科技”领域。这代表了一种默认的承认,即认为有必要进行国家干预以支持私营部门的融资机制。
规划未来:效率、开放与全球雄心
DeepSeek 的成功建立在效率而非巨额资本支出之上,这表明中国的 AI 竞争者可能不需要 Silicon Valley 级别的资金就能在全球竞争。政府对相对廉价的开源 AI 开发的明确支持强化了这一战略,将其视为鼓励中国开发的技术在国内和国际上广泛采用的一种方式。像 Alibaba 这样的公司也在拥抱开源,认为这能将更多用户吸引到他们更广泛的云和服务生态系统中。
尽管日益加剧的保护主义,可能在未来的 Trump 政府下进一步放大,可能会限制这些中国 AI 模型在美国境内的采用,但它们可能会在其他地方找到非常乐于接受的市场。DeepSeek 对成本效益和开放性的强调可能会在Global South的新兴经济体中产生强烈共鸣。这些市场通常拥有相当的独创性和对先进技术的需求,但缺乏西方国家随时可用的庞大计算基础设施和资本。OpenAI 昂贵的专有模型可能不如强大、适应性强且价格合理的中国替代方案有吸引力。
中国已经展示了其以可靠性和可负担性达到最佳平衡点的产品渗透甚至主导外国市场的能力——想想太阳能电池板、电动汽车和智能手机。如果像 DeepSeek 和 Alibaba 这样的公司继续以减少对最昂贵计算硬件依赖的方式进行创新,它们可以有效地普及强大 AI 的使用权。世界其他地区,特别是发展中国家,很可能会选择他们能够轻易负担得起的最佳 AI,从而可能绕过 Silicon Valley 的尖端产品,并建立一个新的全球 AI 影响力轴心。