中国AI崛起:一家初创公司如何撼动硅谷的信心

美国创新神话的破灭

多年来,在比较美国和中国这两个经济引擎的讨论中,一种令人安心的叙事已经形成。按照这种说法,美国是真正创新的源泉,是技术前沿的开拓者。而中国,则被描绘成勤奋、或许有些模仿意味的追随者——擅长迭代、模仿,并最终生产出成本更低的美国突破性技术的版本。这种观点,有时更直白地表述为“中国模仿”,似乎在人工智能(AI)领域尤其根深蒂固。在这个领域,资金雄厚、吸引全球人才的美国科技巨头似乎拥有不可逾越的领先优势。中国公司尽管努力追赶,却似乎总是慢一步。

然而,这一长期存在的假设在今年一月不仅动摇了,而且戏剧性地破裂了。引发震动的并非老牌巨头,而是一家位于杭州、相对不知名的初创公司 DeepSeek。其发布的“推理”大型语言模型(LLM)R1,在行业内引发了冲击波。原因何在?R1 不仅仅是追赶其美国同行 OpenAI 的 o1(仅在几个月前发布);它匹敌了后者的性能。单是这一成就本身就已值得关注,但另外两个因素使其演变成了一场地震级事件:R1 似乎几乎是一夜之间出现的,而且其开发效率惊人。DeepSeek 透露,其直接前身 V3 的最终“训练运行”成本仅为 600 万美元。为了理解这个数字的意义,特斯拉前 AI 科学家 Andrej Karpathy 直言不讳地称其为“开玩笑的预算”,相比之下,美国训练同类模型投入的资金动辄数千万甚至数亿美元。

其影响立竿见影且巨大。随着 R1 下载量激增,恐慌情绪蔓延至华尔街。投资者突然开始质疑美国科技长期主导地位的假设,纷纷抛售股票。Nvidia 和 Microsoft 等行业巨头的市值蒸发超过 1 万亿美元。震荡波及硅谷最高层领导。OpenAI 的 CEO Sam Altman 公开表达了忧虑,甚至提出了转向开源模式的想法——这正是 DeepSeek 所采取的路径。通过将其模型公开并允许修改,DeepSeek 大大降低了其他人进入和使用的门槛及成本,此举产生了强大的共鸣。

“我们中有相当一部分人,包括我自己,从根本上误判了中国产生这类尖端突破的能力,”乔治华盛顿大学政治学助理教授、敏锐的 ChinAI 时事通讯作者 Jeffrey Ding 承认道。过去的叙事令人安心,但现实证明要复杂得多。

从低估到紧急重新评估

当不安情绪弥漫在美国科技和投资界时,中国国内的气氛则截然不同。DeepSeek 的创始人 Liang Wenfeng 发现自己一跃进入了中国商界影响力的顶层,在二月份与习近平主席会面时获得了一个享有盛誉的席位。他与阿里巴巴的 Jack Ma 和华为的 Ren Zhengfei 等知名人士同处一室——这明确是国家认可的信号。这种高层认可不仅仅是象征性的。包括电动汽车领导者 BYD 和家电巨头 Midea 在内的中国大型企业迅速宣布计划,将 DeepSeek 强大且具成本效益的 AI 集成到他们的产品线中。

这一突如其来的成功,为一直与普遍悲观情绪作斗争的中国经济注入了急需的乐观情绪。“DeepSeek 有潜力以政府举措难以实现的方式,单枪匹马地振兴经济,”咨询公司 DGA–Albright Stonebridge Group 负责技术政策分析的 Paul Triolo 评论道。这家初创公司成为了能够在全球舞台上竞争的本土创新的象征。

然而,必须理解的是,DeepSeek 并非孤立现象。它诞生于一个充满活力且快速发展的中国 AI 领域,而许多美国观察家此前基本上忽视了这一点。像阿里巴巴和 ByteDance(TikTok 的母公司)这样的老牌科技巨头一直在发布自己的 AI 模型,其中一些在关键的推理基准测试中已经超越了西方同行。除了这些巨头之外,一个由更小、更灵活的初创公司组成的充满活力的生态系统——有时被称为“AI 独角兽”或“AI 老虎”——正在积极地将中国式的高效 AI 应用于实际场景,为移动应用、复杂的 AI 代理和能力日益增强的机器人提供动力。

这种复苏并未被投资者忽视,他们现在正在重新评估市场格局。资本正在回流到中国科技股。追踪在香港上市的科技公司的关键指标恒生科技指数(Hang Seng Tech Index)今年迄今已飙升 35%。引领这轮反弹的是直接或间接受益于 AI 热潮的公司:在云计算和 AI 模型开发领域扮演重要角色的阿里巴巴;令人印象深刻的文本转视频 AI 模型 Kling 的创造者快手(Kuaishou);以及中国指定的半导体制造“国家队”中芯国际(SMIC),后者在为华为供应国产 AI 芯片方面发挥着至关重要的作用。

中国久经考验的策略:快速追随者的优势

尽管 DeepSeek 的迅速崛起让许多投资者措手不及,但熟悉中国经济发展轨迹的资深观察家认出了熟悉的模式。AI 领域似乎有望成为中国利用其“快速追随者”战略实现同等水平,甚至可能取得全球领导地位的最新行业。这并非新现象。考虑以下例子:

  • 可再生能源: 中国制造商主导了太阳能电池板和风力涡轮机的全球供应链,这些是全球向清洁能源转型的关键组成部分。
  • 电动汽车: 中国电动汽车制造商的激增改变了汽车行业的格局,使中国成为世界上最大的汽车出口国。即使是西方品牌的电动汽车,也常常严重依赖中国制造的电池。
  • 其他前沿领域: 在商用无人机、工业机器人和生物技术等多元化领域,中国公司已将自己确立为强大的全球竞争者。

西方的怀疑论者常常试图贬低这些成功,将其主要归因于不公平的优势,如巨额政府补贴、知识产权盗窃、非法走私或违反出口管制。虽然这些因素可能在特定情况下发挥了作用,但它们忽视了中国技术竞争力更根本、更可持续的驱动因素。这些持久的优势包括:

  • 庞大的制造生态系统: 中国无与伦比的工业基础提供了快速商业化和大规模生产新技术所需的规模和基础设施。
  • 战略性模仿: 根深蒂固的学习、适应和改进他处开创性创新的意愿,使中国公司能够迅速缩小技术差距。
  • 深厚的人才储备: 中国每年培养大量工程师和技术专家,为推动创新提供了所需的人力资本。
  • 积极的政府支持: 中国政府常常扮演强大的催化剂角色,提供资金、设定战略重点,并积极扶持国内产业。

经济学家、《The New China Playbook》一书的作者 Keyu Jin 对中国的创新风格提出了细致入微的看法。她认为,中国的创新往往更侧重于 “量身定制的问题解决”,而非美国创新中心常见的 “突破性、系统性思维”。这种务实的方法,优先考虑有针对性的、“足够好”的解决方案,使中国公司能够擅长批量生产先进技术——例如 DeepSeek 的 R1——这些技术接近前沿水平,同时保持着惊人的可负担性。随着西方公司努力应对 AI 开发和部署成本不断攀升的问题,中国正将自己定位为能够提供成本敏感的全球市场所精确需求的解决方案。

应对逆风:从打压到复苏

中国当前的 AI 热潮,与仅仅几年前相比,代表着一次显著的转变。就在 2022 年,普遍的看法认为,中国在人工智能领域注定要远远落后于美国。这种看法源于北京方面自 2020 年起对其国内科技行业实施的全面监管打压。政治领导人对科技巨头日益增长的权力和被认为不负责任的行为感到警惕,实施了抑制增长和创新的措施。例如,更严格的数据隐私法规,实际上切断了中国科技公司曾经在国际交易所进行 IPO 的丰厚渠道。

OpenAI 在 2022 年底发布的 ChatGPT 鲜明地凸显了这种差距感。随后由中国公司开发的 LLM 通常未能达到 ChatGPT 的能力水平,即使仅在中文语境下运行也是如此。雪上加霜的是美国严格的出口管制,特别是针对训练和运行复杂 LLM 所必需的高性能 Nvidia AI 芯片。中国公司获取这种关键硬件的途径受到严重限制,似乎巩固了美国的领先地位。

然而,据 Jeffrey Ding 等观察人士称,情况在 2024 年秋季左右开始悄然转变。“你开始看到差距在缩小,”他指出,特别是在 开源社区 内取得了进展。中国公司认识到了一个机会。他们开始“优化那些可以更高效训练的小型模型”,绕过了对最强大、受限制硬件的需求,转而专注于巧妙的软件优化和可访问性。

与此同时,在监管逆风的表面之下,中国的 AI 行业正在悄悄孵化一波又一波的创新型初创公司。最初的一批包括“小龙”——像 SenseTime 和 Megvii 这样专注于机器学习和计算机视觉的公司,它们获得了显著的国际关注。随着焦点转向生成式 AI,一个新的群体出现了:“AI 老虎”,包括像 Baichuan、Moonshot、MiniMax 和 Zhipu 这样的公司。现在,即使是这些著名的参与者,也在某种程度上被最新一代的“龙”所掩盖,这是一个由六家位于杭州、前景光明的初创公司组成的集群,DeepSeek 正是其中的领头羊。

中国 AI 加速发展的剖析

杭州,这座以阿里巴巴诞生地而闻名的庞大都市,出人意料地成为了中国当前 AI 革命的熔炉。其独特的地理位置提供了几个优势。“它得益于与北京足够远,可以避开繁琐的官僚障碍,”AI 咨询公司 Proem 的创始人 Grace Shao 解释说。“然而,它又邻近上海,便于接触国际资本和人才。”此外,杭州拥有“极其强大的人才库,这是多年来由阿里巴巴、网易(NetEase)等科技巨头培养起来的,”Shao 补充道。阿里巴巴本身在培育开源环境方面发挥了重要作用;值得注意的是,在领先的开源 AI 平台 Hugging Face 上按性能排名的前 10 个 LLM,都是使用阿里巴巴自家的 Tongyi Qianwen 模型进行训练的。

支撑中国在 AI 竞赛中如此迅速追赶能力的几个关键因素包括:

  1. 无与伦比的规模: 中国的庞大规模提供了内在优势。Shao 指出,当无处不在的超级应用微信(WeChat)的运营商腾讯(Tencent)集成了 DeepSeek 的 LLM,使其可供超过十亿用户使用时,DeepSeek 的用户群几乎一夜之间经历了巨大的激增。这立即将这家初创公司变成了中国庞大数字生态系统中的家喻户晓的名字。
  2. 协调的国家战略: 政府的角色超越了单纯的监管;它积极塑造创新格局。通过有针对性的政策、财政激励和监管框架,官员们培育了一个“国家协调”的创新体系。私营部门通常会与该体系内确立的优先事项保持一致。据 Triolo 称,政府实际上扮演着“啦啦队长”的角色。“当 Liang Wenfeng 与李强总理和习近平主席会面时,这向整个体系发出了一个强有力的信号,”他解释说。二月份的这次高层认可引发了连锁反应:国有电信公司采用了 DeepSeek 的 LLM,随后是科技和消费品巨头,最后是支持性的地方政府举措。
  3. 出口管制成为意想不到的催化剂: 具有讽刺意味的是,旨在削弱中国 AI 进展的美国限制措施,可能无意中刺激了国内创新。“获得资金从来不是我们的主要障碍;对先进芯片运输的禁令才是真正的挑战,”Liang Wenfeng 去年坦率地告诉中国媒体。多年来,中国的国内芯片产业一直停滞不前,因为可以从海外供应商那里轻易获得更优越的替代品。然而,美国的贸易限制“动员了整个国家去追求前沿技术,”经济学家 Keyu Jin 认为。电信巨头华为(Huawei)尽管面临着巨大的美国压力,却已成为中国建立自给自足的先进芯片供应链努力中的关键支柱。其 Ascend AI 芯片,虽然可能尚未达到 Nvidia 顶级芯片的性能,但正越来越多地被像 DeepSeek 这样的初创公司用于“推理”——即在实际应用中运行训练好的 AI 模型的关键任务。
  4. 丰富且不断演进的人才: 中国的大学培养出大量充满热情、技术娴熟的工程师,渴望为 AI 领域做出贡献。虽然像 DeepSeek 这样公司的一些关键人员拥有西方培训背景,但 Triolo 强调了一个重要趋势:“Liang Wenfeng 积极招募了顶尖的年轻人才,他们没有在西方接受过培训,不是在像 MIT 或 Stanford 这样的机构培养出来的。”他补充说,来访的 CEO 们总是“对中国二线、三线甚至四线大学毕业生的素质印象深刻。在美国很难找到那种深度和数量的原始人才。”此外,像 Grace Shao 这样的观察家察觉到中国“90 后一代”创始人思维方式的明显转变。老一辈人可能满足于“复制,但加以改进”,Shao 认为,“今天的企业家将开源不仅仅视为一种策略,而是一种哲学选择。人们越来越相信中国能够并且应该创新原创解决方案,而不仅仅是复制现有的。”

通往主导地位之路上的持续障碍

尽管以 DeepSeek 的成功为代表的进步令人瞩目,但现在就断言中国注定能在 AI 领域达到其目前在太阳能电池板制造或电动汽车生产等行业所享有的同等全球主导地位,还为时过早。重大的障碍依然存在,给其长期发展轨迹蒙上阴影。

也许最严峻的挑战在于中国资本市场的不发达状态,尤其是在科技初创企业的融资机会方面。2020 年代初的监管打压对本已相对低迷的国内风险投资领域造成了严重打击,使活动几乎陷入停滞。雪上加霜的是,北京和华盛顿之间日益加剧的地缘政治紧张局势导致许多外国风险投资者大幅减少了对中国科技领域的投资。DeepSeek 自身的融资故事就很有说明性:由于缺乏传统的风险投资支持,它依赖于其母公司(一家对冲基金)雄厚的财务资源。这种对非传统资金来源的依赖凸显了许多其他有前途的 AI 初创公司在获得增长和规模化所需资本方面所面临的困难。

此外,中国的国内证券交易所在历史上一直不愿让未盈利的初创公司上市,而这正是早期科技公司大力投入研发的普遍特征。曾有一段时间,有前途的中国公司将目光投向纽约进行首次公开募股(IPO),以寻求更深厚的资本池和更宽松的上市要求。然而,华盛顿和北京监管机构加强的审查,已在很大程度上扼杀了这一至关重要的跨境资本流动。“资本市场仍然极度不发达、不成熟且缺乏流动性,”Triolo 直言不讳地说。“这是一个主要的瓶颈。这个问题让北京方面夜不能寐。”

认识到这一关键弱点,中国领导层在三月份的年度“两会”政治会议期间表示了干预的意图。北京公布了设立“国家创业投资引导基金”的计划,任务是动员高达 1 万亿元人民币(约合 1380 亿美元)的资金,专门投向像 AI 这样的“硬科技”领域。此举代表着一种默认,即私营部门本身无法弥合资金缺口,需要大量的国家导向支持来培育具有全球竞争力的科技企业。

全球博弈:开源与新兴市场

即使面临资本化挑战,中国 AI 初创公司的发展轨迹表明,它们可能不需要像硅谷那样典型的巨额融资轮次,就能产生显著的全球影响。积极拥抱开源开发,并得到中国官员的支持以及像阿里巴巴这样的公司的倡导,提供了一条可能更具资本效率的路径。通过培育开放生态系统,他们的目标是鼓励更广泛地采用中国开发的 AI 技术,将其嵌入各种应用程序和平台中。像阿里巴巴这样的公司也看到了商业优势,认为蓬勃发展的开源模型最终将推动更多客户使用其更广泛的云计算和服务生态系统。

虽然源自中国的 AI 模型在美国国内获得广泛采用可能面临障碍,特别是在可能更具保护主义色彩的贸易政策下,但它们在世界其他地区的吸引力可能相当大。DeepSeek 对 效率和开放性 的强调,为像 OpenAI 这样的美国领先者所青睐的昂贵、专有模型提供了一个引人注目的替代方案。这种方法可能会在亚洲、非洲和拉丁美洲的新兴市场产生强烈共鸣——这些地区通常以丰富的创造力为特点,但受到有限计算资源和资本的制约。

中国公司已经通过在各种技术领域提供可靠、低成本的替代品,证明了其有效渗透国外市场的能力:价格实惠的太阳能电池板、经济实惠的电动汽车,以及价格具有竞争力的功能丰富的智能手机。如果像 DeepSeek 这样的创新者和像阿里巴巴这样的老牌企业能够成功地继续减少对最昂贵、最高端计算基础设施的依赖来实现有效的 AI,那么构成“全球南方”的广阔市场很可能会选择他们负担得起的最强大的 AI,而不是追求西方公司以高价提供的绝对前沿技术。AI 霸权之争可能越来越不仅仅是在性能基准上进行,而是在全球范围内的可及性和成本效益上展开。