中国的开放AI悖论:战略馈赠还是暂时休战?

人工智能这一新兴领域在2024年初见证了一项显著进展:中国公司 DeepSeek 发布了一款强大的、免费可用的大语言模型。此举促使 Meta 的首席人工智能科学家、开源研究的著名倡导者 Yann LeCun,在关于中国在人工智能实力上超越美国的猜测声中,提供了一个关键的澄清。LeCun 认为,更准确的解读并非关乎国家主导地位本身,而是“开源模型超越专有模型”的崛起。这一观察揭示了一个引人入胜的动态,但同时也给中国在全球范围内免费传播其尖端人工智能创新的承诺的持久性蒙上了一层长长的不确定性阴影。这种数字慷慨会持续多久?

席卷中国的开源浪潮

纵观中国科技巨头的版图,一个清晰的趋势已经显现。阿里巴巴的吴泳铭 (Eddie Wu)、腾讯的马化腾 (Pony Ma) 以及执掌百度的李彦宏 (Robin Li) 等领导者,都已明确拥抱了开源范式。这种理念允许任何人不受限制地使用、审查、修改和分发人工智能软件及其底层代码。这种做法似乎至少在目前得到了国家机器的默许支持。一个重要的信号出现在一月份,DeepSeek 的首席执行官梁文锋 (Liang Wenfeng) 在与国务院总理李强的高级别会议中,被特别选为人工智能行业的代表。

必须理解的是,开源并非中国独有的发明。然而,与一些西方同行相比,中国贡献的性质往往更贴近该运动的基本原则。例如,DeepSeek 根据许可条款分发其源代码,这些条款对使用施加的限制极少,从而促进了广泛的采用和实验。这与 OpenAI 等实体的策略形成了鲜明对比。这家总部位于美国、开发了广为人知的 ChatGPT 的公司,对其专有模型背后的训练数据和方法论保持着严格控制,将其视为严密保守的公司机密。虽然 OpenAI 已表示未来打算发布一个具有公开可访问训练参数的模型,但其当前的运作模式强调的是控制。即使是 Meta 的 Llama 模型,虽然免费可用,但也包含了对某些商业应用的限制。尽管如此,Meta 也认同,建立行业标准需要对模型进行连续几代的开放承诺。

  • DeepSeek: 通过其开源许可证提供近乎无限制的使用。
  • OpenAI: 主要采用专有模式,对训练数据和流程保密。
  • Meta (Llama): 免费可用,但存在一些商业使用限制,同时承认开放的战略价值。

这种方法上的分歧凸显了各自不同的战略考量。中国当前对开源的热情似乎与其特定的地缘政治和技术环境紧密相连。

战略要务:为何现在选择开放?

中国拥抱开源人工智能远非纯粹的技术利他主义行为;这是在当前全球环境下,由迫切需求和机遇优势驱动的精心计算的战略。几个关键因素支撑着这种方法。

规避限制

也许最重要的驱动因素是华盛顿施加的复杂的技术限制网络。这些措施严重限制了中国公司采购最先进半导体的能力,特别是那些由 Nvidia 生产的芯片,这些芯片被认为是在规模上训练和部署复杂人工智能模型所必需的。在这种受限的环境下,利用由能够接触到这些高端芯片的国际公司开发的强大开源模型,提供了一个至关重要的变通办法。事实上,在 DeepSeek 成为强大的国内参与者之前,相当数量的中国人工智能模型,包括一些据报道为军事应用开发的模型,本质上都是基于 Meta 的 Llama 架构的改编或变体。这种依赖性凸显了开源如何在硬件限制下提供了一条保持竞争力的关键途径。此外,中国内部也在进行创新以缓解这些硬件限制。例如,据报道,由马云 (Jack Ma) 创立的蚂蚁集团 (Ant Group) 开发了复杂的技术,使得能够在性能较弱的国产芯片(如华为生产的芯片)上训练人工智能模型,并取得了与在高端 Nvidia 处理器上训练相媲美的结果。 如果这类方法得到广泛采用,它们将代表着朝着习近平主席实现技术自力更生、减少对外国硬件依赖的总体目标迈出的重要一步。

加速发展

开源模式内在地促进了协作并加速了创新步伐。通过共享代码和方法论,中国公司可以集体地在彼此的进步基础上进行建设,避免重复劳动并快速迭代现有模型。这种协作动态创造了强大的网络效应,使得整个生态系统能够比每家公司孤立运作时更快地发展。最近密集的活动印证了这一点:就在过去几周内,包括百度 (Baidu)、阿里巴巴 (Alibaba)、腾讯 (Tencent) 和 DeepSeek 在内的主要参与者都宣布了对其开源人工智能产品的重大更新或全新发布。 这种快速的改进节奏表明,各方正协同努力汇集资源,并迅速缩小与西方领导者的技术差距。这种集体进步战略为中国提供了在关键人工智能领域迎头赶上甚至可能实现跨越式发展的机会。

全球地位与软实力

在技术创新方面的慷慨是提升国际声誉和影响力的有力工具。正如 DeepSeek 创始人梁文锋 (Liang Wenfeng) 在去年一次罕见的采访中所言:“为[开源]做出贡献为我们赢得了尊重。” 这种情绪超越了个别公司,延伸到了国家本身。由中国开发的强大、免费的人工智能工具的可用性,提升了其作为技术领导者的形象,并显著增强了其软实力,特别是在传统西方势力范围之外的地区。这种开放的做法已明显改变了人们的看法,导致一些观察家,如美国经济学家 Tyler Cowen,注意到中国已经获得了相对于美国的优势——“不仅在技术上,而且在氛围 (vibes) 上。” 有趣的是,这种策略在某种程度上呼应了欧盟正在倡导的方法。认识到开源在赋权国内参与者和防止少数大型科技公司主导方面的潜力,欧盟委员会主席乌尔苏拉·冯德莱恩 (Ursula von der Leyen) 在二月份宣布了计划,旨在动员大量投资(2000亿欧元)以促进人工智能领域的“合作性、开放式创新”, 目标是培育像法国 Mistral AI 这样的本土领军企业。

更广泛的开源对齐

中国对开放标准的倾向并不仅仅局限于人工智能软件领域。它反映了一种更广泛的战略模式,旨在减轻对西方控制技术的依赖,特别是那些易受地缘政治操纵或制裁影响的技术。一个典型的例子是政府积极推广 RISC-V 芯片架构。 这种开放标准的指令集架构,得到了包括华为 (Huawei) 甚至 Nvidia 在内的多元化全球联盟的支持,正被推动成为替代从老牌企业(如主导移动处理器的英国 Arm 公司,以及个人电脑和服务器处理器领导者美国巨头 Intel 和 AMD)获得专有技术许可的可行方案。潜在的担忧很直接:未来美国政府的行动可能会切断对 Arm、Intel 或 AMD 技术的访问。拥抱像 RISC-V 这样的开放标准,为实现更大的技术主权和抵御此类外部压力提供了途径。这种在硬件架构方面的并行努力,强化了这样一种观点:人工智能领域的开源推动是更大范围、具有战略动机的转向的一部分。

根基裂痕:盈利挑战

尽管具有战略优势,但广泛采用开源模式给商业可行性带来了重大障碍,特别是对于需要对股东负责的上市公司而言。虽然开源能够促进创新和应用普及,但免费提供核心产品显著增加了创收的复杂性。

专有模型的所有者,如 OpenAI,通常采用多管齐下的收入策略。他们直接向用户收取访问其最先进模型及相关产品(如 ChatGPT 的高级版本)的费用。此外,他们通过向希望将人工智能功能集成到自己应用程序和服务的开发者授权其 API(应用程序编程接口)来产生可观的收入。

相比之下,主要专注于开源模型的公司,如 DeepSeek,发现其直接的盈利选择大大减少。他们通常只能依赖第二种收入来源——向集成其模型的开发者收取费用。虽然这可以是一种可行的业务模式,但与直接对核心技术收费相比,它通常代表着一个较小的潜在收入池。对于像 DeepSeek 这样的私营实体来说,这可能不是一个迫在眉睫的问题,其创始人梁文锋 (Liang Wenfeng) 已公开表示,他当前的重点是优先考虑创新而非即时利润。

然而,对于像阿里巴巴 (Alibaba) 这样的大型上市企业集团来说,情况更为复杂。据报道,阿里巴巴已承诺投入巨额资金——约 530亿美元——用于人工智能和云计算投资,因此面临着巨大的压力,需要展示这些投资带来盈利的清晰路径。如此大规模投资的回报不佳可能会严重影响其股价和整体市场估值。

认识到这一挑战,阿里巴巴正在推行一种混合策略。这家 市值3150亿美元的电子商务和技术巨头既维护着专有的人工智能模型,也为开源生态系统做出了重大贡献,同时还运营着一个庞大的云计算部门。 在汇丰银行 (HSBC) 的全球投资峰会上,阿里巴巴主席蔡崇信 (Joe Tsai) 阐述了公司的战略赌注:免费的开源模型充当入口点,吸引客户,这些客户随后会从阿里云 (Alibaba Cloud) 购买配套的高利润服务。这些服务包括:

  • 计算能力: 运行和微调人工智能模型所必需。
  • 数据处理与管理: 人工智能应用的关键基础设施。
  • 安全服务: 保护敏感数据和人工智能系统。
  • “全栈软件”: 提供围绕人工智能模型的全面解决方案。

然而,这一算计取决于一个关键假设:即在采用先进 IT 解决方案和云服务方面历来落后于西方同行的中国企业,将在这些领域大幅增加支出。阿里巴巴战略的成功不仅取决于其免费模型的吸引力,还取决于中国产业界愿意为周边生态系统付费的更广泛的数字化转型。盈利难题对于在商业驱动的环境中维持对开源人工智能的长期投资来说,仍然是一个关键挑战。

国家阴影:控制与矛盾

笼罩在中国蓬勃发展的开源人工智能场景之上的是无所不在的国家影响。北京通过集中的产业规划和复杂的监管机制,特别是涉及信息和技术的机制,对国民经济保持着严格的控制。这与开源开发的去中心化、无国界的性质之间产生了内在的张力。

在中国境内运营的生成式人工智能产品和服务受到严格的内容规定约束。官方指导方针要求这些技术必须 “坚持社会主义核心价值观”,并明确禁止生成或传播被认为 “危害国家安全” 或破坏社会稳定的内容。实施和执行这些要求给开源模型带来了独特的挑战。根据其设计,这些模型可以在全球任何地方下载、修改和部署,使得集中式的内容过滤变得困难。当前的监管框架对于与开源人工智能开发和部署相关的具体责任和义务似乎有些模糊,让开发者和用户处于不确定状态。

此外,随着中国人工智能能力的成熟,目前倾向于开放的战略考量可能会发生巨大变化。如果中国公司达到或超过其西方竞争对手的能力,北京方面对于自由分发具有潜在强大双重用途技术的智慧的看法可能会经历重大转变。人工智能对国家力量具有深远影响,包括军事应用和网络战能力。一个高度关注国家安全和维持技术优势的政府,可能会越来越不愿意公开分享其最先进的人工智能创新,特别是如果这些创新可能被地缘政治竞争对手利用的话。

坊间证据已经暗示了潜在的国家担忧。有报道称,像 DeepSeek 这样领先的人工智能公司的一些关键员工面临出行限制, 这可能表明了防止知识转移或人才流失的意愿。来自美国战略与国际研究中心 (CSIS) 的分析师 Gregory C. Allen 等人指出了一种潜在的不对称性:在中国开发的创新人工智能训练技术,如果开源,可能会不成比例地惠及美国公司。美国公司通常拥有更优越的计算基础设施(能够获得更强大的芯片),并可能将中国的软件创新应用于其更先进的硬件,从而获得比中国公司自身从开放中获得的更大的竞争优势。这种竞争对手可能更有效地利用中国创新的可能性,为北京关于开源的长期战略考量增添了另一层复杂性。国家的最终优先事项——控制、国家安全和全球竞争力——最终可能与不受限制的技术共享理念发生冲突。

短暂的慷慨?来自其他行业的启示

认为中国当前拥抱开源人工智能可能是一种暂时的战略策略,而非持久的哲学承诺的假设,在对照其在已经取得全球领先地位的其他技术领域的行动时,更具说服力。这种对比很能说明问题。

电动汽车 (EV) 电池和绿色能源技术 等领域,中国公司主导着全球供应链并拥有尖端能力,其姿态则明显不同。采取的方法不是开放共享,而是倾向于保护主义和谨慎守护技术优势。考虑以下行动:

  • 出口管制: 2023年,中国政府明确 禁止出口某些关键的稀土加工技术, 这些技术是许多高科技应用中的重要组成部分,包括电动汽车和风力涡轮机中使用的磁铁。此举旨在维护中国在这一战略性行业的主导地位。
  • 保护制造技术诀窍: 最近,据报道,政府对潜在技术泄露给美国的担忧,导致了中国领先的电动汽车制造商比亚迪 (BYD) 在墨西哥建厂计划的延迟。 这表明,即使是对友好邻国,在向海外转移先进制造工艺方面也采取谨慎态度,如果这有可能增强竞争对手的实力。

这种在中国占据主导地位的行业中的行为模式,与其目前在人工智能领域的开放性形成了鲜明对比——人工智能是一个它仍在很大程度上追赶的领域。这强烈表明,开放被视为一种工具性的手段——在落后时用于加速进步和规避限制,但一旦取得领先地位或国家安全利益被认为受到威胁时,就可能被抛弃。

先进人工智能模型具有重大军事和网络安全影响的潜力,使情况进一步复杂化。随着中国人工智能的不断进步,自由分享可能增强潜在对手(特别是美国)能力的突破性成果所带来的感知风险可能会增加。当前大量强大、免费的中国人工智能模型的涌现是不可否认的,并且确实正在重塑全球人工智能格局。然而,通过与中国在其他关键技术领域的战略行为进行类比,表明这场数字慷慨的洪流可能只是由当前环境决定的一个阶段,随着中国自身技术地位和战略重点的演变,它很容易被削减。开放的水龙头可能不会永远自由地流淌。