文心一言:中国AI崛起背后的引擎

美国与中国之间的技术竞争日益激烈,中国企业在克服西方制裁所设置的障碍方面取得了越来越大的成功。百度及其旗舰模型 ERNIE Bot(文心一言)已经成为中国在技术上抵抗美国努力的象征。

原本旨在遏制中国人工智能野心的举措,具有讽刺意味地助长了其国内人工智能生态系统的发展,为独立于西方的技术基础设施奠定了基础。

拜登政府实施的制裁延续了特朗普总统发起的政策,旨在通过切断对先进半导体的访问来阻止中国的人工智能进步。然而,结果却大相径庭。中国科技公司不仅生存了下来,而且加速了其本土人工智能解决方案的开发。

突破预期:中国自主研发的芯片组

最初,华为通过推出其 Ascend(昇腾)芯片让全球分析师感到惊讶,该芯片的人工智能应用性能可与 NVIDIA 的芯片相媲美。深圳一家独立实验室进行的内部测试显示,Ascend 910B 芯片在训练大型语言模型的任务中达到了 NVIDIA H100 芯片 80% 的性能。对于一家与西方技术隔绝的公司来说,这一成就似乎在两年前是不可能实现的。

百度方面已投资超过 150 亿元人民币(约 21 亿美元)开发昆仑加速器,专门用于处理大型语言模型。第二代芯片昆仑 II 具有 512 个内核、770 亿个晶体管,并提供 256 TOPS(每秒万亿次运算)的性能,同时功耗仅为其前代产品的一半。

昆仑 II 处理器专为矢量数学运算而设计,这对于大型语言模型至关重要。这使得中国公司无需依赖进口芯片即可训练其语言模型,从而确保了对美国供应商的独立性。

阿里巴巴通过其平头哥部门,在过去两年中将其半导体设计工程师团队从 200 人扩展到 2,000 多人。该公司最近宣布成功测试了其首款 5 纳米芯片,这是弥合技术差距的重要一步。

规避障碍:中国体系

中国公司采取多种创新策略来绕过制裁,展现出卓越的效率和全面性。

在第三国设立空壳公司网络

美国情报部门的调查发现,主要在阿拉伯联合酋长国、新加坡和马来西亚运营的空壳公司构成了错综复杂的网络。这些实体采购先进的 NVIDIA A100 和 H100 芯片,然后将其运往中国研究中心。仅在 2023 年,美国商务部估计,通过这个后门进入中国的先进人工智能芯片可能超过 10,000 个。

已经确定了一个由 300 多家公司组成的网络,这些公司没有从事任何实际运营活动,而是充当购买美国芯片的中介。这些公司经常更改名称和所有权结构以避免被发现。

在迪拜发现了一个特别有趣的案例,一家注册为医疗设备进口商的公司购买了价值超过 2 亿美元的 NVIDIA 芯片,然后将其分发给中国人工智能初创公司。涉案公司 Mountain Summit Technologies 在美国实施制裁后仅一个月就成立了。

重新设计和“降级”技术

另一种策略是故意重新设计芯片,使其在技术上不属于制裁范围。 NVIDIA 旨在保留其重要的中国市场份额,因此创建了特殊版本的芯片 A800 和 H800,这些芯片经过修改以符合美国法规。尽管官方声称其性能比 A100 和 H100 版本有所降低,但中国工程师已经找到方法来部分恢复其原始计算能力。

这是一场经典的猫捉老鼠游戏。随着制造商降低芯片性能以满足监管要求,中国公司已经找到方法来优化软件以弥补这些限制,从而在规避制裁的同时访问最新进展。

在二级市场上收购二手芯片

二手零件市场已经成为先进组件的一个令人惊讶的来源。中国公司积极购买带有先进处理器和显卡的二手服务器和工作站。旧一代的 NVIDIA 显卡(例如 V100 系列)特别有价值。它们不受制裁的约束,但仍为人工智能任务提供强大的计算能力。

2023 年,人们发现几家大型美国公司在不知情的情况下将其退役的数据中心出售给中间商,然后中间商将显卡转售给中国公司。虽然新的法规已经部分解决了这个漏洞,但专家预测,二手零件市场仍将是中国公司组件的重要来源。

开发替代计算架构

对制裁最雄心勃勃的响应是开发全新的计算架构,该架构针对人工智能进行了优化,但其运行原理与占主导地位的西方解决方案不同。上海人工智能实验室与复旦大学合作,正在开发一种模仿人脑结构的神经形态处理器。

这种新的神经形态计算平台 (NCP) 使用与传统 GPU 完全不同的架构。它没有采用大规模并行处理,而是采用人工神经元和突触网络,从而在能源效率方面具有显着优势。

文心一言:中国巨头崛起

百度文心一言(ERNIE Bot (Enhanced Representation through Knowledge Integration))是中国战略有效性的一个主要例子。该模型于 2023 年 3 月首次亮相,但其最新版本 ERNIE 4.0 引起了西方的关注。中国清华大学进行的独立测试表明,ERNIE 4.0 在需要中国文化背景知识的任务中优于 GPT-4,而在其他类别中的表现与 OpenAI 模型相当。

令人惊讶的架构

ERNIE 4.0 基于 Transformer 架构,类似于 OpenAI 和 Google 模型,但融入了多项重大创新。其中之一是“具有增强深度的知识 Transformer”,它将来自中国来源的百科知识(例如百度百科,中国版的 Wikipedia)直接整合到模型的训练过程中。

另一个独特的方面是“持续学习”的能力。 ERNIE 4.0 可以使用新数据进行持续训练,而不会有“忘记”先前获得知识的风险,这与需要完全重新训练才能进行更新的西方模型相比是一个重大进步。

中国语境作为竞争优势

尽管受到制裁,中国人工智能模型的发展速度惊人。文心一言在中国市场具有根本优势。它的开发考虑了中国用户的需求,考虑了西方模型所缺乏的当地语言和文化细微差别。

这种优势在与中国成语、谚语和文化典故相关的测试中最为明显。 ERNIE 4.0 在理解和生成传统的四个汉字成语(成语)方面达到了 95% 的准确率,而 GPT-4 在相同的任务中仅达到了 45%。

审查制度成为训练中意想不到的资产

具有讽刺意味的是,中国的审查要求可能促进了文心一言的开发。像 GPT-4 这样的模型在训练时使用了各种保护措施和过滤器,这些措施和过滤器通常会限制其功能。文心一言虽然受到审查,但却按照不同的标准进行训练。

百度联合创始人、董事长兼首席执行官李彦宏在 2023 年 10 月举行的百度世界 2023 大会上宣布了文心一言 4.0。

中国模型对允许和禁止的内容有不同的定义。这创造了一种有趣的非对称性。文心一言可以自由讨论 GPT-4 禁忌的话题,但避免在中国具有政治敏感性的话题。

文心一言相对于西方竞争对手的关键优势

百度围绕其旗舰人工智能模型创建了一个全面的生态系统,西方竞争对手将很难复制。文心一言相对于西方竞争对手具有关键优势,即:

  • 访问庞大的中文数据集: 作为中国最受欢迎的搜索引擎的运营商,百度拥有独特的中文文本、查询和交互集合,涵盖中国互联网 20 多年的历史。
  • 与百度应用生态系统的深度集成: 文心一言与 50 多个百度应用集成,从地图到流媒体服务,创建了西方竞争对手无法获得的封闭数据和交互循环。
  • 更好地理解中国文化背景: 该模型接受过中国文学、历史和当地媒体的培训,使其能够深入理解文化细微差别和历史参考。
  • 政府支持和保护主义政策: 中国法律倾向于国内解决方案,尤其是在被认为是战略性的领域,这使得文心一言在拥有超过 14 亿潜在用户的市场中具有优势。
  • 针对中国硬件进行了优化: 与西方模型不同,文心一言经过优化可在中国的处理器(例如昆仑)上运行,从而确保以更低的能耗获得更好的性能。

从本地参与者到全球扩张

百度的战略不仅限于国内市场。该公司已与全球南方(尤其是在东南亚和非洲)的公司建立了合作伙伴关系。在马来西亚、泰国和尼日利亚,文心一言已经有当地语言版本,而 OpenAI 和 Anthropic 模型仍在计划将其业务扩展到这些市场。

“数字丝绸之路”倡议

作为“数字丝绸之路”倡议(更广泛的“一带一路”项目的一部分),百度为来自发展中国家的政府和公司提供对其人工智能技术的特殊访问条件。在肯尼亚和埃塞俄比亚,百度正在与当地电信运营商合作,通过简单的 SMS 界面提供对文心一言的访问,即使对于没有智能手机或高速互联网访问权限的人也可以使用人工智能。

满足当地需求

百度首席技术官王海峰解释说:“与主要为发达国家用户设计的西方模型不同,我们的解决方案考虑了发展中国家的具体情况。我们提供需要更少带宽并在低端硬件上运行的模型,这对于在非洲和东南亚等市场广泛采用至关重要。”

该战略取得了切实的成果。在印度尼西亚,百度与当地科技巨头 GoTo 合作,文心一言在推出后仅三个月就获得了超过 800 万活跃用户,这在很大程度上归功于其与当地热门应用的集成。

投资竞赛:人工智能的万亿人民币

根据国际数据公司 (IDC) 的数据,去年中国对人工智能的投资增长了 58%,达到 1200 亿美元以上。相比之下,美国增长了 35%。

前所未有的国家支持

中国科技部于2023年6月宣布设立一项专项基金,价值8000亿元人民币(约合1110亿美元),专门用于发展国内人工智能技术。此外,省市级政府也在制定其支持计划。例如,上海已承诺到 2025 年向其当地人工智能生态系统投资 1000 亿元人民币(140 亿美元)。

彼得森国际经济研究所的玛丽·约翰逊博士评论说:“这是前所未有的资源调动。中国将人工智能视为国家安全和国际竞争力的关键要素,因此投资水平堪比 20 世纪 60 年代的美国太空计划。”

私人资本追随国家资本

私人投资追随国家投资。根据 PitchBook 的数据,2023 年中国人工智能初创公司的融资总额为 450 亿美元,比上一年增长 75%。投资者对专门从事量子计算、人工智能芯片和多模态模型的公司特别感兴趣。

红杉中国在与美国母公司分离后更名为红杉中国,已承诺专门向中国人工智能初创公司投资 80 亿美元。

红杉中国创始人沈南鹏预测:“我们相信,未来 5 年内,中国将涌现至少 50 家人工智能“独角兽”(每家价值超过 10 亿美元)。”

回飞镖效应:制裁加速了中国的发展

专家指出,制裁可能以一种自相矛盾的方式加速了中国人工智能生态系统的发展,迫使公司变得更加自给自足,并加大对研究的投入。虽然美国和中国之间仍然存在技术差距,但差距正在以惊人的速度缩小,这让人对美国遏制战略的有效性产生怀疑。

加速供应链本地化

在制裁之前,中国公司依赖西方技术,几乎没有动力开发自己的解决方案。美国的限制造成了一种生存威胁,调动资源和人才的方式通常需要数十年才能实现。

为了应对制裁,中国政府启动了“本地创新”计划,该计划为投资于国内人工智能技术开发的公司提供大幅减税和优惠贷款。该计划已经吸引了 5,000 多家公司,这些公司承诺实现供应链本地化。

人才逆向流动

一个有趣的现象是来自海外的中国人工智能专家回归。中国教育部的数据显示,2023 年有超过 3,000 名此前在美国和欧洲工作的中国人工智能科学家和工程师回国,是 2020 年的两倍多。

陈晓辉博士解释说:“在硅谷,我越来越感到对作为一名中国研究人员的地位感到不确定。他曾在谷歌工作 15 年后回到北京加入百度的人工智能团队。“在中国,我可以访问庞大的数据集、重要的计算资源,最重要的是,有机会参与对国家具有战略意义的项目。”

对美国企业产生意想不到的后果

制裁也影响了美国公司。英伟达的 GPU 对于人工智能开发至关重要,但该公司已经失去了进入中国市场的机会,每年损失超过 100 亿美元。作为回应,该公司加紧游说以放松限制,辩称制裁对美国的竞争力造成的损害大于对中国的损害。

英特尔和 AMD 也报告了重大收入损失。高盛估计,由于制裁,美国芯片制造商总共损失了超过 250 亿美元的潜在收入,导致研发预算减少,并可能导致技术进步放缓。

未来涂上了中国色彩

当全世界都在关注 OpenAI、Anthropic 和 Google 之间的竞争时,对美国在人工智能领域的主导地位的真正威胁可能来自不同的方向。文心一言和其他中国模型可能很快成为西方解决方案的全球替代品,从而重塑未来几十年的世界技术版图。

未来预测

麦肯锡咨询公司的分析师预测,到 2028 年,中国的人工智能模型将在大多数应用领域具有全球竞争力,并且在某些领域(例如图像识别和亚洲语言处理),它们甚至可能占据主导地位。

战略与国际研究中心的莎拉·米勒博士警告说:“未来五年内,我们很有可能会看到一个数字世界分为两个势力范围,一个是西方世界,由 GPT 和 Claude 等模型主导,另一个是东方世界,由文心一言和类似解决方案主导。”

这种情况不仅可能对技术产生深远的影响,而且可能对地缘政治、贸易和关于人工智能的全球伦理标准产生深远的影响。

创新拥有最终决定权

百度首席执行官李彦宏以其一贯乐观的口吻总结了当前形势:“外部限制可能会减缓发展速度,但无法阻止创新。技术史表明,真正的进步总能找到出路。文心一言证明,中国的人工智能生态系统不仅能够抵御制裁,而且能够将制裁转化为其发展的催化剂。”

尽管存在政治不稳定因素,但有一点是肯定的:美国和中国之间的技术冷战正进入一个决定性阶段,其结果可能与美国领导人最初的预期大相径庭。