上海量化基金:AI训练突破,挑战DeepSeek 2.0?

上海一家量化交易基金在人工智能 (AI) 领域掀起波澜,它在一场重要的国际会议上展示了一种可能具有突破性的训练技术。 这种创新方法在一篇提交给享有盛誉的神经信息处理系统会议 (NeurIPS) 的研究论文中进行了详细阐述,它可能与 DeepSeek 和 OpenAI 等知名研究机构使用的既定 AI 训练方法相媲美,甚至超越其有效性。 这一举动反映了 DeepSeek 自身的发展轨迹,DeepSeek 因其在 AI 算法方面的进步而备受关注。

解码悟空的 SASR 训练框架

上海悟空科技有限公司成立于 2015 年,推出了一种名为 SASR 的新型 AI 训练框架,SASR 是step-wise adaptive hybrid training(分步自适应混合训练)的简称。 这种方法旨在解决诸如监督微调 (SFT) 和强化学习 (RL) 等主流方法的感知局限性。 悟空认为,SASR 的灵感来自人类发展推理技能的方式,它提供了一种更具适应性和效率的途径来构建高级 AI 模型。

SFT 和 RL 被认为是 AI 训练过程的基石,被 OpenAI 和 DeepSeek 等行业巨头所采用。 DeepSeek 明确强调了这些技术在优化其 V3 模型性能方面的关键作用,该模型于 12 月发布,并在技术领域引起了极大的兴趣。

根据悟空的研究论文, SASR 由上海交通大学及其新成立的 AI 子公司上海全知智能科技有限公司的研究人员共同撰写,与 SFT、RL 和静态混合训练方法相比,SASR 表现出卓越的性能。 “实验结果表明,SASR 的性能优于 SFT、RL 和静态混合训练方法,”悟空团队在其研究论文中声称。

悟空进步的意义

据报道,悟空的 AI 训练突破凸显了中国在 AI 领域持续取得的进展。 它可能会强调美国政府实施的旨在通过硬件限制阻碍中国 AI 进步的现行政策的局限性。 英伟达 CEO 黄仁勋最近评论了这些限制措施的明显无效性,他表示“中国拥有全球 50% 的 AI 开发人员”。

DeepSeek 是一家从 High-Flyer 对冲基金中脱颖而出的中国 AI 初创公司,它因展示中国通过先进算法以及硬件和软件的集成来实现 AI 领导力的潜力而获得了广泛的认可。

AllMind 在悟空 AI 战略中的作用

AllMind 的成立与悟空的研究发布同时发生,表明这是一种将资源专门用于 AI 研究和开发的战略举措。 中国商业注册记录表明 AllMind 与悟空发布其研究报告的同一天正式注册。

悟空创始人兼 AllMind 法定代表人王啸表示,成立新实体的目的是探索新的 AI 边界。 这反映了 High-Flyer 采取的方法,High-Flyer 于 2023 年将 DeepSeek 作为一个独立的实体创建。

根据其官方网站上的信息,截至去年年底,悟空利用 AI 驱动的策略,管理着超过 150 亿元人民币(约合 21 亿美元)的国内外资产。

深入研究 SASR:分步自适应混合训练框架

悟空的 SASR 框架在 AI 模型训练领域提出了一种有趣的替代方案。 要真正理解其潜在影响,更详细地了解其组成部分和工作原理至关重要。

SASR 的“分步” 方面暗示了一个多阶段的训练过程,其中 AI 模型经历迭代改进。 每个步骤可能涉及特定的目标,并利用不同的训练数据来培养模型中的特定能力。 这种分阶段的方法可以提供诸如减轻从头开始训练复杂模型的挑战以及允许在每个阶段进行定制优化等好处。

“自适应” 元素表明训练过程不是静态的,而是动态响应模型的性能和特征。 这种适应性可能涉及调整超参数、修改训练数据分布或动态加权不同训练目标的贡献。 自适应过程使 AI 能够更有效地学习和改进。

SASR 的“混合” 性质表明它结合了不同训练方法的元素。 这是一个至关重要的方面,因为 SFT 和 RL 都有优点和缺点。 混合方法使模型能够利用每种方法的优势,同时解决其局限性。 通过整合这三个特性,SARS 在理论上可以更好地调整以发展逻辑和推理。

SASR 与传统方法的比较

监督微调 (SFT) 传统上依赖于一个大型带标签的数据集,其中 AI 模型学习将输入映射到所需的输出。 强化学习 (RL) 涉及通过试错来训练模型,奖励或惩罚行动以最大化特定目标。

SASR 试图整合这两种方法,同时克服每种方法的局限性。 例如,SFT 可能在很大程度上依赖于带标签数据的质量和全面性。 在许多现实场景中,获得足够、准确的数据既耗时又昂贵。 RL 虽然不需要带标签的数据,但也可能不稳定且容易受到奖励黑客攻击。 当 AI 模型发现最大化其奖励的意外方法时,就会发生奖励黑客攻击,这可能会导致不期望的行为。

悟空的框架有可能改进 SFT 和 RL 的局限性。 然而,需要进一步和持续的测试来验证公司论文中记录的初步结果。

算法创新和硬件约束

悟空 SASR 框架的消息在美国与中国的技术关系背景下尤为重要。 一段时间以来,美国政府一直试图通过限制对先进计算硬件(特别是英伟达等公司的高端 GPU)的访问来限制中国在 AI 领域的崛起。 这些限制背后的想法是,限制中国对强大硬件的访问将减缓他们的 AI 开发工作。

然而,英伟达 CEO 黄仁勋的评论以及中国 AI 实验室涌现的进展似乎表明,这些政策可能不如预期的有效。 黄仁勋曾著名地指出,中国拥有全球很大一部分的 AI 开发人员,而限制硬件访问可能会激励他们寻找替代解决方案。

悟空声称的 AI 突破表明,算法创新可能在一定程度上抵消硬件限制。 如果中国研究人员能够开发出更有效的训练算法,他们可能能够通过功能较弱的硬件实现可比的 AI 性能。 这可能对全球 AI 格局产生重大影响,因为它表明尽管存在持续的限制,中国仍可能能够继续提升其 AI 能力。

这并不是说硬件无关紧要。 先进的 GPU 对于训练前沿 AI 模型仍然至关重要,并且访问最新的硬件无疑提供了巨大的竞争优势。 然而,悟空的研究表明了投资硬件和软件的重要性,以及在一个领域的进展可能弥补另一个领域的局限性。

中国 AI 的崛起:超越 DeepSeek

DeepSeek 作为 AI 领域杰出参与者的出现是一个催化剂,它展示了中国成为这项变革性技术领域全球领导者的决心。 然而,DeepSeek 只是一个例子,悟空及其 SASR 训练框架的崛起进一步说明了中国 AI 生态系统中日益增长的实力和创新。

有几个因素促成了这种势头。 首先,中国拥有大量数据,这对于训练 AI 模型至关重要。 凭借庞大的人口和数字技术的广泛采用,中国公司可以访问大量数据集,这些数据集可用于开发和改进其 AI 算法。

其次,中国非常重视 STEM 教育,培养了大量才华横溢的工程师和科学家。 这创造了一支高技能的劳动力队伍,能够推动 AI 及相关领域的创新。

第三,中国政府已将 AI 作为战略重点,为研发提供大量资金和支持。 这为 AI 初创公司创造了一个肥沃的环境,并促进了学术界和产业界之间的合作。

最后,中国公司通常愿意对创新采取更务实和冒险的方法,这使他们能够快速行动并试验新想法。

由于这些因素,中国在 AI 能力方面正在迅速赶上美国。 虽然美国在某些领域(如基础研究和高端硬件)仍然保持领先地位,但中国在计算机视觉、自然语言处理和机器人技术等领域取得了重大进展。

悟空和 DeepSeek 等公司的出现表明,中国已做好充分准备,可以在未来几年继续在 AI 领域崛起。

上海悟空科技有限公司:创新背后的公司

上海悟空科技有限公司是一家成立于 2015 年的量化交易基金。 它使用 AI 驱动的策略管理着大量资产。 该公司明确表示其使命是“将技术与基础分析相结合”,从而为客户带来更好的回报。 除了其资产管理核心业务外,悟空还表现出对推动 AI 研究边界的承诺。 AI 子公司全知智能科技有限公司代表着正式化和加速其 AI 研究工作的战略举措。

有关公司内部结构和运营动态的详细信息仍然相对匮乏。 然而,其公开声明和最近的活动为我们提供了对其方法的见解。 公司的口号是“逻辑和真理是我们唯一遵守的原则”,这反映了一种数据驱动和分析的文化。 对 AI 研发的投资表明了一种长期愿景和对 AI 变革潜力的认识,不仅仅是在金融领域,还在各个行业中。 悟空很可能打算利用 AI 研究的见解来改进其交易策略并在市场上获得竞争优势。