OpenAI 的 GPT-4.5:昂贵且优势模糊

OpenAI 最近推出了 GPT-4.5,最初将其定义为“研究预览版”。这个新版本的语言模型目前提供给特定群体:愿意每月支付 200 美元的专业用户,以及每月支付 20 美元的 Plus 订阅用户。虽然 OpenAI 的 CEO,Sam Altman,一直宣称 GPT-4.5 是一种更自然的对话式 AI,但由于在推理能力方面缺乏突破性进展,许多人对此感到困惑。

增量收益,天文数字般的成本

GPT-4.5 确实有一些改进。OpenAI 声称提高了准确性,减少了“幻觉”(编造信息)的倾向,并增强了说服能力。然而,使用此模型的财务影响是惊人的。每百万输入 token 的价格为 75 美元,每百万输出 token 的价格高达 150 美元,GPT-4.5 的成本效益分析远非明确。这种定价结构在 AI 社区内引发了激烈的争论,专家们对于这些改进是否值得如此高昂的费用存在严重分歧。

正面交锋:GPT-4.5 与其前身

每个人都在思考的问题是:GPT-4.5 与其前身 GPT-4 相比,真正的表现如何?AI 研究领域的杰出人物 Andrej Karpathy 进行了一项揭示性的实验。他向用户展示了五个创意写作任务,要求他们评判 GPT-4 和 GPT-4.5 的输出。结果出乎意料。GPT-4 在五项任务中的四项中胜出。

Raj Dandeker 博士的研究结果进一步证实了这一结果。他的技术评估显示 GPT-4.5 的优势微乎其微。事实上,这个较新的模型似乎在数学和逻辑问题上表现挣扎,这与 OpenAI 关于其能力的一些断言直接矛盾。

众说纷纭

媒体对 GPT-4.5 的反应褒贬不一。《Wired》杂志以其精通技术的报道而闻名,毫不留情地批评了 OpenAI 对通用人工智能 (AGI) 的不懈追求,称 GPT-4.5 是一次昂贵的升级,改进却微乎其微。《Futurism》是另一家有影响力的科技出版物,指出围绕 AI 进步的炒作明显减少。

另一方面,也有一些声音表达了更积极的看法。斯坦福大学的 Jacob Rintamaki 称赞 GPT-4.5 增强的幽默感,认为这代表了 AI 在理解社会细微差别方面向前迈出的重要一步。

甚至 AI 模型也有自己的看法

围绕 GPT-4.5 的争论甚至延伸到了 AI 模型本身的领域。由 xAI 开发的竞争对手 AI Grok 承认 GPT-4.5 在对话流程方面的改进,但很快指出其资源密集型特性。OpenAI 自己的产品 ChatGPT 也加入了讨论,强调其卓越的上下文保留、创造力和准确性。然而,即使是 ChatGPT 也承认在长时间对话中保持连贯性方面偶尔存在不足。

深入探讨争议

GPT-4.5 褒贬不一的反应突显了 AI 开发领域的一个基本矛盾:增量进步与成本效益之间的平衡。虽然 GPT-4.5 无可否认地改进了 AI 语言能力的某些方面,但核心问题仍然存在:这些改进是否物有所值?

支持增量进步的论点:

GPT-4.5 的支持者认为,即使自然语言处理方面的微小改进也会产生重大的连锁反应。他们指出了在以下领域的潜在应用:

  • 客户服务: 更自然、更具吸引力的互动可以提高客户满意度。
  • 内容创作: 提高写作质量和创造力可以简化内容生成工作流程。
  • 教育: 通过更细致的 AI 驱动辅导,可以增强个性化学习体验。
  • 无障碍: 更自然的文本转语音和语音转文本功能可以使残疾人受益。

这些倡导者认为,仅仅关注“突破性”创新忽视了较小、迭代改进的累积影响。他们认为,GPT-4.5 虽然不是革命性的,但代表了 AI 持续发展中向前迈出的有价值的一步。

怀疑者的反驳:

然而,批评者仍然不相信。他们提出了几个关键问题:

  • 成本障碍: GPT-4.5 的高昂定价使其无法被许多潜在用户使用,限制了其实际影响。
  • 缺乏实质性推理: 推理能力缺乏显著进步,让人怀疑 GPT-4.5 解决复杂问题的能力。
  • “幻觉”问题: 虽然 OpenAI 声称降低了幻觉率,但这个问题并没有完全消除,在需要事实准确性的应用中存在风险。
  • 炒作因素: 一些批评者指责 OpenAI 过度夸大 GPT-4.5 的能力,制造了不切实际的期望。
  • 收益递减: 人们越来越担心,当前 AI 发展轨迹正在达到收益递减点,即增量改进需要指数级增长的资源。

更广泛的背景:AI 的发展轨迹

GPT-4.5 的争论是在关于 AI 未来的更广泛讨论的背景下展开的。围绕大型语言模型的最初兴奋感逐渐让位于对其局限性和潜在风险的更清醒的评估。

伦理考虑: 对偏见、错误信息和滥用可能性的担忧日益突出。

可持续性: 训练和运行大型 AI 模型的环境影响正受到越来越多的关注。

监管: 世界各国政府都在努力应对监管 AI 开发和部署的挑战。

寻找替代方案: 研究人员正在积极探索 AI 的替代方法,这些方法可能更有效、更易于解释且更符合道德规范。
关于是否将 GPT-4.5 定义为重大进步或微小进步的问题仍然存在争议。

用户视角:是否值得升级?

对于潜在用户而言,是否投资 GPT-4.5 的决定取决于对其特定需求和优先事项的仔细评估。

  • 企业: 考虑将 GPT-4.5 用于客户服务或内容创作的公司应进行全面的成本效益分析,并将其与其他解决方案进行比较。
  • 研究人员: AI 研究人员可能会发现 GPT-4.5 是探索自然语言处理细微差别的宝贵工具,但他们也应该注意其局限性。
  • 个人用户: 对于大多数个人用户而言,GPT-4.5 的成本可能过高,而且收益可能不抵支出。

归根结底,GPT-4.5 提醒我们,通往真正智能机器的道路是复杂而多方面的。虽然增量进步是不可避免的,但保持批判性视角至关重要,要权衡收益与成本,并考虑每一步的更广泛影响。围绕 AI 的炒作往往会掩盖现实,因此,以健康的怀疑态度和对负责任创新的承诺来对待新的发展至关重要。
进化仍在继续,但价值仍有待观察。