AI 快速发展格局
OpenAI 推出了其最新的生成式 AI 模型,内部称为“Orion”,现正式命名为 GPT-4.5。这一新版本代表着一个重大的进步,拥有更大的规模和更高的计算需求,超越了所有之前的版本。根据 OpenAI 的说法,主要的增强在于其对用户提示的理解能力得到提高,为 ChatGPT 用户带来更直观和更精细的交互体验。这项尖端技术最初被标记为研究预览版,目前仅供 OpenAI 每月 200 美元的高级 ChatGPT Pro 服务订阅者使用。
GPT-4.5 的发布紧随 2025 年一系列 AI 模型的发布。Anthropic 为其 Claude 聊天机器人引入了一个混合推理模型,推动了对话式 AI 的边界。早些时候,中国研究机构 DeepSeek 凭借一个以极低预算训练的强大模型在硅谷引起了轰动。这促使 OpenAI 在一个月前推出了自己推理模型的“迷你”版本。
在这些进展中,OpenAI 已承诺投入大量资金建设必要的 AI 基础设施,以支持开发更大、更强大的模型。GPT-4.5 体现了这种对“越大越好”理念的承诺,OpenAI 认为这一策略对于捕捉人类交流的微妙之处并最大限度地减少 AI 幻觉的发生至关重要。
拥抱规模:最大化方法
与最近的 AI 创新趋势(例如 DeepSeek 的 R1,优先考虑以最少的资源实现前沿模型性能)不同,OpenAI 仍然坚定地认为,扩展模型是取得进展的可行途径。参与 GPT-4.5 开发的研究人员断言,这种最大化方法使模型能够更好地掌握人类情感和互动的复杂性。
模型的庞大规模也被认为有助于减少幻觉,这是以前版本的一个常见问题。OpenAI 的对齐和人类数据团队负责人 Mia Glaese 解释说:“如果你知道更多的事情,你就不需要编造事情。”虽然 GPT-4.5 的确切大小和计算要求仍未公开,但 OpenAI 选择不发布具体数字。
用户体验和发布计划
第一批体验 GPT-4.5 的用户将是 Pro 订阅者。计划分阶段推出,Plus 和 Team 用户将在下周获得访问权限,Enterprise 和 Edu 用户将在下下周获得访问权限。GPT-4.5 旨在与现有功能(如网络搜索、画布功能和文件/图像上传)无缝集成。但是,它尚不兼容 AI 语音模式。
基准测试及其他:性能预期
OpenAI 的公告包括学术基准测试结果,呈现出喜忧参半的情况。GPT-4.5 在数学方面明显逊于 o3-mini 模型,在科学方面略微领先。然而,它确实在语言基准测试中表现出了一定的优势。OpenAI 研究人员强调,这些基准测试并不能完全反映模型的能力。
Glaese 认为,GPT-4.5 和 GPT-4 之间的用户体验差异将与从 GPT-3.5 到 GPT-4 的飞跃相当。用户可以期待在写作和编程等领域获得增强的性能,整体交互感觉更“自然”。有限的发布和随后的用户反馈对于确定 GPT-4.5 的具体优势和局限性至关重要。
超越推理模型:混合的未来
与 OpenAI 的“o”系列模型不同,GPT-4.5 不属于推理模型。OpenAI 首席执行官 Sam Altman 此前在社交媒体上表示,GPT-4.5 (Orion) 将是该公司“最后一个非思维链模型”。OpenAI 基础研究团队负责人 Nick Ryder 澄清说,这一声明与简化产品路线图有关,而不是研究路线图。
OpenAI 正在积极探索推理模型之外的各种方法,用户可以期待在未来的 ChatGPT 版本中获得更集成的体验。目标是消除用户手动选择特定模型的需要。
Ryder 解释说:“说这是最后一个非推理模型,实际上意味着我们正在努力实现一个未来,所有用户都能被引导到正确的模型。”愿景是让 ChatGPT 智能地确定最适合使用的模型,基于用户的提示,消除当前下拉菜单的复杂性,这可能会让用户难以在 o3-mini-high、GPT-4o 等选项中做出最佳选择。
推动无监督学习的前沿
在竞争激烈的环境中,OpenAI 旨在保持其在 AI 技术前沿的地位。该公司正在大力投资预训练,作为该战略的关键组成部分。Ryder 强调了公司致力于“通过增加我们使用的数据量,增加我们使用的计算量,并专注于真正有效的训练方法”来推进无监督学习领域。
大模型时代的可解释性
鉴于 GPT-4.5 的庞大规模,人们可能会担心理解模型内部运作的能力。系统可解释性,即努力理解模型为何生成特定输出,是 AI 开发的一个重要方面。
然而,Ryder 并不认为规模的增加一定会阻碍可解释性工作。他认为,用于较小模型的方法可以直接应用于这些更大规模的努力。即使模型在规模和复杂性上不断增长,为理解较小模型而开发的技术和方法仍然具有相关性和有效性。
人为因素:软技能和拟人化
GPT-4.5 的开发也反映了 OpenAI 对赋予 AI 超越纯粹技术能力之外的品质的兴趣。该公司正在探索增强直觉、情商和审美情趣等方面,进入了一个接近拟人化的领域。
虽然 OpenAI 的长期目标是创建能够与远程工作者产出相匹配的 AI,但对“软技能”的关注表明了更广阔的愿景。该公司不仅致力于让 AI 能够高效地执行任务,还致力于让 AI 能够以更复杂的方式理解和响应人类互动的细微差别。这种对更像人类的 AI 的追求,引发了关于人机交互未来以及 AI 在我们的生活中扮演更细致和更具同理心的角色的潜力的有趣问题。
对 GPT-4.5 功能的持续探索将为这种方法的实际意义提供有价值的见解。该模型是否真正表现出增强的情商或更精致的审美感还有待观察。然而,将这些品质融入 AI 系统的尝试本身就代表着与传统 AI 开发方法的重大背离,传统 AI 开发方法主要关注可量化的指标和客观的性能基准。
GPT-4.5 及其后续版本的演变无疑将塑造 AI 研究和开发的轨迹。对规模的强调、对更融合的模型体验的追求以及对“软技能”的探索,都指向了一个未来,在这个未来,AI 系统不仅更强大,而且更具适应性、更直观,并且在交互中可能更像人类。实现这一愿景的旅程仍在继续,从 GPT-4.5 中获得的见解无疑将有助于持续探索创造能够真正理解和响应人类世界复杂性的 AI。前进的道路充满挑战,但潜在的回报是巨大的,预示着一个未来,AI 可以以前所未有的方式增强和提升人类的能力。对这些前沿领域的持续探索对于塑造 AI 的未来及其在社会中的作用至关重要。
对创新的不懈追求和突破可能性的意愿是 OpenAI 方法的标志。通过 GPT-4.5,该公司朝着 AI 不仅仅是工具,而是人类努力的伙伴的未来又迈出了大胆的一步。