OpenAI发布GPT-4.5:通用语言模型新进展

增强交互性并减少幻觉

OpenAI 在一篇随公告发布的博客文章中强调了 GPT-4.5 提供的改进的用户体验。该公司表示:“早期测试表明,与 GPT-4.5 的交互感觉更自然。”这种增强的自然性源于几个关键改进:

  • 更广泛的知识库: GPT-4.5 拥有更广泛的知识库,使其能够以更高的准确性和深度处理更广泛的主题和查询。
  • 改进的意图理解: 该模型展示了理解和遵循用户意图的卓越能力,从而产生更相关和有用的响应。
  • 更高的’情商’: OpenAI 认为 GPT-4.5 表现出更高水平的“情商”,使其能够更好地理解和响应人类交流的细微差别。

这些改进共同促成了更直观和高效的用户体验。此外,内部测试表明,与 OpenAI 之前的模型 GPT-4o 和 o1 相比,GPT-4.5 的幻觉率显著降低。幻觉是指 AI 模型生成事实上不正确或无意义的信息的情况,这一直是大型语言模型开发中的一个持续挑战。GPT-4.5 降低的幻觉率代表着朝着缓解这个问题迈出了实质性的一步。

向前迈进了一步,但并非巅峰

虽然 GPT-4.5 代表了一项重大进步,但 OpenAI 的联合创始人兼首席执行官 Sam Altman 澄清说,它在基准性能方面不会是最先进的。在 X(前身为 Twitter)上的一篇帖子中,Altman 将该模型描述为具有“我以前从未感受过的魔力”,暗示了其独特的功能和潜力。然而,他承认它不一定会在标准化测试中胜过其他模型。

这种区别突出了 OpenAI 的模型开发方法,该方法不仅优先考虑原始性能,还优先考虑整体用户体验以及模型有效处理现实世界任务的能力。GPT-4.5 专注于自然交互、减少幻觉和改进意图理解,表明向不仅强大而且可靠和用户友好的模型转变。

分阶段推出和基础设施挑战

OpenAI 计划分阶段推出 GPT-4.5,正如 OpenAI 的研究负责人兼公司技术人员 Alex Paino 在直播中所述,下周将首先向 ChatGPT Plus 和 Team 订阅者推出。ChatGPT Edu 和 Enterprise 订阅者将在接下来的一周内获得访问权限。这种交错的方法使 OpenAI 能够管理对新模型的需求,并确保其用户群的平稳过渡。

Altman 在他的 X 帖子中将 GPT-4.5 描述为“巨大的、昂贵的模型”。他解释说,由于资源限制,最初的推出将优先考虑 Plus 和 Pro 订阅者。“我们真的想同时向 Plus 和 Pro 推出它,但我们一直在增长,并且 GPU 不够用了,”他写道。“我们将在下周增加数万个 GPU,然后将其推广到 Plus 层。”这一声明强调了大型语言模型的巨大计算需求,以及在获得足够的硬件资源以支持其部署方面持续存在的挑战。GPU(图形处理单元)是专门的处理器,特别适合 AI 模型所需的并行处理。

与 Microsoft Azure AI Foundry 集成

GPT-4.5 的可用性不仅限于 OpenAI 自己的平台。微软首席执行官 Satya Nadella 在 X 上宣布,该模型可通过 Microsoft 的 Azure AI Foundry 进行预览。这种集成反映了两家公司之间的深厚伙伴关系。微软已向 OpenAI 投入巨资,超过 130 亿美元,并将 OpenAI 的模型整合到各种微软产品中。此外,微软向 OpenAI 提供关键的计算资源,支持其先进 AI 技术的开发和部署。

Azure AI Foundry 为开发人员提供了一个平台,可以使用包括 GPT-4.5 在内的尖端 AI 模型进行试验和构建应用程序。此次合作扩大了 OpenAI 技术的影响范围,并使更广泛的开发人员能够利用其功能。

背景:市场动态和未来路线图

GPT-4.5 的发布正值 AI 领域激烈活动和竞争的时期。就在一个月前,市场对中国实验室 DeepSeek 推出的一种高效方法反应强烈。这一事件导致英伟达(Nvidia)的市值单日大幅下跌近 6000 亿美元,英伟达是广泛用于 AI 模型开发的 GPU 的领先制造商。这一事件凸显了市场对快速发展的人工智能领域的进步和竞争压力的敏感性。

为了回应市场日益增长的意识,Altman 承认需要提高 OpenAI 路线图的透明度。在英伟达市场下跌两周后,他在 X 帖子中表示,该公司旨在改善其关于未来计划的公开沟通。这种对透明度的承诺反映出人们越来越认识到让利益相关者了解 AI 发展的方向和进展的重要性。

Altman 进一步阐述了 OpenAI 的未来计划,表示 GPT-4.5 之后将是 GPT-5,GPT-5 将整合 OpenAI 更广泛的技术。他还提到了该公司在“推理模型”方面的工作,这些模型在用户查询时执行大量计算。相比之下,GPT-4.5 被描述为该公司“最后一个非思维链模型”,表明未来迭代将转向更复杂的推理能力。思维链提示是一种鼓励大型语言模型将复杂问题分解为一系列中间步骤的技术,从而提高它们的推理和解决问题的能力。

深入了解 GPT-4.5 的功能

虽然有关 GPT-4.5 架构和训练数据的具体技术细节仍未披露,但 OpenAI 的声明和初步测试结果提供了一些关于其关键特性和改进的线索:

  • 增强的语言理解: GPT-4.5 可能建立在其前身在自然语言理解方面的进步之上。这包括以下方面的改进:
    • 语法和文法: 更准确地解析和生成语法正确的句子。
    • 语义: 更好地理解单词和概念的含义和关系。
    • 语用: 改进了解释语言使用的上下文和意图的能力。
  • 扩展的知识表示: OpenAI 提到的“更广泛的知识库”表明 GPT-4.5 已经接受了比以前模型更大、更多样化的数据集的训练。这可能包括更广泛的主题、事实信息和写作风格。
  • 改进的推理和解决问题的能力: 虽然没有明确标记为“推理模型”,但 GPT-4.5 改进的遵循用户意图和解决实际问题的能力暗示了其推理能力的增强。这可能涉及以下方面的改进:
    • 逻辑演绎: 从给定的前提得出有效的结论。
    • 常识推理: 应用日常知识和理解来解决问题。
    • 因果推理: 识别因果关系。
  • 减少幻觉: 降低幻觉率是一项至关重要的进步。这可能源于多种因素的组合,例如:
    • 改进的训练数据: 从训练数据集中过滤掉不准确或误导性的信息。
    • 来自人类反馈的强化学习 (RLHF): 根据人类反馈对模型进行微调,以优先考虑事实准确性并减少无意义内容的生成。
    • 架构修改: 可能结合机制以更好地将模型的响应建立在其知识库中,并防止其偏离到不受支持的声明。

“情商”的意义

OpenAI 提到 GPT-4.5 更高的“情商”特别有趣。虽然 AI 模型不具备人类意义上的情感,但在这种情况下,“情商”一词可能指的是模型的能力:

  • 识别和响应情绪基调: 检测用户输入的情绪基调(例如,积极、消极、中性、沮丧、热情)并相应地调整其响应。
  • 生成具有适当情感细微差别的文本: 生成不仅在事实上准确而且在情感上适合给定上下文的文本。这可能涉及使用具有同理心、鼓励或令人放心的语言,具体取决于情况。
  • 理解和响应隐含的情感线索: 从语言使用的微妙线索中推断情绪状态,例如单词选择、句子结构和标点符号。

增强 AI 模型的“情商”是朝着创建更自然和更具吸引力的交互迈出的重要一步。它可以改善各种应用中的用户体验,例如客户服务、教育和创意写作。

GPT-4.5 的更广泛影响

GPT-4.5 的发布对人工智能领域及其应用具有几个更广泛的影响:

  • 通用人工智能的持续进步: GPT-4.5 展示了在开发能够执行广泛任务和处理不同类型信息的 AI 模型方面的持续进展。这一趋势正在推动 AI 的可能性边界,并为其在各个行业的应用开辟了新的可能性。
  • 更加关注可靠性和可信度: 强调减少幻觉和提高事实准确性反映出人们越来越认识到构建可信 AI 系统的重要性。随着 AI 模型越来越融入关键应用,确保其可靠性并最大限度地降低生成误导性信息的风险至关重要。
  • 增强人机交互: 自然语言理解、意图识别和“情商”方面的改进有助于实现人与 AI 系统之间更无缝和直观的交互。这对于使更广泛的受众更容易访问和使用 AI 技术至关重要。
  • 新应用的可能性: GPT-4.5 的功能可以在以下领域实现新的应用:
    • 内容创作: 为各种目的生成高质量的书面内容,例如营销、新闻和教育。
    • 代码生成: 通过生成代码片段、调试代码和自动化编程任务来协助软件开发人员。
    • 数据分析: 从大型数据集中总结和提取见解。
    • 个性化学习: 使教育内容和教学适应学生的个人需求。
    • 客户服务: 提供更智能和更具同理心的客户支持。

GPT-4.5 代表了大型语言模型演进中的一个值得注意的进步。它专注于自然交互、减少幻觉和改善用户体验,使其成为广泛应用的宝贵工具。虽然不是最终的基准测试者,但它代表了人工智能发展的进步,并强调了创建不仅强大而且可靠、可信和用户友好的 AI 系统的重点。分阶段推出以及与 Microsoft Azure AI Foundry 的集成将扩大其影响范围,并使更广泛的用户能够探索其功能。