OpenAI 的 2024:合作、创新与挑战
2024 年对 OpenAI 来说至关重要。该公司与 Apple 建立了重要的合作伙伴关系,将其生成式 AI 功能集成到 Apple Intelligence 中。此外,OpenAI 推出了 GPT-4o,展示了先进的语音交互功能,并继续为 Sora(其文本到视频模型)造势。
然而,这条道路并非一帆风顺。OpenAI 经历了内部变革,包括联合创始人 Ilya Sutskever 和 CTO Mira Murati 等关键人物的离职。该公司还面临法律挑战,包括版权侵权诉讼和 Elon Musk 的禁令。这些障碍凸显了快速发展的 AI 领域固有的复杂性。
展望 2025 年,OpenAI 正在积极努力保持其竞争优势,特别是应对像 DeepSeek 这样的新兴中国竞争对手。与此同时,该公司正在加强与华盛顿的关系,推进雄心勃勃的数据中心项目,据报道正准备进行大规模融资。这些努力突显了 OpenAI 保持在 AI 创新前沿的决心。
ChatGPT 关键更新的时间线回顾
为了全面了解 ChatGPT 的演变,让我们从最近的更新开始,按时间顺序查看其产品更新和发布的列表:
2025 年 3 月:隐私问题和模型增强
- 欧洲隐私投诉: 隐私倡导组织 Noyb 支持一名挪威人,该人发现 ChatGPT 正在传播虚假信息。这一事件强调了按照 GDPR 的要求,准确处理个人数据的至关重要性。
- 转录和语音模型升级: OpenAI 使用新的转录和语音生成模型(’gpt-4o-mini-tts’、’gpt-4o-transcribe’ 和 ‘gpt-4o-mini-transcribe’)增强了其 API。这些模型提供更逼真的语音和改进的转录准确性,并减少了产生幻觉的倾向。
- 推出 o1-pro: OpenAI 在其开发者 API 中推出了 o1-pro,这是其 o1 模型的更强大版本。该模型可供部分开发者使用,通过增加计算能力提供卓越的响应。
- AI ‘推理’ 见解: OpenAI AI 推理研究负责人 Noam Brown 表示,如果采用正确的方法,某些 AI ‘推理’ 模型可能早在几十年前就可以开发出来。
- 创意写作能力: OpenAI 首席执行官 Sam Altman 透露,正在开发一个擅长创意写作的新模型,尽管其实际效果仍有待全面评估。
- 构建 AI 代理的工具: OpenAI 推出了新工具,帮助开发者和企业利用 OpenAI 的模型和框架创建 AI 代理(能够独立执行任务的自动化系统)。
- 专业 AI 代理的定价报告: 报告显示,OpenAI 计划发布用于各种应用的专业 ‘代理’ 产品,月费可能很高,反映了该公司当前的财务需求。
- 直接代码编辑: macOS ChatGPT 应用程序现在允许在受支持的开发者工具中直接编辑代码,从而简化了程序员的工作流程。
- 用户增长激增: Andreessen Horowitz (a16z) 的一份报告强调了 ChatGPT 的用户快速增长,到 2025 年 2 月,每周活跃用户达到 4 亿,这得益于新模型和功能的发布。
2025 年 2 月:模型取消和可访问性改进
- 取消 o3: OpenAI 改变了策略,取消了 o3 模型,转而支持名为 GPT-5 的 ‘统一’ 下一代版本,集成了各种技术。
- 功耗分析: Epoch AI 的研究表明,ChatGPT 每次查询的功耗可能低于之前的估计,尽管这没有考虑图像生成等功能。
- 增强的 ‘思维链’: OpenAI 改进了其 o3-mini 模型传达其 ‘思考’ 过程的方式,让用户更深入地了解其推理步骤。
- 无需登录即可进行网络搜索: OpenAI 在 ChatGPT 中启用了网络搜索功能,无需用户登录,从而提高了可访问性(尽管移动应用程序仍然需要登录)。
- ‘深度研究’ 代理: OpenAI 宣布了一个名为 deep research 的新 AI ‘代理’,专为需要来自多个来源的信息的深度研究任务而设计。
2025 年 1 月:说服实验和模型发布
- AI 说服力测试: OpenAI 利用 subreddit r/ChangeMyView 来评估其 AI 推理模型的说服能力,将 AI 生成的回复与人类回复进行比较。
- 推出 o3-mini: OpenAI 推出了 o3-mini,这是一种新的 ‘推理’ 模型,被描述为既 ‘强大’ 又 ‘经济实惠’。
- 移动用户人口统计: 一份报告显示,ChatGPT 的移动用户中存在显著的性别差距,男性占绝大多数。
- 面向政府机构的 ChatGPT 计划: OpenAI 推出了 ChatGPT Gov,为美国政府机构提供了一种安全且合规的方式来访问该技术。
- 青少年用于学校作业的使用增加: 皮尤研究中心的一项调查显示,尽管该技术存在潜在的缺点,但青少年使用 ChatGPT 进行学校作业的情况有所增加。
- Operator 的数据保留策略: OpenAI 澄清了其 AI ‘代理’ 工具 Operator 的数据保留策略,表明可能将已删除的数据存储长达 90 天。
- Operator 的发布: OpenAI 发布了 Operator 的研究预览版,Operator 是一种能够自动执行预订旅行和在线购物等任务的 AI 代理。
- Pro 计划用户的潜在预览: 有迹象表明,Operator 可能会提前发布给 200 美元 Pro 订阅计划的用户。
- 电话号码注册: OpenAI 开始在特定地区测试 ChatGPT 的仅电话号码注册,简化了注册流程。
- 提醒和任务调度: ChatGPT 引入了一项测试版功能,允许用户安排提醒和重复性任务。
- 可定制的特征: OpenAI 引入了一种让用户自定义 ChatGPT 个性的方法,可以指定 ‘健谈’ 或 ‘Z 世代’ 等特征。
2024 年 12 月:错误信息风险和 AGI 定义
- ChatGPT 搜索漏洞: 研究表明,ChatGPT Search 可能会被操纵生成误导性摘要,突出了潜在风险。
- Microsoft 和 OpenAI 的 AGI 定义: 一份报告指出,Microsoft 和 OpenAI 对 AGI 有一个具体的、以利润为中心的内部定义,基于产生 1000 亿美元的利润。
- 安全策略一致性: OpenAI 发布了研究报告,详细介绍了其使用 ‘审慎一致性’ 使 AI 推理模型与人类价值观保持一致的方法。
- o3 推理模型的公告: OpenAI 首席执行官 Sam Altman 宣布了 o1 推理模型系列的继任者:o3 和 o3-mini,并向安全研究人员提供了预览。
- 固定电话上的 ChatGPT: OpenAI 引入了一个 1-800 号码,可以通过电话访问 ChatGPT,甚至可以通过固定电话访问,从而提高了可访问性。
- 免费用户的 ChatGPT 搜索: OpenAI 向免费、已登录的用户提供 ChatGPT Search,扩大了对实时网络信息的访问。
- 中断事后分析: OpenAI 将 ChatGPT 的一次重大中断归因于 ‘新的遥测服务’ 问题,排除了安全事件或产品发布。
- 限时圣诞老人声音: OpenAI 为 ChatGPT 提供了一个临时的 ‘圣诞老人模式’ 声音,增添了节日气氛。
- 高级语音模式的愿景: OpenAI 为 ChatGPT 发布了实时视频功能,允许用户使用手机摄像头与聊天机器人进行交互。
- 重大中断: ChatGPT 和 Sora 经历了重大中断,归因于配置更改,与 Apple Intelligence 集成无关。
- Canvas 推出:Canvas 是一种以协作为中心的界面,已向所有用户推出,支持 Python 代码集成和自定义 GPT。
- Sora 注册暂停:由于需求量大,OpenAI 暂停了其视频生成器 Sora 的新注册,导致视频生成速度变慢。
- Sora 发布:OpenAI 向 ChatGPT Pro 和 Plus 订阅者(不包括欧盟)发布了其文本到视频模型 Sora,提供视频生成功能。
- ChatGPT Pro 订阅:OpenAI 推出了每月 200 美元的 ChatGPT Pro 订阅,提供对所有模型的无限制访问,包括 o1 的完整版本。
- 12 天揭秘:OpenAI 宣布了 ‘12 Days of OpenAI’,其中包括每日直播,发布产品和演示。
- 用户里程碑:Sam Altman 宣布,ChatGPT 的每周活跃用户超过 3 亿。
2024 年 11 月:隐私问题和潜在广告
- ‘David Mayer’ 崩溃: 用户发现提及 ‘David Mayer’ 会导致 ChatGPT 冻结,这可能是由于数字隐私请求。
- 广告的可能性: OpenAI 探索了在 ChatGPT 中加入广告的可能性,考虑到 Sam Altman 之前的立场,此举引起了人们的关注。
- 加拿大新闻诉讼: 加拿大媒体公司对 OpenAI 提起诉讼,指控其侵犯版权。
*GPT-4o 升级: OpenAI 更新了其 GPT-4o 模型,增强了其创意写作能力和文件访问洞察力。 - 网络上的高级语音模式: ChatGPT 的高级语音模式功能扩展到网络,支持通过浏览器进行语音交互。
- Mac 桌面应用程序集成: 适用于 macOS 的 ChatGPT 桌面应用程序获得了读取以开发者为中心的应用程序中的代码的能力,从而简化了编码工作流程。
- 安全研究员离职: 研究和安全副总裁 Lilian Weng 离开了 OpenAI,延续了 AI 安全研究员离职的趋势。
- 选举新闻重定向: OpenAI 报告称,将数百万用户重定向到可信的新闻来源,以获取与选举相关的信息。
- 收购 Chat.com: OpenAI 收购了 Chat.com 域名,增加了其拥有的高知名度域名。
- Meta 硬件负责人加入: Meta AR 眼镜工作的前负责人加入 OpenAI,领导机器人和消费硬件。
- 设置中的 ChatGPT Plus 升级: Apple 在其设置应用程序中包含了一个升级到 ChatGPT Plus 的选项,简化了订阅流程。
2024 年 10 月:计算能力和产品延迟
- 计算能力限制: Sam Altman 承认,缺乏计算能力正在推迟产品发布,包括高级语音模式的视觉功能。
- ChatGPT Search 的发布: OpenAI 推出了 ChatGPT Search,这是 SearchGPT 的演变,提供网络信息和来源链接。
- 桌面上的高级语音模式: 高级语音模式已推广到 ChatGPT 的 macOS 和 Windows 桌面应用程序。
- AI 芯片计划: 报告显示,OpenAI 正在与 TSMC 和 Broadcom 合作构建内部 AI 芯片。
- 聊天历史记录搜索: OpenAI 引入了一项功能,允许用户搜索其 ChatGPT 聊天历史记录。
- Apple Intelligence 集成: ChatGPT 功能随 iOS 18.1 更新一起提供,与 Apple Intelligence 集成。
- 否认 Orion 发布: OpenAI 否认了在 2024 年发布代号为 Orion 的模型的报道。
- Windows 应用程序预览: OpenAI 开始预览 ChatGPT 的专用 Windows 应用程序。
- 与 Hearst 的内容交易: OpenAI 与 Hearst 达成了一项内容交易,在 ChatGPT 中呈现 Hearst 出版物的报道。
- ‘Canvas’ 界面: OpenAI 引入了 ‘Canvas’,这是一种用于写作和编码项目的新界面。
- 融资: OpenAI 融资 66 亿美元,公司估值 1570 亿美元。
- Dev Day 上的实时 API: OpenAI 在 Dev Day 上宣布了一个新的 API 工具,使开发者能够构建实时的语音到语音体验。
2024 年 9 月:定价和领导层变动
- 潜在的价格上涨: 报告显示,OpenAI 可能会在 2029 年之前将 ChatGPT 订阅的价格提高到 44 美元。
- Mira Murati 离职: CTO Mira Murati 离开了 OpenAI,随后其他研究负责人也离开了。
- 高级语音模式推出: OpenAI 向付费客户推出了具有更多声音和新设计的高级语音模式。
- 图形计算器破解: 一位 YouTuber 演示了如何在修改后的图形计算器上运行 ChatGPT。
- OpenAI o1 的公告: OpenAI 公布了 OpenAI o1 的预览版,这是一种能够自我事实核查的新模型。
- 越狱事件: 一名黑客诱骗 ChatGPT 提供制造炸药的说明。
- 付费用户里程碑: OpenAI 的企业产品达到了 100 万付费用户。
- 大众汽车集成: 大众汽车在美国的车辆中推出了其 ChatGPT 语音助手。
2024 年 8 月:内容交易和初步印象
- 与 Condé Nast 的内容交易: OpenAI 与 Condé Nast 合作,在 ChatGPT 中呈现 Condé Nast 出版物的报道。
- 高级语音模式印象: 对高级语音模式的早期印象突出了其速度和独特的答案,但作为虚拟助手替代品的局限性。
- 关闭选举影响行动: OpenAI 禁止了与伊朗影响行动相关的帐户,这些帐户使用 ChatGPT 生成与选举相关的内容。
- GPT-4o 的怪癖:OpenAI 在其 GPT-4o 模型中发现了一些意想不到的行为。
这个全面的概述展示了 ChatGPT 的持续发展以及 OpenAI 在 AI 领域对创新的不懈追求。聊天机器人的功能已显著扩展,其影响力在各个行业和应用中持续增长。