OpenAI 模型演進:GPT-4 落幕與 GPT-5 曙光

人工智慧的發展日新月異,OpenAI 始終站在創新的最前線。近幾個月來,發生了重大的變化,而且還有更多的變化即將到來。儘管備受期待的 GPT-5 AI 模型尚未正式發布,但 OpenAI 正在策略性地重組其現有的模型陣容,這表明了通往其發布的明確路徑。這包括逐步淘汰一些最受歡迎的模型,例如 GPT-4 和 GPT-4.5。

GPT-4 的退役和推理模型的崛起

OpenAI 決定於 4 月 30 日起停用其 GPT-4 AI 模型,標誌著一個重要的轉變。GPT-4 作為一個長期且廣泛使用的大型語言模型,一直是 OpenAI 產品的基石。然而,該公司的重點已逐漸從傳統的大型語言模型轉向新一代的推理模型和其他先進技術。

在一系列有趣的舉動中,OpenAI 推出了 GPT-4.1 模型系列,僅作為開發人員的 API。同時,宣布了停用最近推出的 GPT-4.5 模型的計劃,同時還發布了 o3 和 o4 推理模型。這些行動強烈暗示 GPT-5 的發布迫在眉睫。

回顧 GPT-4 的旅程

GPT-4 最初於 2023 年 3 月推出,作為 ChatGPT Plus 付費訂閱背後的引擎,正值 AI 革命的早期熱潮。ChatGPT Plus 的推出是對聊天機器人壓倒性需求的響應,這給 OpenAI 的伺服器帶來了巨大的壓力。ChatGPT Plus 訂閱者可以訪問 GPT-4,而免費的 ChatGPT 用戶則繼續使用最初推出 AI 服務時發布的原始 GPT-3.5 模型。

OpenAI 強調了 GPT-3.5 和 GPT-4 之間的多項主要改進。其中包括擴展的上下文窗口,從 2048 個 tokens 增加到 128,000 個 tokens。GPT-4 還引入了上傳圖像進行分析、生成基於文本的回應以及根據詳細提示生成更具創造性和細微差别的文本輸出的能力。隨後的 GPT-4 模型版本更新包括 GPT-4 Turbo、GPT-4 Turbo with Vision、GPT-4o 和 GPT-4o mini。GPT-4o mini 模型目前是所有 ChatGPT 層级的標準。

推理模型:一種新的典範

2024 年 12 月,OpenAI 通過推出推理模型,踏上了一段創新的旅程。這是他們 ‘12 Days of OpenAI’ 行銷活動的一部分。o1 推理模型的揭幕尤其引人注目。此次推出與他們的大型語言模型的公開發布相呼應,為用戶提供了這種新形式 AI 的全面概述。推理模型擅長邏輯思維,可以深入了解 AI 生成結果背後的思維過程。這與大型語言模型形成對比,後者經過大量數據集的訓練,可以提供對查詢的上下文回應。在 ‘12 Days’ 活動期間,OpenAI 還推出了每月 200 美元的 ChatGPT Pro 層级,使 o1 模型成為此訂閱選項的獨有產品。

從那時起,OpenAI 發布了 o3 和 o4-mini 推理模型。與 o1 模型相比,這些模型在編碼、數學和科學任務方面具有更高的性能。它們可在 20 美元的 ChatGPT Plus 層级中使用,而 o4-mini 模型也包含在 ChatGPT 的免費層级中。

GPT-4.5 和圖靈測試

儘管該公司越來越關注推理模型,但 OpenAI 仍在繼續開發和發布其 LLM。2025 年 2 月下旬推出的 GPT-4.5 標誌著一個重要的里程碑,因為它是迄今為止最大的 AI 模型。GPT-4.5 最顯著的特點之一是它減少了產生幻覺的傾向,這對 AI 模型來說是一個持續存在的挑戰。該模型還展示了改進的會話和解決問題能力,以及更高的情商。這使其能夠辨別寫作和設計等任務中創造力的細微差别。GPT-4.5 已提供給 ChatGPT Plus 和 ChatGPT Pro 用戶使用。

圖靈測試的突破

2025 年 4 月初,有報導稱 GPT-4.5 已通過圖靈測試,這是一項在 UC San Diego 研究中進行的智慧評估。該測試涉及人類參與者,他們的任務是在經過五分鐘的互動後,確定他們認為哪個模型是人類,哪個是 AI。研究人員發現,當 AI 模型配置為模擬 ‘精通網路文化的 19 歲書呆子’ 的個人資料時,它有 73% 的時間被選為人類。如果沒有特定的個人資料,該模型有 36% 的時間被識別為人類。

圖靈測試具有重要意義,因為它允許研究人員實時研究 AI 的潛在應用和倫理影響。該研究得出結論,GPT-4.5 模型使人類能夠與 AI 進行有意義且成功的對話。

GPT-4.5 的突然退役

然而,OpenAI 宣布決定在發布僅幾個月後於 4 月中旬停用 GPT-4.5,這讓 AI 社區感到驚訝。該公司解釋說,該模型不符合他們追求的 AI ‘前沿水準’,這被定義為超越當前模型的技術。OpenAI 計劃從其模型陣容中完全刪除 GPT-4.5。已建議開發人員,他們將可以訪問 API 直到 7 月 14 日,並提供將其專案轉換為其他 API 的指南。

API 努力和開發人員關注

雖然面向消費者的 GPT-4 模型即將結束,但 OpenAI 強調其 API 將繼續為開發人員提供。該公司尚未透露其計劃在未來如何利用該協議,但它可以為構建以消費者為中心的 AI 工具提供一個方便的平台。包括 Duolingo、Stripe 和 Microsoft 在內的幾家主要公司已經利用 GPT-4 為其產品中的 AI 功能提供支持。OpenAI 最近還向開發人員提供了其 GPT-3.5 Turbo API。這是 ChatGPT 聊天機器人在 2022 年首次向公眾推出時為其提供支持的基本模型。同樣,Snap Inc.、Quizlet、Instacart 和 Shopify 等品牌也利用該 API 創建面向客戶的 AI 功能。

OpenAI 還在 API 中引入了 GPT-4.1,這是一個針對開發人員的模型系列。該系列包括 GPT-4.1、GPT-4.1 mini 和 GPT-4.1 nano,提供與 GPT-4.5 相同的功能,但成本更低。OpenAI 聲稱它對 GPT-4o 進行了性能更新;但是,它沒有任何重大改進可以稱為 ‘前沿水準’。即便如此,該模型也了解截至 2024 年 6 月的知識。OpenAI 已與 Windsurf、Qodo、Hex、Blue J、Thomson Reuters 和 Carlyle 等品牌合作,以測試 GPT-4.1 作為其最快且最便宜的模型的性能。

期待 GPT-5:一個前沿模型

AI 社區長期以來一直期待 GPT-5,OpenAI 對其先前模型的投資可能會為即將推出的 AI 模型帶來顯著的改進。雖然該公司尚未提供具體的發布時間表,但 2025 年發布的可能性越來越大。OpenAI 今年早些時候表示,GPT-5 可能會在未來幾個月內推出。

最初的報告表明,AI 模型可能會在 5 月或夏季的某个時間發布。然而,最近發布的 o3 和 o4-mini 推理模型對此時間表產生了一些懷疑。儘管如此,OpenAI 以其令人驚訝的公告而聞名。該公司的 CEO Sam Altman 甚至在 X(前身為 Twitter)上暗示,在 GPT-5 發布之前,AI 模型命名約定可能會有一些變化。

有跡象表明,OpenAI 正在努力使 GPT-5 成為真正的領先模型,為該行業提供全新的獨特之處。根據之前的標準,GPT-4 被認為是一種領先的 AI 模型。推理模型也具有這種區分,改變了 AI 處理數據的方式。

GPT-5 的主要功能

Altman 建議 GPT-5 將具有自主 AI 代理,這些代理將通過獨立執行任務來協助用戶。另一個預期的功能是 GPT-5 能夠根據用戶的查詢選擇最佳可用模型。

預計 ChatGPT 免費層級的用戶也可以有限地訪問 GPT-5 模型。但是,那些擁有 Plus 和 Pro 訂閱的人將能夠充分利用該模型的高級功能。