OpenAI 推出 GPT-4.5:通用語言模型新進展

增強互動性並減少幻覺

OpenAI 在一篇部落格文章中強調了 GPT-4.5 提供的改進使用者體驗。該公司表示:「早期測試顯示,與 GPT‑4.5 的互動感覺更自然。」這種增強的自然性源於幾個關鍵改進:

  • 更廣泛的知識庫: GPT-4.5 擁有更廣泛的知識庫,使其能夠以更高的準確性和深度處理更廣泛的主題和查詢。
  • 改進的意圖理解: 該模型展示了理解和遵循使用者意圖的卓越能力,從而產生更相關和有用的回應。
  • 更高的’情商’: OpenAI 暗示 GPT-4.5 表現出更高水準的’情商’,使其能夠更好地理解和回應人類溝通的細微差別。

這些改進共同促成了更直觀和高效的使用者體驗。此外,內部測試顯示,與 OpenAI 之前的模型 GPT-4o 和 o1 相比,GPT-4.5 的幻覺率顯著降低。幻覺是指 AI 模型產生事實上不正確或無意義的資訊,一直是大型語言模型開發中的一個持續挑戰。GPT-4.5 降低的幻覺率代表著朝著減輕這個問題邁出了實質性的一步。

向前邁進了一步,但並非巔峰

雖然 GPT-4.5 代表了一項重大進步,但 OpenAI 的聯合創始人兼執行長 Sam Altman 澄清說,它在基準測試效能方面並不是最先進的。在 X(前身為 Twitter)上的一篇貼文中,Altman 將該模型描述為具有「我以前從未感受過的魔力」,暗示了其獨特的功能和潛力。然而,他承認它不一定會在標準化測試中勝過其他模型。

這種區別突顯了 OpenAI 的模型開發方法,該方法不僅優先考慮原始效能,還優先考慮整體使用者體驗以及模型有效處理實際任務的能力。GPT-4.5 專注於自然互動、減少幻覺和改進意圖理解,表明了向不僅強大而且可靠和使用者友好的模型轉變。

分階段推出和基礎設施挑戰

OpenAI 的研究負責人兼公司技術人員 Alex Paino 在直播中表示,OpenAI 計劃分階段推出 GPT-4.5,從下週的 ChatGPT Plus 和 Team 訂閱者開始。ChatGPT Edu 和 Enterprise 訂閱者將在接下來的一週內獲得存取權限。這種交錯的方法使 OpenAI 能夠管理對新模型的需求,並確保其使用者群的平穩過渡。

Altman 在他的 X 貼文中將 GPT-4.5 描述為一個「巨大、昂貴的模型」。他解釋說,由於資源限制,最初的推出將優先考慮 Plus 和 Pro 訂閱者。「我們真的想同時向 Plus 和 Pro 推出它,但我們一直在快速增長並且 GPU 不足,」他寫道。「我們將在下週增加數萬個 GPU,然後將其推廣到 Plus 層。」這份聲明強調了大型語言模型的巨大計算需求,以及在獲得足夠的硬體資源以支援其部署方面持續存在的挑戰。GPU(圖形處理單元)是專門的處理器,特別適合 AI 模型所需的平行處理。

與 Microsoft Azure AI Foundry 整合

GPT-4.5 的可用性不僅限於 OpenAI 自己的平台。微軟執行長 Satya Nadella 在 X 上宣布,該模型可通過 Microsoft 的 Azure AI Foundry 進行預覽。這種整合反映了兩家公司之間的深度合作夥伴關係。微軟已向 OpenAI 投入巨資,超過 130 億美元,並將 OpenAI 的模型納入各種微軟產品中。此外,微軟為 OpenAI 提供關鍵的計算資源,支援其先進 AI 技術的開發和部署。

Azure AI Foundry 為開發人員提供了一個平台,可以使用包括 GPT-4.5 在內的尖端 AI 模型進行實驗和構建應用程式。這種合作擴大了 OpenAI 技術的影響範圍,並使更廣泛的開發人員能夠利用其功能。

背景:市場動態和未來路線圖

GPT-4.5 的發布正值 AI 領域激烈活動和競爭之際。就在一個月前,市場對中國實驗室 DeepSeek 推出的一種高效方法反應強烈。這一事件導致 Nvidia(一家廣泛用於 AI 模型開發的 GPU 領先製造商)的市值單日大幅下跌近 6000 億美元。這一事件凸顯了市場對快速發展的人工智慧領域的進步和競爭壓力的敏感性。

為了回應市場日益增強的意識,Altman 承認需要提高 OpenAI 路線圖的透明度。在 Nvidia 市場暴跌兩週後,他在 X 貼文中表示,該公司旨在改善其關於未來計劃的公開溝通。這種對透明度的承諾反映出人們越來越認識到讓利益相關者了解 AI 開發的方向和進展的重要性。

Altman 進一步闡述了 OpenAI 的未來計劃,表示 GPT-4.5 之後將是 GPT-5,它將整合更廣泛的 OpenAI 技術。他還提到了該公司在「推理模型」方面的工作,這些模型在使用者查詢時執行大量計算。相比之下,GPT-4.5 被描述為該公司的「最後一個非思維鏈模型」,表明未來迭代將轉向更複雜的推理能力。思維鏈提示是一種鼓勵大型語言模型將複雜問題分解為一系列中間步驟的技術,從而提高其推理和解決問題的能力。

深入了解 GPT-4.5 的功能

雖然有關 GPT-4.5 架構和訓練資料的具體技術細節仍未公開,但 OpenAI 的聲明和初步測試結果提供了一些關於其關鍵特性和改進的線索:

  • 增強的語言理解: GPT-4.5 可能建立在其前身在自然語言理解方面的進步之上。這包括以下領域的改進:
    • 語法和文法: 更準確地解析和生成符合文法的句子。
    • 語義: 更好地理解單詞和概念的含義和關係。
    • 語用: 提高了解釋語言使用背後的上下文和意圖的能力。
  • 擴展的知識表示: OpenAI 提到的「更廣泛的知識庫」表明 GPT-4.5 已經在比以前的模型更大、更多樣化的資料集上進行了訓練。這可能包括更廣泛的主題、事實資訊和寫作風格。
  • 精細的推理和問題解決: 雖然沒有明確標記為「推理模型」,但 GPT-4.5 改進的遵循使用者意圖和解決實際問題的能力暗示了其推理能力的增強。這可能涉及以下方面的改進:
    • 邏輯推論: 從給定前提得出有效結論。
    • 常識推理: 應用日常知識和理解來解決問題。
    • 因果推理: 識別因果關係。
  • 減少幻覺: 降低幻覺率是一項至關重要的進步。這可能源於多種因素的組合,例如:
    • 改進的訓練資料: 從訓練資料集中過濾掉不準確或誤導性的資訊。
    • 來自人類回饋的強化學習 (RLHF): 根據人類回饋對模型進行微調,以優先考慮事實準確性並減少無意義內容的產生。
    • 架構修改: 可能包含機制以更好地將模型的回應建立在其知識庫中,並防止其偏離到未經證實的主張。

‘情商’的重要性

OpenAI 提到 GPT-4.5 更高的’情商’特別引人注目。雖然 AI 模型並不具備人類意義上的情感,但在這種情況下,’情商’一詞可能指的是模型的能力:

  • 識別和回應情緒基調: 檢測使用者輸入的情緒基調(例如,正面、負面、中性、沮喪、熱情)並相應地調整其回應。
  • 生成具有適當情感細微差別的文本: 生成不僅事實準確而且在情感上適合給定上下文的文本。這可能涉及使用具有同理心、鼓勵或令人放心的語言,具體取決於情況。
  • 理解和回應隱含的情緒線索: 從語言使用的細微線索中推斷情緒狀態,例如單詞選擇、句子結構和標點符號。

增強 AI 模型的’情商’是朝著創建更自然和引人入勝的互動邁出的重要一步。它可以改善各種應用程式中的使用者體驗,例如客戶服務、教育和創意寫作。

GPT-4.5 的更廣泛影響

GPT-4.5 的發布對人工智慧領域及其應用具有幾個更廣泛的影響:

  • 通用 AI 的持續進步: GPT-4.5 展示了開發可以執行廣泛任務和處理不同類型資訊的 AI 模型的持續進展。這一趨勢正在推動 AI 的可能性邊界,並為其在各個行業的應用開闢了新的可能性。
  • 更加關注可靠性和可信度: 強調減少幻覺和提高事實準確性反映出人們越來越認識到建立可信賴的 AI 系統的重要性。隨著 AI 模型越來越多地整合到關鍵應用程式中,確保其可靠性並最大限度地降低產生誤導性資訊的風險至關重要。
  • 增強人機互動: 自然語言理解、意圖識別和’情商’方面的改進有助於實現人與 AI 系統之間更無縫和直觀的互動。這對於使更廣泛的受眾更容易使用和使用者友好的 AI 技術至關重要。
  • 新應用程式的潛力: GPT-4.5 的功能可以在以下領域實現新的應用程式:
    • 內容創作: 為各種目的生成高質量的書面內容,例如行銷、新聞和教育。
    • 程式碼生成: 通過生成程式碼片段、除錯程式碼和自動執行程式設計任務來協助軟體開發人員。
    • 資料分析: 從大型資料集中總結和提取見解。
    • 個人化學習: 使教育內容和教學適應學生的個人需求。
    • 客戶服務: 提供更智慧和更具同理心的客戶支援。

GPT-4.5 代表了大型語言模型演進中的一個值得注意的進步。它對自然互動、減少幻覺和改善使用者體驗的關注使其成為廣泛應用程式的寶貴工具。雖然不是最終的基準測試執行者,但它代表了 AI 開發的進展,並強調了創建不僅強大而且可靠、可信賴和使用者友好的 AI 系統的重點。分階段推出以及與 Microsoft Azure AI Foundry 的整合將擴大其影響範圍,並使更廣泛的使用者能夠探索其功能。