OpenAI 推出 GPT-4.5,更具'情感細膩度'

邁向 GPT-5 的墊腳石

由 Microsoft 支持的 OpenAI 推出了 GPT 系列的最新版本 GPT-4.5。此模型以限量預覽的形式推出,為今年稍後預計推出的 GPT-5 的重大轉變鋪平了道路。GPT-4.5 的發布最初僅限於參與「研究預覽」的特定用戶群,特別是那些每月支付 200 美元(159 英鎊)訂閱 ChatGPT Pro 的用戶。

OpenAI 計劃在向更廣泛的受眾推出該模型之前,先從這個初始群體收集反饋。推出時間表包括本週稍後向 Plus 和 Team 用戶推出,然後在稍後日期向 Enterprise 和 Education 用戶推出。這種分階段的方法使 OpenAI 能夠根據實際使用情況和反饋來完善模型,然後再進行全面發布。

增強的訓練技術

GPT-4.5 也可以在 Microsoft 的 Azure AI Foundry 平台上使用。該平台是尖端 AI 模型的中心,不僅提供 OpenAI 的產品,還提供 Stability、Cohere 和 Microsoft 自身的产品。然而,GPT-4.5 的開發過程並非一帆風順。OpenAI 遇到了障礙,特別是在獲取新的、高質量的訓練數據方面。

為了克服這些挑戰並增強模型的能力,OpenAI 採用了一種稱為「後訓練」的技術。此過程涉及結合人類反饋來完善模型的響應並改善其與用戶交互的細微之處。人類反饋在塑造模型行為並使其更符合人類期望和偏好方面發揮著至關重要的作用。

此外,OpenAI 利用其 o1「推理」模型,使用合成數據來訓練 GPT-4.5。這種創新方法允許生成補充現有數據集的訓練數據,從而可能減輕由於缺乏高質量真實世界數據而造成的限制。

GPT-4.5 的訓練方案結合了新穎的監督技術和既定方法。其中包括監督式微調 (SFT) 和來自人類反饋的強化學習 (RLHF),這些技術也用於 GPT-4o 的開發。這種方法的融合旨在利用每種方法的優勢,從而產生更強大和精細的模型。

根據 OpenAI 的說法,與 GPT-4o 相比,GPT-4.5 表現出減少「幻覺」的傾向。在 AI 語言模型的上下文中,幻覺是指生成虛假或無意義的信息。GPT-4.5 也比 o1 推理模型表現出略少的幻覺,顯示出事實準確性和可靠性的提高。

擁抱「情感細膩度」

推理模型,如 o1 模型,其特點是其產生響應的深思熟慮和有條不紊的方法。這種深思熟慮的處理雖然可能較慢,但旨在提高響應的準確性並最大限度地減少錯誤,例如幻覺。速度和準確性之間的權衡是推理模型設計和部署中的關鍵考慮因素。

OpenAI 研究員 Raphael Gontijo Lopes 在一次直播發布會上強調了 GPT-4.5 著重於增強協作和情感智能。他說:「我們調整了 GPT-4.5,使其成為更好的合作夥伴,讓對話感覺更溫暖、更直觀、情感更細膩。」這種對情感細膩度的強調代表著朝著創建能夠以更自然和引人入勝的方式與用戶互動的 AI 模型邁出了重要一步。

GPT-5 的未來

展望未來,OpenAI 計劃在即將推出的 GPT-5 中將其 GPT 系列模型與其 o 系列推理模型集成。這種集成將使 ChatGPT 聊天機器人能夠自主選擇最適合給定任務或交互的模型。這種動態模型選擇功能有望優化性能和用戶體驗。

目前,ChatGPT 為用戶提供了手動選擇他們喜歡的模型的選項。然而,OpenAI 承認這種方法對於某些用戶來說可能過於複雜。為 GPT-5 設想的自動模型選擇旨在簡化用戶體驗,同時在幕後利用不同模型的優勢。

深入探討 GPT-4.5 的進展

GPT-4.5 的開發代表了 AI 語言模型演進的重大進步。讓我們更深入地探討一些關鍵進展及其影響:

1. 人類反饋的力量:

通過後訓練納入人類反饋是 GPT-4.5 開發的基石。這個迭代過程允許人類評估者對模型的輸出提供反饋,引導它產生更理想和準確的響應。這個反饋循環有助於解決微妙的偏差,提高模型對上下文的理解,並增強其生成細膩和相關文本的能力。人類反饋在塑造模型行為並確保其符合人類期望方面非常寶貴。

2. 合成數據增強:

使用由 o1 推理模型生成的合成數據,代表了一種解決數據稀缺挑戰的新方法。通過創建模仿真實世界數據特徵的人工數據,OpenAI 可以擴展訓練數據集,並使模型接觸到更廣泛的場景。當高質量的真實世界數據有限或難以獲取時,此技術特別有用。合成數據增強有助於提高模型的魯棒性和泛化能力。

3. 來自人類反饋的強化學習 (RLHF):

RLHF 是一種強大的技術,結合了強化學習和人類反饋的優勢。在這種方法中,模型學習根據生成理想輸出所獲得的獎勵來優化其行為。人類反饋用於定義獎勵函數,引導模型產生被認為有幫助、準確和安全的響應。RLHF 在訓練模型執行需要細膩理解和決策的複雜任務方面特別有效。

4. 減少幻覺:

減少幻覺是 GPT-4.5 的一項重大成就。通過生成更準確和可靠的信息,該模型成為各種應用中更值得信賴和有用的工具。這種改進可能是多種因素共同作用的結果,包括增強的訓練技術、合成數據的使用以及人類反饋的納入。

5. 情緒智商和協作:

對情感細膩度和協作的強調代表著朝著創建不僅智能而且具有同理心和吸引力的 AI 模型轉變。通過理解和響應人類情感,AI 模型可以與用戶建立更牢固的關係,並提供更個性化和令人滿意的體驗。這種對情緒智商的關注對於開發能夠無縫融入人類互動和工作流程的 AI 至關重要。

6. 通往 GPT-5 的道路:動態模型選擇:

計劃在 GPT-5 中集成 GPT 系列和 o 系列模型,並進行自動模型選擇,這是一項重大的架構進步。此功能將允許聊天機器人動態選擇最適合給定任務的模型,從而優化性能和用戶體驗。這種方法利用了不同模型的優勢,從而實現了更靈活和適應性更強的 AI 系統。例如,需要事實準確性的任務可能由推理模型處理,而涉及創意文本生成的任務可能委託給 GPT 系列模型。

GPT-4.5 及更遠的廣泛影響

GPT-4.5 所體現的進步,以及 GPT-5 的預期功能,對各個領域都有深遠的影響:

  • 客戶服務: AI 驅動的聊天機器人可以提供更個性化和高效的客戶支持,處理常規查詢並讓人工客服人員騰出時間來處理更複雜的問題。這些模型的情緒智商的提高可以帶來更令人滿意的客戶互動。

  • 教育: AI 導師可以提供個性化的學習體驗,適應學生的個人需求並提供量身定制的反饋。這些模型以細膩的方式生成解釋和回答問題的能力可以增強學習過程。

  • 內容創作: AI 寫作工具可以協助完成各種寫作任務,從生成營銷文案到起草電子郵件和報告。這些模型生成創意和引人入勝的文本的能力的提高可以提高生產力和創造力。

  • 研究: AI 模型可以協助研究人員分析大型數據集、識別模式並生成假設。這些模型處理和綜合來自各種來源的信息的能力可以加速科學發現。

  • 醫療保健: AI 模型可以協助完成診斷、治療計劃和藥物發現等任務。這些模型的準確性和可靠性的提高可以提高醫療保健的質量。

  • 無障礙: AI 驅動的工具可以改善殘疾人士的無障礙環境,提供文本轉語音、語音轉文本和實時翻譯等功能。

隨著 AI 語言模型的不斷發展,它們將改變我們與技術和周圍世界互動的方式。從 GPT-4.5 到 GPT-5 及更遠的旅程有望帶來更複雜和更強大的 AI 系統,為社會帶來新的機遇和挑戰。圍繞這些強大技術的開發和部署的倫理考慮將繼續是一個重要的關注領域。確保 AI 系統的公平性、透明度和問責制對於最大限度地發揮其優勢,同時減輕潛在風險至關重要。