OpenAI 的 GPT-4.5:昂貴且優勢不明

遞增的收益,天文數字的成本

OpenAI 最近推出了 GPT-4.5,最初將其定義為「研究預覽」。這個新版本的語言模型提供給特定群體:願意每月支付 200 美元的 Pro 用戶,以及每月支付 20 美元的 Plus 訂閱者。雖然 OpenAI 的 CEO,Sam Altman,吹捧 GPT-4.5 是一種更自然的對話式 AI,但由於在推理能力方面缺乏突破性的進展,許多人感到困惑。

GPT-4.5 確實有一些改進。OpenAI 聲稱提高了準確性,減少了「幻覺」(捏造訊息)的傾向,並增強了說服能力。然而,使用此模型的財務影響是驚人的。每百萬個輸入 token 的價格為 75 美元,每百萬個輸出 token 的價格高達 150 美元,GPT-4.5 的成本效益分析遠非明確。這種定價結構在 AI 社群內引發了激烈的爭論,專家們對於這些改進是否值得如此高昂的費用存在嚴重分歧。

正面交鋒:GPT-4.5 與其前身

每個人心中的問題是:GPT-4.5 與其前身 GPT-4 相比,真正表現如何?Andrej Karpathy,一位 AI 研究領域的傑出人物,進行了一項揭示性的實驗。他向用戶展示了五個創意寫作任務,要求他們判斷 GPT-4 和 GPT-4.5 的輸出。結果出乎意料。GPT-4 在五個任務中的四個中勝出。

這一結果進一步得到了 Raj Dandeker 博士的研究結果的證實。他的技術評估顯示 GPT-4.5 的優勢微乎其微。事實上,這個較新的模型似乎在數學和邏輯問題上表現掙扎,這直接與 OpenAI 關於其能力的一些斷言相矛盾。

眾說紛紜

媒體對 GPT-4.5 的反應是各種不同意見的雜音。Wired 雜誌以其精通技術的報導而聞名,毫不留情。他們批評 OpenAI 對人工通用智慧 (AGI) 的不懈追求,將 GPT-4.5 標記為一個昂貴的升級,但只有邊際改進。Futurism,另一家有影響力的科技出版物,指出圍繞 AI 進步的炒作明顯下降。

另一方面,也有一些聲音提供了更積極的觀點。與史丹佛大學有關聯的 Jacob Rintamaki 稱讚 GPT-4.5 增強的幽默感,認為這代表 AI 在理解社會細微差別方面邁出了重要一步。

甚至 AI 模型也有自己的看法

圍繞 GPT-4.5 的爭論甚至延伸到了 AI 模型本身的領域。Grok,由 xAI 開發的競爭對手 AI,承認 GPT-4.5 在對話流程方面的改進,但很快指出其資源密集型特性。ChatGPT,OpenAI 自己的創造物,也加入了進來,強調其卓越的上下文保留、創造力和準確性。然而,即使是 ChatGPT 也承認在長時間對話中保持連貫性方面偶爾存在不足。

深入探討爭議

GPT-4.5 的褒貶不一的反應突顯了 AI 發展領域的一個基本矛盾:漸進式進步與成本效益之間的平衡。雖然 GPT-4.5 無可否認地改進了 AI 語言能力的某些方面,但核心問題仍然存在:這些改進是否值得付出代價?

支持漸進式進步的論點:

GPT-4.5 的支持者認為,即使自然語言處理方面的微小改進也會產生顯著的連鎖反應。他們指出了在以下領域的潛在應用:

  • 客戶服務: 更自然和引人入勝的互動可以提高客戶滿意度。
  • 內容創作: 提高寫作質量和創造力可以簡化內容生成工作流程。
  • 教育: 通過更細緻的 AI 驅動輔導,可以增強個性化學習體驗。
  • 無障礙功能: 更自然的文字轉語音和語音轉文字功能可以使殘疾人士受益。

這些倡導者認為,僅僅關注「突破性」創新會忽視較小、迭代改進的累積影響。他們認為 GPT-4.5 雖然不是革命性的,但代表了 AI 持續發展中邁出的有價值的一步。

懷疑論者的反駁:

然而,批評者仍然不相信。他們提出了幾個關鍵問題:

  • 成本障礙: GPT-4.5 的高昂定價使其對許多潛在用戶來說遙不可及,限制了其實際影響。
  • 缺乏實質性的推理: 推理能力沒有顯著進步,這讓人們懷疑 GPT-4.5 解決複雜問題的能力。
  • 「幻覺」問題: 雖然 OpenAI 聲稱降低了幻覺率,但這個問題並沒有完全消除,在需要事實準確性的應用中存在風險。
  • 炒作因素: 一些批評者指責 OpenAI 過度誇大 GPT-4.5 的能力,製造了不切實際的期望。
  • 收益遞減: 人們越來越擔心,AI 發展的當前軌跡正在達到收益遞減點,即漸進式改進需要指數級增長的資源。

更廣泛的背景:AI 的發展軌跡

GPT-4.5 的爭論是在關於 AI 未來的更廣泛討論的背景下展開的。圍繞大型語言模型的最初興奮逐漸讓位於對其局限性和潛在風險的更清醒的評估。

倫理考量: 對偏見、錯誤訊息和濫用可能性的擔憂日益突出。

永續性: 訓練和運行大型 AI 模型的環境影響越來越受到關注。

監管: 世界各國政府都在努力應對監管 AI 開發和部署的挑戰。

尋找替代方案: 研究人員正在積極探索 AI 的替代方法,這些方法可能更有效、更易於解釋且更符合道德規範。
關於是否將 GPT-4.5 定義為重要一步還是次要一步的問題仍然存在爭議。

用戶視角:是否值得升級?

對於潛在用戶而言,是否投資 GPT-4.5 的決定取決於對其特定需求和優先事項的仔細評估。

  • 企業: 考慮將 GPT-4.5 用於客戶服務或內容創作的公司應進行徹底的成本效益分析,將其與替代解決方案進行比較。
  • 研究人員: AI 研究人員可能會發現 GPT-4.5 是探索自然語言處理細微差別的寶貴工具,但他們也應該注意其局限性。
  • 個人用戶: 對於大多數個人用戶而言,GPT-4.5 的成本可能過高,而且收益可能不超過費用。

歸根結底,GPT-4.5 提醒我們,通往真正智能機器的道路是複雜而多方面的。雖然漸進式進步是不可避免的,但保持批判性觀點至關重要,權衡收益與成本,並考慮每一步的更廣泛影響。圍繞 AI 的炒作往往會掩蓋現實,因此必須以健康的懷疑態度和對負責任創新的承諾來對待新的發展。
進化仍在繼續,但價值仍有待觀察。