史丹佛研究揭示ChatGPT效能下降
史丹佛大學與加州大學柏克萊分校的研究顯示,GPT-3.5和GPT-4在三個月內效能出現顯著波動。研究發現,GPT-4在數學問題、程式碼生成和指令遵循方面的能力有所下降,而GPT-3.5在某些任務上有所提升。這項研究突顯了大型語言模型在持續發展環境中維持一致性和可靠性的挑戰。
史丹佛大學與加州大學柏克萊分校的研究顯示,GPT-3.5和GPT-4在三個月內效能出現顯著波動。研究發現,GPT-4在數學問題、程式碼生成和指令遵循方面的能力有所下降,而GPT-3.5在某些任務上有所提升。這項研究突顯了大型語言模型在持續發展環境中維持一致性和可靠性的挑戰。