斯坦福研究揭示ChatGPT性能下降
斯坦福大学和加州大学伯克利分校的研究人员在《哈佛数据科学评论》上发表了一篇名为'ChatGPT行为随时间变化'的论文,揭示了GPT-3.5和GPT-4在三个月内的性能和行为出现显著波动。研究发现,GPT-4在数学问题解决、代码生成等多个任务上的准确性下降,且遵循指令的能力也减弱。同时,研究还发现模型在处理敏感问题和内容过滤方面也出现了变化。这项研究强调了保持大型语言模型一致性和可靠性的挑战。
斯坦福大学和加州大学伯克利分校的研究人员在《哈佛数据科学评论》上发表了一篇名为'ChatGPT行为随时间变化'的论文,揭示了GPT-3.5和GPT-4在三个月内的性能和行为出现显著波动。研究发现,GPT-4在数学问题解决、代码生成等多个任务上的准确性下降,且遵循指令的能力也减弱。同时,研究还发现模型在处理敏感问题和内容过滤方面也出现了变化。这项研究强调了保持大型语言模型一致性和可靠性的挑战。