“哥布林”词频暴涨 175%,OpenAI 复盘称 AI 训练奖励机制意外“跑偏”

https://www.ithome.com/0/945/478.htm

OpenAI 针对此问题,已采取多项措施。技术团队移除了偏好生物词汇的奖励信号,并从训练数据中过滤了包含相关词汇的内容。受限于训练周期,GPT-5.5 未能完全规避此问题,开发团队通过添加指令提示进行了缓解。
 
 
Back to Top