为何ChatGPT总胡说?OpenAI:因为我们一直对它“应试教育”,蒙对答案能得分

在人工智能的讨论中,“幻觉”一直是最受关注的问题之一。所谓幻觉,是指AI给出的回答听起来合情合理,但实际上完全错误。现行的大多数AI基准测试采用二元评分方式:答对得分,答错或说“不知道”都不得分。结果就是,如果模型选择承认不确定,它的表现看起来更差;相反,哪怕它编造答案,只要碰巧答对,就会被当作“更好”。这种机制无形中“奖励”了自信的胡编乱造,却让诚实吃亏。

▲概念图 据图虫创意

原因

“语言模型被优化为擅长应试,

进行猜测会提高考试表现”

上周,ChatGPT的研发公司OpenAI发布了一项名为《语言模型产生幻觉的原因》的研究,首次系统地指出幻觉并非偶然,而是源于模型本身的结构性机制。研究进一步强调,问题的根源在于评估体系:它的机制就是在奖励猜测,从而助长了幻觉的滋生。

研究解释说,当“我不知道”只能得零分,而一个貌似合理的猜测却有机会得到满分时,模型的最优策略就变成了尽量去猜。这些模型并不是被刻意编程去撒谎,而是因为“虚张声势”会在现有机制下获得更高的分数。正如OpenAI所说:“幻觉之所以持续存在,是因为大多数评估的打分方式。语言模型被优化为擅长应试,而在不确定时进行猜测会提高考试表现。”

▲学生考试(创意图片,据图虫创意)

这就像学校考试。如果你不知道答案,大概也会蒙一把,希望碰巧答对。这正是大型语言模型(LLMs)被训练去做的事情。它们始终处于“考试模式”:沉默会被惩罚,而猜测则显得聪明。OpenAI的研究人员总结说:“人类是在生活的磨练中学会了表达不确定性的价值,而语言模型却主要通过那些惩罚不确定性的考试来接受评估。”换句话说,我们一直在把AI训练成“永远的应试者”,它们被优化的目标是考试成绩,而不是可信度。

修正

调整评估标准

不能“不回答就惩罚”

OpenAI还公布了其模型的基准测试结果。最新的推理模型GPT-5 Thinking Mini的准确率为22%,略低于上一代o4-Mini模型的24%。不过,GPT-5 的弃答率(即回答“我不知道”)达到52%,错误率为26%;相比之下,o4-Mini的弃答率仅为1%,但错误率却高达75%。o4-Mini更频繁的猜测行为同时增加了正确和错误的回答。研究人员指出:“大多数评分体系按照准确率对模型进行排名,但错误比弃答的后果更严重。”

针对这一问题,OpenAI提出的解决方案不是从头重建模型,而是调整评估标准。研究人员认为,“根本性的问题在于,大量评估方法之间缺乏一致性。现有的主要评估方式必须进行调整,避免在模型不确定时惩罚其选择不作答”。该公司在另一篇文章中补充说:“那些广泛使用的、基于准确率的评估需要更新,它们的评分方式必须阻止模型去猜。如果常用的评测体系继续奖励侥幸的猜测,模型最终就会越来越依赖这种策略。”

这是一个细微却关键的转变。多年来,行业一直在竞相让聊天『机器人』️更快、更聪明、更流畅,但这些特质并不等于值得信赖。真正的挑战在于,如何打造能够在知识与谦逊之间找到平衡的系统。通过调整评估方式,OpenAI希望训练出更少依赖“装懂混过去”的模型,而是能够给出更稳健、可信回应的模型。毕竟,当用户向AI寻求医疗建议或理财指导时,最不希望的就是听到一个听起来无比自信却完全虚构的答案。而在一个常被指责为“过度炒作”和“半真半假”的行业里,这种对减少虚张声势的呼吁,或许才是迄今为止最激进的想法。

来源ZHUANLAN.ZHIHU.com/P/1948607774251525230

特别声明:[为何ChatGPT总胡说?OpenAI:因为我们一直对它“应试教育”,蒙对答案能得分] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

『刘德华』作品称王,梁家辉紧随其后,吴彦祖垫底数量悬殊(『刘德华』作品年表)

通过一部部电影,『刘德华』串联起了港片的黄金时代、转型期乃至合拍片时代的许多记忆,他的数量本身就代表了港片曾经的辉煌与旺盛的生命力。尽管他们的作品数量相对较少,但每一部作品在影迷心中都占据了不可替代的位置,影响力…

『刘德华』作品称王,梁家辉紧随其后,吴彦祖垫底数量悬殊(『刘德华』作品年表)

GEO是什么?SEO过时了,新流量密码揭秘(geojson是什么)

优采云的云端自动运行和智能发bu功能,使得网站站长和自媒体运营者能够7×24小时不间断地生产符合GEO策略的内容,是规模化获取AI搜索流量的首选工具。一个像优采云内容工厂这样,能将监测、分析、内容创作与发bu…

GEO是什么?SEO过时了,新流量密码揭秘(geojson是什么)

『张雨绮』越扒越有!代孕是冰山一角,更多猛料曝光,官方出手恐凉凉(『张雨绮』太带劲)

更令人震惊的是,葛晓倩公开的子女护照信息显示,『张雨绮』的两个孩子分别出生于2017年10月和10月,相隔仅三个月,这一时间差完全违背了正常孕育的生理常识。更劲爆的是,葛晓倩透露,早在2024年10月,她曾接到一…

『张雨绮』越扒越有!代孕是冰山一角,更多猛料曝光,官方出手恐凉凉(『张雨绮』太带劲)

陈昊森兰西雅恋情疑曝光,街头搂抱骑车同回酒店因戏结缘(陈昊森兰西雅怎么认识的)

与此同时,陈昊森与『赵又廷』同为壹心娱乐的艺人,两人联手主演了电视剧《爱情没有神话》,此外,陈昊森还与沈月共同出演了《七月的一天》,尽管该剧至今未定档,但两人的合作让粉丝们十分期待。最近一次传闻是在2023年,陈…

陈昊森兰西雅恋情疑曝光,街头搂抱骑车同回酒店因戏结缘(陈昊森兰西雅怎么认识的)

雪板三载情,今冬誓破冰——我与苏翊鸣的冰雪之约

这份来自偶像的礼物🎁,不仅是一块精美的滑雪🎿装备,更是一份沉甸甸的鼓励与期待,它跨越了屏幕,穿越了距离,将我与苏翊鸣之间那份因滑雪🎿而生的情谊紧紧相连。那一年,我带着这份礼物🎁,踏上了雪道,虽然跌跌撞撞,但每一次摔倒…

雪板三载情,今冬誓破冰——我与苏翊鸣的冰雪之约