写点什么

OpenAI 研究探讨大语言模型幻觉的成因及潜在解决方案

作者:Sergio De Simone

  • 2025-10-15
    北京
  • 本文字数:1367 字

    阅读完需:约 4 分钟

大小:680.21K时长:03:52
OpenAI 研究探讨大语言模型幻觉的成因及潜在解决方案

在最近的一篇研究论文中,OpenAI 指出,大语言模型(LLM)之所以容易产生幻觉,是因为现有的标准训练和评估方法倾向于奖励猜测,而非鼓励模型承认自身的不确定性。这一发现或许能够为减少幻觉现象以及构建更加可靠的 AI 系统提供新的思路,但对于幻觉本身的定义目前学界尚未达成共识。


OpenAI 研究人员指出,幻觉并非神秘现象,而是源于预训练阶段的错误。由于模型在训练过程中仅接触到正面示例,因此无法区分错误陈述与事实。即便所有预训练数据都被明确标记为真实或虚假,这些错误依然难以避免。


这些错误在后训练阶段依然存在,根源在于模型的评估方式。简而言之,当前的评估方法主要依据模型的准确性进行排序和排名,同时对模型表现出的不确定性或拒绝回答进行惩罚。这形成了一种恶性循环,LLM 为了在相对有限的评估测试中提高准确性逐渐学会了猜测。


我们发现,现有的主流评估方法几乎一致地对不确定性进行惩罚,这正是问题的根源所在——存在大量不一致的评估方式。假设模型 A 是一个经过对齐的模型,它能够准确地发出不确定性信号,并且从不产生幻觉。而模型 B 与模型 A 类似,但 B 从不表现出不确定性,且在不确定时总是选择“猜测”。在这种情况下,按照大多数当前基准测试所采用的 0-1 评分制,模型 B 会优于模型 A。


基于这一见解,OpenAI 研究人员得出结论,减少幻觉需要重新思考模型的评估方式。他们提出了一种方法:对自信的错误给予比表达不确定性更严厉的惩罚,从而让模型在适当地表达不确定性时获得相对的奖励。尽管这一想法已经引起了部分关注,但 OpenAI 团队却采取了更为激进的立场:

仅仅在现有的评估体系中增加一些新的不确定性感知测试是远远不够的。目前广泛使用的基于准确性的评估方法需要进行全面更新,使其评分机制能够有效遏制模型的猜测行为。如果主要的排行榜继续对幸运的猜测给予奖励,那么模型就会继续学习通过猜测来获取高分。修复排行榜可以扩大幻觉减少技术的采用,包括新开发的技术以及先前研究中的技术。


事实上,OpenAI 研究人员报告称,他们在 GPT-5-thinking-mini 中减少幻觉的努力已经取得了显著成效,错误率从 o4-mini 的 75% 降低到了 26%。然而,正如 meshugaas 在 Hacker News 上指出的那样,这也意味着“超过一半的回答最终会是‘我不知道。’”。他们表示,“没有人会使用那种东西”。


尽管 OpenAI 研究人员表示他们有信心能够避免幻觉现象,但他们也承认,由于幻觉本身的复杂性和多面性,目前学界对于幻觉到底是什么尚未达成共识。


他们的乐观态度受到了对 LLM 拟人化批评的抑制。在 Hacker News 上,didibus 着重指出了将 LLM 错误标记为幻觉背后的营销动机,并强调“如果你停止将它们拟人化,回归到它们作为预测模型的本质,那么预测出错也就不足为奇了”。


在 LLM 幻觉争论的一端是 ThoughtWorks 首席技术官 Rebecca Parsons。Martin Fowler 报道称,她认为 LLM 幻觉不是错误,而是一种特性:

LLM 所做的事情本质上就是产生幻觉,只不过我们发现其中一些幻觉对我们来说是有用的。


关于 LLM 幻觉争论的另一种观点,Gary Marcus 强调,尽管 LLM 模仿了人类语言的结构,但它们对现实没有任何真正的把握,它们对自己输出内容的肤浅理解,使得它们无法进行有效的事实核查。


【声明:本文由 InfoQ 翻译,未经许可禁止转载。】


查看英文原文https://www.infoq.com/news/2025/10/openai-llm-hallucinations/

2025-10-15 13:001

评论

发布
暂无评论

Java 反射 getClass()

爱好编程进阶

Java 面试 后端开发

一起来试玩!在线可编程交互的实时音视频 Web SDK 入门教程

声网

音视频 教程

K8S太火了!花10分钟玩转它不香么?

爱好编程进阶

Java 面试 后端开发

IDEA-2021首个大版本发布,Java开发者感动哭了(附新亮点演示

爱好编程进阶

Java 面试 后端开发

如何设计一条稳定的应用交付流程?|云效工程师指北

阿里云云效

云计算 阿里云 云原生 持续交付 应用交付

java8 Stream API及常用方法

爱好编程进阶

Java 面试 后端开发

Java岗大厂面试百日冲刺 - 日积月累,每日三题【Day26

爱好编程进阶

Java 面试 后端开发

Java并发编程(实战)

爱好编程进阶

Java 面试 后端开发

关于 WordPress 你了解多少?

海拥(haiyong.site)

4月月更

DevOps转型到底值不值?

华为云开发者联盟

DevOps 敏捷 敏捷开发 软件工程 DevSecOps

Java-进阶:多线程2

爱好编程进阶

Java 面试 后端开发

for(;;)和while(true)的区别

爱好编程进阶

Java 面试 后端开发

java并发锁ReentrantLock源码分析二之Condition实现原理

爱好编程进阶

Java 面试 后端开发

鲸智WhaleBI 平民化数据消费还业务以真正的“数据自由”

鲸品堂

方法论 数据 数据治理

Flink整合ElasticSearch详细指南及踩坑记录

五分钟学大数据

4月月更

30个实用SQL语句,玩转PostgreSQL

慕枫技术笔记

数据库 后端 4月月更

走向数据科学:在字节跳动广告投放这么干

字节跳动数据平台

大数据 字节跳动 ab测试

java冒泡排序的实现以及优化

爱好编程进阶

Java 面试 后端开发

进程内优雅管理多个服务

万俊峰Kevin

微服务 RPC web开发 go-zero Go 语言

Java应用日志如何与Jaeger的trace关联

爱好编程进阶

Java 面试 后端开发

java高级用法之:JNA中的Structure

程序那些事

Java 程序那些事 JNA 4月月更

Java 结合实例学会使用 静态代理、JDK动态代理、CGLIB动态代理

爱好编程进阶

Java 面试 后端开发

混迹过超多开源社区的黄之鹏老师,为你解码AI开源的技术应用与未来趋势

OpenI启智社区

Java IO

爱好编程进阶

Java 面试 后端开发

JAVA 百度地图 API

爱好编程进阶

Java 面试 后端开发

Java多线程-死锁的出现和解决

爱好编程进阶

Java 面试 后端开发

DDD实战(8):冲刺1战术之聚合设计

深清秋

DDD 软件架构 生鲜电商系统 4月月更

J2EE基础集合框架之Map集合

爱好编程进阶

Java 面试 后端开发

Java反射

爱好编程进阶

Java 面试 后端开发

龙蜥大讲堂:如何利用硬件SIMD指令提升Java程序的性能?|第14期

OpenAnolis小助手

Java simd arm sig 龙蜥大讲堂

Elasticsearch聚合学习之三:范围限定

爱好编程进阶

Java 面试 后端开发

OpenAI 研究探讨大语言模型幻觉的成因及潜在解决方案_AI&大模型_InfoQ精选文章