写点什么

用 AI 对抗 AI!斯坦福研究人员推出 DetectGPT,专门检测 ChatGPT 等模型生成的文本

  • 2023-01-31
    北京
  • 本文字数:838 字

    阅读完需:约 3 分钟

用AI对抗AI!斯坦福研究人员推出 DetectGPT,专门检测 ChatGPT 等模型生成的文本

过去两个月,ChatGPT火爆全网,写代码、编故事、构建虚拟机……ChatGPT 几乎无所不能。在“硬币的另一面”,有学生开始用 ChatGPT写作业、写论文。根据最新研究,学者们也可能会被 ChatGPT 欺骗,误以为 ChatGPT 生成的虚假科学摘要来自顶级研究期刊上发表的真实医学论文。

 

近日,斯坦福大学研究团队提出了一种名为 DetectGPT 的新方法,旨在成为首批打击高等教育中 LLM 生成文本的工具之一。相关研究论文已发表在预印本网站 arXiv 上。据悉,这是一种使用模型的对数概率函数的局部曲率检测预训练大型语言模型样本的方法,该方法或对检测验证产业带来积极影响。

 

该方法基于的原理是:由大型语言模型生成的文本通常在模型的对数概率函数的负曲率区域的特定区域徘徊。通过这个发现,该团队开发了一种新的指标,用于判断文本是否是机器生成的,并且不需要训练人工智能或收集大型数据集来比较文本。

 

研究人员表示,随着大型语言模型(LLMs)的流畅性和知识积累程度不断增强,人们对于检测一段文本是否由机器编写的需求日益旺盛。比如,一些学生使用大型语言模型来完成书面作业,以至于教师无法准确地评估学生的学习情况。

 

研究人员首先证明了从大型语言模型中采样的文本倾向于占据模型的对数概率函数的负曲率区域。利用这一观察结果,定义了一个新的基于曲率的标准,用于判断是否从给定的 LLM 生成通道。这种方法即为 DetectGPT——不需要训练单独的分类器,不需要收集真实或生成的段落的数据集,也不需要显式地为生成的文本加水印,它只使用由感兴趣的模型计算的对数概率,和来自另一个通用预训练语言模型(例如 T5)的文章随机扰动。

 

研究发现 DetectGPT 比现有的零帧模型样本检测方法更具鉴别性,显著提高了 20B 参数 GPT-NeoX 生成的假新闻文章的检测能力,从最强零帧基线的 0.81 AUROC 提高到 DetectGPT 的 0.95 AUROC。

 

然而,这一方法也存在一定的局限性。例如,如果现有的掩模填充模型不能很好地表示有意义的改写空间,则某些域的性能可能会降低,从而降低曲率估计的质量;DetectGPT 相比其他检测方法需要更大的计算量等。

2023-01-31 18:036850

评论 1 条评论

发布
用户头像
你来我往
2023-02-01 08:09 · 浙江
回复
没有更多了
发现更多内容

面试官:谈谈你对线程池拒绝策略的理解?

王磊

APP的USB通讯开发

北京木奇移动技术有限公司

APP开发 软件外包公司 蓝牙开发

CST软件优化超表面--- 偏振片- 线圆极化转换,天线阵任务,远场算轴比AR

思茂信息

cst cst使用教程 CST软件

重生之我用火语言 RPA 生成 EXE

火语言RPA

从 0 到 1,靠火语言写流程开启赚钱新路径

火语言RPA

掌握火语言写流程技巧,轻松变身接单赚钱达人

火语言RPA

副业新选择:靠火语言写流程,实现睡后收入增长

火语言RPA

从开源大模型工具Ollama存在安全隐患思考企业级大模型应用如何严守安全红线

星环科技

数据安全 #大模型

25年浙江等保测评机构名单汇总

行云管家

网络安全 等保 等保测评

润开鸿重磅首发基于“RISC-V+OpenHarmony+星闪”的“鸿锐”AI开发平台

坚果

润开鸿

利用碎片时间,我用火语言搞副业轻松躺赚

火语言RPA

震撼发布!CodeArts 解锁全新技能,鸿蒙应用与元服务开发轻松拿捏

华为云开发者联盟

harmoyos

重磅官宣!荣耀远航计划 | 2025年激励政策持续升级,报名进行中

荣耀开发者服务平台

折叠屏 AI智能体 应用市场 荣耀HONOR 荣耀远航计划

如何一眼定位SQL的代码来源:一款SQL染色标记的简易MyBatis插件

京东科技开发者

Java的SPI机制详解

京东科技开发者

APP与USB通讯的异常处理

北京木奇移动技术有限公司

APP开发 软件外包公司 USB开发

小白也能上手!我用火语言接单的实战经验

火语言RPA

智能制造:关于中小企业数字化转型

积木链小链

数字化转型 智能制造 中小企业

开发HarmonyOS NEXT版五子棋游戏实战

威哥爱编程

游戏 HarmonyOS ArkTS HarmonyOS NEXT

Echarts与Vue3中获取DOM节点可能出现的异常错误

秃头小帅oi

荣耀远航计划丨【AI服务生态】激励解读

荣耀开发者服务平台

AI Agent AI 智能体 荣耀HONOR 荣耀远航计划

荣耀远航计划丨【折叠视界】激励解读

荣耀开发者服务平台

安卓 适配 折叠屏 荣耀HONOR 荣耀远航计划

荣耀远航计划丨【联运新游首发】激励解读

荣耀开发者服务平台

游戏 联营联运 荣耀HONOR 荣耀远航计划 新游首发

论文分享:GLM: General Language Model Pretraining

京东科技开发者

Deepseek 与火语言 RPA:开启智能高效新时代

火语言RPA

上班族的逆袭:我用火语言搞副业

火语言RPA

用AI对抗AI!斯坦福研究人员推出 DetectGPT,专门检测 ChatGPT 等模型生成的文本_AI&大模型_凌敏_InfoQ精选文章