写点什么

用 AI 对抗 AI!斯坦福研究人员推出 DetectGPT,专门检测 ChatGPT 等模型生成的文本

  • 2023-01-31
    北京
  • 本文字数:838 字

    阅读完需:约 3 分钟

用AI对抗AI!斯坦福研究人员推出 DetectGPT,专门检测 ChatGPT 等模型生成的文本

过去两个月,ChatGPT火爆全网,写代码、编故事、构建虚拟机……ChatGPT 几乎无所不能。在“硬币的另一面”,有学生开始用 ChatGPT写作业、写论文。根据最新研究,学者们也可能会被 ChatGPT 欺骗,误以为 ChatGPT 生成的虚假科学摘要来自顶级研究期刊上发表的真实医学论文。

 

近日,斯坦福大学研究团队提出了一种名为 DetectGPT 的新方法,旨在成为首批打击高等教育中 LLM 生成文本的工具之一。相关研究论文已发表在预印本网站 arXiv 上。据悉,这是一种使用模型的对数概率函数的局部曲率检测预训练大型语言模型样本的方法,该方法或对检测验证产业带来积极影响。

 

该方法基于的原理是:由大型语言模型生成的文本通常在模型的对数概率函数的负曲率区域的特定区域徘徊。通过这个发现,该团队开发了一种新的指标,用于判断文本是否是机器生成的,并且不需要训练人工智能或收集大型数据集来比较文本。

 

研究人员表示,随着大型语言模型(LLMs)的流畅性和知识积累程度不断增强,人们对于检测一段文本是否由机器编写的需求日益旺盛。比如,一些学生使用大型语言模型来完成书面作业,以至于教师无法准确地评估学生的学习情况。

 

研究人员首先证明了从大型语言模型中采样的文本倾向于占据模型的对数概率函数的负曲率区域。利用这一观察结果,定义了一个新的基于曲率的标准,用于判断是否从给定的 LLM 生成通道。这种方法即为 DetectGPT——不需要训练单独的分类器,不需要收集真实或生成的段落的数据集,也不需要显式地为生成的文本加水印,它只使用由感兴趣的模型计算的对数概率,和来自另一个通用预训练语言模型(例如 T5)的文章随机扰动。

 

研究发现 DetectGPT 比现有的零帧模型样本检测方法更具鉴别性,显著提高了 20B 参数 GPT-NeoX 生成的假新闻文章的检测能力,从最强零帧基线的 0.81 AUROC 提高到 DetectGPT 的 0.95 AUROC。

 

然而,这一方法也存在一定的局限性。例如,如果现有的掩模填充模型不能很好地表示有意义的改写空间,则某些域的性能可能会降低,从而降低曲率估计的质量;DetectGPT 相比其他检测方法需要更大的计算量等。

2023-01-31 18:036451

评论 1 条评论

发布
用户头像
你来我往
2023-02-01 08:09 · 浙江
回复
没有更多了
发现更多内容

当 Aily 遇上盈米且慢 MCP,你的 AI 智能助手也能秒变投资顾问

盈米AI开放平台

大模型如何算出最优价格?电商定价策略的变革实践

京东零售技术

系统上线最大的难点其实不是技术问题,而是人和管理!

积木链小链

数字化转型 管理系统 智能制造

MCP 极简开发 读书笔记2

wasa

产品研发的永恒难题:质量、速度与成本的三角博弈

IPD产品研发管理

产品 产品经理 产品设计 研发管理 产品研发

烟草行业企业综合管理平台(信创版)上线运行

中烟创新

智能AI图像编辑软件Luminar Neo for Mac

晨光熹微

AI 英语数字人App的主要功能

北京木奇移动技术有限公司

软件外包公司 AI技术应用 AI数字人

国产化即时通讯软件,支持内网私有化部署

BeeWorks

即时通讯IM 私有化部署

AI 英语学习数字人 App 的主要功能

北京木奇移动技术有限公司

软件外包公司 AI技术外包 AI数字人

数据治理之数据分类分级

天翼云开发者社区

大数据 数据仓库

数据治理之构建数据资产目录

天翼云开发者社区

大数据、

通过折纸视角理解神经网络:ReLU网络的几何直观与实验探索

qife122

神经网络 机器学习

应对2025年律师团队持续增长难题,Alpha系统助力律所人效升级

科技汇

数据治理的长效机制

天翼云开发者社区

大数据 数据仓库

首发!百度百科全系能力上线百度智能云千帆,权威知识增强Agent一键打造

科技热闻

代码简洁之道:'两个就是太多'的编程哲学

qife122

设计模式 代码重构

如何构建跨语言、跨文化的海外舆情监测防火墙

沃观Wovision

出海企业 舆情监测 海外舆情监控 沃观Wovision

音频控制工具SoundSource for Mac

晨光熹微

企业IT运维方案怎么选?盘点排行几款企业远控软件

科技热闻

Playwright | 元素定位四大法宝:CSS/文本/XPath/语义化定位实战

测试人

2025全球数字经济大会拉萨高层论坛开幕

科技热闻

添加DNS解析记录时,提醒记录冲突是怎么回事?

国科云

佛山律协与iCourt围绕法律AI应用达成战略合作

科技汇

私有化即时通讯 - 专业的即时通讯系统

BeeWorks

即时通讯 IM 私有化部署

8 月 9 日,TiDB 社区活动在厦门!瑞幸咖啡、美柚、美图、飞连、福建四大机场、厦门三甲医院的 TiDB 实践分享 & 数据库选型趋势!到场的小伙伴可领瑞幸咖啡!评论区互动参与社区新款周边抽奖~

TiDB 社区干货传送门

社区活动

小度首发智能硬件MCP Server,开启物理世界智能交互新时代

科技大数据

OpenAI Agents: 配置,运行

wasa

AI 口语练习 App 的主要功能

北京木奇移动技术有限公司

软件外包公司 AI口语练习 AI英语学习

CST的UAV无人机RCS --- A求解器 - 一维距离像(HRRP)和正弦图(Sinogram)

思茂信息

cst电磁仿真 CST软件 CST Studio Suite

mac音频录制编辑工具Sound Studio

晨光熹微

用AI对抗AI!斯坦福研究人员推出 DetectGPT,专门检测 ChatGPT 等模型生成的文本_AI&大模型_凌敏_InfoQ精选文章