写点什么

用 AI 对抗 AI!斯坦福研究人员推出 DetectGPT,专门检测 ChatGPT 等模型生成的文本

  • 2023-01-31
    北京
  • 本文字数:838 字

    阅读完需:约 3 分钟

用AI对抗AI!斯坦福研究人员推出 DetectGPT,专门检测 ChatGPT 等模型生成的文本

过去两个月,ChatGPT火爆全网,写代码、编故事、构建虚拟机……ChatGPT 几乎无所不能。在“硬币的另一面”,有学生开始用 ChatGPT写作业、写论文。根据最新研究,学者们也可能会被 ChatGPT 欺骗,误以为 ChatGPT 生成的虚假科学摘要来自顶级研究期刊上发表的真实医学论文。

 

近日,斯坦福大学研究团队提出了一种名为 DetectGPT 的新方法,旨在成为首批打击高等教育中 LLM 生成文本的工具之一。相关研究论文已发表在预印本网站 arXiv 上。据悉,这是一种使用模型的对数概率函数的局部曲率检测预训练大型语言模型样本的方法,该方法或对检测验证产业带来积极影响。

 

该方法基于的原理是:由大型语言模型生成的文本通常在模型的对数概率函数的负曲率区域的特定区域徘徊。通过这个发现,该团队开发了一种新的指标,用于判断文本是否是机器生成的,并且不需要训练人工智能或收集大型数据集来比较文本。

 

研究人员表示,随着大型语言模型(LLMs)的流畅性和知识积累程度不断增强,人们对于检测一段文本是否由机器编写的需求日益旺盛。比如,一些学生使用大型语言模型来完成书面作业,以至于教师无法准确地评估学生的学习情况。

 

研究人员首先证明了从大型语言模型中采样的文本倾向于占据模型的对数概率函数的负曲率区域。利用这一观察结果,定义了一个新的基于曲率的标准,用于判断是否从给定的 LLM 生成通道。这种方法即为 DetectGPT——不需要训练单独的分类器,不需要收集真实或生成的段落的数据集,也不需要显式地为生成的文本加水印,它只使用由感兴趣的模型计算的对数概率,和来自另一个通用预训练语言模型(例如 T5)的文章随机扰动。

 

研究发现 DetectGPT 比现有的零帧模型样本检测方法更具鉴别性,显著提高了 20B 参数 GPT-NeoX 生成的假新闻文章的检测能力,从最强零帧基线的 0.81 AUROC 提高到 DetectGPT 的 0.95 AUROC。

 

然而,这一方法也存在一定的局限性。例如,如果现有的掩模填充模型不能很好地表示有意义的改写空间,则某些域的性能可能会降低,从而降低曲率估计的质量;DetectGPT 相比其他检测方法需要更大的计算量等。

2023-01-31 18:035827

评论 1 条评论

发布
用户头像
你来我往
2023-02-01 08:09 · 浙江
回复
没有更多了
发现更多内容

模块二作业 -- 图片字小,可以放大网页观看

库尔斯

带你了解元宇宙

CECBC

微信朋友圈高性能复杂度

鱼恨水

云原生训练营 -Week08

jjn0703

jackson学习之五:JsonInclude注解

程序员欣宸

4月月更

架构实战营 - 第 6 期 模块二课后作业

乐邦

「架构实战营」

不断挖掘“区块链”更大潜能

CECBC

内容管理系统简史

张泽豪

CMS

极客星球 | 数据智能公司K8S生产环境落地之监控篇

MobTech袤博科技

K8s 多集群管理

模块二

Geek_5hnu3d

企业如何度量研发效能?

爱吃小舅的鱼

元宇宙大热,是风口还是虎口

CECBC

RabbitMQ 补偿机制、消息幂等性解决方案

Ayue、

RabbitMQ 4月月更

朋友圈架构设计

踩着太阳看日出

架构训练营

训练营作业-Module2:朋友圈高性能复杂度分析

Jadedev

架构训练营

分布式session之RedisSession的探索

Rubble

redis 4月日更 4月月更

一文简述:企业应用架构演进史

穿过生命散发芬芳

4月月更

linux之type命令

入门小站

Linux

微信朋友圈架构复杂度分析

Trent

分析微信朋友圈的高性能复杂度

Kevin

「架构实战营」

尤达 DDD 领域驱动设计思想 第五章作业(使用微服务框架对 SmartRM 系统重新进行微服务化重构)

代廉洁

尤达DDD领域驱动设计思想

在线SQL压缩工具

入门小站

工具

基于HiKariCP组件,分析连接池原理

HikariCP 连接池 数据库连接池

有没有一件你认为是成功的,能让自己骄傲的事情?

石云升

职场经验 4月月更

架构训练营模块 2 作业

小马

「架构实战营」

微信朋友圈的高性能复杂度分析

Geek_bc9c8d

架构实战营【模块二】作业

michael

架构实战营 「架构实战营」

k8s TLS bootstrap解析-k8s TLS bootstrap流程分析

良凯尔

容器 云原生 kubeadm #Kubernetes#

在线计算两个时间相差多少秒,分钟,天

入门小站

工具

微信朋友圈的高性能复杂度

唐诗宋词

PiFlow 发布企业级分布式关系型数据库 OceanBase 组件

OceanBase 数据库

oceanbase OceanBase 开源

用AI对抗AI!斯坦福研究人员推出 DetectGPT,专门检测 ChatGPT 等模型生成的文本_AI&大模型_凌敏_InfoQ精选文章