如何 0 成本启动全员 AI 技能提升?戳> 了解详情
写点什么

科学家被 ChatGPT 骗了

  • 2023-01-30
    北京
  • 本文字数:1381 字

    阅读完需:约 5 分钟

科学家被ChatGPT骗了

根据最新研究,学者们可能会被 ChatGPT 所欺骗,他们误以为 ChatGPT 生成的虚假科学摘要来自顶级研究期刊上发表的真实医学论文。


本文最初发布于 The Register。

学者难以识别人工智能生成的假论文摘要


近日,美国西北大学领导的一个研究小组使用 OpenAI 开发的文本生成工具,基于一篇真实科学论文的标题,采用五种不同的医学期刊风格生成了 50 篇摘要。


4 名学者参加了一项测试,他们被分为两组,每组两人。测试通过电子抛硬币的方式来决定将人工智能生成的摘要交给每组中的哪一名审核员。如果一名研究人员拿到的是真摘要,那么另一名研究人员拿到的就是假摘要,反之亦然。每个人都审阅了 25 篇科学摘要。


审核员能够识别出 68% 由人工智能生成的假摘要,和 86% 来自真实论文的原始摘要。换句话说,他们被成功欺骗,将 32% 的人工智能生成的摘要识别为真摘要,将 14% 的真摘要识别为假摘要。


该研究的第一作者、西北大学专攻肺病学的医生和科学家 Catherine Gao 说,这表明 ChatGPT 相当有说服力。她在一份声明中写道,“我们的审核员知道他们收到的部分摘要是假的,所以他们非常警惕”。


“事实上,我们的审核员还是在 32% 的时间里漏掉了人工智能生成的摘要,这表明这些摘要真的很好。我估计,如果有人偶然看到了其中一份生成的摘要,那么他们不一定能识别出那是由人工智能写的。”

大型语言模型生成的文本为什么能骗倒众人?


像 ChatGPT 这样的大型语言模型使用从互联网上抓取的大量文本进行训练。经过学习后,它们会通过预测在给定的句子中哪些词更有可能出现来生成文本,而且生成的文本语法准确。这并不奇怪,即使是学者也会上当受骗,相信人工智能生成的摘要是真的。


大型语言模型擅长生成具有清晰结构和模式的文本,科学摘要通常采用类似的格式,而且可能相当模糊。


Gao 说:“我们的审核员评论说,区分真假摘要非常困难。ChatGPT 生成的摘要非常有说服力……当编造数值时,它甚至知道患者群体应该有多大。”例如,一篇关于高血压的假摘要描述了一项有数万名参与者的研究,而一篇关于猴痘的研究涉及的患者则较少。


Gao 认为,像 ChatGPT 这样的工具将使靠出版研究成果获利的造纸厂更容易炮制虚假科学论文。她补充说,“如果其他人试图以这些不正确的研究为基础进行科学研究,那可能真的很危险”。


不过,使用这些工具也有好处。这项研究的合作者、芝加哥大学医学副教授 Alexander Pearson 说,它们可以帮助母语非英语的科学家更好地写作和分享他们的工作。


人工智能比人类更擅长检测机器文本。例如,免费的 GPT-2 输出检测器能够以超过 50% 的置信区间从 50 篇由语言模型生成的论文中猜出 33 篇。研究人员认为,提交的论文应该通过这些探测器的检测,科学家应该公开使用这些工具。


Gao 告诉 The Register,“我们在撰写自己的摘要或手稿时没有使用 ChatGPT,因为这是否可接受在学术界还没有清晰的边界。例如,国际机器学习大会已经制定了一项政策,禁止使用它,不过他们承认,讨论仍在继续,并澄清说,在‘编辑或打磨’时使用是可以的。”


不过,已经有一些团体开始使用它来辅助写作,有些人还把它列为合著者。我认为,使用 ChatGPT 来辅助写作是可以的,重要的是,这样做的时候要明确标示 ChatGPT 辅助编写的那部分手稿。我们将来使用或不使用 LLM 来辅助撰写论文,取决于科学界最终达成的共识。”


原文链接:


https://www.theregister.com/2023/01/11/scientists_chatgpt_papers/

2023-01-30 12:006319

评论 1 条评论

发布
用户头像
AI自动帮小学生写作业
2023-01-31 08:11 · 浙江
回复
没有更多了
发现更多内容

信创国产化,可私有化部署的企业内部即时通讯聊天软件

BeeWorks

即时通讯 IM 私有化部署

Solana“网络扩展(Network Extensions)”成最被误解的基础设施创新之一

PowerVerse

Web3 钱包开发的流程

北京木奇移动技术有限公司

dapp开发 区块链开发 软件外包公司

为了白嫖 https 的图床, 顺手写了个 Picgo 的插件

Avan

Hexo PicGo 博客搭建 Obsidian

“数字创新产品课程” 8月2-3日 · CSPO认证上海线下面授周末班【和A-CSPO打包报名享特惠】

ShineScrum

产品负责人 CSPO认证 CSPO

远程玩3A大作要多少帧?ToDesk、向日葵、UU远程性能对决

小喵子

游戏 向日葵 远程桌面 ToDesk

MyEMS能源管理系统后台配置-能源费率管理

开源能源管理系统

开源 能源管理

可私有化部署的企业内部即时通讯聊天软件 ——BeeWorks 免费版上线

BeeWorks

即时通讯 IM 私有化部署

为什么中国企业AI难以落地?——一场分享会后的深度反思

蜉蝣

人工智能 AI 大模型 LLL AI困境

DApp开发库选择指南

北京木奇移动技术有限公司

区块链技术 dapp开发 软件外包公司

DApp 开发的安全审计

北京木奇移动技术有限公司

区块链技术开发 dapp开发 软件外包公司

MyEMS能源管理系统后台配置-成本中心管理

开源能源管理系统

开源 能源管理 开源能源管理系统

淘宝API系列:淘宝商品优惠信息API接口详解

tbapi

淘宝API接口 天猫API接口 淘宝商品优惠券接口 天猫商品优惠券接口

企业数字化转型《求生手册》:教你如何有效进行转型以及如何避坑

优秀

数字化转型 数字化 企业数字化转型

Spring Boot 插件化开发模式,即插即用

Geek_e3e86e

Java 编程

Paperless-ngx 文档管理系统

qife122

开源 文档管理

大数据-27 ZooKeeper zoo.cfg多节点分布式配置

武子康

Java 大数据 hadoop zookeeper 分布式

AI 技术赋能英语口语 App 开发

北京木奇移动技术有限公司

软件外包公司 AI英语学习 AI技术应用

MyEMS能源管理系统后台配置-能源分类管理

开源能源管理系统

开源 能源管理

云上AI推理平台全掌握 (1): PAI-EAS LLM服务一键压测

阿里云大数据AI技术

人工智能 大数据 模型 推理 压测数据

看负载、调资源、控进度!用资源日历掌控全员进度

禅道项目管理

项目管理 企业管理 进度管理 禅道项目管理软件

AI 词汇记忆 App 的开发

北京木奇移动技术有限公司

软件外包公司 AI英语学习 AI英语教育

2025智慧矿山高质量发展大会暨内蒙古矿业博览会定于10月10日开幕

科技汇

腾讯云与微盟启动“私域安全护航计划”,共筑数字商业安全新防线

人称T客

EarlGrey - iOS UI自动化测试框架

qife122

ios UI测试

经济型数字广告屏

Dylan

LED显示屏 全彩LED显示屏 户外LED显示屏 led显示屏厂家 户内led显示屏

腾讯的面试,拷问的太全面了

王中阳Go

Go 腾讯 面试

为什么说方法的参数最好不要超过4个?

秃头小帅oi

智慧疾控物资管理系统(源码+文档+讲解+演示)

深圳亥时科技

MIAOYUN | 每周AI新鲜事儿(06.20-06.27)

MIAOYUN

人工智能 AI AI 智能体

大麦基于HarmonyOS星盾安全架构,打造全链路安全抢票方案

HarmonyOS SDK

harmoyos

科学家被ChatGPT骗了_AI&大模型_Katyanna Quach_InfoQ精选文章