写点什么

上百篇 AI“著作”登期刊!ChatGPT 和 Gemini 靠重写论文搞出的仿作,全冒充新研究成功了

  • 2025-09-24
    北京
  • 本文字数:1156 字

    阅读完需:约 4 分钟

大小:562.30K时长:03:11
上百篇AI“著作”登期刊!ChatGPT 和 Gemini靠重写论文搞出的仿作,全冒充新研究成功了

整理 | 华卫

 

近日,对文献数据库的一项分析发现,包括 ChatGPT 和 Gemini 在内的文本生成人工智能(AI)工具,可用于重写科学论文并生成“仿作版”论文,这些仿作随后被当作新研究成果蒙混过关。

 

在 9 月 12 日发布于 medRxiv 平台的一篇预印本论文中,研究人员指出,过去 4 年半里,112 种期刊上发表了 400 多篇此类仿作论文;他们还证实,AI 生成的生物医学领域研究论文能够避开出版商的反剽窃检测。该研究的作者警告称,个人以及“论文工厂”(接受定制、批量生产虚假论文并出售作者署名的公司)可能正利用公开可用的健康数据集,借助大型语言模型(LLMs)批量生成缺乏科学价值的低质量论文。

 

“若不加以干预,这种基于 AI 的操作模式可能会被应用到各类开放获取数据库中,生成的论文数量将远超任何人的想象,”瑞士弗里堡大学的药理学家乔巴·绍博(Csaba Szabó)表示,他并未参与此项研究,“这可能会打开‘潘多拉魔盒’,学术文献恐将充斥着这类人造论文。”

 

为展开调查,研究人员筛选了“关联研究”——即通过统计学方法将某一变量与健康结局关联起来的研究,这类研究的数据均来源于美国国家健康与营养检查调查(NHANES)。NHANES 是一个大型开放数据库,包含数千人的健康、饮食及生活方式相关数据。

 

研究人员将搜索重点放在了他们定义为“冗余”的研究上。这类研究的特点是:其探究的“变量与健康结局关联”和其他已有研究完全一致,但分析的是原始数据中一个细微不同的子集——例如,使用不同调查年份的数据,或聚焦不同年龄、性别的参与者。他们对生物医学文献数据库 PubMed 进行检索后发现,2021 年 1 月至 2025 年 7 月期间共发表了 411 项此类冗余研究。其中大部分是简单的“重复”案例,即两篇内容几乎完全相同的论文。不过,有 3 个“变量-健康结局关联”主题的重复研究数量格外多,每个主题都对应 6 篇论文,且部分论文是在同一年发表的。

 

“这种情况本不应该发生,它对学术文献的健康发展毫无益处,”该研究的合著者、英国吉尔福德萨里大学的生物医学科学家马特·斯皮克(Matt Spick)表示。

 

大多数出版商会采取检测措施,防止研究人员将同一研究成果提交给多家期刊,但斯皮克及其同事怀疑,AI 工具正被用于规避这些检测。

 

为验证 AI 是否能基于同一数据集生成多篇论文,研究人员使用 OpenAI 的聊天机器人 ChatGPT 和谷歌的 Gemini,对其分析中发现的 3 篇冗余度最高的论文(每篇论文所报告的特定“变量-健康结局关联”均已被发表过 5 至 6 次)进行了重写。研究人员向大型语言模型发出指令,要求其利用每篇论文中的信息以及 NHANES 数据集,生成一篇能够避开剽窃检测工具的新论文手稿。

 

“结果立竿见影,这让我们感到震惊,”斯皮克说,“生成的手稿并非完美无缺,大型语言模型也确实制造了一些错误。每篇手稿都需要花两个小时进行修正完善。”

 

参考链接:

https://www.nature.com/articles/d41586-025-03046-z

2025-09-24 10:376

评论

发布
暂无评论

测试自动化最佳实践指南

阿里云云效

云计算 阿里云 测试 自动化测试 测试自动化

直播预告丨Hello HarmonyOS进阶系列课程重磅来袭,4月27日开播

HarmonyOS开发者

HarmonyOS 智能家居 原子化服务

免费IT自动化运维平台- ETL调度批量管理工具 TASKCTL 8.0 作业设计功能使用

敏捷调度TASKCTL

数据仓库 数据治理 运维自动化 ETL任务 TASKCTL

网站的FAQ页面应该怎么写?

小炮

FAQ

以南大通用为例,讲一讲如何完成与龙蜥操作系统的兼容验证

OpenAnolis小助手

操作系统 龙蜥社区 南大通用 兼容验证

使用车载小程序,共建车联网联合共赢生态

Speedoooo

车联网 物联网 智能设备 小程序容器 车载设备

天翼云:加速推进云网融合共赢算力时代

天翼云开发者社区

大数据

最新云原生网络技术标准来了,为企业提供基础架构能力权威指南

York

架构 云原生 网络性能

OpenHarmony技术日圆满举行 | 3.1 Release版本重磅发布,生态落地初具规模

OpenHarmony开发者

OpenHarmony 技术日

风险与机遇并存,数据分析厂商如何突围?

ToB行业头条

MySQL数据库之数据查询

乌龟哥哥

4月月更

天翼云Web应用防火墙(边缘云版)拦截WordPress Elementor漏洞的说明

天翼云开发者社区

防火墙

OpenHarmony,一路前行,为了奇迹

脑极体

全场景式全流程监控,博睿数据为券商IT运维难题提供了范例

博睿数据

OpenHarmony技术日成功举办,全球下载次数高达6300万

科技汇

如何通过灵魂复盘大幅降低业务风险?

Samson

技术管理 复盘 事故 SRE 4月月更

RTE NG-Lab:一起探索下一代实时互动新世界

声网

NG-Lab 声网动态

设计千万级学生管理系统的考试试卷存储方案

锎心😌😌😌

KPI与360度考核结合的应用落地方案

明道云

工程师们看过来|这是我见过的IT圈最“潮”的产品发布会了!

观测云

程序员 可观测性 产品发布会 IT工程师 监测

不知道OpenCLA的注意啦!(OpenCLA签署须知)

Jianmu

开源项目 开源社区 建木CI CLA 贡献者许可协议

基于Sharding-JDBC的订单分库⽅案

领创集团Advance Intelligence Group

一看即会:Serverless 应用开发的 7 个实战小技巧(文末附好礼)

阿里巴巴云原生

阿里云 Serverless 架构 开发者 云原生

松灵学院 | Scout mini 仿真指南

松灵机器人

人工智能 机器人 ROS 移动机器人

阿里云人工智能创新发布-工业五金图片搜索

视觉智能

拍照购物 以图搜图 图像搜索 拍立淘

80+产品正通过兼容性测试,OpenHarmony生态落地已初具规模

科技汇

Sidecar 模式的机制与应用

全象云低代码

Kubernetes 容器 低代码 后端技术 Sidecar

直播预告|企业云原生 IT 成本治理方案解析

阿里巴巴云原生

阿里云 容器 云原生 cncf 直播预告

合作创新,携手共赢!共筑坚实数字底座!

天翼云开发者社区

系统

区块链赋能不动产—易居EBaaS在不动产领域应用

BSN研习社

区块链

小程序赛道的发展,让智能电视业务发展如虎添翼

Speedoooo

小程序 物联网 IoT 小程序容器 智能电视

上百篇AI“著作”登期刊!ChatGPT 和 Gemini靠重写论文搞出的仿作,全冒充新研究成功了_AI&大模型_华卫_InfoQ精选文章