2天时间,聊今年最热的 Agent、上下文工程、AI 产品创新等话题。2025 年最后一场~ 了解详情
写点什么

上百篇 AI“著作”登期刊!ChatGPT 和 Gemini 靠重写论文搞出的仿作,全冒充新研究成功了

  • 2025-09-24
    北京
  • 本文字数:1156 字

    阅读完需:约 4 分钟

大小:562.30K时长:03:11
上百篇AI“著作”登期刊!ChatGPT 和 Gemini靠重写论文搞出的仿作,全冒充新研究成功了

整理 | 华卫

 

近日,对文献数据库的一项分析发现,包括 ChatGPT 和 Gemini 在内的文本生成人工智能(AI)工具,可用于重写科学论文并生成“仿作版”论文,这些仿作随后被当作新研究成果蒙混过关。

 

在 9 月 12 日发布于 medRxiv 平台的一篇预印本论文中,研究人员指出,过去 4 年半里,112 种期刊上发表了 400 多篇此类仿作论文;他们还证实,AI 生成的生物医学领域研究论文能够避开出版商的反剽窃检测。该研究的作者警告称,个人以及“论文工厂”(接受定制、批量生产虚假论文并出售作者署名的公司)可能正利用公开可用的健康数据集,借助大型语言模型(LLMs)批量生成缺乏科学价值的低质量论文。

 

“若不加以干预,这种基于 AI 的操作模式可能会被应用到各类开放获取数据库中,生成的论文数量将远超任何人的想象,”瑞士弗里堡大学的药理学家乔巴·绍博(Csaba Szabó)表示,他并未参与此项研究,“这可能会打开‘潘多拉魔盒’,学术文献恐将充斥着这类人造论文。”

 

为展开调查,研究人员筛选了“关联研究”——即通过统计学方法将某一变量与健康结局关联起来的研究,这类研究的数据均来源于美国国家健康与营养检查调查(NHANES)。NHANES 是一个大型开放数据库,包含数千人的健康、饮食及生活方式相关数据。

 

研究人员将搜索重点放在了他们定义为“冗余”的研究上。这类研究的特点是:其探究的“变量与健康结局关联”和其他已有研究完全一致,但分析的是原始数据中一个细微不同的子集——例如,使用不同调查年份的数据,或聚焦不同年龄、性别的参与者。他们对生物医学文献数据库 PubMed 进行检索后发现,2021 年 1 月至 2025 年 7 月期间共发表了 411 项此类冗余研究。其中大部分是简单的“重复”案例,即两篇内容几乎完全相同的论文。不过,有 3 个“变量-健康结局关联”主题的重复研究数量格外多,每个主题都对应 6 篇论文,且部分论文是在同一年发表的。

 

“这种情况本不应该发生,它对学术文献的健康发展毫无益处,”该研究的合著者、英国吉尔福德萨里大学的生物医学科学家马特·斯皮克(Matt Spick)表示。

 

大多数出版商会采取检测措施,防止研究人员将同一研究成果提交给多家期刊,但斯皮克及其同事怀疑,AI 工具正被用于规避这些检测。

 

为验证 AI 是否能基于同一数据集生成多篇论文,研究人员使用 OpenAI 的聊天机器人 ChatGPT 和谷歌的 Gemini,对其分析中发现的 3 篇冗余度最高的论文(每篇论文所报告的特定“变量-健康结局关联”均已被发表过 5 至 6 次)进行了重写。研究人员向大型语言模型发出指令,要求其利用每篇论文中的信息以及 NHANES 数据集,生成一篇能够避开剽窃检测工具的新论文手稿。

 

“结果立竿见影,这让我们感到震惊,”斯皮克说,“生成的手稿并非完美无缺,大型语言模型也确实制造了一些错误。每篇手稿都需要花两个小时进行修正完善。”

 

参考链接:

https://www.nature.com/articles/d41586-025-03046-z

2025-09-24 10:372647

评论

发布
暂无评论

项目管理系统对比:2025年主流的9款

易成研发中心

项目管理系统

低代码+ Vue.js:企业级应用开发实践指南

秃头小帅oi

YashanDB内存体系

YashanDB

数据库 yashandb

飞算JavaAI+开发者:双剑合璧,编程效率倍增!

飞算JavaAI开发助手

DevEco Studio构建分析工具Build Analyzer 为原生鸿蒙应用开发提速

HarmonyOS开发者

新一代 Cron-Job 分布式任务调度平台 正式发布!

Horace

分布式 定时任务 Job 分布式定时任务 Java定时任务

YashanDB主备高可用

YashanDB

数据库 yashandb

YashanDB实例架构

YashanDB

数据库 yashandb

飞算JavaAI:一款改变编程行业格局的智能助手

飞算JavaAI开发助手

告别高配焦虑!三款白菜价云电脑PK

小喵子

阿里云 云电脑 云游戏 ToDesk

两台运行“满血版”DeepSeek,第四范式推出大模型推理一体机解决方案SageOne IA

新消费日报

在杭州智算中心,听懂钱塘江畔人工智能潮

脑极体

AI

在线项目管理软件有哪些?比较推荐的9款

易成研发中心

项目管理软件

报名开启丨Future.Industry 2025线上直播会议:探索AI、仿真与HPC的技术未来

Altair RapidMiner

AI HPC 知识图谱 仿真 hyperworks

YashanDB数据库实例

YashanDB

数据库

释放你的创造力:飞算JavaAI,让代码编写不再是负担

飞算JavaAI开发助手

AI写代码再进化!飞算JavaAI让编程不再属于重复造轮子工程

飞算JavaAI开发助手

生产管理思路和方法

易成研发中心

隐语 SecretFlow 2025开源需求全面征集

隐语SecretFlow

Python 开源 隐私计算

阶跃星辰开源文生视频模型 Step-Video-T2V;斯坦福社交推理语言模型:多个 AI 用自然语言玩 Among US丨日报

声网

知识文档管理系统哪个好?对比25年主流11款

易成研发中心

文档管理系统

YashanDB共享集群

YashanDB

数据库 yashandb

Vue3 基础概念与环境搭建

不在线第一只蜗牛

JavaScript vue.js

当AI遇上代码库,飞算JavaAI让程序员不再孤单

飞算JavaAI开发助手

上百篇AI“著作”登期刊!ChatGPT 和 Gemini靠重写论文搞出的仿作,全冒充新研究成功了_AI&大模型_华卫_InfoQ精选文章