即刻成为鸿蒙应用开发者,解锁职业发展新机遇!点击了解~ 了解详情
写点什么

被 AI 分掉精力的数学天才陶哲轩,论文被拒了

  • 2025-01-03
    北京
  • 本文字数:4304 字

    阅读完需:约 14 分钟

大小:2.07M时长:12:04
被 AI 分掉精力的数学天才陶哲轩,论文被拒了

整理 | 华卫


-亲爱的,今天工作怎么样?


-还行,我在办公桌上拒稿了陶哲轩,他的结果有点差强人意,写的东西也不符合我的标准。然后,我有了一个安静的办公时间,总之…


——来自一位网友对此次事件的场景描述


近日,菲尔茨奖获得者、华裔数学家陶哲轩在个人社交平台上讲述了其最新论文被投稿期刊拒绝的过程和感受,随后引发了种种热议:“审稿人的选择完全是胡扯。”“如果最优秀、最聪明的数学家之一都能让一篇论文被拒绝,那么这几乎可能发生在任何人身上。”“至少这说明某些系统运行得还算正常(不是仅凭名字就发表任何东西)…”


陶哲轩:我被拒稿挺常见


这是陶哲轩所发帖子的完整内容:


今天,我的一篇论文被我投稿的期刊拒绝了,他们还礼貌地写了一封信,说虽然他们认为这篇论文很有趣,但它并不适合该期刊。事实上,我基本同意他们的结论,现在这篇论文已经投给了其他期刊(希望更合适)。

对我来说,被拒稿其实是比较常见的事情,平均每年发生一到两次。我偶尔会向我的学生和同事提及这一事实,他们有时会惊讶于我的拒稿率远非零。我后来才意识到,我们这个行业更愿意公布成功的成就(如论文被接受或结果被证明),而不愿意公布失败的成就(如论文被拒或证明尝试失败),除非这些失败在某种程度上具有争议性。

正因为如此,人们会认为所有的同行不是取得了成功就是引起了争议,而自己的个人职业生涯最终成为 “平凡 ”失败例子的唯一已知来源。我推测,这可能是该领域普遍存在 “冒名顶替综合症 ”的诱因之一(不过,由于上述报告的偏差,也可能是由于对这一话题的某种成见,这种综合症并没有得到广泛传播)。因此,我决定报告这次(相当例行公事的)被拒稿事件,以示对更准确披露信息的一种象征性姿态。

事后看来,我过去的一些被拒稿经历令人捧腹。有一次,我和一位合著者几乎解决了一个猜想,用一个关键参数的 "epsilon loss"确定了结果。我们向一家声誉很高的期刊投稿,但被拒了,理由是它没有解决全部的猜想。于是我们又向其他地方投稿,结果论文被接受了。

第二年,我们终于在没有 "epsilon loss"的情况下证明了完整猜想,并决定再次尝试向那家声誉卓著的期刊投稿。这篇论文也被拒了,理由是与之前的文献相比,它只针对 epsilon 做了改进! (这篇论文也在其他地方投过稿,被接受了;此后我还在那家选择性很强的期刊上发表过论文。我自己也当过编辑,也曾由于各种原因拒绝过一些不错的投稿,所以我觉得最好不要把这类拒稿放在心上,而是转向其他期刊,当然是在修改论文以解决拒稿带来的任何问题之后)。


应用数学家兼物理学家 Wojciech Aniszewski 第一时间热切地询问陶哲轩道:“你有没有在自己的论文被拒之后直接 ‘报复性地拒掉 ’一篇论文?”


对此,陶哲轩认真地做出以下回复:


不会;考虑到期刊投稿过程的时间周期相当缓慢(审稿人报告之间需要数月时间,编辑委员会讨论之间需要数周时间,而且大部分工作流程都是通过电子邮件和编辑平台完成的,此时编辑们有一些空闲时间可以投入到任务中),我怀疑这个过程是否受到激烈情绪的影响。

不过,如果编辑或审稿人在与作者有个人或职业关系的情况下,可能会影响其客观性,那么他们回避投稿的情况并不罕见。(出于类似的原因,作者向亲密的私人朋友或专业同事编辑投稿通常也不是一个好主意,因为该朋友可能不得不回避并将论文交给其他的编辑。


“审稿人也是人”


帖子发布后,也引起了其他各界人士对于审稿人的选择和工作流程的激烈讨论。


一位网友表示,“有时审稿人的选择完全是胡扯。”在他看来,“审稿人也是人,会把各种偏见和观点带入这个过程。在同一个评审周期内,出现相互矛盾的意见也是常有的事。其中一些可能归因于作者缺乏清晰的沟通。但许多期刊不会花很多时间选择合适的审稿人,而是选择最先同意审稿的几个人。”


也有许多网友赞同这样的说法,认为“当像 Tao 这样的人提交一篇论文时,任何编辑都(应该)付出额外的努力来让最优秀的研究人员来评审这篇论文。”


对此,一位网友提出一个深刻的问题:这不正是为什么提交的论文对审稿人来说应该是匿名的吗?“这是科学,论文应该不言自明。一个默默无闻的人可能会做出突破性的、意想不到的发现,而诺贝尔奖获得者也可能犯愚蠢的错误。”


紧接着,有更多人士提到了“偏见来源”问题。“这不就是把偏见的来源从审稿人转移到了协调者吗?一些 “无名小卒 ”提交的论文会得到一个滥竽充数的审稿人,而一个知名的 “大人物 ”则会得到一个广受好评的公正审稿人。”


据了解,现在学术期刊在审稿时分为三种情况,单盲审,双盲审,公开审稿。大多数使用单盲模式:审稿人对于投稿人是匿名的,而投稿人对于审稿人是不匿名的。双盲审,顾名思义就是审稿人不知道论文作者信息,论文作者也不知道审稿人的信息。公开审稿即审稿人知道论文作者信息,论文作者也知道审稿人的信息。


有一位网友表示,“如果论文的审稿人在整个审稿过程中必须保持固定,那么完全匿名可能很有价值。如果同行评审的工作方式更像其他出版物工作流程(文档由多个团队处理,这些团队出于不同的原因进行评审),我认为部分匿名(例如将作者的引用次数四舍五入)实际上可能很有用。”


“为什么我们不能像对待客户服务一样对待同行评审呢?”他提出以下五点评审机制:


  • 论文必须通过从初审到终审的所有关卡,才能被接受发表。

  • 根据投稿人的引用次数,论文会被分流到特定级别的收件箱中。

  • 以前从未发表过论文的人的论文首先会被一级审稿人审阅,他们的存在纯粹是为了区分和过滤掉胡言乱语 / 庸人自扰。他们的存在只是为了让其他人不必为此浪费时间。

  • 同样,来自杰出作者的论文通常不会包含愚蠢的明显错误,因此为了避免浪费投稿人的时间和 1 到 N-1 级审稿人的时间,这些论文会被直接转给最终的 N 级审稿人。这个群体主要由杰出的作者自己组成,他们最有可能捕捉到最微小、最深奥的致命缺陷。

  • 被引用次数一般的人的论文最终会被放在中间层,由中等经验的人审核那些中等偏上的东西,然后要么被退回重审,要么被反复向上递交,而这些编辑标记都是事先挑选好的,这样较高层次的审稿人就不用费心去找那些东西了,可以专注于技术上更困难的东西。至于是否将论文退回给作者修改,则由较高层次的审稿人决定。


该网友认为,在这种模式下,没有论文会被拒绝发表,但论文可能陷入无限的修改循环中。理论上,即使是一篇前提存在致命缺陷的论文,也有可能在修改过程中被 “忒修斯之船”(ship-of-Theseus-ed)变成一篇完全不同的、没有缺陷的论文。


然而,其推荐的评审模式同样被其他网友指出一些问题。例如,“论文可能陷入无限的修改循环中,这可能意味着一篇有价值的论文永远无法发表。大多数期刊要求一次只能向一家期刊投稿。”“通常论文由 1 到 3 名审稿人审阅。现实中很难有两层以上的审稿人。”“审稿人不可能真的对作者姓名视而不见。首先,审稿人必须能够识别是否存在利益冲突;其次,尤其是关于实验的论文,从实验名称就能知道作者是谁。”


深入 AI 领域的陶哲轩


针对此次拒稿事件,有网友这样评价陶哲轩,“他这个级别的科学家更像是 CEO,而非典型科学家。他拥有多个大型实验室。每隔几天就要进行演讲。”


值得一提的是,从陶哲轩的公开动作看,除数学领域外,他本人在 AI 方面确实花了不少精力。


在刚刚过去的 IMO 2024 现场,陶哲轩带来了主题就叫“AI 与数学”的演讲分享。洋洋洒洒的一小时演讲里,他深入探讨了 AI 在数学和科学领域的应用前景,以及它如何与人类智慧相结合,引领我们进入一个崭新的数学纪元。


前不久,陶哲轩还和 OpenAI 两位高管进行了一场线上对谈,主题是以推理为主的 o1 模型如何与数学融合,从而解锁突破性的科学进步。对聊中,陶哲轩直言,目前的 AI 还只停留在数据阶段,并没有想象中的那么有用,只是解决了 2000 万个小的数学问题,理想中的 AI 系统是能够解决一个大问题。


不光是在演讲中讲 AI,就连陶哲轩近期发布的帖子也都有多条提及 AI 相关的话题和事件。



一直以来,陶哲轩也都是 AI 的深度应用者。去年,他在牵头开启的“等式理论计划”中,采用“数学家 +AI(包括自动定理证明系统和大模型)+ 证明辅助语言 Lean”的协作方式,在短短 57 天里,人类携手 AI 一同攻克了 4694 个等式间多达 22,028,942 个蕴含关系,证明了 AI 在处理复杂数学关系证明时可发挥重要作用。


据了解,2023 年,陶哲轩就加入了美国总统科技顾问委员会(PCAST)成立的生成式人工智能工作组,在其中担任 co-leader 的角色。当时,陶哲轩在博客中表示,这一小组主要研究生成式人工智能技术在科学和社会产生更广泛的影响,包括流行的基于文本的大语言模型(如 ChatGPT),图像生成的扩散模型(如 DALL-E2、Midjourney),以及科学应用模型(如蛋白质设计或天气预报)。


“评判标准应该是取得进步的总和”


陶哲轩谈到的接连被同一家期刊拒稿的经历,也被许多网友所热议。


在陶哲轩的那次经历中,第一次他们用一个关键参数的 "epsilon loss"确定了结果,但被这家期刊以“没有解决全部的猜想”的理由拒稿,之后他在其他期刊上发表了这一相关论文;第二次,他们终于在没有 "epsilon loss"的情况下证明了完整猜想,但又被拒了,理由是“与之前的文献相比,它只针对 epsilon 做了改进”。


“这看起来合理吗?”一位网友表示,假设完整成果的影响分值为 7 分,部分成果的影响分值为 5 分,修正成果的影响分值为 2 分。期刊的发表门槛是 6 分。如果作者在得到完整结果之前一直保留论文,期刊就会发表它,但这两部分都不够重要。如果他们不这样做,学术界会更好,因为其他人可能会得到修正,但期刊的行为似乎是合理的。


还有网友评价道:“虽然我不是数学家,但我认为期刊的这种态度并不鼓励健康的社区动态。它非但没有让社区通过将更大的问题化整为零来联合起来,反而鼓励了各自为政和野营者心态。”


对此,有网友认为,“如果人们以这种方式思考,就会激励其坐等增量结果,并且强烈地对成果保密,直到能自己证明整个更大的成果,无论这可能需要多长时间。如果一系列渐进式成果的声望与将它们捆绑在一起推迟发布的声望一样高,那么人们就有理由更积极地合作和完成彼此的工作。把一项几乎完整的成果推迟一年,以让期刊认为它有足够的影响点,这样做似乎很直接,但也很糟糕,因为它既减缓了进展,也减缓了进展和合作的速度。”


另一位网友则直接指出,“科学几乎都是渐进的结果。现在发表文章的动力远大于 ‘坐等’ 一项增量成果,希望在此基础上再添砖加瓦,引起更大轰动的动力。”


还有网友表示,“过度关注单篇期刊出版物会导致这样的荒唐事。评判一位研究人员的标准应该是他所取得进步的总和,至少是同行和未来人类对他的评价。(所有点的总和,而不是最大值)。”


参考链接:


https://mathstodon.xyz/@tao/113721192051328193


2025-01-03 10:1712568

评论

发布
暂无评论

[CSS入门到进阶] 用transform后z-index失效了?总结transform的注意事项!

HullQin

CSS JavaScript html 前端 8月月更

解密 Flutter 的 const 关键字

岛上码农

flutter ios 前端 安卓开发 8月月更

【Java】:二维数组的定义、初始化、长度以及循环遍历等...

翼同学

Java 学习 编程语言 分享 8月月更

电商秒杀系统设计(架构实战营 毕业设计项目)

Gor

Java基础之网络编程(一)

自然

网络 8月月更

架构实战营毕业总结

Naoki

架构实战营

Kubernetes 真的在蚕食云吗

CTO技术共享

Kubernetes中API安全加固

CTO技术共享

C++多态之析构和纯虚析构分析与示例(三)

CtrlX

c++ 后端 面向对象思想 8月月更

SpringBoot(二、基础知识)

SpringBoot 2 8月月更

【Go事】一眼看穿 Go 的集合和切片

梦想橡皮擦

Python 爬虫 8月月更

leetcode 560. Subarray Sum Equals K 和为 K 的子数组(中等)

okokabcd

LeetCode 算法与数据结构

用户权限-Linux系统特殊权限

Albert Edison

Linux centos 运维 用户权限 8月月更

Java基础之网络编程(二)

自然

网络 8月月更

来聊聊 OpenJDK 和 JVM 虚拟机

HoneyMoose

kubernetes镜像构建和扫描

CTO技术共享

IDEA开发Spark应用实战(Scala)

程序员欣宸

8月月更

架构实战营模块 9 作业

Naoki

架构实战营

数据结构——树(树的基本概念)

工程师日月

8月月更

《博弈论》— 人生何处不博弈

蔡农曰

读书笔记 博弈论

头脑风暴:最大子序和

HelloWorld杰少

数据结构 算法 LeetCode 8月月更

Prototype以及jQuery和CDN -内容分发网络在使用JavaScript实战运用

恒山其若陋兮

8月月更

为什么说:被观察者是 push 数据,迭代者是 pull 数据?

掘金安东尼

前端 函数式编程 8月月更

RocketMQ高可用设计之消息重试机制

急需上岸的小谢

8月月更

【算法实践】| 手把手带你实现快速排序算法

迷彩

快速排序 算法实践 8月月更

架构实战营 毕业总结

Gor

网信办将全面规范打赏连麦等功能,必须监督好平台和MCN机构

石头IT视角

程序员最容易读错的单词,听到status我炸了

艾小仙

Java 前端

被 AI 分掉精力的数学天才陶哲轩,论文被拒了_AI&大模型_华卫_InfoQ精选文章