【ArchSummit架构师峰会】探讨数据与人工智能相互驱动的关系>>> 了解详情
写点什么

接管创新项目未果,转身就质疑研究造假?谷歌这篇登上《Nature》杂志的研究引发大讨论

  • 2022-06-07
  • 本文字数:3665 字

    阅读完需:约 12 分钟

接管创新项目未果,转身就质疑研究造假?谷歌这篇登上《Nature》杂志的研究引发大讨论

谷歌员工声称,今年早些时候某高级研究员曾给另两名初级 AI 研究员“挖坑”——暗示二人研究成果有错,甚至存在伪造行为。


因未接管创新项目而攻击项目创造者?


2018 年末,谷歌 AI 研究员 Anna Goldie 和 Azalia Mirhoseini 终于得到批准,测试她们灵光一闪的想法。该想法主要是用 AI 的方式来提高谷歌发明的计算机芯片 TPU 的研发效率,这也就是后来的 Morpheus 项目,该项目当时得到了谷歌 AI 负责人 Jeff Dean 的大力支持,同时引起了公司芯片制造团队的兴趣。


在进行芯片电路设计时,工程师们需要考虑众多需求和限制因素,整个工作周期往往长达数月且复杂度极高。2021 年 6 月,Goldie 和 Mirhoseini 以主要作者的身份在《自然》杂志上发表论文,称可以利用强化学习技术实现超越谷歌工程师的芯片设计能力,并把整个工作周期缩短到几小时内。


这样的结果自然赢得了半导体界以及众多科技媒体的关注。加州大学圣迭戈分校教授 Andrew Kahng 就在论文评论中预测,这项技术将很快在芯片制造领域落地。他写道,“对于长年从事芯片设计的工作者来说,Mirhoseini 团队的成果看起来确实神奇。”事实上,谷歌数据中心目前所使用的不少 TPU 芯片就是由 Morpheus 项目协助设计而来。三星和英伟达也分别表示,他们正在使用强化学习技术优化芯片设计。


然而,Mirhoseini 与 Goldie 两位一鸣惊人的研究员万万没有想到,自己的辉煌成功竟然惹出一场延续数年的大麻烦。


员工们证实,谷歌高级研究员 Satrajit Chatterjee 以科学讨论为由,对 Mirhoseini 和 Goldie 发起人身攻击。由于无权讨论公司事务,这些谷歌员工只能匿名发言。有员工提到,谷歌人事部门先后收到关于 Chatterjee 恶意攻击的多起投诉,并向其发出书面警告,但这厮仍然我行我素。


今年 3 月,Chatterjee 从研究经理那边获得许可,公开向 Mirhoseini 和 Goldie 的《自然》论文开炮,冲突也由此达到顶点。谷歌为此专门成立了高管论文审查委员会,成员们认为 Chatterjee 的结论站不住脚,无法驳倒论文中的早期研究成果。同一个月,Chatterjee 被谷歌解雇。


谷歌于 2018 年聘请 Satrajit Chatterjee 担任高级机器学习研究员。他之前曾在对冲基金 Two Sigma 担任高级副总裁,也曾效力于英特尔公司。Chatterjee 入职时,Mirhoseini 和 Goldie 已经在谷歌最著名的机器学习实验室 Google Brain 工作。


这两位员工跟 Chatterjee 并没有工作上的直接交集。但 Goldie 在一份内部文件中提到,Chatterjee 曾在 2019 年要求接管 Morpheus 项目。员工们证实,在被礼貌地拒绝之后,Chatterjee 就开始向参与项目合作和支持工作的其他高级研究员“吹风”,质疑二人的工作成果、暗示她们的成果有错甚至存在伪造行为。


因为资历更深,所以 Chatterjee 的言论确实产生了影响。员工们回忆道,当时确实有其他高级研究员会时不时对 Goldie 和 Miroseini 表示质疑。


内部人士称,这就导致 Miroseini 和 Goldie 在谷歌的工作愈发压力重重、难以开展。虽然谷歌的芯片设计师团队一直坚定支持,但她们还是得耗费大量额外精力来回应这些关于错误、甚至是伪造的指控。


谷歌内部连续不停歇的讨论


在此期间,Goldie 在谷歌内部讨论列表上发布了一份文件,描述了审查委员会对 Chatterjee 的驳斥意见,同时指责他对 Morpheus 项目联合负责人及工作成果发动的一系列攻击根本就未经证实。Goldie 写道,“Sat Chatterjee 对我和 Azalia 发动了一场两年有余的所谓「打假声讨」。这不仅是在诋毁我们的工作成果,还毫无根据地宣称 Azalia 和我的研究结果纯属伪造。”


当时,谷歌员工正在对《纽约时报》的一篇文章做出发帖回应,Goldie 的文件也发布在此帖中。《纽约时报》率先报道了 Chatterjee 被解雇的消息,他的律师认定谷歌研究团队在攻击他个人、阻止他参与科学讨论。但事实证明,加入话题的大部分谷歌员工都表达了对两位女性研究员和她们工作成果的支持。部分前任和现任谷歌研究员甚至在社交媒体上公开了自己的态度。


Chatterjee 的律师 Laurie M. Burgess 拒绝让她的客户接受采访,否认 Chatterjee 存在不当行为,并提到 Chatterjee 有证据表明谷歌对他施以不正当打压。但 Burgess 表示不想分享这些证据,也没有回复关于此次事件细节的询问邮件。


在被问及 Chatterjee 时,谷歌发言人 Jason Freidenfelds 拿出一份公司声明,确认此人“因故被解雇”。Friedenfelds 还提供了一份由谷歌研究院副总裁 Zoubin Ghahramani 做出的声明,称“我们坚定维护研究人员之间以尊重为前提的自由讨论权利”。但 Ghahramani 并未在声明中提到 Chatterjee 的名字。


芯片设计团队天生就谨小慎微,因为纳米级制造的成本极高,芯片中的任何错误一旦被刻进芯片就将永远无法修复。谷歌曾表示 TPU 在 AI 研究与服务方面取得了重大突破,并通过 Google Cloud Platform 云服务对外出租这部分算力资源。但即使谷歌的硬件领导者对 Morpheus 项目给予充分信任,并决定用它协助设计公司的下一代 TPU,Chatterjee 对 Morpheus 的批评也一刻都没有停止。


2021 年 5 月,一名谷歌员工在内部邮件列表中发帖,询问有没有人尝试用机器学习来辅助电路板设计。Mirhoseini 回复说 Morpheus 项目应该能帮得上忙。但 Chatterjee 马上插了进来,宣称传统技术的表现优于机器学习工具,最好直接选择市面上销售的商业芯片设计工具。


谷歌 AI 负责人 Jeff Dean 很快加入了讨论,他说谷歌已经在用 Morpheus 设计下一代 TPU 芯片了。Dean 还提到,Morpheus 技术已经在广泛测试中获得了超越人类芯片专家和商业芯片设计工具的成绩,同时附上了结果演示文稿。


Dean 还贴出了 Mirhoseini 团队刚刚发表、已经完成同行评审的《自然》刊载论文。报道指出,Morpheus 团队的成果在 TPU 电路块的排布上优于使用商业芯片设计工具的谷歌工程师。论文并没有公布这些芯片的细节信息,因为属于谷歌内部保密资料,但附上了可以开放访问的开源处理器设计结果。论文结论随后被谷歌内部另一个研究团队成功重现,实验代码也已经开源发布(https://github.com/google-research/circuit_training)。


消息人士提到,Chatterjee 随后把《自然》杂志上的这篇论文当成了目标,想要联合谷歌内外的其他几位工程师用新论文将其斗臭。2021 年末,Chatterjee 写完了文章,想在公司之外发表。谷歌因此组建了一支由 5 位高级芯片和 AI 专家组成的特别委员会,保证剔除掉 Chatterjee 宣称有所偏袒的管理者,以公正的态度审查这篇反驳论文。期间,特别委员会还亲自尝试重现 Morpheus 团队的研究成果。


Chatterjee 论文的匿名草稿随后被泄露在网上,其中展示了来自不同实验、不同测试的实际结果,宣称 Morpheus 算法其实并不如传统的芯片电路排布软件。


经过为期三个月的审查,谷歌特别委员会表示,Chatterjee 的这份反驳论文不可在公司外发表。究其原因,新论文并没有完全重建整个实验,所以提供的实验和数据并不能驳倒《自然》论文的结论。但委员会还是给了 Chatterjee 和合著者们机会,要求他们再做修改。


今年 3 月,特别委员会认为修改后的论文只能说略有改进,仍达不到发表标准。委员会在电子邮件中解释道,“由谷歌研究院撰写的论文必须遵循非常严格的标准,因此特别委员会才会投入大量精力来审查这篇文章。”3 月下旬,Chatterjee 被公司解雇。Goldie 在 5 月初发布在内部讨论列表的文件中提到了特别委员会的决定。她还表示,谷歌的多位管理者已经调查并重现了她团队的结果,并确定 Chatterjee 的说法“完全没有依据”。


谷歌研究事务副总裁 Zoubin Ghahramani 也参加了讨论,并对 Goldie 表达了感谢。他还向《纽约时报》和《连线》杂志发布一份声明,称谷歌支持《自然》杂志的报道,认可论文作者为公司设计出了更实用、更高效的 AI 硬件。项目研究人员已经发表了经过同行评审的论文,并提交了相关专利申请。


但另一位熟知内情的人士却有不同说法,认为谷歌高管明显支持原始论文,所以反对者很难在反驳论文中真正讨论关于芯片设计的具体问题。这位消息人士还提到,他们从未见过 Chatterjee 有所谓不当行为。


谷歌内部高管限制研究人员对外发表内容的冲突早已公开化。谷歌去年曾表示,在 Google Brain 道德 AI 团队联合负责人 Timnit Gebru 和 Margaret Mitchell 被迫离职而引发强烈抗议之后,公司将收紧对外发表内容的预审查程序。Gebru 和 Mitchell 曾与其他学者合著一篇研究论文,其中批评了谷歌搜索及其他产品中使用的 AI 技术。面对来自内部的指责,谷歌不仅将二人扫地出门,还要求论文剔除他们的名字。


谷歌 AI 负责人 Dean 的一份备忘录也引起了公司内外研究者们的一致嘲笑,其中写道 Gebru 和 Mitchell 的论文“不符合我们的出版标准”。之后,几千名谷歌员工和外部 AI 专家签署一封公开信,批评谷歌公司这是在自欺欺人。这篇引发巨大争议的论文随后被某领先同行审查会议接收,由此脱离了谷歌的控制。


目前还不清楚 Chatterjee 是否会在谷歌控制范围之外发表这篇论文,或是递交同行评审。但至少在公司内部,Goldie 和 Mirhoseini 设计的算法仍在不停运转,协助谷歌设计未来几代芯片。


参考链接:


https://www.wired.com/story/google-brain-ai-researcher-fired-tension/

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2022-06-07 08:523622

评论

发布
暂无评论
发现更多内容

低代码真能做到“让人人都能做开发者”吗?

优秀

低代码

如何打造更为精准的个性化推荐?Amazon Personalize 有独门技术秘籍!

亚马逊云科技 (Amazon Web Services)

计算机原理学习笔记 Day12

穿过生命散发芬芳

计算机原理 4月日更

基于mysqldump聊一聊MySQL的备份和恢复

麦洛

MySQL MySQL 运维 数据备份

Open Source Load Testing Tool Review 2020

OutOfMemory1024

Load Testing Open Source

Ubuntu 20.04 启用休眠(Hibernate)配置过程

OutOfMemory1024

Ubuntu20.04

采访彩食鲜 CTO乔新亮:程序员如何持续的登上新台阶

风翱

4月日更 采访提纲

如何从零开始学Python:(5)如何处理列表中嵌套多个列表?

广之巅

Python 4月日更

Linux OOM Killer

OutOfMemory1024

Linux

Redis - 跳表以及其内部结构

insight

redis 4月日更

运动的这两个价值,你知道吗?|靠谱点评

无量靠谱

JVM 读书笔记(一) 内存划分

U2647

JVM 4月日更

Go Channel

escray

学习 极客时间 Go 语言 4月日更

如何批评下属?

石云升

团队建设 28天写作 职场经验 管理经验 4月日更

轻松搞定XML和对象之间的互转,就它了!

麦洛

xml XStream

Guide to UUID in Java

OutOfMemory1024

Java

如何缓解低代码开发的安全风险

YonBuilder低代码开发平台

小程序云开发 开发者 低代码 APP开发 APICloud

百度南渡,护航泉州水务的产业智能化征程

脑极体

警惕数据泄露!快给你的数据加上安全密钥!

亚马逊云科技 (Amazon Web Services)

专访阿里巴巴研究员吴翰清 | 安全的持续运营之道

架构精进之路

4月日更 调查采访能力考核 人物访谈

TO B产品从0到1:从项目中走出来

菜根老谭

产品孵化

架构师实战营 模块一总结

代廉洁

架构实战营

话题讨论|To B & To G,互联网公司的下一主战场

程序员架构进阶

话题讨论 28天写作 4月日更 To B业务 领域思考

独家对话阿里云函数计算负责人不瞋:你所不知道的 Serverless

阿里巴巴云原生

Serverless 容器 微服务 开发者 云原生

微服务架构核心基础讲解

麦洛

微服务

低开销获取时间戳

捉虫大师

Java

Linux nslookup 命令

一个大红包

Linux linux命令 4月日更

Zip和7-zip谁更强,如何选择?

麦洛

ZIP格式 ZIP zip4j

乘“云”加速疾病诊断研发,亚马逊云科技新阶段“诊断开发计划”已开启!

亚马逊云科技 (Amazon Web Services)

不惧业务规模与复杂性,实现敏捷的云转型“三步走”就对了 | 云途专栏

亚马逊云科技 (Amazon Web Services)

专访前美篇首席架构师张超|从工程师到CTO的蜕变

Aldeo

程序员 采访 调查采访能力考核

接管创新项目未果,转身就质疑研究造假?谷歌这篇登上《Nature》杂志的研究引发大讨论_语言 & 开发_核子可乐_InfoQ精选文章