【AICon】AI 基础设施、LLM运维、大模型训练与推理,一场会议,全方位涵盖! >>> 了解详情
写点什么

谷歌华人工程师被捕:号称“全球能搭建万卡级算力平台的十人之一”,在国内两公司担任 CTO、CEO

  • 2024-03-08
    北京
  • 本文字数:2957 字

    阅读完需:约 10 分钟

大小:1.44M时长:08:23
谷歌华人工程师被捕:号称“全球能搭建万卡级算力平台的十人之一”,在国内两公司担任CTO、CEO

因涉嫌窃取谷歌 AI 商业机密,中国籍谷歌工程师在美被捕

 

据美国司法部网站信息,日前,美国联邦政府对华人工程师 Linwei Ding(又名 Leon Ding)提起四项商业机密盗窃罪名,指控其涉嫌意图从谷歌公司处窃取与 AI 技术相关的专有信息。3 月 5 日,Linwei Ding 在加利福尼亚州纽瓦克当地被捕。

 

如果罪名成立,Linwei Ding 将面临最高 10 年监禁及每项罪名最高 25 万美元(约 180 万元人民币)的罚款,联邦地区法院法官将在参考美国量刑指南及其他法律因素后做出判决。目前,联邦调查局与商务部正在联手调查此案。

 

起诉书显示,Linwei Ding 今年 38 岁,为中国公民、加利福尼亚州纽瓦克居民。根据公布的法庭文件,Linwei Ding 涉嫌窃取的技术涉及谷歌先进超级计算数据中心的构建模块,该数据中心专门用于支持大型 AI 模型训练和托管中的机器学习类工作负载。从起诉书看来,该大型 AI 模型能够理解细微的语言表达差别,属于能针对提示词、任务或查询生成智能响应的 AI 应用。

 

起诉书还描述了谷歌如何开发其专有硬件和软件,进而推动由其超级计算数据中心支持的机器学习过程。在硬件方面,谷歌采用了先进的计算机芯片,具备支撑机器学习并运行 AI 应用所需要的卓越处理能力。而在软件方面,谷歌部署有多层软件,起诉书将其称为“软件平台”,旨在有效协调机器学习工作负载。

 

例如,该软件平台的组件之一为集群管理系统(CMS),由其充当谷歌超级计算数据中心的“主脑”。CMS 负责为整个硬件基础设施进行任务组织、优先级排序和具体分配,从而确保各先进芯片能够以高效方式执行机器学习工作负载或托管 AI 应用程序。

 

美国司法部长 Garland 表示,“司法部不会容忍对 AI 乃至其他任何可能危及我们国家安全的先进技术实施盗窃。在本案中,我们指控被告在秘密为两家中国企业工作期间,窃取了谷歌的 AI 相关商业机密。我们将努力保护美国开发的敏感技术,避免这些技术落入错误的人手中。”

该工程师号称是“全球能搭建万卡级算力平台的十人之一”

 

起诉书提到,谷歌于 2019 年聘请 Linwei Ding 担任软件工程师,其工作职责包括开发谷歌超级计算数据中心内部署的软件。正式入职之后,Linwei Ding 获得了访问谷歌机密信息的权限,具体内容涉及硬件基础设施、软件平台及其所支持的 AI 模型与应用程序。

 

此外,起诉书还指控 Linwei Ding 秘密与两家中国科技企业有所关联。从内容来看,Linwei Ding 曾在 2022 年 6 月 13 日左右收到来自中国某早期科技公司 CEO 的几封电子邮件,其中提到 Linwei Ding 已被任命为该公司首席技术官。据称 Linwei Ding 于 2022 年 10 月 29 日回到中国,并逗留至 2023 年 3 月 25 日。在此期间他参加了为新公司筹集资金的投资者会议。起诉书提到,各准投资方被告知 Linwei Ding 担任新公司首席技术官,而且掌握着公司 20%的股权。

 

起诉书同时指出,在谷歌不知情的前提下,Linwei Ding 于 2023 年 5 月 30 日前创立了自己的 AI 与机器学习科技企业,并担任公司 CEO。Linwei Ding 的这家公司宣称将开发一套软件平台,旨在加快机器学习类工作负载的运行速度,包括大型 AI 模型的训练速度。根据起诉书所言,Linwei Ding 曾申请中国的初创企业孵化计划,并于 2023 年 11 月 24 日前往北京,在投资者会议上介绍了这家企业。而且与 Linwei Ding 初创公司相关的一份文件也提到,“我们拥有谷歌万卡级算力平台的管理经验;只需照搬并加以升级,就能进一步开发出适合中国国情的算力平台。”

 

起诉书强调,Linwei Ding 的行为违反了雇佣协议以及其在入职谷歌时签署的单独行为准则。此外,起诉书也解释了 Linwei Ding 为隐瞒其商业机密窃取行为而采取的措施。

 

例如,Linwei Ding 疑似将谷歌源文件中的数据复制到公司配发给他的 MacBook 笔记本上的 Apple Notes 应用程序当中。随后,Linwei Ding 将 Apple Notes 转换为 PDF 文件,又将其通过谷歌网络上传至独立账户。据称 Linwei Ding 避开了谷歌数据丢失防护系统的检测。此外,起诉书还描述了 Linwei Ding 在 2023 年 12 月如何把自己的工牌出借给另一位谷歌员工,使其顺利打卡并进入谷歌办公大楼。打卡记录显示 Linwei Ding 似乎仍在出入办公地点,但他当时实际上人在中国。

 

美国司法部国家安全部门助理总检察长 Matthew G. Olsen 表示,“Linwei Ding 涉嫌策划从谷歌处窃取顶尖 AI 技术,同时与中方竞争企业秘密接触并接洽业务。”美国检察官 Ismail Ramsey 提到,“Linwei Ding 在谷歌担任软件工程师期间,曾秘密为个人及两家位于中国的企业谋取利益。通过窃取谷歌关于 AI 超级计算系统的商业机密,Linwei Ding 为他本人及归其名下的两家中国公司带来不公平的竞争优势。”

 

根据国内社交媒体上挖掘的信息,Linwei Ding 极有可能是融数联智 CTO、至算科技 CEO 丁林葳。

 




根据介绍,丁林葳毕业于美国南加州大学,曾任谷歌主任工程师/异构计算研发负责人,是全世界能搭建万卡级算力平台的十人之一。领导 GPU 和 TPU 等加速器的系统设计和开发,以及 Pathways 和 Jax 的系统框架的开发。其团队开发了所有云服务的加速器系统,以及基于超级计算机来研发 LLM 大规模语言模型。丁林葳曾在谷歌搭建的万卡级算力平台,正在被 Google Research、 Anthropic、DeepMind 和 OPEN AI 所使用。

 

丁林葳任职的两家公司中,融数联智成立于 2019 年,专精于隐私计算,公司拥有自主研发的隐私保护芯片、多方安全计算软件系统、AI 联邦学习平台、可信计算 TEE 以及隐私计算一体机,为客户构建合法高效的数据协同链提供技术保障,助力数据在机构之间“可用不可见”的流通和融合应用,保障数据合作和数据流通的全链条安全,为数据要素发挥价值提供技术驱动。

 

至算科技是国内唯一最早推出单任务万卡级的大算力 AI 训练推理加速算力平台的公司,从底层系统上解决“国内做不了 50B 以上大模型”的痛点。信息显示,该项目创始人(丁林葳)曾在谷歌带队做出的 6 万卡 TPU、2.6 万 GPU 万卡级算力平台。本项目支持的算力规模可达单任务万卡,支持大模型训练时长从月级可降至小时级。

将谷歌技术机密上传至谷歌网盘,网友:事情绝不简单

 

起诉书提到,2022 年 5 月 21 日,Linwei Ding 开始将机密信息复制至个人 Google Cloud 账户,秘密上传保存在谷歌网络内部的商业机密。之后 Linwei Ding 持续定期上传,直到 2023 年 5 月 2 日,期间 Linwei Ding 共上传了 500 多个包含机密信息的独立文件。

 

美国司法部副部长 Lisa Monaco 表示,“在我们努力以负责任的方式发挥 AI 积极价值的同时,司法部也对其风险保持着高度警惕,包括可能对我们国家安全造成的全面威胁。从今天的指控来看,被告从谷歌公司处窃取到 500 多个包含 AI 商业机密的保密文件,同时也秘密在为希望取得 AI 技术竞赛领先优势的中国企业工作。司法部将不懈追查那些将颠覆性技术成果(特别是 AI)非法传出境外的人,并追究其责任。”

 

有网友质疑,“将谷歌技术机密上传至谷歌网盘”这一操作并不符合“窃密思维”,反而更像是正常的日常工作。有网友评论称,“不离职就只是工作,离职就是窃密”,也有网友将其归类于“阴谋论”:“内部技术人才辞工,不能把人才流去其他地方公司,然后找点所谓的证据,只有坐牢了就不会把前公司的技术泄露出去了”。

 

目前,关于该案只有美国司法部一面之词,当事人还未回应。值得一提的是,起诉书本身仅为涉案指控,被告在被法庭证明有罪之前,面临的一切指控均遵循疑罪从无原则。

 

参考链接:

https://www.justice.gov/opa/pr/chinese-national-residing-california-arrested-theft-artificial-intelligence-related-trade

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2024-03-08 14:267309

评论

发布
暂无评论

JVM 垃圾回收原理简述

Mars

第四周 系统架构 作业 「架构师训练营 3 期」

胡云飞

极客大学架构师训练营

阿里P8传授给小老弟的Java面试宝典,竟让让小弟也拿到了P8的offer,傻眼了

Java架构之路

Java 程序员 架构 面试 编程语言

可视化指挥调度平台搭建,应急指挥调度监控中心建设方案

t13823115967

可视化 指挥调度

mybatis二级缓存,7个问题拿下它

田维常

mybatis

看了这个你还不懂mybatis缓存,单独找我

田维常

mybatis

从月薪3K的Java菜鸟,到年薪80W的Java架构师,靠这份文档,让我学习像打怪升级一样简单!

Java架构之路

Java 程序员 架构 面试 编程语言

mybatis一级缓存是啥?5个面试题回答你

田维常

mybatis

架构师训练营第九周作业

丁乐洪

面试必问系列,源码解析多线程绝对不容忽视得问题:线程活性故障

小Q

Java 学习 架构 面试 多线程

阿里大牛亲自总结整理的一线互联网公司面试真题及面经(阿里、网易、字节)

Java架构之路

Java 程序员 架构 面试 编程语言

架构训练营-week13-总结

于成龙

架构师训练营第 13 周课后练习

薛凯

java代码优化技巧及原理

积极&丧

LeetCode题解:18. 四数之和,哈希表,JavaScript,详细注释

Lee Chen

算法 大前端 LeetCode

工厂模式学习

en

设计模式 工厂模式 Go 语言

性能优化总结(三)

Mars

[架构师训练营第 1 期] 第 13 周学习总结

猫切切切切切

极客大学架构师训练营

泡泡玛特市值千亿背后,我们为什么会为盲盒买单?

脑极体

在wildfly中使用SAML协议连接keycloak

程序那些事

程序那些事 SAML openid SSO wildfly

第四周 系统架构 学习总结

胡云飞

极客大学架构师训练营

面试阿里被质问:ConcurrentHashMap线程安全吗

Java架构师迁哥

列举出常见的Java面试题100+,我靠这个在十月拿到了阿里的offer

Java架构之路

Java 程序员 架构 面试 编程语言

如何透彻理解 Redis 核心原理?怎样才能形成 Redis 系统观?

Java架构师迁哥

北纬37°的浪漫与理性,穿越千年的信息之变

脑极体

智慧城市管理平台,多规合一平台搭建解决方案

t13823115967

智慧城市

万字庖解区块链跨链技术

CECBC

区块链

Java架构速成笔记:五大专题,1345页考点 看完直接收获腾讯、京东、滴滴offer

比伯

Java 编程 架构 面试 计算机

架构师训练营第 13 周作业

netspecial

极客大学架构师训练营

架构训练营-week13-作业1

于成龙

架构训练营

科普:区块链中的公链和私链的有什么区别?

CECBC

公有链 私有链

谷歌华人工程师被捕:号称“全球能搭建万卡级算力平台的十人之一”,在国内两公司担任CTO、CEO_AI&大模型_凌敏_InfoQ精选文章