写点什么

谷歌华人工程师被捕:号称“全球能搭建万卡级算力平台的十人之一”,在国内两公司担任 CTO、CEO

  • 2024-03-08
    北京
  • 本文字数:2957 字

    阅读完需:约 10 分钟

大小:1.44M时长:08:23
谷歌华人工程师被捕:号称“全球能搭建万卡级算力平台的十人之一”,在国内两公司担任CTO、CEO

因涉嫌窃取谷歌 AI 商业机密,中国籍谷歌工程师在美被捕

 

据美国司法部网站信息,日前,美国联邦政府对华人工程师 Linwei Ding(又名 Leon Ding)提起四项商业机密盗窃罪名,指控其涉嫌意图从谷歌公司处窃取与 AI 技术相关的专有信息。3 月 5 日,Linwei Ding 在加利福尼亚州纽瓦克当地被捕。

 

如果罪名成立,Linwei Ding 将面临最高 10 年监禁及每项罪名最高 25 万美元(约 180 万元人民币)的罚款,联邦地区法院法官将在参考美国量刑指南及其他法律因素后做出判决。目前,联邦调查局与商务部正在联手调查此案。

 

起诉书显示,Linwei Ding 今年 38 岁,为中国公民、加利福尼亚州纽瓦克居民。根据公布的法庭文件,Linwei Ding 涉嫌窃取的技术涉及谷歌先进超级计算数据中心的构建模块,该数据中心专门用于支持大型 AI 模型训练和托管中的机器学习类工作负载。从起诉书看来,该大型 AI 模型能够理解细微的语言表达差别,属于能针对提示词、任务或查询生成智能响应的 AI 应用。

 

起诉书还描述了谷歌如何开发其专有硬件和软件,进而推动由其超级计算数据中心支持的机器学习过程。在硬件方面,谷歌采用了先进的计算机芯片,具备支撑机器学习并运行 AI 应用所需要的卓越处理能力。而在软件方面,谷歌部署有多层软件,起诉书将其称为“软件平台”,旨在有效协调机器学习工作负载。

 

例如,该软件平台的组件之一为集群管理系统(CMS),由其充当谷歌超级计算数据中心的“主脑”。CMS 负责为整个硬件基础设施进行任务组织、优先级排序和具体分配,从而确保各先进芯片能够以高效方式执行机器学习工作负载或托管 AI 应用程序。

 

美国司法部长 Garland 表示,“司法部不会容忍对 AI 乃至其他任何可能危及我们国家安全的先进技术实施盗窃。在本案中,我们指控被告在秘密为两家中国企业工作期间,窃取了谷歌的 AI 相关商业机密。我们将努力保护美国开发的敏感技术,避免这些技术落入错误的人手中。”

该工程师号称是“全球能搭建万卡级算力平台的十人之一”

 

起诉书提到,谷歌于 2019 年聘请 Linwei Ding 担任软件工程师,其工作职责包括开发谷歌超级计算数据中心内部署的软件。正式入职之后,Linwei Ding 获得了访问谷歌机密信息的权限,具体内容涉及硬件基础设施、软件平台及其所支持的 AI 模型与应用程序。

 

此外,起诉书还指控 Linwei Ding 秘密与两家中国科技企业有所关联。从内容来看,Linwei Ding 曾在 2022 年 6 月 13 日左右收到来自中国某早期科技公司 CEO 的几封电子邮件,其中提到 Linwei Ding 已被任命为该公司首席技术官。据称 Linwei Ding 于 2022 年 10 月 29 日回到中国,并逗留至 2023 年 3 月 25 日。在此期间他参加了为新公司筹集资金的投资者会议。起诉书提到,各准投资方被告知 Linwei Ding 担任新公司首席技术官,而且掌握着公司 20%的股权。

 

起诉书同时指出,在谷歌不知情的前提下,Linwei Ding 于 2023 年 5 月 30 日前创立了自己的 AI 与机器学习科技企业,并担任公司 CEO。Linwei Ding 的这家公司宣称将开发一套软件平台,旨在加快机器学习类工作负载的运行速度,包括大型 AI 模型的训练速度。根据起诉书所言,Linwei Ding 曾申请中国的初创企业孵化计划,并于 2023 年 11 月 24 日前往北京,在投资者会议上介绍了这家企业。而且与 Linwei Ding 初创公司相关的一份文件也提到,“我们拥有谷歌万卡级算力平台的管理经验;只需照搬并加以升级,就能进一步开发出适合中国国情的算力平台。”

 

起诉书强调,Linwei Ding 的行为违反了雇佣协议以及其在入职谷歌时签署的单独行为准则。此外,起诉书也解释了 Linwei Ding 为隐瞒其商业机密窃取行为而采取的措施。

 

例如,Linwei Ding 疑似将谷歌源文件中的数据复制到公司配发给他的 MacBook 笔记本上的 Apple Notes 应用程序当中。随后,Linwei Ding 将 Apple Notes 转换为 PDF 文件,又将其通过谷歌网络上传至独立账户。据称 Linwei Ding 避开了谷歌数据丢失防护系统的检测。此外,起诉书还描述了 Linwei Ding 在 2023 年 12 月如何把自己的工牌出借给另一位谷歌员工,使其顺利打卡并进入谷歌办公大楼。打卡记录显示 Linwei Ding 似乎仍在出入办公地点,但他当时实际上人在中国。

 

美国司法部国家安全部门助理总检察长 Matthew G. Olsen 表示,“Linwei Ding 涉嫌策划从谷歌处窃取顶尖 AI 技术,同时与中方竞争企业秘密接触并接洽业务。”美国检察官 Ismail Ramsey 提到,“Linwei Ding 在谷歌担任软件工程师期间,曾秘密为个人及两家位于中国的企业谋取利益。通过窃取谷歌关于 AI 超级计算系统的商业机密,Linwei Ding 为他本人及归其名下的两家中国公司带来不公平的竞争优势。”

 

根据国内社交媒体上挖掘的信息,Linwei Ding 极有可能是融数联智 CTO、至算科技 CEO 丁林葳。

 




根据介绍,丁林葳毕业于美国南加州大学,曾任谷歌主任工程师/异构计算研发负责人,是全世界能搭建万卡级算力平台的十人之一。领导 GPU 和 TPU 等加速器的系统设计和开发,以及 Pathways 和 Jax 的系统框架的开发。其团队开发了所有云服务的加速器系统,以及基于超级计算机来研发 LLM 大规模语言模型。丁林葳曾在谷歌搭建的万卡级算力平台,正在被 Google Research、 Anthropic、DeepMind 和 OPEN AI 所使用。

 

丁林葳任职的两家公司中,融数联智成立于 2019 年,专精于隐私计算,公司拥有自主研发的隐私保护芯片、多方安全计算软件系统、AI 联邦学习平台、可信计算 TEE 以及隐私计算一体机,为客户构建合法高效的数据协同链提供技术保障,助力数据在机构之间“可用不可见”的流通和融合应用,保障数据合作和数据流通的全链条安全,为数据要素发挥价值提供技术驱动。

 

至算科技是国内唯一最早推出单任务万卡级的大算力 AI 训练推理加速算力平台的公司,从底层系统上解决“国内做不了 50B 以上大模型”的痛点。信息显示,该项目创始人(丁林葳)曾在谷歌带队做出的 6 万卡 TPU、2.6 万 GPU 万卡级算力平台。本项目支持的算力规模可达单任务万卡,支持大模型训练时长从月级可降至小时级。

将谷歌技术机密上传至谷歌网盘,网友:事情绝不简单

 

起诉书提到,2022 年 5 月 21 日,Linwei Ding 开始将机密信息复制至个人 Google Cloud 账户,秘密上传保存在谷歌网络内部的商业机密。之后 Linwei Ding 持续定期上传,直到 2023 年 5 月 2 日,期间 Linwei Ding 共上传了 500 多个包含机密信息的独立文件。

 

美国司法部副部长 Lisa Monaco 表示,“在我们努力以负责任的方式发挥 AI 积极价值的同时,司法部也对其风险保持着高度警惕,包括可能对我们国家安全造成的全面威胁。从今天的指控来看,被告从谷歌公司处窃取到 500 多个包含 AI 商业机密的保密文件,同时也秘密在为希望取得 AI 技术竞赛领先优势的中国企业工作。司法部将不懈追查那些将颠覆性技术成果(特别是 AI)非法传出境外的人,并追究其责任。”

 

有网友质疑,“将谷歌技术机密上传至谷歌网盘”这一操作并不符合“窃密思维”,反而更像是正常的日常工作。有网友评论称,“不离职就只是工作,离职就是窃密”,也有网友将其归类于“阴谋论”:“内部技术人才辞工,不能把人才流去其他地方公司,然后找点所谓的证据,只有坐牢了就不会把前公司的技术泄露出去了”。

 

目前,关于该案只有美国司法部一面之词,当事人还未回应。值得一提的是,起诉书本身仅为涉案指控,被告在被法庭证明有罪之前,面临的一切指控均遵循疑罪从无原则。

 

参考链接:

https://www.justice.gov/opa/pr/chinese-national-residing-california-arrested-theft-artificial-intelligence-related-trade

2024-03-08 14:269076

评论

发布
暂无评论
发现更多内容

浏览器辅助神器:油猴脚本使用教程

源字节1号

前端开发 后端开发 技术分享 网站开发

Kafka Kraft核心实现

Clarke

训练营作业-Module_1

Jadedev

架构实战营

黄金排障场景之Coredump

焦振清

稳定性 稳定性治理 coredump 故障复盘 90-2-5-10

加密项目必修科目:代币经济学

CECBC

#JiraHero:Soumen Deb——重塑 Jira Software 中的 Bug 工作流,提高可见性、简化开发流程

Atlassian

DevOps 敏捷 工作流 Atlassian Jira

NFT数字藏品NFT交易系统平台开发

薇電13242772558

NFT

【架构学习06】——拆分电商系统为微服务

tiger

架构实战营

企业级低代码服务编排库 - Commander

Meta-Soft

服务编排 低代码平台 服务组合

微服务架构趋势下如何处理存量系统

Meta-Soft

微服务 servicemesh 边车模式

3分钟带你搞懂Vue双向绑定原理及问题剖析

Bug终结者

CSS JavaScript vue.js

测试开发【Mock平台】03 基础:初识Antd React 开箱即用中台前端框架

MegaQi

React 测试平台开发教程 测试干货

一个编译问题带你了解 Flutter Web 的打包构建和分包实现

CRMEB

数字经济的重要基石——数据安全

CECBC

写作一

ASCE

并发与多线程之线程安全篇

Linux服务器开发

线程 多线程 并发 后端开发 Linux后台开发

架构师作业1

小虾米

Mysql的explain,你真的会用吗?

慕枫技术笔记

数据库 3月月更

高并发场景下优化加锁方式:线程等待与通知机制

华为云开发者联盟

线程 高并发 死锁 加锁 互斥锁

Altium Designer

謓泽

3月月更

模拟小程序电商的微服务拆分

AragornYang

架构训练营 架构实战营

该怎么认识数字藏品

CECBC

特性更新!DistSQL 集群治理能力详解

SphereEx

Apache 数据库 ShardingSphere SphereEx

不想业务被中断?快来解锁华为云RDS for MySQL新特性

华为云开发者联盟

MySQL 事务 华为云RDS for MySQL 应用无损透明 业务中断

模块一:作业

本人法海

「架构实战营」

运维自动化发展的4个阶段

穿过生命散发芬芳

3月月更

C语言总结_格式化打印函数、字符串、运算符

DS小龙哥

3月月更

Mac 和 Windows 共享一套鼠标键盘

TroyLiu

效率 Mac windows sharemouse 共享键鼠

Prometheus搭乘华为云GaussDB(for Influx):让监控数据更安全

华为云开发者联盟

安全 Prometheus 华为云 GaussDB(for Influx) 监控数据

手绘流程图讲解spark是如何实现集群的高可用

华为云开发者联盟

spark 高可用 集群 Worker master

谷歌华人工程师被捕:号称“全球能搭建万卡级算力平台的十人之一”,在国内两公司担任CTO、CEO_AI&大模型_凌敏_InfoQ精选文章