PyTorch陷抄袭质疑,Facebook再被指控窃取算法,挖角挖出麻烦事

2020 年 3 月 12 日

PyTorch陷抄袭质疑,Facebook再被指控窃取算法,挖角挖出麻烦事

官司缠身的 Facebook 又摊上了一件麻烦事。


Facebook 被控窃取算法


近日,创业公司 Neural Magic 一纸诉状将 Facebook 告上了法庭,Neural Magic 指控 Facebook 窃取并公开属于自己的核心算法机密和知识产权,该算法主要用于加速硬件的使用,目前它已成为PyTorch的一部分和关键技术。


有人猜测,这一关键技术可能是 Facebook 的深度学习编译器 Glow。


起诉书信息显示,Neural Magic 是一家创立于 2017 年的小型 AI 算法初创公司,创始人是两位来自麻省理工学院的教授,MIT 电气工程与计算机科学系教授 Nir Shavit 和 MIT 计算机科学与人工智能实验室的研究科学家 Alex Matveev。


这家公司的核心技术是一种被称作“神经魔术”的技术,“神经魔术算法”是神经魔术技术的核心。据了解,神经魔术算法能够使某些类型的神经网络高效运行,工程师可以不通过 GPU 等专用芯片来处理深度学习的计算问题。该算法可降低在医学、网络经济和人工智能领域的硬件成本。


这并不是 Facebook 第一次面临窃取算法的指控。


2019 年 6 月,一家立陶宛的数据公司起诉 Facebook 使用窃取的 3D 对象数据库来训练 AI 项目。这是一个由门、窗、桌子、椅子等家具的 3D 数据组成的 SUNCG 数据集,Facebook 利用它来训练机器人识别三维空间。


Facebook 所用的 SUNCG 数据集并不由它直接窃取而来,始作俑者是普林斯顿大学。普林斯顿大学的人员通过编写代码从 Planner5D 网站上非法下载了 100 多万个数字化对象。Facebook 在未经允许的情况下擅自使用了这些数据集。最终 Facebook 被起诉侵犯商业机密法和版权法,SUNCG 数据集也被禁止使用。


PyTorch 编译器核心算法是员工“偷”来的?


这是一桩由前员工跳槽引发侵犯商业秘密的纠纷案。


与 Facebook 一同被推上被告席的还有 Facebook 的一名技术人员—Aleksandar Zlateski。


Zlateski 是第一位加入 Neural Magic 的员工,在该公司担任技术总监职位时,Zlateski 深受团队信任,其年薪为 16.5 万美元,并享有公司期权。


工作期间,凭借技术总监的身份,Zlateski 可以接触到神经魔术技术的所有商业秘密、专有信息和未来的商业计划。非常关键的一点是,Zlatesk 还接触到了开发神经魔术的核心软件,其源代码封装了神经魔术算法的编译器。


2019 年 7 月,在工作了一年半后,Zlateski 通知 Neural Magic,他在 Facebook 获得了一个新职位,并保证接下来从事的技术工作与在 Neural Magic 的工作无关。考虑到岗位性质差异,Neural Magic 觉得 Zlateski 没有违反竞业协议,只在他离开时提醒他要对神经魔术算法的专业信息保密。


半年之后,Facebook 宣布在 GitHub 上开源PyTorch。但令 Neural Magic 没想到的是,PyTorch 中包含了构成核心神经魔术专有算法的技术和知识产权,该技术本质上是 Neural Magic 的核心算法。


诉讼文件中,Neural Magic 还提到了一个“实锤”细节,Facebook 曾在 2019 年 12 月的一次会议上,公开感谢 Zlateski ,高度称赞他在解决稀疏内核和统一代码缓存方面做出了重大贡献。


2020 年 1 月 18 日,来自 Facebook 员工的一篇 LinkedIn 帖子让 Neural Magic 的 Matveev 博士意识到,Facebook 和 Zlateski 已经盗用了神经魔术算法。随后,Neural Magic 审查了 Facebook 发布的开放源代码后确认,Zlateski 盗用了神经魔术算法,并把它们给了 Facebook。


发现被侵权后,Neural Magic 书面要求 Facebook 删除 Github 上有关侵权的部分,但被 Facebook 拒绝了。


多番交涉无果,Neural Magic 决定以法律的形式维护自己的合法权益,它认为,Facebook 的行为违反了马萨诸塞州的《商业秘密法》。Zlateski 违反了他在公司任职时所签署的保密和竞业禁止协议,Neural Magic 要求获得三倍的实际损害赔偿,并要求 Facebook 删除代码,停止进一步使用 Neural Magic 的专有机密信息。


目前,Facebook 尚未对该指控做出回应。PyTorch 是当下最主流的机器学习框架之一,在学界和工业界都有着广泛的运用,如果后续该案判定侵权事实成立,PyTorch 的发展史上无疑将蒙上一层抄袭的阴影。


参考链接:


https://www.docketalarm.com/cases/Massachusetts_District_Court/1–20-cv-10444/Neural_Magic_Inc._v._Facebook_Inc._et_al/1/


https://github.com/pytorch/FBGEMM


2020 年 3 月 12 日 15:281749
用户头像
刘燕 InfoQ记者

发布了 470 篇内容, 共 146.9 次阅读, 收获喜欢 829 次。

关注

评论

发布
暂无评论
发现更多内容

架构师训练营1期第1周:架构方法 - 作业

piercebn

极客大学架构师训练营

mysql union子句排序问题

LSJ

开发 SQL语法

实战中学习浏览器工作原理 — HTML 解析与 CSS 计算

三钻

CSS 前端 浏览器

UML图

饺子

食堂就餐卡系统设计

熊桂平

系统设计 极客大学架构师训练营 UML

整合Micrometer与Prometheus & ElasticSearch

李欢颜

[Go] 设置各种选项的最佳套路

eddix

go 设计模式

优选2020第十三届南京国际智慧停车展览会

InfoQ_caf7dbb9aa8a

英特尔揭示智能边缘重大机遇,助推产业智能变革

intel001

简直人生外挂,直接涨薪20K,跪谢这份性能调优实战指南

小Q

Java MySQL 架构 JVM 性能调优

抓住这些BUG程序员进大厂也就这回事,工作后2到3年进大厂操作指南

Java架构师迁哥

StringBuilder 比 String 快?空嘴白牙的,证据呢!

小傅哥

小傅哥 string 面试题 StringBuilder StringBuffer

领域模型的定义

Braisdom

Java 领域驱动设计 ObjectiveSql

谈谈力软快速开发平台B/S专业报表工具

Learun

小程序 敏捷开发 开发者工具 报表

2020南京国际工业互联网及工业通讯展览会

InfoQ_caf7dbb9aa8a

java安全编码指南之:堆污染Heap pollution

程序那些事

Java java安全编码 java安全编码指南 堆污染

听说你想进腾讯总部?这项黑科技你值得拥有!

腾讯云视频云

音视频

架构师技术栈

elfkingw

架构师训练营1期 - 第一周 - 食堂就餐卡系统设计

三板斧

极客大学架构师训练营

zabbix 4.x一键部署脚本

edd

Vitalik Buterin: 协作的好坏两面

安比实验室SECBIT

区块链 博弈论 协作

大咖布道丨证券行业规模化敏捷和核心能力演进

华为云开发者社区

产品 证券 大咖

第一周学习架构方法总结

三板斧

亚洲2020第十三届南京国际智慧新零售暨无人售货展览会

InfoQ_caf7dbb9aa8a

架构师训练营第一周学习总结

尹斌

极客大学架构师训练营

【API进阶之路】做OCR文字识别,谁说必须要有AI工程师?

华为云开发者社区

API 文字识别 OCR

成为技术领导者-读书笔记

edd

非传统的“易观”,和他的技术驱动之路

易观大数据

Golang领域模型-依赖倒置

奔奔奔跑

golang 架构 微服务 领域驱动设计 DDD

Servlet 知识点

陈靓-哲露

第一周学习总结

饺子

PyTorch陷抄袭质疑,Facebook再被指控窃取算法,挖角挖出麻烦事-InfoQ