写点什么

PyTorch-Nightly 受到供应链攻击,导致数据和文件泄露

  • 2023-02-10
    北京
  • 本文字数:932 字

    阅读完需:约 3 分钟

PyTorch-Nightly受到供应链攻击,导致数据和文件泄露

 PyTorch维护者表示,建议在 2022 年 12 月 25 日至 12 月 30 日期间安装了 PyTorch 夜间构建的开发人员卸载它并清除 pip 缓存,以摆脱恶意包。新的攻击凸显了最近的一个趋势。

 

供应链攻击源自一个恶意依赖项。该依赖项被推送到了 PyPi,它与 PyTorch 夜间构建附带的依赖项同名。

 

由于 PyPI 是索引优先的,所以安装的是这个恶意包,而不是官方存储库中的版本。这种设计允许用户注册与第三方索引中存在重名的包,pip 将默认安装他们的版本。

 

该恶意包名为 torchtriton,包含一个二进制文件,除了窃取主机名、DNS 配置、用户名、shell 环境等系统信息外,还会将/etc/hosts/etc/passwords~/.gitconfig~ /.ssh /*的内容,以及在用户主目录中找到的前 1000 个文件上传到外部服务器。不过,只有当用户显式地将triton包导入到他们的程序中时,信息才会被泄露,这降低了此次攻击的影响。

 

这种被称为依赖混淆的供应链攻击方案并不新颖。在接受 InfoQ 采访时,Endor Labs 安全研究员 Henrik Plate 解释说,这种攻击“与我们在过去两年中看到的次世代攻击类型一致”,攻击者的重点是操纵维护者和用户,而不是设法利用漏洞。

 

在官方披露后,torchtriton 的所谓维护者在他们的网站上宣称,这个包不是恶意的。对此,Ax Sharma 首先在 Twitter 上做了报道。不过,在分析Bleeping Computer 的攻击时,Sharma 还透露,torchtriton 使用了反虚拟机技术以及混淆来逃避检测。

 

这也不是第一次有黑客声称他们的行为应算是伦理研究,就像他们被抓到窃取机密一样。

 

根据 Plate 的说法,依赖项混淆攻击可以使用私有存储库来托管内部包和镜像外部包来解决。Python 生态系统有一个这样的解决方案是devpi,但它并不简单。

 

通常,这样的解决方案允许对依赖项解析和包下载过程进行更多的控制。但是,它们的设置和操作需要付出不小的努力,并且只有在开发人员本地客户端配置正确时,它们才有效。

 

PyTorch 维护者立即采取行动,删除作为依赖项的 torchtriton,替换为pytorch-triton,并在 PyPi 上注册了一个假包,以确保这种情况不会再发生。

 

原文链接:

https://www.infoq.com/news/2023/01/pytorch-supply-chain-attack/


相关阅读:

里程碑!PyTorch 正式加入 Linux 基金会,社区治理这一核心将不会改变

深度学习为什么要选择 PyTorch

进击的 PyTorch,和它背后的开源领袖

2023-02-10 10:165148

评论

发布
暂无评论
发现更多内容

5G多输入多输出技术,到底是个啥东东?

华为云开发者联盟

5G 输入 输出

为什么阿里人能够快速成长?看完他们Java架构进化笔记,我秒懂!

Java架构追梦

Java 学习 架构 面试 成长笔记

Linux角度仰视Goroutine的GMP

ninetyhe

Java Linux 多线程与高并发 Go 语言

mongodb 源码实现系列 - command 命令处理模块源码实现二

gmoy-tencent

MySQL mongodb 分布式数据库 源码刨析 分布式数据库mongodb

告别“效率内卷化”,华为用一年时间让职场人支棱起来

脑极体

深入灵魂的考验,每行注释都是灵魂的单例模式,源码+实例降临

小Q

Java 学习 架构 面试 设计模式

深度学习在物理层信号处理中的应用研究

华为云开发者联盟

学习 模型 物理层

干货分享!用心满满:面试前必知必会的二分查找及其变种

比伯

Java 编程 架构 面试 计算机

研发管理:敏捷研发下周报的价值

云原生实验室

云原生 敏捷 研发管理 周报

架构探索:事务处理一

Dark

WebRTC SDP 详解和剖析

阿里云CloudImagine

阿里云 音视频 WebRTC 视频云 流媒体传输

揭秘 VMAF 视频质量评测标准

阿里云CloudImagine

视频 图像处理

《Web自动化》基础知识脑图

清菡软件测试

Web

构师训练营 - 第七周课后练习

joshuamai

鹅厂大佬亲身经历证明,一周上线百万级并发系统

Java架构师迁哥

架构师训练营第 1 期 第 11 周作业

李循律

极客大学架构师训练营

三分钟看懂快速开发,常用软件快速开发平台速览

Marilyn

敏捷开发 快速开发 企业开发 企业应用

理解Python协程的本质

Justfly

Python 协程 异步 Async 异步编程

王者级别的Java多线程技术笔记,我愿奉你为地表最强!

Java架构师迁哥

拆解增长黑客之实战(一):获客与激活

懒杨杨

增长 产品运营

全球熵ETV系统APP开发|全球熵ETV软件开发

系统开发

InfoQ 内容推荐位资源限时开放

乐白

InfoQ 资源

多活/多机房的几种实现方式与重点

Justfly

高可用 跨机房 数据同步 异地多活容灾

工商银行基于 Dubbo 构建金融微服务架构的实践-服务发现篇

阿里巴巴云原生

云原生 dubbo 中间件 案例分享 CloudNative

前端开发还可以这么玩?元数据实践分享

华为云开发者联盟

大前端 元数据 组件 ROMA 业务流

构师训练营 - 第七周学习总结

joshuamai

anyRTC 联合 vInClass 打造在线教育上课模式

anyRTC开发者

音视频 WebRTC 在线教育 RTC

CloudIDE插件开发实战:教你如何调试代码

华为云开发者联盟

ide 开发 Cloud

基于RTMP数据传输协议的实时流媒体技术研究(论文全文)

程序员小灰

音视频 ffmpeg 流媒体 RTMP webrtc、

流动性挖矿系统APP开发|流动性挖矿软件开发

系统开发

云原生架构:容器资源限制及资源可见性

云原生实验室

云原生

PyTorch-Nightly受到供应链攻击,导致数据和文件泄露_AI&大模型_Sergio De Simone_InfoQ精选文章