写点什么

PyTorch-Nightly 受到供应链攻击,导致数据和文件泄露

  • 2023-02-10
    北京
  • 本文字数:932 字

    阅读完需:约 3 分钟

PyTorch-Nightly受到供应链攻击,导致数据和文件泄露

 PyTorch维护者表示,建议在 2022 年 12 月 25 日至 12 月 30 日期间安装了 PyTorch 夜间构建的开发人员卸载它并清除 pip 缓存,以摆脱恶意包。新的攻击凸显了最近的一个趋势。

 

供应链攻击源自一个恶意依赖项。该依赖项被推送到了 PyPi,它与 PyTorch 夜间构建附带的依赖项同名。

 

由于 PyPI 是索引优先的,所以安装的是这个恶意包,而不是官方存储库中的版本。这种设计允许用户注册与第三方索引中存在重名的包,pip 将默认安装他们的版本。

 

该恶意包名为 torchtriton,包含一个二进制文件,除了窃取主机名、DNS 配置、用户名、shell 环境等系统信息外,还会将/etc/hosts/etc/passwords~/.gitconfig~ /.ssh /*的内容,以及在用户主目录中找到的前 1000 个文件上传到外部服务器。不过,只有当用户显式地将triton包导入到他们的程序中时,信息才会被泄露,这降低了此次攻击的影响。

 

这种被称为依赖混淆的供应链攻击方案并不新颖。在接受 InfoQ 采访时,Endor Labs 安全研究员 Henrik Plate 解释说,这种攻击“与我们在过去两年中看到的次世代攻击类型一致”,攻击者的重点是操纵维护者和用户,而不是设法利用漏洞。

 

在官方披露后,torchtriton 的所谓维护者在他们的网站上宣称,这个包不是恶意的。对此,Ax Sharma 首先在 Twitter 上做了报道。不过,在分析Bleeping Computer 的攻击时,Sharma 还透露,torchtriton 使用了反虚拟机技术以及混淆来逃避检测。

 

这也不是第一次有黑客声称他们的行为应算是伦理研究,就像他们被抓到窃取机密一样。

 

根据 Plate 的说法,依赖项混淆攻击可以使用私有存储库来托管内部包和镜像外部包来解决。Python 生态系统有一个这样的解决方案是devpi,但它并不简单。

 

通常,这样的解决方案允许对依赖项解析和包下载过程进行更多的控制。但是,它们的设置和操作需要付出不小的努力,并且只有在开发人员本地客户端配置正确时,它们才有效。

 

PyTorch 维护者立即采取行动,删除作为依赖项的 torchtriton,替换为pytorch-triton,并在 PyPi 上注册了一个假包,以确保这种情况不会再发生。

 

原文链接:

https://www.infoq.com/news/2023/01/pytorch-supply-chain-attack/


相关阅读:

里程碑!PyTorch 正式加入 Linux 基金会,社区治理这一核心将不会改变

深度学习为什么要选择 PyTorch

进击的 PyTorch,和它背后的开源领袖

2023-02-10 10:164921

评论

发布
暂无评论
发现更多内容

畅直播|针对直播痛点的关键技术解析

ZEGO即构

直播体验升级 首帧秒开

牛客java选择题每日打卡Day1

京与旧铺

6月月更

Volcano成Spark默认batch调度器

华为云开发者联盟

云计算 数据分析 后端

共享洗车机多少钱一台?看品牌

共享电单车厂家

自助洗车机价格 自助洗车加盟 共享洗车机多少钱

面试官:你说你精通Redis,你看过持久化的配置吗?

阿Q说代码

redis aof rdb 数据持久化

如何化解35岁危机?华为云数据库首席架构师20年技术经验分享

华为云开发者联盟

中年危机 经验分享 华为云

openGauss内核:简单查询的执行

华为云开发者联盟

数据库 互联网 华为云

建木持续集成平台v2.5.0发布

Jianmu

开源 DevOps CI/CD Worker 建木CI

Datakit 代理实现局域网数据统一汇聚

观测云

心楼:华为运动健康的七年筑造之旅

脑极体

架构实战营 第 6 期 毕业设计

火钳刘明

#架构实战营 「架构实战营」

主数据建设的背景

奔向架构师

数据仓库 主数据 6月月更

Guava中这些Map的骚操作,让我的代码量减少了50%

码农参上

JAVA开发 Guava java工具包

《各行业零代码企业应用案例集锦》正式发布

明道云

优酷 Android 包瘦身治理思路全解

阿里巴巴文娱技术

治理 包大小

即构「畅直播」上线!提供全链路升级的一站式直播服务

ZEGO即构

一文理解OpenStack网络

华为云开发者联盟

后端 网络

TDengine可通过数据同步工具 DataX读写

TDengine

数据库 tdengine 时序数据库 DataX

Redis+Caffeine两级缓存,让访问速度纵享丝滑

码农参上

redis 缓存 JAVA开发 Caffeine

如何做到全彩户外LED显示屏节能环保

Dylan

LED显示屏 全彩LED显示屏 户外LED显示屏

为什么生命科学企业都在陆续上云?

阿里云弹性计算

HPC 高性能计算 生命科学 基因测序

在shiro基础上整合jwt,可在项目中直接使用呦

阿Q说代码

springboot Java EE 权限验证 shiro整合jwt

架构实战营 第 6 期 毕业总结

火钳刘明

海泰前沿技术|隐私计算技术在医疗数据保护中的应用

电子信息发烧客

车白兔:洗车新模式共享自助洗车

共享电单车厂家

自助洗车 自助洗车加盟 车白兔洗车

应用实践 | 海量数据,秒级分析!Flink+Doris 构建实时数仓方案

SelectDB

数据库 flink 数据分析 Doris 数仓

AntDB数据库在线培训开课啦!更灵活、更专业、更丰富

亚信AntDB数据库

数据库 AntDB 培训学习 数据库·

XTransfer技术新人进阶秘诀:不可错过的宝藏Mentor

XTransfer技术

职场新人 职场经验

升哲科技 AI 智能防溺水服务上线

SENSORO

大数据 AI 物联网

我国SaaS产业的发展趋势与路径

小炮

如何抓手机的包进行分析,Fiddler神器或许能帮到您!

wljslmz

抓包 fiddler 6月月更

PyTorch-Nightly受到供应链攻击,导致数据和文件泄露_AI&大模型_Sergio De Simone_InfoQ精选文章