写点什么

PyTorch-Nightly 受到供应链攻击,导致数据和文件泄露

  • 2023-02-10
    北京
  • 本文字数:932 字

    阅读完需:约 3 分钟

PyTorch-Nightly受到供应链攻击,导致数据和文件泄露

 PyTorch维护者表示,建议在 2022 年 12 月 25 日至 12 月 30 日期间安装了 PyTorch 夜间构建的开发人员卸载它并清除 pip 缓存,以摆脱恶意包。新的攻击凸显了最近的一个趋势。

 

供应链攻击源自一个恶意依赖项。该依赖项被推送到了 PyPi,它与 PyTorch 夜间构建附带的依赖项同名。

 

由于 PyPI 是索引优先的,所以安装的是这个恶意包,而不是官方存储库中的版本。这种设计允许用户注册与第三方索引中存在重名的包,pip 将默认安装他们的版本。

 

该恶意包名为 torchtriton,包含一个二进制文件,除了窃取主机名、DNS 配置、用户名、shell 环境等系统信息外,还会将/etc/hosts/etc/passwords~/.gitconfig~ /.ssh /*的内容,以及在用户主目录中找到的前 1000 个文件上传到外部服务器。不过,只有当用户显式地将triton包导入到他们的程序中时,信息才会被泄露,这降低了此次攻击的影响。

 

这种被称为依赖混淆的供应链攻击方案并不新颖。在接受 InfoQ 采访时,Endor Labs 安全研究员 Henrik Plate 解释说,这种攻击“与我们在过去两年中看到的次世代攻击类型一致”,攻击者的重点是操纵维护者和用户,而不是设法利用漏洞。

 

在官方披露后,torchtriton 的所谓维护者在他们的网站上宣称,这个包不是恶意的。对此,Ax Sharma 首先在 Twitter 上做了报道。不过,在分析Bleeping Computer 的攻击时,Sharma 还透露,torchtriton 使用了反虚拟机技术以及混淆来逃避检测。

 

这也不是第一次有黑客声称他们的行为应算是伦理研究,就像他们被抓到窃取机密一样。

 

根据 Plate 的说法,依赖项混淆攻击可以使用私有存储库来托管内部包和镜像外部包来解决。Python 生态系统有一个这样的解决方案是devpi,但它并不简单。

 

通常,这样的解决方案允许对依赖项解析和包下载过程进行更多的控制。但是,它们的设置和操作需要付出不小的努力,并且只有在开发人员本地客户端配置正确时,它们才有效。

 

PyTorch 维护者立即采取行动,删除作为依赖项的 torchtriton,替换为pytorch-triton,并在 PyPi 上注册了一个假包,以确保这种情况不会再发生。

 

原文链接:

https://www.infoq.com/news/2023/01/pytorch-supply-chain-attack/


相关阅读:

里程碑!PyTorch 正式加入 Linux 基金会,社区治理这一核心将不会改变

深度学习为什么要选择 PyTorch

进击的 PyTorch,和它背后的开源领袖

2023-02-10 10:164890

评论

发布
暂无评论
发现更多内容

短短一年,是什么让移动AI颠覆想象?

脑极体

AI

spss是什么软件,SPSS主要用来做什么的 ? SPSS数据分析软件介绍 spss个人版和企业版区别

阿拉灯神丁

mac数据分析统计软件 spss数据统计 IBM SPSS Statistics中文 spss统计软件

时序数据库 TDengine × Power BI:高频数据也能秒级响应

TDengine

数据库 tdengine 时序数据库

MySQL派生表查询大数据量无结果问题分析与解决

GreatSQL

别划走!选择无代码平台的10个理由!

积木链小链

数字化转型 无代码 无代码平台

AI进行时,AlphaGPT引领法律服务新时代

科技汇

企业放弃TeamViewer转投贝锐向日葵企业版:性能价格向日葵均有优势

科技热闻

Selenium — Playwright 自动化测试框架

测试人

时序数据库 TDengine 通过麒麟全系列兼容性认证,稳了!

TDengine

数据库 tdengine 时序数据库

VKProxy新增速率限制功能

八苦-瞿昙

智慧园区系统(源码+文档+讲解+演示)

深圳亥时科技

从API测试看企业系统性落地AI的鸿沟

思码逸研发效能

研发效能 智能测试 API 测试 研发效能管理 思码逸

《HarmonyOSNext性能飞跃秘籍:响应优化0.1秒生死线必备指南》

Turing_010

项目管理利器:甘特图的全面解析与应用指南

敏捷开发

甘特图 #项目管理

利用 Amazon Bedrock 构建高效 SEO 内容生成系统:从流量挖掘到智能创作

亚马逊云科技 (Amazon Web Services)

时序数据库 TDengine x Kepware:解决你最头疼的“设备接入”问题

TDengine

数据库 tdengine 时序数据库

如何测试DNS解析状态是否正常?

国科云

跨境卖家必看!2025年1688API新功能解锁全球供应链

tbapi

1688商品详情接口 1688商品列表接口 1688API 1688寻源通API

《HarmonyOSNext教育应用性能飞跃:ArkTS长列表优化5大实战指南》

Turing_010

黑龙江腾讯云:科技赋能,助力龙江新发展

等保测评

什么是数字化创新?数字化创新能给企业带来什么好处?

优秀

数字化 数字化创新 数字化赋能升级

大模型 RAG 进阶实战营 毕业总结

gigifrog

大数据-17 Flume 分布式日志收集 实时采集引擎 Source Channel Sink 串行复制负载均衡

武子康

大数据 hadoop flume

鸿蒙运动项目开发:封装超级好用的 RCP 网络库(下)—— 实战应用

王二蛋和他的张大花

ArkUI-X应用工程结构说明

龙儿筝

ArkUI-X平台桥接Bridge说明

龙儿筝

AI教育APP的开发

北京木奇移动技术有限公司

AI教育 软件外包公司 AI英语学习

二级等保

等保测评

合合信息发布业内首个AI Agent跨平台云资源智能管理终端

合合技术团队

人工智能 大数据 算法

Golang基础笔记二之字符串及其操作

Hunter熊

golang 字符串 字符串处理

时序数据库 TDengine 助力华锐 D5 平台实现“三连降”:查询快了,机器少了,成本也低了

TDengine

数据库 tdengine 时序数据库

PyTorch-Nightly受到供应链攻击,导致数据和文件泄露_AI&大模型_Sergio De Simone_InfoQ精选文章