写点什么

44.7 GB !遭前雇员“叛变”,俄版百度 Yandex 几乎所有源代码泄露

  • 2023-01-29
    北京
  • 本文字数:1304 字

    阅读完需:约 4 分钟

44.7 GB !遭前雇员“叛变”,俄版百度Yandex几乎所有源代码泄露

1 月 28 日,据外媒报道,俄罗斯最大的 IT 科技公司之一 Yandex 发生了源代码泄露事故。

Yandex 几乎所有源代码泄露


据称,一名前雇员泄露了 Yandex 的源代码存储库,其中泄露了 Yandex 在其搜索算法中使用的 1,922 个排名因素。


目前,被泄露的 Yandex 源代码存储库已在一个流行的黑客论坛上以 BT 种子的形式泄露。


1 月 26 日,泄密者发布了一个磁力链接,声称这是““Yandex git sources”,其中包含 2022 年 7 月从公司窃取的 44.7 GB 文件。据称,这些代码存储库包含公司除反垃圾邮件规则之外的所有源代码。


软件工程师 Arseniy Shestakov 分析了泄露的 Yandex Git 存储库 ,并表示其中包含有关以下产品的技术数据和代码:


  • Yandex search engine and indexing bot

  • Yandex Maps

  • Alice (AI assistant)

  • Yandex Taxi

  • Yandex Direct (ads service)

  • Yandex Mail

  • Yandex Disk (cloud storage service)

  • Yandex Market

  • Yandex Travel (travel booking platform)

  • Yandex360 (workspaces service)

  • Yandex Cloud

  • Yandex Pay (payment processing service)

  • Yandex Metrika (internet analytics)Shestakov 还在 GitHub 上分享了 泄露文件的目录列表, 供那些想查看哪些源代码被盗的人使用。“至少有一些 API 密钥,但它们可能仅用于测试部署,”Shestakov 谈到泄露的数据时说。

Yandex 否认黑客入侵,将源代码泄露归咎于前员工

在给Bleeping Computer 的一份声明中,Yandex 表示他们的系统没有被黑客入侵,一名前雇员泄露了源代码存储库。


“Yandex 没有被黑。我们的安全服务从公共领域的内部存储库中发现了代码片段,但内容与 Yandex 服务中使用的存储库的当前版本不同。


存储库是用于存储和使用代码的工具。大多数公司在内部通过这种方式使用代码。代码仓库的作用是处理代码,而非存储个人用户数据。我们正在对向公众发布源代码片段的原因进行内部调查,但我们没有发现对用户数据或平台性能有任何威胁。”- Yandex。

增加黑客暴露风险

Yandex 前高级系统管理员、开发副主管兼传播技术总监Grigory Bakunov向 BleepingComputer 评论此次泄密事件表示 ,他对泄露的代码非常熟悉,他曾在 2002 年至 2019 年期间在这家科技巨头工作。


Bakunov认为,数据泄露的动机是政治性的,导致数据泄露的“流氓” Yandex 员工并未试图将代码出售给竞争对手。


这位前高管补充说,泄露不包含任何客户数据,因此不会对 Yandex 用户的隐私或安全构成直接风险,也不会直接威胁和泄露专有技术。


“Yandex 使用名为‘Arcadia’的单一存储结构,但并非公司的所有服务都使用它。此外,即使只是构建服务,也需要大量内部工具和专业知识,因为标准构建程序并不适用。泄露的存储库仅包含代码;另一个重要部分是数据。神经网络的模型权重等关键部分都没有,所以几乎没有用。尽管如此,仍有许多‘有趣’的文件,其名称如“blacklist.txt”可能会暴露正在运行的服务。”


不过 Bakunov 也提醒,泄露的代码使黑客有可能识别安全漏洞并实施有针对性的漏洞利用活动。现在,这只是时间问题。


这位前高管还评论了 Yandex 的声明,称泄露的代码可能与公司工作服务中使用的当前代码不相同,但相似度可能高达 90%。因此,对泄露代码开展全面检查后,恶意黑客很可能会从 Yandex 系统中发现可供利用的缺口。

2023-01-29 17:266520
用户头像
刘燕 InfoQ高级技术编辑

发布了 1112 篇内容, 共 595.1 次阅读, 收获喜欢 1981 次。

关注

评论 2 条评论

发布
用户头像
嗯,前员工偷的不能算偷
2023-01-30 10:35 · 江苏
回复
用户头像
震惊,吃瓜
2023-01-30 08:18 · 浙江
回复
没有更多了
发现更多内容

开发动态 | StoneDB 2022年版本发布里程碑

StoneDB

云原生 #数据库 大数据 开源 #开源

你离「TDengine 开发者大会」只差一条 SQL 语句!

TDengine

tdengine 开源 时序数据库

IP地址分类及范围

郑州埃文科技

IP地址 IP地址分类 IP地址范围

深入理解完美哈希

C++后台开发

hash 后端开发 C++后台开发 哈希函数 C++开发

带你认识8个软件设计中的谬误

华为云开发者联盟

后端 分层架构 开发

运行时,物体移动旋转缩放插件,“RuntimeTransformGizmos插件”使用教程(Unity3D)

恬静的小魔龙

游戏开发 Unity 插件 虚拟仿真 游戏引擎

2022年中国第三方支付市场专题分析

易观分析

第三方支付

26岁从计算机视觉界“黄埔军校”博士毕业,他想为车打造一双慧眼

华为云开发者联盟

人工智能 计算机视觉 天才少年 激光感知

数字化转型失败的罪魁祸首是什么?

雨果

数字化转型 DaaS数据即服务

用Unity做仿真,这款图表插件我不允许你不知道

恬静的小魔龙

Unity

想要制作沙盒游戏?那么这一款插件你一定不能错过(Unity3D)

恬静的小魔龙

Unity

同城订单同城送,爆单依旧得心应手!

CRMEB

还在被电影中吧爆炸的画面震撼?那你一定不要错过这款Unity的爆炸插件

恬静的小魔龙

Unity

EMQ映云科技荣登《中国企业家》2022年度“新锐100”榜单

EMQ映云科技

开源 物联网 IoT emq 7月月更

浅谈负载

Damon

7月月更

易观分析《2022年中国数据安全市场数据监测报告》正式启动

易观分析

技术

数字藏品系统开发——商城盲盒h5平台搭建

开源直播系统源码

数字藏品 数字藏品系统软件开发 NFT数字藏品系统 数字藏品源码出售 数字藏品交易平台开发

hive数据导入:Python脚本

怀瑾握瑜的嘉与嘉

Python hive 7月月更

这次和GrowingIO工程师一起搞事情 | StartDT Hackathon

奇点云

饿了么为啥给你推荐这个?本地生活搜索算法解密

阿里技术

算法 性能提升

同构+跨端,懂得小程序+kbone+小程序容器就够了!

Geek_99967b

小程序容器

tsconfig.json在配置文件中找不到任何输入,怎么办?

华为云开发者联盟

JavaScript 前端

void 0 有什么意义?undefined竟然是可变的?

南极一块修炼千年的大冰块

7月月更

还在用Unity开发游戏?那你就out了,试试用Unity做一个答题系统吧

恬静的小魔龙

Unity

还在用 ListView?使用 AnimatedList 让列表元素动起来

岛上码农

flutter ios 安卓开发 跨平台开发 7月月更

移动研发平台EMAS 3.0全新升级,欢迎登陆阿里云官网搜索EMAS进行体验

移动研发平台EMAS

阿里云 emas 移动测试 移动研发 产品架构

Spirng之Annotation注解与AOP使用

echoes

个人实战经验:数据建模 “账户数据是属于维度还是账户域 ”

金松(李博源)

数据仓库 数据建模 数据中台场景实践

融云超级群的「新能力」

融云 RongCloud

ios Android;

膜拜~ 终于拿到了美团老大哥分享的 Netty 源码剖析与应用 PDF

程序知音

Java 程序员 架构 Netty 后端技术

2022年中国人工智能产业生态图谱

易观分析

人工智能

44.7 GB !遭前雇员“叛变”,俄版百度Yandex几乎所有源代码泄露_AI&大模型_刘燕_InfoQ精选文章