写点什么

44.7 GB !遭前雇员“叛变”,俄版百度 Yandex 几乎所有源代码泄露

  • 2023-01-29
    北京
  • 本文字数:1304 字

    阅读完需:约 4 分钟

44.7 GB !遭前雇员“叛变”,俄版百度Yandex几乎所有源代码泄露

1 月 28 日,据外媒报道,俄罗斯最大的 IT 科技公司之一 Yandex 发生了源代码泄露事故。

Yandex 几乎所有源代码泄露


据称,一名前雇员泄露了 Yandex 的源代码存储库,其中泄露了 Yandex 在其搜索算法中使用的 1,922 个排名因素。


目前,被泄露的 Yandex 源代码存储库已在一个流行的黑客论坛上以 BT 种子的形式泄露。


1 月 26 日,泄密者发布了一个磁力链接,声称这是““Yandex git sources”,其中包含 2022 年 7 月从公司窃取的 44.7 GB 文件。据称,这些代码存储库包含公司除反垃圾邮件规则之外的所有源代码。


软件工程师 Arseniy Shestakov 分析了泄露的 Yandex Git 存储库 ,并表示其中包含有关以下产品的技术数据和代码:


  • Yandex search engine and indexing bot

  • Yandex Maps

  • Alice (AI assistant)

  • Yandex Taxi

  • Yandex Direct (ads service)

  • Yandex Mail

  • Yandex Disk (cloud storage service)

  • Yandex Market

  • Yandex Travel (travel booking platform)

  • Yandex360 (workspaces service)

  • Yandex Cloud

  • Yandex Pay (payment processing service)

  • Yandex Metrika (internet analytics)Shestakov 还在 GitHub 上分享了 泄露文件的目录列表, 供那些想查看哪些源代码被盗的人使用。“至少有一些 API 密钥,但它们可能仅用于测试部署,”Shestakov 谈到泄露的数据时说。

Yandex 否认黑客入侵,将源代码泄露归咎于前员工

在给Bleeping Computer 的一份声明中,Yandex 表示他们的系统没有被黑客入侵,一名前雇员泄露了源代码存储库。


“Yandex 没有被黑。我们的安全服务从公共领域的内部存储库中发现了代码片段,但内容与 Yandex 服务中使用的存储库的当前版本不同。


存储库是用于存储和使用代码的工具。大多数公司在内部通过这种方式使用代码。代码仓库的作用是处理代码,而非存储个人用户数据。我们正在对向公众发布源代码片段的原因进行内部调查,但我们没有发现对用户数据或平台性能有任何威胁。”- Yandex。

增加黑客暴露风险

Yandex 前高级系统管理员、开发副主管兼传播技术总监Grigory Bakunov向 BleepingComputer 评论此次泄密事件表示 ,他对泄露的代码非常熟悉,他曾在 2002 年至 2019 年期间在这家科技巨头工作。


Bakunov认为,数据泄露的动机是政治性的,导致数据泄露的“流氓” Yandex 员工并未试图将代码出售给竞争对手。


这位前高管补充说,泄露不包含任何客户数据,因此不会对 Yandex 用户的隐私或安全构成直接风险,也不会直接威胁和泄露专有技术。


“Yandex 使用名为‘Arcadia’的单一存储结构,但并非公司的所有服务都使用它。此外,即使只是构建服务,也需要大量内部工具和专业知识,因为标准构建程序并不适用。泄露的存储库仅包含代码;另一个重要部分是数据。神经网络的模型权重等关键部分都没有,所以几乎没有用。尽管如此,仍有许多‘有趣’的文件,其名称如“blacklist.txt”可能会暴露正在运行的服务。”


不过 Bakunov 也提醒,泄露的代码使黑客有可能识别安全漏洞并实施有针对性的漏洞利用活动。现在,这只是时间问题。


这位前高管还评论了 Yandex 的声明,称泄露的代码可能与公司工作服务中使用的当前代码不相同,但相似度可能高达 90%。因此,对泄露代码开展全面检查后,恶意黑客很可能会从 Yandex 系统中发现可供利用的缺口。

2023-01-29 17:266246
用户头像
刘燕 InfoQ高级技术编辑

发布了 1112 篇内容, 共 560.0 次阅读, 收获喜欢 1978 次。

关注

评论 2 条评论

发布
用户头像
嗯,前员工偷的不能算偷
2023-01-30 10:35 · 江苏
回复
用户头像
震惊,吃瓜
2023-01-30 08:18 · 浙江
回复
没有更多了
发现更多内容

天翼云4.0创新成果发布!科技创新赋能安全普惠

天翼云开发者社区

微幕小程序,给市场一个新的想象空间

Geek_99967b

小程序容器 小程序开发

亚马逊AWS特约评委揭秘FinClip黑客松获胜秘诀

Geek_99967b

SaaS 小程序容器 小程序开发 小程序组件

天翼云成为“云优化能力提升计划”首批成员单位!

天翼云开发者社区

在星云科技,我们使用 Zadig 实现多环境并行发布,上千次周部署

Zadig

DevOps 云原生 CI/CD 软件交付

创业、女性、数字化:后COVID-19世界的复苏“铁三角”

脑极体

如何以极客的方式探索小程序容器技术

Geek_99967b

SaaS应用 小程序转app 跨端运行

10分钟,将微信小程序转换成App

Speedoooo

微信小程序 移动开发 小程序容器 小程序转app

我们为什么选择使用分布式持续交付新星 Zadig ?

Zadig

DevOps 云原生 CI/CD 软件交付

Apache SeaTunnel(Incubating)与计算引擎的解耦之道,重构API我们做了些什么

Apache SeaTunnel

Apache 大数据 开源 DolphinScheduler workflow

前端食堂技术周刊第 38 期:Remix v1.5.0、Babel v7.18.0、前端部署十五章、Tree Shaking 问题排查指南、一文搞懂前端技术发展

童欧巴

前端 Remix 前端部署

Markdown语法简介

工程师日月

markdown语法 5月月更

在KVM中运行苹果操作系统

lyan

在线火星文转简体中文工具

入门小站

工具

十、云原生网络架构

穿过生命散发芬芳

网络架构 5月月更

一文学完Linux常用命令

编程攻略

Linux

Java Core「3」volatile 关键字

Samson

学习笔记 5月月更 Java core

使用 Provider 实现 Flutter 不相关页面状态数据共享

岛上码农

flutter ios 安卓开发 跨平台开发 5月月更

使用postMessage对iframe进行跨域数据传输

空城机

iframe postMessage 5月月更

linux之tar使用技巧

入门小站

Linux

第一梯队,增速第一

天翼云开发者社区

在线HTML转YAML工具

入门小站

工具

分布式协议-Paxos

白裤

PAXOS paxos协议 Basic paxos 5月月更

英伟达周锡健:设计到数字营销的最后一公里

阿里云弹性计算

vr XR 视觉计算

Hoo研究院|区块链简报 20220523期

区块链前沿News

#区块链# Hoo 热点

【刷题第16天】数组中出现次数超过一半的数字

白日梦

5月月更

企业引流和留存,“App+小程序”是较优技术策略

Speedoooo

微信小程序 APP开发 小程序容器 小程序转app

混合办公首选轻薄本,华为MateBook的“三重变身”改变了什么?

脑极体

天翼云通过DCMM 4级认证

天翼云开发者社区

一起来体验小程序应用的独特魅力

Geek_99967b

SaaS应用 finclip 小程序容器

人人皆为开发者?不可错过的低代码发展新趋势

云智慧AIOps社区

大前端 低代码 数据可视化

44.7 GB !遭前雇员“叛变”,俄版百度Yandex几乎所有源代码泄露_AI&大模型_刘燕_InfoQ精选文章