写点什么

44.7 GB !遭前雇员“叛变”,俄版百度 Yandex 几乎所有源代码泄露

  • 2023-01-29
    北京
  • 本文字数:1304 字

    阅读完需:约 4 分钟

44.7 GB !遭前雇员“叛变”,俄版百度Yandex几乎所有源代码泄露

1 月 28 日,据外媒报道,俄罗斯最大的 IT 科技公司之一 Yandex 发生了源代码泄露事故。

Yandex 几乎所有源代码泄露


据称,一名前雇员泄露了 Yandex 的源代码存储库,其中泄露了 Yandex 在其搜索算法中使用的 1,922 个排名因素。


目前,被泄露的 Yandex 源代码存储库已在一个流行的黑客论坛上以 BT 种子的形式泄露。


1 月 26 日,泄密者发布了一个磁力链接,声称这是““Yandex git sources”,其中包含 2022 年 7 月从公司窃取的 44.7 GB 文件。据称,这些代码存储库包含公司除反垃圾邮件规则之外的所有源代码。


软件工程师 Arseniy Shestakov 分析了泄露的 Yandex Git 存储库 ,并表示其中包含有关以下产品的技术数据和代码:


  • Yandex search engine and indexing bot

  • Yandex Maps

  • Alice (AI assistant)

  • Yandex Taxi

  • Yandex Direct (ads service)

  • Yandex Mail

  • Yandex Disk (cloud storage service)

  • Yandex Market

  • Yandex Travel (travel booking platform)

  • Yandex360 (workspaces service)

  • Yandex Cloud

  • Yandex Pay (payment processing service)

  • Yandex Metrika (internet analytics)Shestakov 还在 GitHub 上分享了 泄露文件的目录列表, 供那些想查看哪些源代码被盗的人使用。“至少有一些 API 密钥,但它们可能仅用于测试部署,”Shestakov 谈到泄露的数据时说。

Yandex 否认黑客入侵,将源代码泄露归咎于前员工

在给Bleeping Computer 的一份声明中,Yandex 表示他们的系统没有被黑客入侵,一名前雇员泄露了源代码存储库。


“Yandex 没有被黑。我们的安全服务从公共领域的内部存储库中发现了代码片段,但内容与 Yandex 服务中使用的存储库的当前版本不同。


存储库是用于存储和使用代码的工具。大多数公司在内部通过这种方式使用代码。代码仓库的作用是处理代码,而非存储个人用户数据。我们正在对向公众发布源代码片段的原因进行内部调查,但我们没有发现对用户数据或平台性能有任何威胁。”- Yandex。

增加黑客暴露风险

Yandex 前高级系统管理员、开发副主管兼传播技术总监Grigory Bakunov向 BleepingComputer 评论此次泄密事件表示 ,他对泄露的代码非常熟悉,他曾在 2002 年至 2019 年期间在这家科技巨头工作。


Bakunov认为,数据泄露的动机是政治性的,导致数据泄露的“流氓” Yandex 员工并未试图将代码出售给竞争对手。


这位前高管补充说,泄露不包含任何客户数据,因此不会对 Yandex 用户的隐私或安全构成直接风险,也不会直接威胁和泄露专有技术。


“Yandex 使用名为‘Arcadia’的单一存储结构,但并非公司的所有服务都使用它。此外,即使只是构建服务,也需要大量内部工具和专业知识,因为标准构建程序并不适用。泄露的存储库仅包含代码;另一个重要部分是数据。神经网络的模型权重等关键部分都没有,所以几乎没有用。尽管如此,仍有许多‘有趣’的文件,其名称如“blacklist.txt”可能会暴露正在运行的服务。”


不过 Bakunov 也提醒,泄露的代码使黑客有可能识别安全漏洞并实施有针对性的漏洞利用活动。现在,这只是时间问题。


这位前高管还评论了 Yandex 的声明,称泄露的代码可能与公司工作服务中使用的当前代码不相同,但相似度可能高达 90%。因此,对泄露代码开展全面检查后,恶意黑客很可能会从 Yandex 系统中发现可供利用的缺口。

2023-01-29 17:266558
用户头像
刘燕 InfoQ高级技术编辑

发布了 1112 篇内容, 共 599.6 次阅读, 收获喜欢 1982 次。

关注

评论 2 条评论

发布
用户头像
嗯,前员工偷的不能算偷
2023-01-30 10:35 · 江苏
回复
用户头像
震惊,吃瓜
2023-01-30 08:18 · 浙江
回复
没有更多了
发现更多内容

架构2期第八周作业(1)

浮生一梦

极客大学架构师训练营 2组 第八周作业

请回答2020:芯片巨头并购潮究竟意味着什么?

脑极体

JVM垃圾回收性能分析

积极&丧

架构师训练营第十三周作业

月殇

极客大学架构师训练营

牛啤了!字节跳动Java岗面试官把内部面试题(含答案)泄露了,明年金三银四有望了

面试 算法 架构师

算法爱好者福利—拓扑排序的简介及实现

比伯

Java 编程 架构 程序人生 算法

生产环境全链路压测建设历程13:淘宝网稳定性近十年发展历程 2009年-2019年

数列科技杨德华

全链路压测 七日更

“九章”问世,量子计算将如何影响区块链技术?

CECBC

量子计算机

沪上首座“区块链生态谷”揭开面纱!

CECBC

大数据 生态产业

90分钟10个手写案例,从源码底层给你讲解7种线程池创建方式

小Q

学习 源码 架构 面试 多线程

如何让组织文化不在虚无?

Alan

团队管理 个人提升 文化 28天写作

Eureka 架构原理及其源码分析

Fox爱分享

Spring Cloud Eureka

elasticsearch打怪升级之基础篇

泽睿

ES

世界之书:《人类简史》与想象中的共同体

lidaobing

28天写作

第四周命题作业

cc

微服务架构及其技术栈

Fox爱分享

微服务 Spring Cloud spring cloud alibaba

阿里技术分享:电商IM消息平台,在群聊、直播场景下的技术实践

JackJiang

即时通讯 IM 群聊

我不喜欢挫折教育

熊斌

成长 自我思考 自我独白 个体成长

盘点2020 | 寒门难出贵子,我当程序员让爸妈在老家长脸了

爱笑的架构师

Java 程序员 程序人生 编程之路 盘点2020

朱嘉明:产业周期、科技周期与金融周期的失衡

CECBC

金融 科技

极客大学架构师训练营 - 同城快递业务架构设计

好吃不贵

极客大学架构师训练营

点燃“云+AI”的烽火,照亮网络安全的月之暗面

脑极体

【得物技术】基于配置的通用化动态报表平台设计与使用

得物技术

设计 动态 报表 平台 通用化

详解C/C++协程实现原理及使用

赖猫

c++ 协程

太赞了!2021疫情期间八家大厂的Android面试经历和真题整理,值得收藏!

欢喜学安卓

android 程序员 面试 移动开发

太牛了!在字节跳动我是如何当面试官的,Android篇

欢喜学安卓

android 程序员 面试 移动开发

冰河,能不能讲讲如何实现MySQL数据存储的无限扩容?

冰河

MySQL 分布式存储 海量数据 mycat 可扩展

滴滴开源Super-jacoco:java代码覆盖率收集平台

滴滴技术

Java 开源 滴滴开源 Super-Jacoco

工作多年还是只会用wait和notify?30分钟用案例告诉你有更好得选择

小Q

Java 学习 编程 架构 面试

第四周学习心得

cc

算法太TM重要了!实战讲述Flutter跨平台框架应用,3面直接拿到offer

欢喜学安卓

android 程序员 面试 移动开发

44.7 GB !遭前雇员“叛变”,俄版百度Yandex几乎所有源代码泄露_AI&大模型_刘燕_InfoQ精选文章