【FCon】聚焦金融行业在数智化的全面革新,一线的金融数智化实践干货 了解详情
写点什么

Elasticsearch 泄露 27 亿邮件数据,包括多家国内大厂邮箱

  • 2019-12-12
  • 本文字数:1769 字

    阅读完需:约 6 分钟

Elasticsearch 泄露27亿邮件数据,包括多家国内大厂邮箱

6 月 17 日,极客时间《企业级 Agents 开发实战营》正式上线,10 周掌握企业级 Agents 从设计、开发到部署全流程。

2019 年 12 月 4 日,Comparitech 与安全研究人员 Bob Diachenko 一起发现了一个数据泄露的 Elasticsearch 数据库,其中包括 27 亿个电子邮件地址。Diachenko 称:“单就数字而言,这可能是我所看到的泄露的数据最庞大的一次。”

事件回溯

SecurityDiscovery 网站的网络威胁情报总监鲍勃·迪亚琴科(Bob Diachenko)发文称:“我们发现了一个 Elasticsearch 数据库泄露,包括了 27 亿个电子邮件地址,其中 10 亿个密码都是以简单的明文存储的。其中大多数被盗的邮件域名来自中国的邮件提供商,腾讯、新浪、搜狐和网易等都在内,发现了包括 qq.com,139.com,126.com,gfan.com 和 game.sohu.com 等域名。另外,雅虎、Gmail 以及一些俄罗斯的邮件域名也受到了影响。”


该数据泄露的 Elasticsearch 数据库被发现的情况为:


  • 2019 年 12 月 1 日:该数据库首先由 BinaryEdge 搜索引擎建立索引,此后公开可用。

  • 2019 年 12 月 4 日:Diachenko 发现了数据库,并立即采取措施通知责任方。

  • 2019 年 12 月 9 日:禁止访问数据库。


据了解,这次数据泄露的 Elasticsearch 服务器属于美国的一个托管服务中心。2019 年 12 月 9 日,在 Diachenko 发布数据库存储安全报告之后,该托管服务中心关闭了 Elasticsearch 服务器,但是其至少对外开放了一周的时间,并且允许任何人在无密码的情况下访问。


本次泄露的数据除了电子邮件地址和密码,还包括了每个电子邮件地址的 MD5,SHA1 和 SHA256 散列。哈希加密的电子邮件地址文本具有固定的长度,因为存储文本数据风险太大,所以往往会用来安全存储数据,泄露数据库的所有者用每个地址的 MD5、SHA1 和 SHA256 散列对电子邮件地址进行了操作,很大可能是用来简化关系数据库的搜索。



目前,被泄露的 27 亿个电子邮件地址还无法证实是否为有效地址,但可以确定的是其来源违规。Diachenko 表示:“这些电子邮件的泄露往往不会引起企业的重视,但实际上它们受到攻击的可能性很高。”这些电子邮件一旦引发攻击行为,用户往往不会收到警报,因为国内的防火墙阻止了检查电子邮件泄露的服务。


虽然还不清楚是谁公开了数据库,可能是黑客,又或者是安全研究人员。但是确定的是,这种行为都忽略了 Elasticsearch 本来提供的安全性选项,也忽略了云存储安全的重要性。一旦黑客获得了帐户访问权限,他们就可以通过更改密码和关联的电子邮件来劫持该帐户,达到多种目的,包括垃圾邮件、网络钓鱼、欺诈、盗窃等。


Diachenko 称:“单就数字而言,这可能是我所看到的泄露数据最庞大的一次。”

原因分析

事实上,Elasticsearch 数据库泄露事件时有发生,就在不到一个月之前,Bob Diachenko 和 Vinny Troia 发现了一个公开可访问的 Elasticsearch 服务器,其中包含 12 亿用户账户,该服务器被公开在暗网上。


2019 年 1 月,InfoQ 盘点了该月发生的 Elasticsearch 数据泄露事件,据不完全统计,一个月就有 6 起数据泄露事件。通过分析这些事件,我们发现大部分泄露的原因都是 Elasticsearch 服务器没有设置密码保护。


为什么大家不设置密码保护呢?之前我们采访技术专家称:“很有可能是团队忽视了数据安全,再加上服务器防火墙对于端口开放策略过于激进,导致 Elasticsearch 集群只要一部署即可公网访问。另外,不少开发人员及其团队在认知上更多地把 Elasticsearch 看成是与 MySQL 同等的存储系统,所以在部署以后并没有太多地关心其访问控制策略和数据安全。而且 Elastisearch 开箱即用的特点也让开发和运维人员放松了对安全的重视。”

如何预防数据泄露?

如何预防数据泄露呢?首先,Elasticsearch 开源版本是不具备任何数据保护功能的,只有基本的攻击保护,例如防火墙。不过,Elasticsearch 产品的提供商 Elastic 为订阅用户提供了相关的数据保护功能,例如认证和授权、数据加密(通讯加密)、审计合规等。如果自己搞不定安全问题,选择商业版本也是一条不错的路子。


如果只想开源版本,技术专家也给出了几个低成本的防止数据泄露的措施:


1)服务器必须要有防火墙,不能随意对外开放端口;


2)Elasticsearch 集群的端口包括 TCP 和 HTTP,都不能暴露在公网;


3)Elasticsearch 集群禁用批量删除索引功能;


4)Elasticsearch 中保存的数据要做基本的脱敏处理;


5)加强监控和告警,能够在安全事件发生的第一时间感知并启动紧急预案,将损失降到最低。


相关阅读:


一个月被曝五次数据泄露,ElasticSearch 还行不行?


2019-12-12 14:244474
用户头像

发布了 497 篇内容, 共 311.6 次阅读, 收获喜欢 1911 次。

关注

评论

发布
暂无评论
发现更多内容

专业开发者眼中的HarmonyOS:专访资深软件工程师李宁

Geek_283163

华为

混音新手必备软件:FL Studio,用它简单制作混音

奈奈的杂社

BERT和GAN咋压缩,且看咱PaddleSlim新利器—— OFA

百度大脑

百度 飞桨

字节三面:对于Spring你了解多少?如果你会了这150道题 ,吊打面试官岂不是洒洒水?

北游学Java

Java spring Spring Framework spring Boot Starter spring cloud alibaba

攻击区块链网络的都有哪些方式方法

CECBC

区块链

积极研发区块链技术落地应用业务 这家A股上市企业试水云算力挖矿

CECBC

区块链

数据中台在企业数字化转型中的践行(下篇)

EAWorld

架构训练营作业-模块二

西伯利亚鼯鼠

Hadoop的发展及其架构

五分钟学大数据

hadoop 4月日更

OSI七层模型

赖猫

TCP 后台开发 后端 网络编程 网络协议

快速定制OCR识别模型好帮手:百度EasyDL OCR自训练平台上线啦!

百度大脑

EasyDL-OCR

TimSort — 以人命名的排序法

D

视频云全球创新挑战赛 —— 视频目标分割经典算法解析

阿里云视频云

阿里云 计算机视觉

情指勤指挥调度平台搭建,公安重点人员管控平台搭建

26天吃透算法笔记,面试字节,面试官朝我比了个“ok”

比伯

Java 编程 架构 算法 技术宅

跟着源码学IM(八):万字长文,手把手教你用Netty打造IM聊天

JackJiang

Netty 即时通讯 IM

身份和访问管理标准及挑战

龙归科技

物联网 云服务 认证授权 身份和访问管理

StreamX: 流批一体大数据平台正式开源

ApacheStreamPark

用 JavaScript 实现三次贝塞尔动画库 - 前端组件化

三钻

JavaScript 大前端 动画 组件化

回归主流:区块链新大门的“密钥”

CECBC

区块链

实时 OLAP, 从 0 到 1

Apache Flink

flink OLAP 区块链技术

好运转购物商城

飞亚科技

数据中台在企业数字化转型中的践行(上篇)

EAWorld

SpringBoot Admin2.0 集成 Java 诊断神器 Arthas 实践

阿里巴巴云原生

Java 运维 云原生 中间件 Arthas

聪明人的训练(十二)

Changing Lin

4月日更

思维导图学《Java性能权威指南》

Yano

Java 性能 思维导图

Javacv 音视频小工具 - 下载抖音无水印视频

张音乐

Java 音视频 ffmpeg 抖音 javacv

Redis单线程已经很快,为何6.0要引入多线程?有啥优势?

Java架构师迁哥

如何将区块链打造为城市底层基础设施

CECBC

区块链

交易所跟单软件搭建,合约跟单系统开发

融云音视频产品免费 20 万分钟 助力通信场景全搭建

融云 RongCloud

Elasticsearch 泄露27亿邮件数据,包括多家国内大厂邮箱_数据库_田晓旭_InfoQ精选文章