写点什么

近期数据泄露事件盘点:医疗信息、法律文件、个人隐私都在“裸奔”

2019 年 4 月 24 日

近期数据泄露事件盘点:医疗信息、法律文件、个人隐私都在“裸奔”

2019 年 1 月,我们盘点了 Elasticsearch 数据泄露事件。在短短的一个月内,外媒共报道了 6 起泄露事件。虽然 Facebook、亚马逊、微软、谷歌和苹果(FAMGA)等科技公司都在积极投资数据安全,公众对于数据保护的意识也在逐步增强,但是数据泄露的事件还在频频发生。


本文盘点了最近一个月左右发生的数据泄露事件,泄露的数据涉及医疗信息、法律文件信息和 LinkedIn 中的个人资料信息。


15 万名康复患者的医疗信息泄露

Cloudflare 信任与安全主管 Justin Paine 在使用 Shodan 搜索公开的互联网设备时,发现了一个包含两个索引的开放数据库。超 491 万份包含成瘾康复患者个人身份信息(PII)的文件被存储在这个配置错误的 ElasticSearch 数据库中,数据总量约为 1.45GB,可公开访问的时间达到两年内多。



(数据库中公开的一些信息)


据悉,只要掌握足够的计算机知识,任何人都可以通过该泄露数据库定位到医疗程序中的某个特定的人,并且可以获悉这个病人具体的就医消费金额,使用的医疗设备等等信息。另外,除了 Elasticsearch 数据库公开的数据,如果有心人利用谷歌搜索是可以获取到患者更多信息,例如年龄、生日、居住地址、患者家庭成员的姓名、政治背景、电话号码和电子邮件地址等等。


25 万份法律文件信息泄露

安全研究员 Bob Diachenko 在位于美国的 AWS 服务器上发现了一个没有保护的 Elasticsearch 集群,其数据有 4.7GB,包含了 25 万余份带有“非指定发布”标签的敏感法律文件。


Bob Diachenko 提取了 250 个样本进行了分析,发现这些文档是基于 'type’编译的。文件内容主要是来自美国各地的、2002 年到 2010 年的法律文件。


据悉,该公开数据库的所有者目前还没有找到。Bob Diachenko 曾给自认为可能是所有者的知识产权诉讼研究公司 Lex Machina 和位于印度的 LexSphere 公司,分别发了安全通知警报,但是目前还没有收到任何一家公司的官方确认。


6000 万个 LinkedIn 数据记录泄露

GDI 基金会的安全研究员 Sanyam Jain 发现一个奇怪的事情:在不同的 IP 地址下,相同内容的 LinkedIn 数据在网上总是重复出现和消失。据 Sanyam Jain 分析,出现这种情况的原因可能是这些数据每天都在被删除,然后加载到另一个 IP 上。一段时间之后,另一个 IP 上的数据也会变得不可访问,或者不能再连接到特定的 IP。



Sanyam Jain 总共发现了 8 个不安全的数据库,8 个数据库的总大小为 229 GB,每个数据库的大小在 25 GB 到 32 GB 之间,其中大约有 6000 万条 LinkedIn 用户信息记录。虽然大部分信息是公开信息,但数据库中包含了 LinkedIn 用户的电子邮件地址。


作为测试,Sanyam Jain 从其中一个数据库中提取了 Lawrence Abrams 的信息记录,并发送给 Lawrence Abrams 本人进行确认,结果发现该数据库中包含了 Lawrence Abrams 详细的 LinkedIn 个人资料信息,包括 ID、个人资料 url、工作历史、教育历史、位置信息、列出的技能、其他社交资料以及个人资料最后一次更新时间。


最令人吃惊的是,这些个人信息中还包含了 Lawrence Abrams 注册 LinkedIn 账号时的电子邮件信息,据 Lawrence Abrams 称,“我在 LinkedIn 的隐私设置中一直是把电子邮件地址设为不公开显示的。”


因不安全数据库导致的数据泄露事件并不在少数,之前我们已经报道过很多起相似事件,同时针对数据泄露也向相关专家咨询了防范措施。但遗憾的是,数据泄露仍在发生,很多企业并没有对数据安全引起足够的重视。之后,我们也会持续关注数据泄露的相关消息,希望企业能够以此为诫,真正重视数据安全。


相关文章:


数十家公司超 10 亿数据泄露,如何避免?


超 2 亿中国用户简历曝光!MongoDB 又一重大安全事故


一个月 6 次泄露,为啥大家用 Elasticsearch 总不设密码?


一个月被曝五次数据泄露,ElasticSearch 还行不行?


在线赌场泄漏 1.08 亿投注信息,ElasticSearch 再成祸首


2019 年 4 月 24 日 15:014316
用户头像
田晓旭 InfoQ 编辑

发布了 497 篇内容, 共 234.6 次阅读, 收获喜欢 1613 次。

关注

评论

发布
暂无评论
发现更多内容

GeekPwn 2020少年黑客马拉松大赛即将开启 谁将CARRY全场?

Geek_116789

架构师训练营学习总结

John

极客大学架构师训练营

区块链系列教程之:比特币的问题

程序那些事

比特币 区块链 智能合约 以太坊

[1.3万字] 玩转前端二进制

阿宝哥

Java 前端 base64 Blob

针对GPU单指令多数据流的编译优化算法

GPU

gpu 编译器 程序语言 if-conversion

Raft探索历程--Part2

老胡爱分享

分布式系统 raft

现在面试这么难,背下题就能过的时代一去不复返了

小谈

Java JVM Java 面试 springboot SpringCloud

架构师训练营 第5课学习总结

Glowry

极客大学架构师训练营

谈谈Spring xml配置文件中的命名空间,以及一些例外情况

xiaoxi666

spring 命名空间

架构训练营第五周 - 总结

无心水

极客大学架构师训练营

它们为什么这么快:从多进程到多线程再到I/O复用

Ya

多线程 进程 并发

重学 Java 设计模式:实战策略模式「模拟多种营销类型优惠券,折扣金额计算策略场景」

小傅哥

Java 设计模式 小傅哥 重构 代码优化

小白也有大厂梦,如何从零开始掌握高薪Java工程师必备技能?

无予且行

Java 架构 面试 后端 大厂

有了多线程,为什么还要有协程?

八两

线程 进程 协程 GMP 进程线程区别

一致性哈希 -- java 实现

lei Shi

分布式缓存架构与负载均衡架构

负载均衡 极客大学架构师训练营 消息队列 分布式缓存 第五周

刚去面试现场聊了一个多小时的Redis ,悄悄分享给大家!

Java小咖秀

nosql redis Java 面试

面试官:为什么需要happens-before规则和什么是指令重排序

无予且行

Java 编程 程序员 happens-before java面试

操作系统概览

引花眠

计算机基础

Java线程池最细的解释,看完后彻底征服面试官

小新

Java 架构 面试 线程 线程池

碎片化学习行不行

封不羁

依赖倒置原则

John

极客大学架构师训练营

从Servlet到Spring Boot

废材姑娘

Java Spring Boot

视读——沟通的艺术,看入人里,看出人外(开篇)

废材姑娘

读书笔记 视觉笔记

Git 的远端操作及解析(含思维导图)

多选参数

git GitHub gitlab

ARTS打卡 第6周

引花眠

ARTS 打卡计划

架构训练营第五周 - 作业

无心水

极客大学架构师训练营

三十张图助你看清红黑树的前世今生

淡蓝色

Java 程序员 数据结构 算法

公司一直用Mybatis的原因原来在这!不得不竖起我的大拇指

小闫

Java mybatis mybatis-config.xml mybatis缓存

【Python】 any() 和 or 区别你真的知道吗?

Leetao

Python 数据结构 Python基础知识

架构师训练营 第5课作业

Glowry

极客大学架构师训练营

新晋管理者都会遇到的6个问题

新晋管理者都会遇到的6个问题

近期数据泄露事件盘点:医疗信息、法律文件、个人隐私都在“裸奔”-InfoQ