写点什么

近期数据泄露事件盘点:医疗信息、法律文件、个人隐私都在“裸奔”

  • 2019-04-24
  • 本文字数:1543 字

    阅读完需:约 5 分钟

近期数据泄露事件盘点:医疗信息、法律文件、个人隐私都在“裸奔”

2019 年 1 月,我们盘点了 Elasticsearch 数据泄露事件。在短短的一个月内,外媒共报道了 6 起泄露事件。虽然 Facebook、亚马逊、微软、谷歌和苹果(FAMGA)等科技公司都在积极投资数据安全,公众对于数据保护的意识也在逐步增强,但是数据泄露的事件还在频频发生。


本文盘点了最近一个月左右发生的数据泄露事件,泄露的数据涉及医疗信息、法律文件信息和 LinkedIn 中的个人资料信息。

15 万名康复患者的医疗信息泄露

Cloudflare 信任与安全主管 Justin Paine 在使用 Shodan 搜索公开的互联网设备时,发现了一个包含两个索引的开放数据库。超 491 万份包含成瘾康复患者个人身份信息(PII)的文件被存储在这个配置错误的 ElasticSearch 数据库中,数据总量约为 1.45GB,可公开访问的时间达到两年内多。



(数据库中公开的一些信息)


据悉,只要掌握足够的计算机知识,任何人都可以通过该泄露数据库定位到医疗程序中的某个特定的人,并且可以获悉这个病人具体的就医消费金额,使用的医疗设备等等信息。另外,除了 Elasticsearch 数据库公开的数据,如果有心人利用谷歌搜索是可以获取到患者更多信息,例如年龄、生日、居住地址、患者家庭成员的姓名、政治背景、电话号码和电子邮件地址等等。

25 万份法律文件信息泄露

安全研究员 Bob Diachenko 在位于美国的 AWS 服务器上发现了一个没有保护的 Elasticsearch 集群,其数据有 4.7GB,包含了 25 万余份带有“非指定发布”标签的敏感法律文件。


Bob Diachenko 提取了 250 个样本进行了分析,发现这些文档是基于 'type’编译的。文件内容主要是来自美国各地的、2002 年到 2010 年的法律文件。


据悉,该公开数据库的所有者目前还没有找到。Bob Diachenko 曾给自认为可能是所有者的知识产权诉讼研究公司 Lex Machina 和位于印度的 LexSphere 公司,分别发了安全通知警报,但是目前还没有收到任何一家公司的官方确认。

6000 万个 LinkedIn 数据记录泄露

GDI 基金会的安全研究员 Sanyam Jain 发现一个奇怪的事情:在不同的 IP 地址下,相同内容的 LinkedIn 数据在网上总是重复出现和消失。据 Sanyam Jain 分析,出现这种情况的原因可能是这些数据每天都在被删除,然后加载到另一个 IP 上。一段时间之后,另一个 IP 上的数据也会变得不可访问,或者不能再连接到特定的 IP。



Sanyam Jain 总共发现了 8 个不安全的数据库,8 个数据库的总大小为 229 GB,每个数据库的大小在 25 GB 到 32 GB 之间,其中大约有 6000 万条 LinkedIn 用户信息记录。虽然大部分信息是公开信息,但数据库中包含了 LinkedIn 用户的电子邮件地址。


作为测试,Sanyam Jain 从其中一个数据库中提取了 Lawrence Abrams 的信息记录,并发送给 Lawrence Abrams 本人进行确认,结果发现该数据库中包含了 Lawrence Abrams 详细的 LinkedIn 个人资料信息,包括 ID、个人资料 url、工作历史、教育历史、位置信息、列出的技能、其他社交资料以及个人资料最后一次更新时间。


最令人吃惊的是,这些个人信息中还包含了 Lawrence Abrams 注册 LinkedIn 账号时的电子邮件信息,据 Lawrence Abrams 称,“我在 LinkedIn 的隐私设置中一直是把电子邮件地址设为不公开显示的。”


因不安全数据库导致的数据泄露事件并不在少数,之前我们已经报道过很多起相似事件,同时针对数据泄露也向相关专家咨询了防范措施。但遗憾的是,数据泄露仍在发生,很多企业并没有对数据安全引起足够的重视。之后,我们也会持续关注数据泄露的相关消息,希望企业能够以此为诫,真正重视数据安全。


相关文章:


数十家公司超 10 亿数据泄露,如何避免?


超 2 亿中国用户简历曝光!MongoDB 又一重大安全事故


一个月 6 次泄露,为啥大家用 Elasticsearch 总不设密码?


一个月被曝五次数据泄露,ElasticSearch 还行不行?


在线赌场泄漏 1.08 亿投注信息,ElasticSearch 再成祸首


2019-04-24 15:015254
用户头像

发布了 497 篇内容, 共 341.4 次阅读, 收获喜欢 1927 次。

关注

评论

发布
暂无评论
发现更多内容

架构实战营-外包学生管理系统架构文档

CityAnimal

架构实战营 #架构实战营 「架构实战营」

Build On 活动预告 | 构建你的第一个基于知识图谱的推荐模型

亚马逊云科技 (Amazon Web Services)

云计算

预备,请关注!DingOS先导小视频发布!

鼎道智联

Go 入门很简单:如何在 Go 中使用日志包

宇宙之一粟

日志 log Go 语言 4月月更

组件容器化Statefulset与Deployment的选型与实践

移动云大数据

Deployment statefulset

制约国内企业知识管理发展的因素

小炮

知识管理 企业知识管理 企业知识管理工具

TASKCTL 资源树刷新、重载和重置的不同区别

敏捷调度TASKCTL

DevOps 分布式 敏捷开发 自动化运维 大数据运维

行业大咖齐聚 多元主题碰撞 OpenHarmony技术日等你来

Geek_283163

OpenAtom OpenHarmony

玩转LiteOS组件:玩转Librws

华为云开发者联盟

TCP websocket LiteOS LiteOS组件 Librws

为什么需要可编程代理

Flomesh

负载均衡 代理 Pipy 可编程代理

Windows注册表内容

Sher10ck

注册表

Mybatis-plus在项目中的应用

Rubble

4月日更 4月月更

HDFS小文件分析实践

移动云大数据

hdfs 小文件

GAIA-IR: GraphScope 上的并行化图查询引擎

6979阿强

大数据 并行计算 图计算 GraphScope 图分析

华为云GaussDB(for Influx)揭密:数据分级存储

华为云开发者联盟

华为云 GaussDB(for Influx) 时序数据 数据分级存储 Influx

微信小程序开发系列(一) :开发环境搭建和微信小程序的视图设计与开发

汪子熙

微信小程序 微信 开发视图 微信小程序专栏 4月月更

Android C++系列:C++最佳实践6 constexpr与decltype

轻口味

c++ android ndk jni 4月月更

Linux驱动框架与杂项字符设备框架介绍

DS小龙哥

4月月更

湖仓一体,Hologres加速云数据湖DLF技术原理解析

阿里云大数据AI技术

sql 大数据 分布式计算 Cloud Native MaxCompute

Git技巧小能手

西门阿杰

git 版本控制

【高并发】如何解决可见性和有序性问题?这次彻底懂了!

冰河

并发编程 多线程 协程 异步编程 精通高并发系列

什么是域名(Domain Name ) ?

源字节1号

百度小程序包流式下载安装优化

百度Geek说

小程序

解决报错:SSL certificate problem: certificate has expired

liuzhen007

SSL证书 4月月更

深入解析require源码,知其根,洞其源

战场小包

前端 Node 4月月更

面试突击41:notify是随机唤醒吗?

王磊

Java java面试

spring-cloud-kubernetes与SpringCloud Gateway

程序员欣宸

Java spring-cloud 4月月更

[Day20]-[动态规划]零钱兑换 II

方勇(gopher)

LeetCode 动态规划 数据结构算法

Cilium 原理解析:网络数据包在内核中的流转过程

火山引擎边缘云

Linux 云原生 网络

Apache ShardingSphere 如何实现分布式事务

SphereEx

Apache 数据库 ShardingSphere SphereEx

阿里云发布中国云原生数据湖应用洞察白皮书

阿里云大数据AI技术

大数据 数据湖

近期数据泄露事件盘点:医疗信息、法律文件、个人隐私都在“裸奔”_数据库_田晓旭_InfoQ精选文章