写点什么

近期数据泄露事件盘点:医疗信息、法律文件、个人隐私都在“裸奔”

  • 2019-04-24
  • 本文字数:1543 字

    阅读完需:约 5 分钟

近期数据泄露事件盘点:医疗信息、法律文件、个人隐私都在“裸奔”

2019 年 1 月,我们盘点了 Elasticsearch 数据泄露事件。在短短的一个月内,外媒共报道了 6 起泄露事件。虽然 Facebook、亚马逊、微软、谷歌和苹果(FAMGA)等科技公司都在积极投资数据安全,公众对于数据保护的意识也在逐步增强,但是数据泄露的事件还在频频发生。


本文盘点了最近一个月左右发生的数据泄露事件,泄露的数据涉及医疗信息、法律文件信息和 LinkedIn 中的个人资料信息。

15 万名康复患者的医疗信息泄露

Cloudflare 信任与安全主管 Justin Paine 在使用 Shodan 搜索公开的互联网设备时,发现了一个包含两个索引的开放数据库。超 491 万份包含成瘾康复患者个人身份信息(PII)的文件被存储在这个配置错误的 ElasticSearch 数据库中,数据总量约为 1.45GB,可公开访问的时间达到两年内多。



(数据库中公开的一些信息)


据悉,只要掌握足够的计算机知识,任何人都可以通过该泄露数据库定位到医疗程序中的某个特定的人,并且可以获悉这个病人具体的就医消费金额,使用的医疗设备等等信息。另外,除了 Elasticsearch 数据库公开的数据,如果有心人利用谷歌搜索是可以获取到患者更多信息,例如年龄、生日、居住地址、患者家庭成员的姓名、政治背景、电话号码和电子邮件地址等等。

25 万份法律文件信息泄露

安全研究员 Bob Diachenko 在位于美国的 AWS 服务器上发现了一个没有保护的 Elasticsearch 集群,其数据有 4.7GB,包含了 25 万余份带有“非指定发布”标签的敏感法律文件。


Bob Diachenko 提取了 250 个样本进行了分析,发现这些文档是基于 'type’编译的。文件内容主要是来自美国各地的、2002 年到 2010 年的法律文件。


据悉,该公开数据库的所有者目前还没有找到。Bob Diachenko 曾给自认为可能是所有者的知识产权诉讼研究公司 Lex Machina 和位于印度的 LexSphere 公司,分别发了安全通知警报,但是目前还没有收到任何一家公司的官方确认。

6000 万个 LinkedIn 数据记录泄露

GDI 基金会的安全研究员 Sanyam Jain 发现一个奇怪的事情:在不同的 IP 地址下,相同内容的 LinkedIn 数据在网上总是重复出现和消失。据 Sanyam Jain 分析,出现这种情况的原因可能是这些数据每天都在被删除,然后加载到另一个 IP 上。一段时间之后,另一个 IP 上的数据也会变得不可访问,或者不能再连接到特定的 IP。



Sanyam Jain 总共发现了 8 个不安全的数据库,8 个数据库的总大小为 229 GB,每个数据库的大小在 25 GB 到 32 GB 之间,其中大约有 6000 万条 LinkedIn 用户信息记录。虽然大部分信息是公开信息,但数据库中包含了 LinkedIn 用户的电子邮件地址。


作为测试,Sanyam Jain 从其中一个数据库中提取了 Lawrence Abrams 的信息记录,并发送给 Lawrence Abrams 本人进行确认,结果发现该数据库中包含了 Lawrence Abrams 详细的 LinkedIn 个人资料信息,包括 ID、个人资料 url、工作历史、教育历史、位置信息、列出的技能、其他社交资料以及个人资料最后一次更新时间。


最令人吃惊的是,这些个人信息中还包含了 Lawrence Abrams 注册 LinkedIn 账号时的电子邮件信息,据 Lawrence Abrams 称,“我在 LinkedIn 的隐私设置中一直是把电子邮件地址设为不公开显示的。”


因不安全数据库导致的数据泄露事件并不在少数,之前我们已经报道过很多起相似事件,同时针对数据泄露也向相关专家咨询了防范措施。但遗憾的是,数据泄露仍在发生,很多企业并没有对数据安全引起足够的重视。之后,我们也会持续关注数据泄露的相关消息,希望企业能够以此为诫,真正重视数据安全。


相关文章:


数十家公司超 10 亿数据泄露,如何避免?


超 2 亿中国用户简历曝光!MongoDB 又一重大安全事故


一个月 6 次泄露,为啥大家用 Elasticsearch 总不设密码?


一个月被曝五次数据泄露,ElasticSearch 还行不行?


在线赌场泄漏 1.08 亿投注信息,ElasticSearch 再成祸首


2019-04-24 15:015285
用户头像

发布了 497 篇内容, 共 345.1 次阅读, 收获喜欢 1927 次。

关注

评论

发布
暂无评论
发现更多内容

《Operating System Concepts》阅读笔记:p258-p271

codists

操作系统

字节跳动 EB 级日志系统设计与优化实践

火山引擎开发者社区

从人工到智能:DeepSeek重新定义告警管理效能标准

嘉为蓝鲸

运维 AIOPS 告警管理 DeepSeek

DistilQwen2.5蒸馏小模型在PAI-ModelGallery的训练、评测、压缩及部署实践

阿里云大数据AI技术

人工智能 阿里云 LLM Qwen DistilQwen2.5

19.5stars!未来十年一定要学的免费、开源的OLAP数据库——DuckDB

遇码

大数据 开源 数据分析 OLAP duckdb

认知、实践、驾驭:AI 时代普通人的务实生存法则

小鲸数据

黑龙江等级保护测评到底该不该每年都做?

黑龙江陆陆信息测评部

官网购买、注册即用!华为云Flexus云会议让云上沟通更高效

轶天下事

高清、高效、高性价比,华为云Flexus云会议专为中小企业而生!

轶天下事

YashanDB操作系统身份认证配置

YashanDB

数据库 yashandb

推理大模型时代,TextIn ParseX助力出版业知识资产重构

合合技术团队

人工智能 算法 图表 图像处理 大模型

【GreatSQL优化器-16】INDEX_SKIP_SCAN

GreatSQL

OCAI + DeepSeek满血版双buff加成,OS运维从此告别焦虑

OpenCloudOS

AI OpenCloudOS 社区 DeepSeek

鸿蒙APP性能优化

北京木奇移动技术有限公司

APP开发 软件外包公司 APP外包公司

RocketMQ:消息发送机制

葛飞

零代码!快速搭建你的专属论文阅读助手|火山方舟零代码智能体教程

火山引擎开发者社区

MAC与HMAC技术辨析

石君

hash HMAC-SHA

邀请函|相约新乡——“AI 赋能,智造跃迁” AI 驱动数字化创新设计促进新质生产力发展交流会

Altair RapidMiner

AI 数字化转型 仿真 智能制造 CAE

DeepSeek大模型6大部署模式解析与探索测试开发技术赋能点

测试人

人工智能 软件测试

首次覆盖超 11 类真实编程场景!豆包大模型团队开源代码大模型全新基准

科技热闻

当达索仿真遇上DeepSeek:AI给工程研发装上了"智慧大脑"

思茂信息

abaqus DeepSeek SIMULIA CST Studio Suite 达索

如何组织一场成功的云会议?华为云Flexus云会议让会议更加轻松高效

轶天下事

从ChatGPT到DeepSeek,现象级爆火背后的数学逻辑!

小鲸数据

从古籍到算法,数智本草大模型背后的研发之路

华为云开发者联盟

人工智能 盘古大模型 大模型

打破云会议技术壁垒!华为云Flexus云会议轻松解决中小企业协作难题

轶天下事

多种设备皆可联接!华为云Flexus云会议开箱即用、轻松上手

轶天下事

字节跳动冯佳时:大语言模型在计算机视觉领域的应用、问题和我们的解法

极客天地

智能制造架构设计方案

金陵老街

智慧工厂 智能制造

Sandisk闪迪携UFS 4.1存储解决方案亮相CFMS | MemoryS 2025

极客天地

广大中小企业的共同选择!华为云Flexus云会议引领云上协作新潮流

轶天下事

为什么说JSON不一定是LLM结构化输出的最佳选择?

Baihai IDP

程序员 AI LLMs 格式化数据

近期数据泄露事件盘点:医疗信息、法律文件、个人隐私都在“裸奔”_数据库_田晓旭_InfoQ精选文章