写点什么

Martin Fowler 谈数据紧缩

2013 年 12 月 20 日

越来越多的企业正投资于大数据系统。由于这些系统设计用来存储和处理海量的信息,所以其建设和维护往往都极其复杂和昂贵。它们也非常容易受到攻击,但对于高额利润的预期,企业似乎无法抗拒。

Martin Fowler 写了一篇文章,关于与大数据截然相反的 Datensparsamkeit 。这是一个德语词,大致可以翻译成“数据紧缩(data austerity)”或者直白地译为“不存储不需要的数据”。其中一个原因是隐私。其实在爱德华·斯诺登泄密事件之前,人们就已经对 2001 年的美国爱国者法案和随后的未授权监控表示了担忧。Martin 写到:

“收集所有数据(capture-it-all)”的方式其问题在于会引发严重的隐私问题。即使我们相信自己不会滥用收集的数据,但每个数据存储都可能成为罪犯或者政府监控机构的目标。在德国,这个问题尤其令人担忧。历届政府均存在这一问题,为了控制国民,政府对他们进行了广泛地监控。德国因此具有了健全的数据隐私法。

Datensparsamkeit 是一个源于这些隐私法的概念,与“收集所有数据”的理念截然相反。对于这个词,英语中没有一个直截了当的译法(这就是为什么我在文中保留了这个德语词),但大致上可以将其翻译为“数据紧缩”、“数据最小化”、“吝惜数据(data parsimony)”或者“节省数据(data frugality)”。这意味着,企业应该总是问自己这样一个问题,为什么收集或者存储数据,并设法只处理达到目的所需的最小数据量。

当然,政府监控不是唯一的担忧。即使是最小的企业也会成为黑客设法获取密码和信用卡信息的目标。Martin 继续写到:

即使读者不同意我关于个人控制自己数据的观点,安全遭破坏的风险还是意味着 datensparsamkeit 是一个明智的做法。如果保存了并不需要的数据,而某个人窃取并造成了损失,难道保存数据的人就不需要为此承担责任吗?即使没有法律责任,公开传播也将产生严重的后果——因此,任何不践行 datensparsamkeit 的人都在冒险。

对于某些行业,这个问题的答案毫无疑问是肯定的。例如,任何储存了信用卡背面三位数代码的企业都要对来自 Visa 和 Mastercard 的巨额罚款负责,即使实际上并没有破坏安全的行为发生。如果信息遭到窃取并被使用,法庭判处的罚款、相关部门出具的罚款以及赔款会让一个小企业破产。

查看英文原文:**** Martin Fowler on Data Austerity

2013 年 12 月 20 日 06:531208
用户头像

发布了 256 篇内容, 共 67.6 次阅读, 收获喜欢 5 次。

关注

评论

发布
暂无评论
发现更多内容

访谈阿里巴巴安全科学家吴翰清

容光

专访 阿里吴翰清 最新网络安全

领域驱动设计 101- 上下文与持续集成

luojiahu

领域驱动设计 DDD

由 JVM Attach API 看跨进程通信中的信号和 Unix 域套接字

AI乔治

Java 架构 JVM 性能调优

在gitee码云上搭建一个网站

空城机

JavaScript 前端 gitee 4月日更 搭建网页

【提纲】专访融云 CTO 杨攀 | 物联网城池应用和发展

李孟

调查采访能力考核

LeetCode题解:145. 二叉树的后序遍历,栈,JavaScript,详细注释

Lee Chen

算法 LeetCode 前端进阶训练营

SpringBoot极简集成Shiro

Java小咖秀

spring springboot shiro

《采访彩食鲜 CTO 乔新亮:IT 团队从 100 到 10000 的管理心得》(采访提纲)

程序员历小冰

调查采访能力考核

专访声网首席科学家钟声|倾听不一样的“钟声”,声网实时互动服务

程序员架构进阶

28天写作 四月日更 4月日更 调查采访能力考核 人物访谈

浪潮云洲链全面接入“星火·链网”

浪潮云

工业互联网

python 变量作用域和列表

若尘

变量 Python编程 作用域

行动起来!为迁移到自己的证书颁发机构做好准备!

亚马逊云科技 (Amazon Web Services)

芯片设计软件上云新思路!看珂晶达如何高效拓宽市场 | 精选案例

亚马逊云科技 (Amazon Web Services)

TikTok安装

高彪

【4 月日更】

搭载自研处理器 Amazon Graviton2 的 Amazon EC2 X2gd 已全面可用 | 新服务上线

亚马逊云科技 (Amazon Web Services)

对话声网 Agora 首席科学家钟声 :5G时代到来前景下RTE实时互动技术的应用与发展

麦洛

Java

1W字|40 图|硬核 ES 实战

悟空聊架构

全文检索 elasticsearch elastic springboot 实战

游戏开发者福音!我们和 TapTap 将为您提供全套的发行服务!

亚马逊云科技 (Amazon Web Services)

混沌工程=可观测性+探索性测试?

混沌工程实践

云原生 可观测性 混沌工程 测试右移 探索性测试

MySQL 死锁套路:再来看一例走不同索引更新的例子

AI乔治

Java MySQL 架构

干货来袭!阿里Java面试26大专题整理PDF版Github开源(2021最新)

程序员小毕

Java spring 程序员 架构 面试

使用 Amazon SageMaker 特征存放区存储、发现和共享机器学习特性!

亚马逊云科技 (Amazon Web Services)

ARTS- Week 7

steve_lee

我们携手东软集团,助力智能汽车“乘云转型达四海” | 精选案例

亚马逊云科技 (Amazon Web Services)

Go Goroutine

escray

go 极客时间 学习笔记 4月日更 Go 语言从入门到实践

Ansible 介绍

耳东

4月日更

模块2的作业

谢博琛

玩一玩Tiktok

高彪

【4 月日更】

户外广告行业的未来会是那个方向?

󠀛Ferry

专家呼吁:保护肾脏,从关注酸性尿开始

intel001

ElasticSearch 如何使用 TDigest 算法计算亿级数据的百分位数?

程序员历小冰

elasticsearch 近似算法 TDgigest 大数据量

如何打造一支有战斗力的技术团队?

如何打造一支有战斗力的技术团队?

Martin Fowler谈数据紧缩-InfoQ