写点什么

Martin Fowler 谈数据紧缩

  • 2013-12-20
  • 本文字数:929 字

    阅读完需:约 3 分钟

越来越多的企业正投资于大数据系统。由于这些系统设计用来存储和处理海量的信息,所以其建设和维护往往都极其复杂和昂贵。它们也非常容易受到攻击,但对于高额利润的预期,企业似乎无法抗拒。

Martin Fowler 写了一篇文章,关于与大数据截然相反的 Datensparsamkeit 。这是一个德语词,大致可以翻译成“数据紧缩(data austerity)”或者直白地译为“不存储不需要的数据”。其中一个原因是隐私。其实在爱德华·斯诺登泄密事件之前,人们就已经对 2001 年的美国爱国者法案和随后的未授权监控表示了担忧。Martin 写到:

“收集所有数据(capture-it-all)”的方式其问题在于会引发严重的隐私问题。即使我们相信自己不会滥用收集的数据,但每个数据存储都可能成为罪犯或者政府监控机构的目标。在德国,这个问题尤其令人担忧。历届政府均存在这一问题,为了控制国民,政府对他们进行了广泛地监控。德国因此具有了健全的数据隐私法。

Datensparsamkeit 是一个源于这些隐私法的概念,与“收集所有数据”的理念截然相反。对于这个词,英语中没有一个直截了当的译法(这就是为什么我在文中保留了这个德语词),但大致上可以将其翻译为“数据紧缩”、“数据最小化”、“吝惜数据(data parsimony)”或者“节省数据(data frugality)”。这意味着,企业应该总是问自己这样一个问题,为什么收集或者存储数据,并设法只处理达到目的所需的最小数据量。

当然,政府监控不是唯一的担忧。即使是最小的企业也会成为黑客设法获取密码和信用卡信息的目标。Martin 继续写到:

即使读者不同意我关于个人控制自己数据的观点,安全遭破坏的风险还是意味着 datensparsamkeit 是一个明智的做法。如果保存了并不需要的数据,而某个人窃取并造成了损失,难道保存数据的人就不需要为此承担责任吗?即使没有法律责任,公开传播也将产生严重的后果——因此,任何不践行 datensparsamkeit 的人都在冒险。

对于某些行业,这个问题的答案毫无疑问是肯定的。例如,任何储存了信用卡背面三位数代码的企业都要对来自 Visa 和 Mastercard 的巨额罚款负责,即使实际上并没有破坏安全的行为发生。如果信息遭到窃取并被使用,法庭判处的罚款、相关部门出具的罚款以及赔款会让一个小企业破产。

查看英文原文:**** Martin Fowler on Data Austerity

2013-12-20 06:532158
用户头像

发布了 256 篇内容, 共 100.9 次阅读, 收获喜欢 12 次。

关注

评论

发布
暂无评论
发现更多内容

北京银行推出“智策”零售数字化运营体系 加速推进数字化转型发展

易观分析

数字化转型

2022年盘点,主流前端跨端技术方案(包含小程序)

Speedoooo

flutter taro Weex React Native finclip

Android-聊聊自动化测试真经

芝麻粒儿

android 7月月更

【运维小知识】单点登录是什么意思?有什么作用?

行云管家

运维 单点登录 IT运维

2022可信云大会 | 中国信通院云上软件工程评估结果即将发布

中国IDC圈

软件工程 可信云 评估结果

如何用Apifox 的智能Mock功能?

Liam

前端 Mock

用友网络:把握穿越周期的关键,高研发投入下的发展韧性

Lily

IDC 发布《云原生 AI - 加速 AI 工程化落地》报告,百度智能云领跑云原生 AI 能力

Baidu AICLOUD

异构计算 AI加速 云原生AI

记录一次现场 mysql 重复记录数据的排查处理

安逸的咸鱼

MySQL 实战案例 7月月更

秒懂 Git 与 Gitee

攻城狮杰森

git gitee 7月月更 入门教程

用户体验 | 银行如何优化APP用户体验

易观分析

用户体验

那个从「四大」出来的小哥哥,后来怎么样了|ONES 人物

万事ONES

亚马逊云科技如何通过智能营销帮助苏泊尔实现年产破亿?

Lily

在线版 Python 图片转字符画

OpenHacker

Python

Cannot connect to the Docker daemon at unix:///var/run/docker.sock. Is the docker daemon running?

OpenHacker

Docker

入门即享受!coolbpf 硬核提升 BPF 开发效率 | 龙蜥技术

OpenAnolis小助手

开源 技术 龙蜥大讲堂 BPF coolbpf

ES6 --- 展开运算符(一)

bo

前端 面试题 ES6 深拷贝 7月月更

SpringSecurity 添加验证码的两种方式

急需上岸的小谢

7月月更

深度解析:LP流动性挖矿系统开发逻辑拆解

开发微hkkf5566

技术分享| 快对讲-5G对讲

anyRTC开发者

音视频 传输协议 快对讲 RAST

AI简报-how to use Loss Surfaces 一种模型集成

AIWeker

AI简报 7月月更

版本通告|Apache Doris 1.1 Release 版本正式发布!

SelectDB

数据库 数据仓库 Doris apache doris 版本更新

大数据培训如何优化HiveSQL

@零度

大数据开发 hiveSQL

AI 翻译助力社交泛娱乐应用全球无障碍沟通

融云 RongCloud

Python 入门指南之虚拟环境和包

海拥(haiyong.site)

7月月更

云图说丨OLAP开源引擎的一匹黑马,MRS集群组件之ClickHouse

华为云开发者联盟

数据库 后端

首次公开!华为顶级团队合编300页Docker进阶手册,理论实战双收

冉然学Java

Java Docker 操作系统 #技术干货#

这些功能要是没有,我大 Pro 还怎么出来混!

CRMEB

iOS 中的代理模式

NewBoy

ios 前端 移动端 iOS 知识体系 7月月更

AWS Trusted Advisor

冯亮

云计算 DevOps AWS

Martin Fowler谈数据紧缩_大数据_Jonathan Allen_InfoQ精选文章