最新发布《数智时代的AI人才粮仓模型解读白皮书(2024版)》,立即领取! 了解详情
写点什么

Martin Fowler 谈数据紧缩

  • 2013-12-20
  • 本文字数:929 字

    阅读完需:约 3 分钟

越来越多的企业正投资于大数据系统。由于这些系统设计用来存储和处理海量的信息,所以其建设和维护往往都极其复杂和昂贵。它们也非常容易受到攻击,但对于高额利润的预期,企业似乎无法抗拒。

Martin Fowler 写了一篇文章,关于与大数据截然相反的 Datensparsamkeit 。这是一个德语词,大致可以翻译成“数据紧缩(data austerity)”或者直白地译为“不存储不需要的数据”。其中一个原因是隐私。其实在爱德华·斯诺登泄密事件之前,人们就已经对 2001 年的美国爱国者法案和随后的未授权监控表示了担忧。Martin 写到:

“收集所有数据(capture-it-all)”的方式其问题在于会引发严重的隐私问题。即使我们相信自己不会滥用收集的数据,但每个数据存储都可能成为罪犯或者政府监控机构的目标。在德国,这个问题尤其令人担忧。历届政府均存在这一问题,为了控制国民,政府对他们进行了广泛地监控。德国因此具有了健全的数据隐私法。

Datensparsamkeit 是一个源于这些隐私法的概念,与“收集所有数据”的理念截然相反。对于这个词,英语中没有一个直截了当的译法(这就是为什么我在文中保留了这个德语词),但大致上可以将其翻译为“数据紧缩”、“数据最小化”、“吝惜数据(data parsimony)”或者“节省数据(data frugality)”。这意味着,企业应该总是问自己这样一个问题,为什么收集或者存储数据,并设法只处理达到目的所需的最小数据量。

当然,政府监控不是唯一的担忧。即使是最小的企业也会成为黑客设法获取密码和信用卡信息的目标。Martin 继续写到:

即使读者不同意我关于个人控制自己数据的观点,安全遭破坏的风险还是意味着 datensparsamkeit 是一个明智的做法。如果保存了并不需要的数据,而某个人窃取并造成了损失,难道保存数据的人就不需要为此承担责任吗?即使没有法律责任,公开传播也将产生严重的后果——因此,任何不践行 datensparsamkeit 的人都在冒险。

对于某些行业,这个问题的答案毫无疑问是肯定的。例如,任何储存了信用卡背面三位数代码的企业都要对来自 Visa 和 Mastercard 的巨额罚款负责,即使实际上并没有破坏安全的行为发生。如果信息遭到窃取并被使用,法庭判处的罚款、相关部门出具的罚款以及赔款会让一个小企业破产。

查看英文原文:**** Martin Fowler on Data Austerity

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2013-12-20 06:531586
用户头像

发布了 256 篇内容, 共 81.7 次阅读, 收获喜欢 11 次。

关注

评论

发布
暂无评论
发现更多内容

高并发系统三大利器之缓存

java金融

Java 缓存 高并发 本地缓存 分布式缓存

键盘敲入 A 字母时,期间发生了什么....

小林coding

操作系统 计算机基础 键盘

编程的乐趣与苦恼

看山

随笔杂谈 人月神话

ARTS-WEEK11

一周思进

ARTS 打卡计划

架构师训练营 - 第 8 周学习总结

红了哟

一家估值20亿美元的公司,竟然没有办公室?

Atlassian

远程办公 Atlassian Jira

硬件产品管理(4):人体工程学验证

老壳有点爽

硬件产品 智能硬件 产品管理 人体工程学

硬件产品管理(5):硬件产品工作流程管理及案例分析

老壳有点爽

创业 硬件产品 智能硬件 产品管理

面试的时候不能做捧哏

escray

学习 面试

设计模式:建造者模式

看山

设计模式 建造者模式

程序员什么时候该考虑辞职

看山

随笔杂谈 辞职

Java ForEach语句判断是否为空

引花眠

bug

高并发系统三大利器之限流

java金融

架构 高并发 分布式限流 限流 单机限流

什么是产品以及如何将一个开源软件项目产品化

常平

架构模式 架构设计 架构师 产品思维

ARTS打卡 第13周

引花眠

微服务 ARTS 打卡计划

ARTS打卡(20.08.17-20.08.23)

小王同学

如何做好项目时间管理?

石云升

项目管理 需求 项目排期

顺时针遍历矩阵,提高系统高并发350倍,React Native原理浅析 组件设计原则 安全架构 防火墙ModSecurity John 易筋 ARTS 打卡 Week 14

John(易筋)

ARTS 打卡计划 组件设计原则 React Native 高并发优化

浅谈 GET 和 POST 区别

叉叉敌

面试 post GET

速看!今天我才知道,UUID还分五个版本

麦洛

Java uuid

【Elasticsearch 技术分享】—— ES 常用名词及结构

程序员小航

Java 搜索引擎 elastic ES Lucene Elastic Search

硬件产品管理(3):产品问题整理-举例

老壳有点爽

创业 硬件产品 智能硬件

Java中的单例模式(完整篇)

看山

Java 设计模式 单例模式

disruptor 高性能队列最佳选择

柿子

队列 disruptoer 高性能队列

MacOS抓包工具Charles

叉叉敌

ios charles 抓包

硬件产品管理(1):手板管理流程

老壳有点爽

创业 硬件产品 智能硬件 手板

《我在一线做用户增长》读书笔记及感想

王新涵

用户增长

(2.6w字)网络知识点灵魂拷问——前端面试必问

执鸢者

面试 大前端 网络 HTTP

硬件产品管理(2):产品QA检测

老壳有点爽

硬件产品 智能硬件 QA 产品管理

ARTS Week13

时之虫

ARTS 打卡计划

Java中的一些限制

xiaoxi666

Martin Fowler谈数据紧缩_大数据_Jonathan Allen_InfoQ精选文章