NVIDIA 初创加速计划,免费加速您的创业启动 了解详情
写点什么

Martin Fowler 谈数据紧缩

  • 2013-12-20
  • 本文字数:929 字

    阅读完需:约 3 分钟

越来越多的企业正投资于大数据系统。由于这些系统设计用来存储和处理海量的信息,所以其建设和维护往往都极其复杂和昂贵。它们也非常容易受到攻击,但对于高额利润的预期,企业似乎无法抗拒。

Martin Fowler 写了一篇文章,关于与大数据截然相反的 Datensparsamkeit 。这是一个德语词,大致可以翻译成“数据紧缩(data austerity)”或者直白地译为“不存储不需要的数据”。其中一个原因是隐私。其实在爱德华·斯诺登泄密事件之前,人们就已经对 2001 年的美国爱国者法案和随后的未授权监控表示了担忧。Martin 写到:

“收集所有数据(capture-it-all)”的方式其问题在于会引发严重的隐私问题。即使我们相信自己不会滥用收集的数据,但每个数据存储都可能成为罪犯或者政府监控机构的目标。在德国,这个问题尤其令人担忧。历届政府均存在这一问题,为了控制国民,政府对他们进行了广泛地监控。德国因此具有了健全的数据隐私法。

Datensparsamkeit 是一个源于这些隐私法的概念,与“收集所有数据”的理念截然相反。对于这个词,英语中没有一个直截了当的译法(这就是为什么我在文中保留了这个德语词),但大致上可以将其翻译为“数据紧缩”、“数据最小化”、“吝惜数据(data parsimony)”或者“节省数据(data frugality)”。这意味着,企业应该总是问自己这样一个问题,为什么收集或者存储数据,并设法只处理达到目的所需的最小数据量。

当然,政府监控不是唯一的担忧。即使是最小的企业也会成为黑客设法获取密码和信用卡信息的目标。Martin 继续写到:

即使读者不同意我关于个人控制自己数据的观点,安全遭破坏的风险还是意味着 datensparsamkeit 是一个明智的做法。如果保存了并不需要的数据,而某个人窃取并造成了损失,难道保存数据的人就不需要为此承担责任吗?即使没有法律责任,公开传播也将产生严重的后果——因此,任何不践行 datensparsamkeit 的人都在冒险。

对于某些行业,这个问题的答案毫无疑问是肯定的。例如,任何储存了信用卡背面三位数代码的企业都要对来自 Visa 和 Mastercard 的巨额罚款负责,即使实际上并没有破坏安全的行为发生。如果信息遭到窃取并被使用,法庭判处的罚款、相关部门出具的罚款以及赔款会让一个小企业破产。

查看英文原文:**** Martin Fowler on Data Austerity

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2013-12-20 06:531589
用户头像

发布了 256 篇内容, 共 81.8 次阅读, 收获喜欢 11 次。

关注

评论

发布
暂无评论
发现更多内容

云智一体:攀登2021智能经济新山峰

脑极体

ES6中的Promise和Generator详解

程序那些事

新特性 ES6 Promise 程序那些事 Generator

程序员如何解决中年危机?我的阿里春招之路分享,顺利通过阿里Android岗面试

欢喜学安卓

android 程序员 面试 移动开发

生产环境全链路压测建设历程12:通过生产压测发现的问题摘录

数列科技杨德华

全链路压测

直播报名 | 携程技术沙龙——前端测试技术创新与实践

携程技术中心

AI 数据分析

技术选型背后的国家利益:区块链自主化道路的交锋

CECBC

科技

完美!凭借这份阿里大佬分享的4170页Java高手真经笔记!offer拿到手软

Java~~~

Java 程序员 编程语言 电子书 架构资料

网易区块链打造可信数字身份认证应用新场景,赋能科技峰会

CECBC

数字身份

QoS简介

星环科技自动特征工程论文被ICA3PP2020接收

星环科技

AI 数据集

Rancher开源Harvester:基于K8S的超融合基础架构软件

Rancher

Kubernetes rancher

架构师训练营第 1 期 week13

张建亮

极客大学架构师训练营

架构师训练营第 1 期 week13 总结

张建亮

极客大学架构师训练营

利用Python进行数据分析(原书第2版)免费下载

计算机与AI

Python 数据分析 数据科学

架构之书:我们从何处来?我们是谁?我们向何处去?

lidaobing

架构 编程的未来

波场链智能合约软件系统开发|波场链智能合约APP开发

系统开发

Superset 助力企业级大数据 Ad-hoc 查询

麻婆豆腐没麻婆

数据分析 Apache Superset BI数美

re:Invent 重磅回顾 | AWS 重塑机器学习的四大亮点,触及每一位 AI 工作者

亚马逊云科技 (Amazon Web Services)

云计算 AWS

Kafka实战宝典:Kafka的控制器controller详解

数据社

kafka 七日更

架构师训练营第 1 期第 13 周学习总结

好吃不贵

极客大学架构师训练营

工业区块链正在改变什么?

CECBC

环保

甲方日常 70

句子

工作 随笔杂谈 日常

芯片破壁者(二十二):政府与半导体间的“美国往事”

脑极体

游戏服务器多钱一个月呢?

德胜网络-阳

【智简联接,万物互联】华为云·云享专家董昕:Serverless和微服务下, IoT的变革蓄势待发

华为云开发者联盟

Serverless 物联网 IoT

全球最火的程序员学习路线!2020年GitHub上那些优秀Android开源库总结,吊打面试官系列!

欢喜学安卓

android 程序员 面试 移动开发

闭嘴,别再问什么是锁了

程序员老猫

乐观锁 悲观锁 分布式锁 java锁 公平锁

架构师 3 期 3 班 -week4- 总结

zbest

总结 week4

架构师训练营第 1 期第 13 周作业

好吃不贵

极客大学架构师训练营

TeamLeader不可不知的三种团队建设形式

Alan

团队管理 个人成长 28天写作

阅站无数!不过我只推荐下面这些

cxuan

推荐 网站

Martin Fowler谈数据紧缩_大数据_Jonathan Allen_InfoQ精选文章