新机器学习库TensorFlow Privacy问世：旨在保护敏感数据_AI&大模型_Kent Weare



 写点什么

在最近的一篇博文中，TensorFlow 宣布推出TensorFlow Privacy。这是一个开源库，它允许研究人员和开发人员构建具有强大隐私保护功能的机器学习模型。基于强大的数学确定性（mathematical guarantees），使用本库可以确保用户数据无法通过训练过程被记住。

机器学习在如今的在线产品和服务中非常普遍。谷歌认为，为了保护用户隐私，把强大的隐私保护功能嵌入 TensorFlow 是非常重要的。为什么那么重要呢？谷歌大脑（Google Brain）的产品经理Carey Radebaugh对此进行了解释：

现代机器学习正越来越多地用于创造令人惊叹的新技术和用户体验，其中很多需要让训练机器负责地从敏感数据（例如个人照片或电邮）中学习。理想情况下，受过训练的机器学习模型的参数应该编码一般模式，而不是关于特定训练示例的事实。

TensorFlow Privacy 的引入符合谷歌去年发布的负责的AI实践承诺（Responsible AI Practices commitment），旨在“在这些[AI]系统中建立公平性、可解释性、隐私和安全性”。谷歌除了遵循负责的 AI 实践外，他们还希望让外部开发人员在其构建的应用程序和产品中应用同样的实践。

TensorFlow Privacy 的技术实现建立在差异化隐私理论（differentail privacy theory）之上，该理论通过提供一个衡量隐私保障的框架，以确保模型不会学习或记住用户的详细信息。

为了证明 TensorFlow Privacy 的有效性，谷歌提供了一个训练两个模型的例子，其中一个模型具有基于 TensorFlow Privacy 库的差异化隐私功能，而另一个没有。这两个模型是在标准 Penn Treebank 训练数据集上训练的。这两个模型在对英语建模中都表现良好。如对于以下的财经新闻句子，二者都能够获得好分数。

There was little turnover and nothing to stimulate the market
South korea and japan continue to be profitable
Merchant banks were stronger across the board

但是，在某些领域，这两个模型的得分天差地别。例如，使用传统的训练方法，以下这三个句子的得分都很高，也就是“在标准训练过程中，有效地记住了内容”。相反，差异性隐私模型在这些句子上的得分很低，并被拒绝了。

Aer banknote berlitz calloway … ssangyong swapo wachter
The naczelnik stands too
My god and i know i am correct and innocent

在财经新闻的语境中，这三个句子似乎不常见。因此，这三个罕见的句子可以用来识别或揭示个人信息，因而使用敏感数据训练就被拒绝了。Radebaugh 进行了额外的解释：

这两个模型的差异在于，有隐私保护的模型不能记住异常的罕见序列。我们可以利用我们先前在神经网络中测量无意识记忆的工作来量化这种影响。我们故意在训练数据中插入独特的、随机的罕见句子，并评估罕见句子对训练模型的影响。在这种情况下，单个随机罕见句子的插入就足够让无隐私保护模型完全记住它了。

TensorFlow Privacy 库和示例可以在它们的GitHub存储库中找到。此外，TensorFlow技术白皮书已经更新，包含了这些新隐私机制的详细信息。

阅读英文原文：Introducing TensorFlow Privacy, a New Machine Learning Library for Protecting Sensitive Data

发布

暂无评论

创作场景

新机器学习库 TensorFlow Privacy 问世：旨在保护敏感数据

评论

QCon看点｜亚马逊云科技可持续软件工程实践分享

Week 1命题作业

阿里云多个智物新品集体出道,持续加速产业智能化

达摩院求解器升级覆盖黑盒优化难题

付费云存储，微信的登云梯还是蜀道难？

DeFi去中心化DAPP系统软件开发案例（现成）

10天拿到腾讯Android岗offer，内容太过真实

2021Android大厂面试题来袭，Android性能优化推荐书

数实融合·绽放新机，Techo Day技术回响日邀您“云相聚”

2021Android进阶学习资料，动脑学院vip课程百度云

模块一作业

金九银十，面试必备！耗时一周整理的牛客网上最火Java面试八股文

阿里云隐私增强计算产品DataTrust助力产业间实现数据价值高效协同

纵观移动云对象存储发展历程，也少不了 Apache APISIX 的能力加持

分布式事务开山之作，带你深入理解分布式事务

老凡尔赛了！当亚马逊云科技大佬“转行”讲起脱口秀

收藏！490家专精特新数智企业全名单：听听“小巨人”企业怎么说？

官方线索|把梦想当作热爱，用技术创造价值！

翻车了，字节一道 Fragment面试题

每秒创建百万文件，百度沧海·文件存储CFS推出新一代Namespace架构

会计CRM系统软件提高公司管理效率

Android架构之网络优化

SimpleDateFormat线程不安全了？这里有5种解决方案

阿里云正式开源PolarDB-X数据库,壮大云原生分布式数据库生态

第 21 章 -《Linux 一学就会》- 结构化命令case和for、while循环

架构设计第一周学习总结

同为aPaaS平台，华为云开天aPaaS与AppCube有何不同？

docker 安装kafka

腾讯云，五轮面试，六个小时，灵魂拷问，含泪拿下 60W offer

阿里云混合云Apsara Stack 2.0发布，加速政企数智创新

2021Android面试笔试总结！html5移动开发即学即用网盘

创作场景

新机器学习库 TensorFlow Privacy 问世：旨在保护敏感数据

评论

更多内容推荐

推荐阅读

电子书

大厂实战PPT下载