如何让数据安全地发挥其真正价值?

2020 年 9 月 25 日

如何让数据安全地发挥其真正价值?

你是否经历过这样的场景:和朋友在聊天软件上说着夏天到了,该减肥了。再去打开购物软件的时候,发现首页上多了许多瑜伽垫、弹力带等运动用品的推荐;或许你对这样的“现代科技”惊叹过,抑或许你对这样的“实时监控”惊慌过,但由于这样的事情已经屡见不鲜了,所以你从未因此申诉过自己的数据被“窃取”了。

各类囊括了我们衣食住行需求的 App 让我们的生活更加便捷,电子商务、新零售、物流业也被注入了蓬勃发展的动力。

与此同时 App 的数据安全问题也日益暴露出来,前有第三方iOS 程序私自监控剪贴板,后有315 晚会上央视点名某些手机App 盗窃隐私。

各大类App 都或多或少存在一些数据安全问题,只是这些问题掩盖在了App 带给我们的便利之下。

各大类App 信息安全平均问题数统计 数据来源:信通院《移动应用(App)数据安全与个人信息保护白皮书》

其实我国对公民的隐私安全问题也逐步重视起来,去年已经印发了《App 违法违规收集使用个人信息行为认定方法》,即使App 经过我们的同意获取到了我们的相关隐私数据,但也无权转让给其他App。

但是在安全合规的情况下,如何保证我们的生活依旧便捷呢?联邦学习不失为一个解决办法。

联邦学习是什么?

联邦学习就是通过联合多方,在不泄露或汇聚各方原始数据的前提下进行联合建模的一种机器学习框架。

联邦学习框架

当两个不同地区银行的信贷风险部门因为数据量不足以及数据行为不具有普遍性而无法建立合适的信贷风险模型来进行风险防控时,可能两个银行用户不同但其业务特征重叠较多,我们就可以使用** 横向联邦学习 ** 赋能两家银行的信贷业务。

当某地区的银行因为弱识别用户的银行 APP 活跃度不够或数据行为覆盖较少而对给其放贷犹豫不决时,则可以引入同一用户群体在电商平台的消费数据和其他金融机构的相关数据,再运用纵向联邦学习进行建模,从而能够有效降低不良贷款率。

而对于用户重叠较少且业务特征也重叠较少的两企业,若想利用双方数据赋能各自业务线,则可以使用横纵结合的联邦学习

三类联邦学习

联邦学习中进行交换的数据是经过加密的模型或梯度,其他人是无法通过这些信息反推出参与方的原始数据的,因而联邦学习在解决数据孤岛问题时具有良好的隐私保护机制。

同时,联邦学习中建立的激励和利益分配机制,让各企业都有动力参与其中,并且都能根据其对联邦任务的贡献程度而获得应有的利益。

联邦学习在Sophon 上的演绎

为了帮助客户实现隐私保护与数据应用上的平衡以及解决在某些领域存在的数据孤岛问题,Sophon 也提出了自己的联邦学习框架Sophon FL。

Sophon FL 框架

在底层的数据和设备层中,该框架会支持 CPU、GPU 集群,以及多种类型的输入数据源;

底层上一层是加密层和计算后端层,在此我们会支持同态加密和差分隐私等加密方式,以及 Spark、Tensorflow、Pytorch 等多种计算框架。这样的设计让使用不同后端计算引擎的客户都能参与到 Sophon FL 上的联邦任务中;

再上一层即是联邦学习计算层,其支持基本的安全计算以及在此之上的不同种类的模型训练和联邦学习任务,让不同场景的数据安全应用要求都尽可能得到满足;

在最上层的应用层中,我们会支持诸如反洗钱、反欺诈、风控和精准营销等场景,联邦风控、联邦营销、联邦安防等不会是纸上谈兵了。

Sophon FL 为用户提供多样化选择

多元化的计算框架能够支持如 Sophon,Spark 等多种计算框架;多元化的硬件设备让你本地的 CPU、GPU 等多种硬件设备都能得到支持;多元化的算法种类使得多种联邦计算算法和联邦优化算法都能助力你的智慧化转型大业;多元化的隐私保护让你不论是在《数据安全管理办法》的考验下,还是在GDPR 的管控下,都不会有数据使用侵权的嫌疑。

Sophon FL 看板展示

“两易两高”便于操作:交互式的操作界面以及清晰化的功能设计让 Sophon FL 易于上手;看板管理让每条联邦学习任务的状态和进程易追踪;良好的通信效率让加密的模型或梯度都能得到高效传输;无论是多种联邦学习算法保障的建模效果,还是全流程建模和模型上线的支持,都能让用户体验高效建模。

实践示例

假设有两个信贷管理部门,分别来自上海的银行 A 和北京的银行 B,他们都面临同样的两个问题,本行信贷档案数据量不足以及相关信贷数据不具有普遍性。如果把 A、B 的数据进行汇聚再建模确实能解决以上两个问题,但同时也将银行的用户隐私进行了泄露,可能面临与“池子状告中信银行”相似的场面。而利用 Sophon FL 则能既进行隐私保护又能让两家银行合法合规地通过联邦计算模型去判断客户的贷款资质和信用情况,实现联邦信贷风控。

数字经济时代,数据既是创造财富的关键,也是智慧化转型的必需,与此同时数据安全及隐私保护也不可忽视。

2020 年 9 月 25 日 10:53 860

评论

发布
暂无评论
发现更多内容

数据库快速迁移10亿级数据

架构师修行之路

高并发系统设计 数据库优化

Makefile的基本编写与优化

Liuchengz.

c Linux makefile

对于结果不同程度的追求,决定了这个人的身价

非著名程序员

程序员 个人成长 思维模型 结果思维

究竟要找什么样的工作?

escray

面试 学习笔记 面试现场

我以后去做什么,技术还是业务?

escray

面试 职业规划 学习笔记 面试现场

为什么考研,考研能给你带来什么?说说我的感受!

我是程序员小贱

架构设计篇之云计算服务设计与决策

小诚信驿站

云计算 刘晓成 云计算服务设计 企业架构和云服务 SaaS/IaaS/PaaS

免费开源看板软件Wekan安装与使用记录

emuqi

Docker 效率工具 wekan 看板 任务管理

如何通过技术面试?

escray

面试 学习笔记 面试现场

Flink的2种部署模式-2

小知识点

scala flink 大数据技术

大数据技术发展(三):Spark 代替 Hadoop ? Spark Or Flink ?

Jeffy

Java 大数据 flink hadoop spark

区块链在新冠病毒爆发中将加速发展

CECBC区块链专委会

区块链技术 供应链 食品追溯

Week 11 学习总结

Jeremy

公司想要大龄程序员么?

escray

学习笔记 面试现场

我是合适的人选么?

escray

面试 学习笔记 面试现场

特性预览:Apache 顶级项目 Apache Pulsar 2.6.1 版本即将发布

Apache Pulsar

Apache Apache Pulsar 消息系统

辗转相除法求最大公约数(C语言实现)

InfoQ_3f366696ed0c

C语言

Python中的bytes、str以及unicode区别

王坤祥

Python Python PEP

简单交互式页面的思考(C)

Alex

指针 C语言 交互设计

终于可以职业规划了么?

escray

面试 学习笔记 面试现场

一看就懂的三次握手

书旅

TCP 三次握手 操作系统 协议族

Apache Pulsar 社区周报:08-08 ~ 08-14

Apache Pulsar

Apache Apache Pulsar 消息系统

搞一搞Elasticsearch

北漂码农有话说

我喜欢的工作,喜欢我么?

escray

面试 学习笔记 面试现场

小白程序员成长之路-准备篇

小柚先生不吃辣

盲打练习 在线打字

企业品尝新基建的美酒前,需要名为NetEngine 8000的酒杯

脑极体

firewalld 常用指令

wong

Firewalld

迟到的"松鼠"

许学文

个人感悟

区块链政策区域特征分明 产业园区渐成聚集效应

CECBC区块链专委会

区块链 新基建

Week 11命题作业

Jeremy

四十不惑,准备面试

escray

学习笔记 面试现场

如何让数据安全地发挥其真正价值?-InfoQ