写点什么

北大王立威教授:数据隐私的研究关键在于如何定义隐私

  • 2020-04-09
  • 本文字数:2150 字

    阅读完需:约 7 分钟

北大王立威教授:数据隐私的研究关键在于如何定义隐私

Robin.ly 在 NeurIPS 2019 现场特邀北京大学信息科学技术学院计算机科学与技术系的王立威教授,分享了他在 NeurIPS 2019 大会被接收的研究论文,同时他也对数据隐私、中美两国在 AI 研究趋势的差异作了深入分析。


王教授长期从事机器学习领域相关研究,为解释深度学习算法、boosting 算法、主动学习、隐私保护学习等算法的泛化性做出了重要贡献。自 2002 年以来,在 NeurILS、CVPR、ICML、TPAMI 等国际顶级期刊和会议上发表了 100 多篇论文。他是第一位被 IEEE 评为“人工智能十大新星”的亚洲研究人员,并参与编写 2009 版《机器学习及其应用》及 2015 版《差分隐私保护的机器学习》的相关章节。



王立威(左)在 NeurIPS 2019 会场接受 Robin.ly 专访

NeurIPS 2019 的论文亮点

Margaret Laffan: 王教授,您在 NeurIPS 2019 提交的三篇论文已经被大会接收。能介绍一下这些文章的主要贡献吗?


王立威:


这三篇论文中有两篇是焦点论文(spotlight papers),也就是在所有接收论文中前 10% 的优秀论文。但我想提到的是另外一篇墙报论文。在这篇论文中,我们提供了一种新算法,完全解决了在线学习(online learning)领域存在了 10 年的开放性问题,并获得了非常有趣的结果,比前人的方法能够更有效地解决许多实际应用问题。


差分隐私机器学习

Margaret Laffan: 作为机器学习和模式识别方面的专家,您撰写过一本有关机器学习和差分隐私的书。数据隐私是当前的热门话题,您认为这个领域目前的技术局限在哪里?我们应该如何解决?


王立威:


我从事数据隐私工作有 10 多年了。大约 15 年前,人们已经开始对数据隐私进行研究,但是在所有这些工作中都存在一个关键问题:对于“数据隐私”这个概念的定义五花八门,但是并没有关于启发式算法的定义(heuristic algorithms)。例如,有人发明了一种保护隐私的算法,后来又出现了一种可以攻击这种隐私保护算法的新算法。发生这种情况就是因为对隐私的定义不是很明确。


但是在 2006 年,诞生了一种对隐私的严格定义,即“差分隐私”的概念。如果我们设计了一种算法,并证明它可以保护差分隐私,那么无论计算机具有什么计算能力,具有什么先验知识,我们都可以保证它无法破坏数据的隐私。自那之后,数据隐私领域的大部分工作都建立在差分隐私上。所以可以说这是一项突破,是数据隐私领域一次巨大的进步。


当然,差分隐私也存在局限性。这种局限性在于,我们需要为数据添加大量噪声以保护隐私,而这种噪声会损害数据本身的实用性。我认为一种解决方法是寻找除了差分隐私,是否还存在其他更好的关于数据隐私的定义。所以一方面我们可以保护隐私,另一方面,对于要用于机器学习或其他统计目的的数据,也要保证其良好的实用性。



图片来源:pixabay

中美在 AI 领域的差异

Margaret Laffan: 您在过去二十年的工作一直非常受人瞩目,您也参加过很多全球性的会议。能不能谈谈中美两国在研究方向,商业应用和产品商业化方面有何不同?


王立威:


在中国,如果我们拥有一项技术,就可以迅速将其应用于商业并开始盈利。我认为这是中国比美国和加拿大,以及欧洲做得好的地方。但是对于 AI 的基础理论的研究,我认为西方国家的优势更大。在中国,目前只有少数人从事 AI 相关的理论研究。如果中国想在 AI 领域真正占据主导地位,还需要进行更深入的理论研究,并结合我们在应用,工程和技术上的优势。


当然,中国也存在数据隐私问题,尤其是在医疗领域。中国有很多将 AI 应用于医学分析的创业公司。不过针对这些隐私问题,中国政府也很快制定了相应的政策,鼓励更多的公司在这一领域开展业务。我相信中国在这个领域的发展会非常迅速。

AI 领域下一个趋势

Margaret Laffan: 在过去的十年中,您见证了中国的机器学习领域发生了哪些变化?放眼全球,您认为 AI 领域的下一个主要趋势是什么?


王立威:


过去的十年,人工智能和机器学习在中国的发展非常迅速。 许多学生和研究人员都在从事与 AI 相关的工作。AI 在工业界的发展尤其显著,一项新技术甚至在几个月内就能转化为产品。从学术角度来说,十年前在 NeurIPS 2009(那时候还叫 NIPS 2009),我清楚地记得来自中国的参会者只有 1% 左右,来自中国的论文投稿一只手也数得过来。但是现在我们已经能看到很多中国面孔,提交的论文也随之出现了大幅度的增长。


从世界范围内看,一个比较明显的趋势是将 AI,尤其是深度学习应用于行业的各个方面。目前,深度学习主要应用于计算机视觉,语音识别和自然语言处理,但在许多其他学科中,人工智能具有尚未被应用的潜力,例如通信。我已经与一些通信公司进行了交谈,我认为有机会使用 AI 技术来提高该领域的效率。



图片来源:pixabay

NeurIPS 区域主席的责任

Margaret Laffan: 您也是 NeurIPS 的区域主席。能介绍一下这个角色的主要工作内容吗?


王立威:


在过去的几年中,NeurIPS 会议的论文提交数量呈现了指数增长,每年都会比上一年增加大约 50%。作为区域主席,我们需要把控审阅流程的质量,仔细阅读每一篇投稿,监督审稿人能否提出正确的建议并做出负责任的评论,以确保优质的论文能够被接收。一个最重要的评判标准就是对所在领域的贡献——是否提出了有针对性的新想法,当然如何用流畅的语言讲一个好的故事也很重要。我认为这是每位区域主席的责任。


本文转载自 Robinly 公众号。


原文链接:https://mp.weixin.qq.com/s/qTdHdgnbcWJU3eNG9gk-HA


2020-04-09 15:531128

评论

发布
暂无评论
发现更多内容

AI制作PPT软件有哪些?这款中文版Gamma值得推荐!

职场工具箱

效率工具 职场 PPT 办公软件 AI生成PPT

青椒云上线《黑神话:悟空》专属游戏云电脑,免安装,即点即用!仅需2.98/h

青椒云云电脑

云电脑 云电脑平台 黑神话悟空

万界星空科技注塑行业MES解决方案

万界星空科技

制造业 mes 万界星空科技 注塑MES 注塑行业

2024-08-21:用go语言,给定一个从 0 开始索引的整数数组 nums 和一个整数 k,请设计一个算法来使得数组中的所有元素都大于或等于 k,返回所需的最少操作次数。 每次操作可以执行以下步骤

福大大架构师每日一题

福大大架构师每日一题

云手机解决了TikTok哪些账号运营难题?

Ogcloud

云手机 海外云手机 tiktok云手机 云手机海外版 tiktok运营

今日分享丨浅谈iGIX并行启动

inBuilder低代码平台

亚马逊云科技服务之安全巡检及优化

伊克罗德信息科技

岳阳东宇第六家高端网咖开业,这位老板笃定14900K的原因是?

E科讯

KubeCon China 2024 现场见!与华为云原生专家畅聊服务治理,一起Meet The Authors !

华为云原生团队

云计算 容器 云原生 KubeCON

MES系统在铜加工行业的应用

万界星空科技

mes 万界星空科技 铜业 制造业工厂 铜加工

跟着 iLogtail 学习高质量软件建设

阿里巴巴云原生

阿里云 云原生

望繁信科技入选2024年第3批上海市高新技术成果转化项目名单

望繁信科技

数字化转型 流程挖掘 高新技术企业 流程智能 数字北极星

为财务团队合理进行角色分配和技术培训

智达方通

财务管理 财务转型

更快更强,SLS 推出高性能 SPL 日志查询模式

阿里巴巴云原生

阿里云 云原生 日志服务

短视频生成与AI的结合应用,Web/App RPA 智能化应用

霍格沃兹测试开发学社

云手机在亚马逊店铺运营中能发挥什么作用

Ogcloud

云手机 海外云手机 云手机海外版 亚马逊运营 亚马逊云手机

Cohere 创始人:语音是下一代用户界面;OpenAI 开放 GPT-4o 定制新功能丨 RTE 开发者日报

声网

数据库运维实操优质文章分享(含Oracle、MySQL等) | 2024年7月刊

墨天轮

MySQL 数据库 oracle sql postgresql

极客天成和ScaleFlux完成产品相互兼容认证

ScaleFlux

分布式存储 企业级SSD

沪港数据竞赛圆满落幕,启信宝独揽双重大奖

合合技术团队

科技 合合信息 启信宝

如何选择合适的代理IP?

IPIDEA全球HTTP

一直没找到合适的开源富文本?何不尝试下Fluent Editor,一个基于Quill 2.0的富文本编辑器,功能强大、开箱即用!

OpenTiny社区

前端 OpenTiny TinyVue 开源组件库

1场Keynote,7场技术演讲 | Karmada云原生多云容器编排引擎闪耀亮相 KubeCon China 2024

华为云原生团队

云计算 容器 云原生 KubeCON

小度联合新华网客户端,举办“AI技术对中小学教育的深度赋能”主题活动

科技热闻

华为云CodeArts API:API管理一体化平台 7月新特性介绍

API 华为云

《黑神话》火到破纪录,老黄都要到游戏展秀一把:全景光追英伟达独享,同款技术还有20+游戏在路上

Openlab_cosmoplat

AI 游戏

【IoTDB 线上小课 06】列式写入=时序数据写入性能“利器”?

Apache IoTDB

观测云:千人千面的监控观测平台

观测云

观测云 监控观测

北大王立威教授:数据隐私的研究关键在于如何定义隐私_大数据_Robinly_InfoQ精选文章