50万奖金+官方证书,深圳国际金融科技大赛正式启动,点击报名 了解详情
写点什么

智源研究院学术副院长唐杰:数据在开放共享的同时,隐私保护机制也要并举

  • 2019-11-07
  • 本文字数:1497 字

    阅读完需:约 5 分钟

智源研究院学术副院长唐杰:数据在开放共享的同时,隐私保护机制也要并举

10 月 31 日,由北京智源人工智能研究院主办的 2019 北京智源大会在国家会议中心开幕,会期两天。智源大会是北京创建全球人工智能学术和创新最优生态的标志性学术活动,定位于“内行的 AI 盛会”。

为推动行业数据开放共享,支撑人工智能基础研究与关键技术研发,大会现场,北京智源人工智能研究院宣布成立数据开放研究中心。该中心旨在制定数据开放标准,研究数据开放核心技术,搭建数据开放共享平台。智源研究院学术副院长唐杰担任数据开放研究中心主任。此次大会上,北京市科委主任许强、智源研究院院长黄铁军和数据开放研究中心主任唐杰共同为研究中心揭牌。

大会现场,数据开放研究中心主任唐杰接受了 InfoQ 等少数媒体的采访,唐杰就数据开放研究中心的情况做了详细介绍,并就数据安全、AI 发展现状等热门话题发表了自己的看法。

推动数据开放共享

据唐杰介绍,数据开放研究中心大概从今年 6、7 月份开始策划,“最早北京人工智能研究院主要想做几件事:第一是智源学者;第二是联合实验室,第三是社区,总的来讲,我们是希望智源成为一个平台性的组织,上面有学者、联合实验室、有各种社区。”


在实际推进过程中,联合实验室推进较慢,因为像这样重量级的项目一般都需要经过多次论证,到现在,智源才论证成立了京东、旷视两个联合实验室,未来这十个联合实验室仍需要很长时间建设,即便在并行操作的情况下。


因此,智源的专家们就在思考:是否能够打造一个数据平台?在这个数据平台上能够支持更加广泛的、容易的、轻量级的共享,且能在上面建立出面向学者和企业级的任务型竞赛。这样就可以加快迭代,否则依托这种联合实验室来做相对比较慢,而且联合实验室一发布出来后,有些公司还会有顾虑比如对竞争对手的考量。这是数据开放共享研究中心设立的原因之一。


唐杰表示,另外一个很重要的原因是,如何做数据脱敏、数据隐私、如何让数据更安全是数据开放中非常重要的研究内容。


据 InfoQ 了解,数据开放研究中心的具体工作内容包括以下几个方面:


开放标准:制定数据开放和共享系列标准,包括人工智能数据开放许可协议、人工智能数据资源开放管理规范等。


关键技术:研究隐私数据泄露风险模型;按照数据使用场景,研究相应的数据开放技术。


开放数据集:创建行业关键数据集,通过自动抓取、标注、与外部单位合作等方式,构建一批高质量的数据集。


共享平台:搭建数据开放共享平台,提供数据开放与共享服务,推动人工智能行业发展。


谈到数据安全、隐私问题,唐杰表示,从研究的角度讲,数据脱敏、数字隐私保护是一个“矛和盾”、“盾和矛”的问题,因为你在这里想办法怎么将数据保护起来,但总会有人想办法攻击进来,这两个方面是不停的在发展,可能有的阶段是“道高一尺”,有的阶段是“魔高一丈”。


目前解决的办法主要有几种,一种是加密共享技术,可以将数据用私钥加密后再进行共享,接下来在加密数据上构建模型。一种是联邦学习,联邦学习并不分享数据,而是分享模型,在在模型层面上做共享,这个时候数据没有开放出来。


采访中,唐杰表示,近期 AI 技术在逐渐朝着实用性发展,如时下热度颇高的安防、交通、医疗等都是 AI 非常重要的应用领域。


谈到现在比较火的自动驾驶,唐杰对其发展前景表示乐观,“我认为在未来有限的时间里是可以实现的“。他表示,自动驾驶技术发展越来越快,几乎每年都有很大的变化,在国内的特定领域,自动驾驶已经成型。未来随着技术的发展,它是一定可以实现的,但这个实现需要政府、民众等各方的努力,此外,有必要花一些时间消除人们对于自动驾驶的恐惧,很多人认为自动驾驶危险性很高,其实无人驾驶可能人驾驶还更安全一些。“我个人乐观估计,希望能够在未来六到九年实现,希望我的预言成真”。


2019-11-07 08:001962
用户头像
刘燕 InfoQ高级技术编辑

发布了 1112 篇内容, 共 598.3 次阅读, 收获喜欢 1982 次。

关注

评论

发布
暂无评论
  • new Vue 的时候到底做了什么

    1.初始化的第一阶段是Vue实例也就是vm对象创建前后:首先Vue进行生命周期,事件初始化发生在beforeCreate生命周期函数前,然后进行数据监测和数据代理的初始化,也就是创建vm对象的过程,当vm对象创建完成就可以通过vm对象访问到劫持的数据,比如data中的数据

    2022-11-16

  • 解决事务隔离产生问题的 MVCC

    什么是MVCC ?? MVCC称为:多版本并发控制,数据多版本并发控制,Multi Version Concurrency Control,也可以称为MCC,反正我最先知道他就是被称为MCC,因为当时我了解他的时候是这样的MultiVersion Concurrency Control。

    2023-04-12

  • 结束语|送你一张通往未来“通用人工智能”时代的船票

    送你一张通往未来“通用人工智能”时代的船票

    2023-05-15

  • 导读 | 万物背后的规律都是数据

    这节课其实相当于我们正式进入正课内容的一个小预习,我们很多人平时很容易对数据想当然,但究根结底,我们对数据还需要进一步的认识。

    2021-07-28

  • 开源模式新探索!卡奥斯工业互联网开源开放社区再升级

    为了进一步加速工业互联网的发展,更好地对开源模式进行实践探索,5月13日,由天工开物开源基金会、开源中国社区联合发起的中国开源未来发展峰会在重庆召开。会上,卡奥斯COSMOPlat公布了其立足工业互联网平台开源开放建设,打造的以软件开源、硬件开放、开发

    2023-05-23

  • 33|AI 前沿:ChatGPT 资料精选集

    本精选集的目的在于提供一个便捷的参考资源,帮助你全面掌握ChatGPT。

    2023-05-01

  • 软件测试 / 测试开发 | 测试平台开发 - 前端开发之 Vue.js 框架的使用

    首先将 Vue.js 下载到本地,本章就以本地的 Vue.js 为例。在本地创建一个工作区即创建一个文件夹,使用 vscode 打开,将 Vue.js 放到工作区目录下。

    2023-03-06

  • 2023 数字中国建设峰会:百度点石获开放群岛开源社区优秀共建单位

    4月29日,作为第六届数字中国建设峰会重要组成部分,数字中国建设成果展览会同期论坛“2023数字中国建设与数据可信流通论坛”在福州海峡国际会展中心召开。论坛由国内首个致力于构建可信数据要素流通体系的开放群岛(Open Islands)开源社区主办,论坛同步举

    2023-05-22

  • 万物皆可“Embedding”,NLP 到底应该怎么做?(下)

    讲师介绍: 廖益玄,vivo AI NLP组技术负责人、AI算法专家。负责vivo内容理解平台的算法研发工作,并主导实现了公司内的NLP技术框架VNF。资深IT人,AI技术发烧友,撸过代码,做过架构,写过算法,早年曾作为技术合伙人开发了国内第一款中文语音助手智能360。 问题背景: 做NLP的同学想必都知道,从2013年Word2vec词向量提出开始,深度学习的方法逐渐“占领”了NLP领域各个应用场景,比如用于文本分类的TextCNN,用于序列标注的RNN等等。而在2018年大规模预训练模型Elmo、BERT发布之后,NLP领域又开始了新一轮的“革命”。 在这个万物皆可“Embedding”的年代,NLP应该怎么来做呢?跟之前传统机器学习方法又有何异同呢? 内容看点: Network weights 在计算词向量时,不同于 Word2vec的地方 文本表征模型的变化,从Transformer到BERT 预训练时代下NLP开发的新范式

    2021-10-22

  • 如何访问 TDH 中 Inceptor 底层的元数据库 TxSQL

    如何访问TDH中Inceptor 底层的元数据库TxSQL ?

    2023-09-25

  • “程”风破浪的开发者|我的 Docker 学习小妙招

      本文是 Docker 容器的数据卷使用的简单教程,介绍了什么是数据卷、数据卷概念、以及如何使用数据卷等。

    2022-10-23

  • 表结构数据详解(上)

    2022-12-29

  • 异常检测:探索数据深层次背后的奥秘《中篇》

     异常检测:探索数据深层次背后的奥秘《中篇》

    2023-09-22

  • 简洁好用的思维导图软件:simplemind 中文版

    SimpleMind 是一款流行的思维导图软件,支持多种平台,包括 Windows、Mac、iOS 和 Android。它提供了简单易用的界面和丰富的功能,可以帮助用户轻松地创建、编辑和共享思维导图。

    2023-05-04

  • 15 年磨一剑,亚马逊云科技数据产品掌门人 Swami 揭秘云原生数据战略的三大关键要素

    2022亚马逊云科技 re:Invent 全球大会正在拉斯维加斯如火如荼进行中,亚马逊云科技数据与机器学习副总裁 Swami Sivasubramanian 博士发表了“数据与机器学习如何助力企业构建端到端的数据战略”的主题演讲来开启第三天的日程。

    2022-12-05

  • 湖仓一体:国产基础软件的创新突破与弯道超车

    随着数字化转型进程的加快,企业对于数据基础设施的存储和计算能力要求越来越高。如何进行数据资产的统一管理和共享?通过数据构建企业关键能力、实现数据智能型组织?应对企业的数字化转型需要,数据基础软件领域的技术也在不断升级迭代。

    2023-08-14

  • 如何打开 plist 文件

    plist 文件是一种用于存储应用程序配置信息的文件格式,其中包含应用程序的各种设置和数据。在过去,plist 文件通常是以.plist 格式存储的。然而,随着时间的推移,人们开始使用.plistx 格式来存储更复杂的数据结构和数据。如果您需要将.plist 文件打开,可以

    2023-04-12

  • 海泰方圆又双叒叕连获两项隐私计算专利

    身处数据时代,需要统筹数据发展和安全,以数据开发利用和产业发展促进数据安全,以数据安全保障数据开发利用和产业发展。如何兼顾发展和安全,平衡效率和风险,在保障安全的前提下发挥数据价值,是当前面临的重要课题。隐私计算技术为流通过程中数据的“可用

    2023-03-17

  • 区块链 + 新基建:数字社会的四驾马车

    区块链在内的“四驾马车”,如何推动数字社会的发展?

    2021-08-18

发现更多内容

链上量化合约保险交易挖矿dapp系统开发

开发微hkkf5566

小程序化:企业降本增效新玩法

Speedoooo

小程序 远程办公 数字化管理 数字化办公 小程序容器

专访“MySQL 之父”:我曾创造 MySQL,也将颠覆 MySQL

博文视点Broadview

手把手入门 Vue教学

MobTech袤博科技

html Vue

不知道如何分库分表,看完这篇文章,轻松应对工作面试

一灯架构

Java 10月月更

小程序技术可助力智慧医疗企业破茧突围?

Speedoooo

小程序 小程序容器 小程序化

聚焦DPU 技术研发与创新 天翼云打造全新一代云计算体系结构

天翼云开发者社区

【Mybatis】如何继承Mybatis中的Mapper.xml文件

石臻臻的杂货铺

mybatis 10月月更

面试官竟然问我为啥要用MQ,幸亏我看了参考答案

一灯架构

Java Java 面试 10月月更

读写锁还不会用StampedLock就Out了

JAVA旭阳

Java 并发 10月月更

CEF | CEF浏览器客户端功能详解

YOLO.

qt 10月月更 C++

收集yum install安装的软件的全量依赖 rpm 包

琦彦

rpm yum 10月月更

程序员脱口秀|10.20 硬核女孩召集!

Jina AI

程序员 活动 1024 活动报名

音频功率放大电路(使用过的语音方案电路记录)

矜辰所致

10月月更 音频功率放大电路 语言模块

玩转云端| 看天翼云iBox智能盒子如何实现边缘侧的“神机妙算”

天翼云开发者社区

化解企业云端协同难题,英特尔超能云终端2.0版本为市场注入全新活力

科技之家

PaaS平台应用趋势

元年技术洞察

AI 数据湖 PaaS 容器服务 微服务化

TCP:当初取代NCP,如今害怕被取代

C++后台开发

后台开发 网络协议 TCP/IP 后端开发 TCP协议

2022年中国快递出海市场发展洞察

易观分析

一带一路 快递

react-Suspense工作原理分析

夏天的味道123

React

方舟数据中台,打造企业数据能力组件中心

元年技术洞察

数据中台 低代码 数字化转型 企业自驱力

【Mybatis】Mybatis generator如何修改Mapper.java文件

石臻臻的杂货铺

mybatis 10月月更

如何向大模型注入知识?达摩院通义对话模型SPACE系列探索

阿里技术

人工智能 机器学习 深度学习 NLP 大模型

告别丑陋判空,一个Optional类搞定

JAVA旭阳

Java 架构 并发 10月月更

Web3.0时代,区块链能做什么?

旺链科技

区块链 产业区块链 Web 3.0 企业号十月PK榜

天翼云赋能智慧农业新农人迎来好收成

天翼云开发者社区

数字先锋| 铺设一条县域医疗“康庄大道”!

天翼云开发者社区

奋楫十年天翼云以科技创新刷新“中国速度”

天翼云开发者社区

一文详解如何用MySQL/Redis/ZooKeeper实现分布式锁

一灯架构

Java 10月月更

彻底搞懂React-hook链表构建原理

夏天的味道123

React

详解React的Transition工作原理原理

夏天的味道123

React

智源研究院学术副院长唐杰:数据在开放共享的同时,隐私保护机制也要并举_AI&大模型_刘燕_InfoQ精选文章