写点什么

智源研究院学术副院长唐杰:数据在开放共享的同时,隐私保护机制也要并举

  • 2019-11-07
  • 本文字数:1497 字

    阅读完需:约 5 分钟

智源研究院学术副院长唐杰:数据在开放共享的同时,隐私保护机制也要并举

10 月 31 日,由北京智源人工智能研究院主办的 2019 北京智源大会在国家会议中心开幕,会期两天。智源大会是北京创建全球人工智能学术和创新最优生态的标志性学术活动,定位于“内行的 AI 盛会”。

为推动行业数据开放共享,支撑人工智能基础研究与关键技术研发,大会现场,北京智源人工智能研究院宣布成立数据开放研究中心。该中心旨在制定数据开放标准,研究数据开放核心技术,搭建数据开放共享平台。智源研究院学术副院长唐杰担任数据开放研究中心主任。此次大会上,北京市科委主任许强、智源研究院院长黄铁军和数据开放研究中心主任唐杰共同为研究中心揭牌。

大会现场,数据开放研究中心主任唐杰接受了 InfoQ 等少数媒体的采访,唐杰就数据开放研究中心的情况做了详细介绍,并就数据安全、AI 发展现状等热门话题发表了自己的看法。

推动数据开放共享

据唐杰介绍,数据开放研究中心大概从今年 6、7 月份开始策划,“最早北京人工智能研究院主要想做几件事:第一是智源学者;第二是联合实验室,第三是社区,总的来讲,我们是希望智源成为一个平台性的组织,上面有学者、联合实验室、有各种社区。”


在实际推进过程中,联合实验室推进较慢,因为像这样重量级的项目一般都需要经过多次论证,到现在,智源才论证成立了京东、旷视两个联合实验室,未来这十个联合实验室仍需要很长时间建设,即便在并行操作的情况下。


因此,智源的专家们就在思考:是否能够打造一个数据平台?在这个数据平台上能够支持更加广泛的、容易的、轻量级的共享,且能在上面建立出面向学者和企业级的任务型竞赛。这样就可以加快迭代,否则依托这种联合实验室来做相对比较慢,而且联合实验室一发布出来后,有些公司还会有顾虑比如对竞争对手的考量。这是数据开放共享研究中心设立的原因之一。


唐杰表示,另外一个很重要的原因是,如何做数据脱敏、数据隐私、如何让数据更安全是数据开放中非常重要的研究内容。


据 InfoQ 了解,数据开放研究中心的具体工作内容包括以下几个方面:


开放标准:制定数据开放和共享系列标准,包括人工智能数据开放许可协议、人工智能数据资源开放管理规范等。


关键技术:研究隐私数据泄露风险模型;按照数据使用场景,研究相应的数据开放技术。


开放数据集:创建行业关键数据集,通过自动抓取、标注、与外部单位合作等方式,构建一批高质量的数据集。


共享平台:搭建数据开放共享平台,提供数据开放与共享服务,推动人工智能行业发展。


谈到数据安全、隐私问题,唐杰表示,从研究的角度讲,数据脱敏、数字隐私保护是一个“矛和盾”、“盾和矛”的问题,因为你在这里想办法怎么将数据保护起来,但总会有人想办法攻击进来,这两个方面是不停的在发展,可能有的阶段是“道高一尺”,有的阶段是“魔高一丈”。


目前解决的办法主要有几种,一种是加密共享技术,可以将数据用私钥加密后再进行共享,接下来在加密数据上构建模型。一种是联邦学习,联邦学习并不分享数据,而是分享模型,在在模型层面上做共享,这个时候数据没有开放出来。


采访中,唐杰表示,近期 AI 技术在逐渐朝着实用性发展,如时下热度颇高的安防、交通、医疗等都是 AI 非常重要的应用领域。


谈到现在比较火的自动驾驶,唐杰对其发展前景表示乐观,“我认为在未来有限的时间里是可以实现的“。他表示,自动驾驶技术发展越来越快,几乎每年都有很大的变化,在国内的特定领域,自动驾驶已经成型。未来随着技术的发展,它是一定可以实现的,但这个实现需要政府、民众等各方的努力,此外,有必要花一些时间消除人们对于自动驾驶的恐惧,很多人认为自动驾驶危险性很高,其实无人驾驶可能人驾驶还更安全一些。“我个人乐观估计,希望能够在未来六到九年实现,希望我的预言成真”。


2019-11-07 08:001997
用户头像
刘燕 InfoQ高级技术编辑

发布了 1123 篇内容, 共 609.0 次阅读, 收获喜欢 1982 次。

关注

评论

发布
暂无评论
  • 解决事务隔离产生问题的 MVCC

    什么是MVCC ?? MVCC称为:多版本并发控制,数据多版本并发控制,Multi Version Concurrency Control,也可以称为MCC,反正我最先知道他就是被称为MCC,因为当时我了解他的时候是这样的MultiVersion Concurrency Control。

    2023-04-12

  • 简洁好用的思维导图软件:simplemind 中文版

    SimpleMind 是一款流行的思维导图软件,支持多种平台,包括 Windows、Mac、iOS 和 Android。它提供了简单易用的界面和丰富的功能,可以帮助用户轻松地创建、编辑和共享思维导图。

    2023-05-04

  • 区块链 + 新基建:数字社会的四驾马车

    区块链在内的“四驾马车”,如何推动数字社会的发展?

    2021-08-18

  • new Vue 的时候到底做了什么

    1.初始化的第一阶段是Vue实例也就是vm对象创建前后:首先Vue进行生命周期,事件初始化发生在beforeCreate生命周期函数前,然后进行数据监测和数据代理的初始化,也就是创建vm对象的过程,当vm对象创建完成就可以通过vm对象访问到劫持的数据,比如data中的数据

    2022-11-16

  • 湖仓一体:国产基础软件的创新突破与弯道超车

    随着数字化转型进程的加快,企业对于数据基础设施的存储和计算能力要求越来越高。如何进行数据资产的统一管理和共享?通过数据构建企业关键能力、实现数据智能型组织?应对企业的数字化转型需要,数据基础软件领域的技术也在不断升级迭代。

    2023-08-14

  • 软件测试 / 测试开发 | 测试平台开发 - 前端开发之 Vue.js 框架的使用

    首先将 Vue.js 下载到本地,本章就以本地的 Vue.js 为例。在本地创建一个工作区即创建一个文件夹,使用 vscode 打开,将 Vue.js 放到工作区目录下。

    2023-03-06

  • 表结构数据详解(上)

    2022-12-29

  • 导读 | 万物背后的规律都是数据

    这节课其实相当于我们正式进入正课内容的一个小预习,我们很多人平时很容易对数据想当然,但究根结底,我们对数据还需要进一步的认识。

    2021-07-28

  • 开源模式新探索!卡奥斯工业互联网开源开放社区再升级

    为了进一步加速工业互联网的发展,更好地对开源模式进行实践探索,5月13日,由天工开物开源基金会、开源中国社区联合发起的中国开源未来发展峰会在重庆召开。会上,卡奥斯COSMOPlat公布了其立足工业互联网平台开源开放建设,打造的以软件开源、硬件开放、开发

    2023-05-23

  • 海泰方圆又双叒叕连获两项隐私计算专利

    身处数据时代,需要统筹数据发展和安全,以数据开发利用和产业发展促进数据安全,以数据安全保障数据开发利用和产业发展。如何兼顾发展和安全,平衡效率和风险,在保障安全的前提下发挥数据价值,是当前面临的重要课题。隐私计算技术为流通过程中数据的“可用

    2023-03-17

  • 万物皆可“Embedding”,NLP 到底应该怎么做?(下)

    讲师介绍: 廖益玄,vivo AI NLP组技术负责人、AI算法专家。负责vivo内容理解平台的算法研发工作,并主导实现了公司内的NLP技术框架VNF。资深IT人,AI技术发烧友,撸过代码,做过架构,写过算法,早年曾作为技术合伙人开发了国内第一款中文语音助手智能360。 问题背景: 做NLP的同学想必都知道,从2013年Word2vec词向量提出开始,深度学习的方法逐渐“占领”了NLP领域各个应用场景,比如用于文本分类的TextCNN,用于序列标注的RNN等等。而在2018年大规模预训练模型Elmo、BERT发布之后,NLP领域又开始了新一轮的“革命”。 在这个万物皆可“Embedding”的年代,NLP应该怎么来做呢?跟之前传统机器学习方法又有何异同呢? 内容看点: Network weights 在计算词向量时,不同于 Word2vec的地方 文本表征模型的变化,从Transformer到BERT 预训练时代下NLP开发的新范式

    2021-10-22

  • “程”风破浪的开发者|我的 Docker 学习小妙招

      本文是 Docker 容器的数据卷使用的简单教程,介绍了什么是数据卷、数据卷概念、以及如何使用数据卷等。

    2022-10-23

  • 2023 数字中国建设峰会:百度点石获开放群岛开源社区优秀共建单位

    4月29日,作为第六届数字中国建设峰会重要组成部分,数字中国建设成果展览会同期论坛“2023数字中国建设与数据可信流通论坛”在福州海峡国际会展中心召开。论坛由国内首个致力于构建可信数据要素流通体系的开放群岛(Open Islands)开源社区主办,论坛同步举

    2023-05-22

  • 如何访问 TDH 中 Inceptor 底层的元数据库 TxSQL

    如何访问TDH中Inceptor 底层的元数据库TxSQL ?

    2023-09-25

  • 异常检测:探索数据深层次背后的奥秘《中篇》

     异常检测:探索数据深层次背后的奥秘《中篇》

    2023-09-22

  • 结束语|送你一张通往未来“通用人工智能”时代的船票

    送你一张通往未来“通用人工智能”时代的船票

    2023-05-15

  • 如何打开 plist 文件

    plist 文件是一种用于存储应用程序配置信息的文件格式,其中包含应用程序的各种设置和数据。在过去,plist 文件通常是以.plist 格式存储的。然而,随着时间的推移,人们开始使用.plistx 格式来存储更复杂的数据结构和数据。如果您需要将.plist 文件打开,可以

    2023-04-12

  • 33|AI 前沿:ChatGPT 资料精选集

    本精选集的目的在于提供一个便捷的参考资源,帮助你全面掌握ChatGPT。

    2023-05-01

  • 15 年磨一剑,亚马逊云科技数据产品掌门人 Swami 揭秘云原生数据战略的三大关键要素

    2022亚马逊云科技 re:Invent 全球大会正在拉斯维加斯如火如荼进行中,亚马逊云科技数据与机器学习副总裁 Swami Sivasubramanian 博士发表了“数据与机器学习如何助力企业构建端到端的数据战略”的主题演讲来开启第三天的日程。

    2022-12-05

发现更多内容

轻帆云ITAM携手新能源汽车制造商:打造智能制造时代下的IT资产管理新模式

云智慧AIOps社区

ITSM软件 IT服务管理 工单管理系统 IT资产管理 itam

设备点检 设备维护经验总结(13)

万里无云万里天

工业 工厂运维 设备点检

Doris MCP Server v0.6.0 正式发布

SelectDB

数据库 AI 智能体

第十二届“创青春”佛山青年创新创业大赛总决赛成功举办

极客天地

一线操作工也能管能耗?MyEMS 的 “傻瓜式仪表盘”,把专业数据变成 “大白话”

开源能源管理系统

开源 能源管理系统

从园区到城市:MyEMS 的 “能源孪生平台”,能当区域能源互联网的 “神经中枢” 吗?

开源能源管理系统

开源 能源管理系统

区块链 Web3 开发框架及特点

北京木奇移动技术有限公司

区块链开发 软件外包公司 web3开发

伊克罗德信息连获三重国际认证,以标准化服务体系护航客户数智化转型

伊克罗德信息科技

人工智能“芯模联动”产业大会召开  萧山区芯模社区正式开园

极客天地

【提示词工程】项目计划书正在杀死90%的创业项目

HuiZhuDev

敏捷管理 项目规划 AI革命 创业思维 动态系统

火山引擎Data Agent赋能金融行业,打造智能投顾与精准营销新范式

科技新消息

三星Gallery3d应用取证分析:挖掘删除痕迹的数字取证技术

qife122

数字取证 SQLite分析

库存防超卖(Redis Lua+分布式锁对比实践)

王中阳Go

Go 后端 电商

N8N工作流中文转换神器!一键转中文

王磊

快速构建一个基础、现代化的 WinForm 管理系统

追逐时光者

C# .net WinForm

Web of Things (WoT) 物描述 2.0 首个公开工作草案发布

qife122

物联网 JSON-LD

拒绝 “厂商绑定”:MyEMS 凭什么成为工业企业的 “能源管理自主选择权”?

开源能源管理系统

开源 能源管理系统

KnowFlow 牵手百度 PaddleOCR-VL,开启高精度文档解析新时代

KnowFlow RAG 知识库

AI 大模型 知识库 agent rag

信号、Shell与Docker:层层嵌套的陷阱剖析

qife122

Docker Linux

远程控制软件谁更优?ToDesk、向日葵、UU 远程性能核心维度对比实测

鸽芷咕

安全 远程控制软件

区块链 Web3 系统开发的流程

北京木奇移动技术有限公司

区块链开发 软件外包公司 web3开发

构建流畅架构:领域驱动设计、Wardley映射与团队拓扑的完美融合

qife122

微服务架构 Wardley映射

🧭 前端周刊第440期(2025年11月10日–11月16日)

掘金安东尼

Apache Doris AI 能力揭秘(三):AI_AGG 与 EMBED 函数深度解析

SelectDB

Apache 数据库 实时数仓 Doris AI 函数

如何找到适合好用的 AI 数据分析软件?实用指南

Aloudata

大数据 数据分析 agent ChatBI dataagent

工业数字化 信息化经验总结(11)

万里无云万里天

数字化转型 工业 工厂运维

Apache Doris 数据导入原理与性能优化 | Deep Dive

SelectDB

数据库 数据分析 实时数仓 apache doris 数据导入

「 活动 」阿里云 ESA 有奖征文|六大选题 + 多档奖励,所有人均可参加

阿里云CloudImagine

云计算 阿里云 边缘计算 征文投稿 ESA

智源研究院学术副院长唐杰:数据在开放共享的同时,隐私保护机制也要并举_AI&大模型_刘燕_InfoQ精选文章