《HarmonyOS:领航者说》技术公开课来啦,大咖分享、实战解码,不容错过 了解详情
写点什么

智源研究院学术副院长唐杰:数据在开放共享的同时,隐私保护机制也要并举

  • 2019-11-07
  • 本文字数:1497 字

    阅读完需:约 5 分钟

智源研究院学术副院长唐杰:数据在开放共享的同时,隐私保护机制也要并举

10 月 31 日,由北京智源人工智能研究院主办的 2019 北京智源大会在国家会议中心开幕,会期两天。智源大会是北京创建全球人工智能学术和创新最优生态的标志性学术活动,定位于“内行的 AI 盛会”。

为推动行业数据开放共享,支撑人工智能基础研究与关键技术研发,大会现场,北京智源人工智能研究院宣布成立数据开放研究中心。该中心旨在制定数据开放标准,研究数据开放核心技术,搭建数据开放共享平台。智源研究院学术副院长唐杰担任数据开放研究中心主任。此次大会上,北京市科委主任许强、智源研究院院长黄铁军和数据开放研究中心主任唐杰共同为研究中心揭牌。

大会现场,数据开放研究中心主任唐杰接受了 InfoQ 等少数媒体的采访,唐杰就数据开放研究中心的情况做了详细介绍,并就数据安全、AI 发展现状等热门话题发表了自己的看法。

推动数据开放共享

据唐杰介绍,数据开放研究中心大概从今年 6、7 月份开始策划,“最早北京人工智能研究院主要想做几件事:第一是智源学者;第二是联合实验室,第三是社区,总的来讲,我们是希望智源成为一个平台性的组织,上面有学者、联合实验室、有各种社区。”


在实际推进过程中,联合实验室推进较慢,因为像这样重量级的项目一般都需要经过多次论证,到现在,智源才论证成立了京东、旷视两个联合实验室,未来这十个联合实验室仍需要很长时间建设,即便在并行操作的情况下。


因此,智源的专家们就在思考:是否能够打造一个数据平台?在这个数据平台上能够支持更加广泛的、容易的、轻量级的共享,且能在上面建立出面向学者和企业级的任务型竞赛。这样就可以加快迭代,否则依托这种联合实验室来做相对比较慢,而且联合实验室一发布出来后,有些公司还会有顾虑比如对竞争对手的考量。这是数据开放共享研究中心设立的原因之一。


唐杰表示,另外一个很重要的原因是,如何做数据脱敏、数据隐私、如何让数据更安全是数据开放中非常重要的研究内容。


据 InfoQ 了解,数据开放研究中心的具体工作内容包括以下几个方面:


开放标准:制定数据开放和共享系列标准,包括人工智能数据开放许可协议、人工智能数据资源开放管理规范等。


关键技术:研究隐私数据泄露风险模型;按照数据使用场景,研究相应的数据开放技术。


开放数据集:创建行业关键数据集,通过自动抓取、标注、与外部单位合作等方式,构建一批高质量的数据集。


共享平台:搭建数据开放共享平台,提供数据开放与共享服务,推动人工智能行业发展。


谈到数据安全、隐私问题,唐杰表示,从研究的角度讲,数据脱敏、数字隐私保护是一个“矛和盾”、“盾和矛”的问题,因为你在这里想办法怎么将数据保护起来,但总会有人想办法攻击进来,这两个方面是不停的在发展,可能有的阶段是“道高一尺”,有的阶段是“魔高一丈”。


目前解决的办法主要有几种,一种是加密共享技术,可以将数据用私钥加密后再进行共享,接下来在加密数据上构建模型。一种是联邦学习,联邦学习并不分享数据,而是分享模型,在在模型层面上做共享,这个时候数据没有开放出来。


采访中,唐杰表示,近期 AI 技术在逐渐朝着实用性发展,如时下热度颇高的安防、交通、医疗等都是 AI 非常重要的应用领域。


谈到现在比较火的自动驾驶,唐杰对其发展前景表示乐观,“我认为在未来有限的时间里是可以实现的“。他表示,自动驾驶技术发展越来越快,几乎每年都有很大的变化,在国内的特定领域,自动驾驶已经成型。未来随着技术的发展,它是一定可以实现的,但这个实现需要政府、民众等各方的努力,此外,有必要花一些时间消除人们对于自动驾驶的恐惧,很多人认为自动驾驶危险性很高,其实无人驾驶可能人驾驶还更安全一些。“我个人乐观估计,希望能够在未来六到九年实现,希望我的预言成真”。


2019-11-07 08:001885
用户头像
刘燕 InfoQ高级技术编辑

发布了 1112 篇内容, 共 571.8 次阅读, 收获喜欢 1980 次。

关注

评论

发布
暂无评论
  • 表结构数据详解(上)

    2022-12-29

  • 开源模式新探索!卡奥斯工业互联网开源开放社区再升级

    为了进一步加速工业互联网的发展,更好地对开源模式进行实践探索,5月13日,由天工开物开源基金会、开源中国社区联合发起的中国开源未来发展峰会在重庆召开。会上,卡奥斯COSMOPlat公布了其立足工业互联网平台开源开放建设,打造的以软件开源、硬件开放、开发

    2023-05-23

  • 区块链 + 新基建:数字社会的四驾马车

    区块链在内的“四驾马车”,如何推动数字社会的发展?

    2021-08-18

  • new Vue 的时候到底做了什么

    1.初始化的第一阶段是Vue实例也就是vm对象创建前后:首先Vue进行生命周期,事件初始化发生在beforeCreate生命周期函数前,然后进行数据监测和数据代理的初始化,也就是创建vm对象的过程,当vm对象创建完成就可以通过vm对象访问到劫持的数据,比如data中的数据

    2022-11-16

  • 海泰方圆又双叒叕连获两项隐私计算专利

    身处数据时代,需要统筹数据发展和安全,以数据开发利用和产业发展促进数据安全,以数据安全保障数据开发利用和产业发展。如何兼顾发展和安全,平衡效率和风险,在保障安全的前提下发挥数据价值,是当前面临的重要课题。隐私计算技术为流通过程中数据的“可用

    2023-03-17

  • 如何打开 plist 文件

    plist 文件是一种用于存储应用程序配置信息的文件格式,其中包含应用程序的各种设置和数据。在过去,plist 文件通常是以.plist 格式存储的。然而,随着时间的推移,人们开始使用.plistx 格式来存储更复杂的数据结构和数据。如果您需要将.plist 文件打开,可以

    2023-04-12

  • 软件测试 / 测试开发 | 测试平台开发 - 前端开发之 Vue.js 框架的使用

    首先将 Vue.js 下载到本地,本章就以本地的 Vue.js 为例。在本地创建一个工作区即创建一个文件夹,使用 vscode 打开,将 Vue.js 放到工作区目录下。

    2023-03-06

  • 如何访问 TDH 中 Inceptor 底层的元数据库 TxSQL

    如何访问TDH中Inceptor 底层的元数据库TxSQL ?

    2023-09-25

  • 异常检测:探索数据深层次背后的奥秘《中篇》

     异常检测:探索数据深层次背后的奥秘《中篇》

    2023-09-22

  • 简洁好用的思维导图软件:simplemind 中文版

    SimpleMind 是一款流行的思维导图软件,支持多种平台,包括 Windows、Mac、iOS 和 Android。它提供了简单易用的界面和丰富的功能,可以帮助用户轻松地创建、编辑和共享思维导图。

    2023-05-04

  • 33|AI 前沿:ChatGPT 资料精选集

    本精选集的目的在于提供一个便捷的参考资源,帮助你全面掌握ChatGPT。

    2023-05-01

  • 导读 | 万物背后的规律都是数据

    这节课其实相当于我们正式进入正课内容的一个小预习,我们很多人平时很容易对数据想当然,但究根结底,我们对数据还需要进一步的认识。

    2021-07-28

  • “程”风破浪的开发者|我的 Docker 学习小妙招

      本文是 Docker 容器的数据卷使用的简单教程,介绍了什么是数据卷、数据卷概念、以及如何使用数据卷等。

    2022-10-23

  • 解决事务隔离产生问题的 MVCC

    什么是MVCC ?? MVCC称为:多版本并发控制,数据多版本并发控制,Multi Version Concurrency Control,也可以称为MCC,反正我最先知道他就是被称为MCC,因为当时我了解他的时候是这样的MultiVersion Concurrency Control。

    2023-04-12

  • 2023 数字中国建设峰会:百度点石获开放群岛开源社区优秀共建单位

    4月29日,作为第六届数字中国建设峰会重要组成部分,数字中国建设成果展览会同期论坛“2023数字中国建设与数据可信流通论坛”在福州海峡国际会展中心召开。论坛由国内首个致力于构建可信数据要素流通体系的开放群岛(Open Islands)开源社区主办,论坛同步举

    2023-05-22

  • 结束语|送你一张通往未来“通用人工智能”时代的船票

    送你一张通往未来“通用人工智能”时代的船票

    2023-05-15

  • 15 年磨一剑,亚马逊云科技数据产品掌门人 Swami 揭秘云原生数据战略的三大关键要素

    2022亚马逊云科技 re:Invent 全球大会正在拉斯维加斯如火如荼进行中,亚马逊云科技数据与机器学习副总裁 Swami Sivasubramanian 博士发表了“数据与机器学习如何助力企业构建端到端的数据战略”的主题演讲来开启第三天的日程。

    2022-12-05

  • 湖仓一体:国产基础软件的创新突破与弯道超车

    随着数字化转型进程的加快,企业对于数据基础设施的存储和计算能力要求越来越高。如何进行数据资产的统一管理和共享?通过数据构建企业关键能力、实现数据智能型组织?应对企业的数字化转型需要,数据基础软件领域的技术也在不断升级迭代。

    2023-08-14

  • 万物皆可“Embedding”,NLP 到底应该怎么做?(下)

    讲师介绍: 廖益玄,vivo AI NLP组技术负责人、AI算法专家。负责vivo内容理解平台的算法研发工作,并主导实现了公司内的NLP技术框架VNF。资深IT人,AI技术发烧友,撸过代码,做过架构,写过算法,早年曾作为技术合伙人开发了国内第一款中文语音助手智能360。 问题背景: 做NLP的同学想必都知道,从2013年Word2vec词向量提出开始,深度学习的方法逐渐“占领”了NLP领域各个应用场景,比如用于文本分类的TextCNN,用于序列标注的RNN等等。而在2018年大规模预训练模型Elmo、BERT发布之后,NLP领域又开始了新一轮的“革命”。 在这个万物皆可“Embedding”的年代,NLP应该怎么来做呢?跟之前传统机器学习方法又有何异同呢? 内容看点: Network weights 在计算词向量时,不同于 Word2vec的地方 文本表征模型的变化,从Transformer到BERT 预训练时代下NLP开发的新范式

    2021-10-22

发现更多内容

YashanDB 知识库|YMP 迁移报告无法下载?可能是你的 Java 版本“太新了”

数据库砖家

百度文小言全面接入文心4.5Turbo、X1Turbo,进一步增强多模态能力

极客天地

从程序员到架构师看似很简单,实则一点都不难!

程序员高级码农

Java 程序员 架构师

《Operating System Concepts》阅读笔记:p794-p807

codists

操作系统

如何鉴别全彩LED显示屏的品质等级

Dylan

LED显示屏 全彩LED显示屏 led显示屏厂家 户内led显示屏

Manus 技术路线的硬伤

柯杰

软通动力2024年年报:软硬一体战略促营收新高,增幅超78%

财见

邀请函|2025 Altair区域技术交流会华北站,报名开启!

Altair RapidMiner

AI 电磁仿真 hyperworks 多物理场仿真 仿真数据管理

百度智能云推出千帆数据智能平台

科技热闻

YashanDB 知识库|跨库访问不求人!手把手教你用 DBLink 玩转多库联动

数据库砖家

数据库、

百度搜索AI开放计划:助力开发者通过MCP Server连接用户和应用

猫头虎

AI MCP 百度搜索开放平台 百度AI开放计划 mcpserver

开放平台架构的本质

柯杰

[翻译]Java内存分配器不做垃圾清理的好处-Java11

极客罗杰

等保测评5个等级

黑龙江陆陆信息测评部

YashanDB 知识库|YMP 报 YAS-04204 创建索引失败?可能是你配置超了并发上限

数据库砖家

数据库·

YashanDB |自研 YFS,为共享集群打造专属“高性能存储引擎”

数据库砖家

数据库

Arthas classloader (查看 classloader 的继承树,urls,类加载信息)

刘大猫

ClassLoader Arthas 大模型 类加载信息 继承树

Semantic Kernel也能充当MCP Client

为自己带盐

semantic kernel MCP

Arthas memory(查看 JVM 内存信息)

刘大猫

JVM 监控 Arthas memory 查看JVM内存信息

如何在 Windows 11 上下载并安装免费版 Microsoft 365?office 365免费产品密钥激活码获取

阿拉灯神丁

Office 365 Microsoft 365 办公软件 智能办公 office破解版

百度搜索AI开放计划:让应用连接精准流量的秘诀

Yan-英杰

MCP 百度搜索开放平台 百度AI开放计划 mcpserver create2025

YashanDB 知识库|共享集群换 IP 怎么操作?这篇教你全流程无坑换网段!

数据库砖家

数据库·

YashanDB 知识库|主备延迟怎么查?一文教你搞懂根源在哪

数据库砖家

数据库

百度慧播星打造高说服力数字人,具备四大能力

极客天地

匠心打造超级 ping,多运营商多协议全方位测试,sir.net 正式上线!

timerring

测试 网站 IP

CFD专栏丨FlightStream-基于面元法的快速CFD分析工具

Altair RapidMiner

CAE Hypermesh CFD 流体仿真 FlightStream

全球线上直播会议丨快速赋能企业,仿真技术如何实现降本增效?

Altair RapidMiner

仿真 CAE hyperworks Inspire Simlab

为千行万业开算力通途,为什么是百舸?

脑极体

AI

新闻速递|Altair 荣膺 2025 年度 Google Cloud 制造业商业应用合作伙伴大奖

Altair RapidMiner

深度学习 制造业 Google Cloud CAE physicsAI

成事:程序员最硬的通货,产品经理最好的PRD

AI时代的一滴水

程序员 成长

中昊芯英作为“杭州 AI 18 罗汉”荣登《杭州 AI 卧龙图》

科技热闻

智源研究院学术副院长唐杰:数据在开放共享的同时,隐私保护机制也要并举_AI&大模型_刘燕_InfoQ精选文章