智源研究院学术副院长唐杰：数据在开放共享的同时，隐私保护机制也要并举_AI&大模型_刘燕_InfoQ精选文章

《HarmonyOS：领航者说》技术公开课来啦，大咖分享、实战解码，不容错过了解详情 



 写点什么

登录/注册

智源研究院学术副院长唐杰：数据在开放共享的同时，隐私保护机制也要并举

10 月 31 日，由北京智源人工智能研究院主办的 2019 北京智源大会在国家会议中心开幕，会期两天。智源大会是北京创建全球人工智能学术和创新最优生态的标志性学术活动，定位于“内行的 AI 盛会”。
为推动行业数据开放共享，支撑人工智能基础研究与关键技术研发，大会现场，北京智源人工智能研究院宣布成立数据开放研究中心。该中心旨在制定数据开放标准，研究数据开放核心技术，搭建数据开放共享平台。智源研究院学术副院长唐杰担任数据开放研究中心主任。此次大会上，北京市科委主任许强、智源研究院院长黄铁军和数据开放研究中心主任唐杰共同为研究中心揭牌。
大会现场，数据开放研究中心主任唐杰接受了 InfoQ 等少数媒体的采访，唐杰就数据开放研究中心的情况做了详细介绍，并就数据安全、AI 发展现状等热门话题发表了自己的看法。

推动数据开放共享

据唐杰介绍，数据开放研究中心大概从今年 6、7 月份开始策划，“最早北京人工智能研究院主要想做几件事：第一是智源学者；第二是联合实验室，第三是社区，总的来讲，我们是希望智源成为一个平台性的组织，上面有学者、联合实验室、有各种社区。”

在实际推进过程中，联合实验室推进较慢，因为像这样重量级的项目一般都需要经过多次论证，到现在，智源才论证成立了京东、旷视两个联合实验室，未来这十个联合实验室仍需要很长时间建设，即便在并行操作的情况下。

因此，智源的专家们就在思考：是否能够打造一个数据平台？在这个数据平台上能够支持更加广泛的、容易的、轻量级的共享，且能在上面建立出面向学者和企业级的任务型竞赛。这样就可以加快迭代，否则依托这种联合实验室来做相对比较慢，而且联合实验室一发布出来后，有些公司还会有顾虑比如对竞争对手的考量。这是数据开放共享研究中心设立的原因之一。

唐杰表示，另外一个很重要的原因是，如何做数据脱敏、数据隐私、如何让数据更安全是数据开放中非常重要的研究内容。

据 InfoQ 了解，数据开放研究中心的具体工作内容包括以下几个方面：

开放标准：制定数据开放和共享系列标准，包括人工智能数据开放许可协议、人工智能数据资源开放管理规范等。

关键技术：研究隐私数据泄露风险模型；按照数据使用场景，研究相应的数据开放技术。

开放数据集：创建行业关键数据集，通过自动抓取、标注、与外部单位合作等方式，构建一批高质量的数据集。

共享平台：搭建数据开放共享平台，提供数据开放与共享服务，推动人工智能行业发展。

谈到数据安全、隐私问题，唐杰表示，从研究的角度讲，数据脱敏、数字隐私保护是一个“矛和盾”、“盾和矛”的问题，因为你在这里想办法怎么将数据保护起来，但总会有人想办法攻击进来，这两个方面是不停的在发展，可能有的阶段是“道高一尺”，有的阶段是“魔高一丈”。

目前解决的办法主要有几种，一种是加密共享技术，可以将数据用私钥加密后再进行共享，接下来在加密数据上构建模型。一种是联邦学习，联邦学习并不分享数据，而是分享模型，在在模型层面上做共享，这个时候数据没有开放出来。

采访中，唐杰表示，近期 AI 技术在逐渐朝着实用性发展，如时下热度颇高的安防、交通、医疗等都是 AI 非常重要的应用领域。

谈到现在比较火的自动驾驶，唐杰对其发展前景表示乐观，“我认为在未来有限的时间里是可以实现的“。他表示，自动驾驶技术发展越来越快，几乎每年都有很大的变化，在国内的特定领域，自动驾驶已经成型。未来随着技术的发展，它是一定可以实现的，但这个实现需要政府、民众等各方的努力，此外，有必要花一些时间消除人们对于自动驾驶的恐惧，很多人认为自动驾驶危险性很高，其实无人驾驶可能人驾驶还更安全一些。“我个人乐观估计，希望能够在未来六到九年实现，希望我的预言成真”。

评论

发布

暂无评论

YashanDB 知识库｜YMP 迁移报告无法下载？可能是你的 Java 版本“太新了”

数据库砖家

百度文小言全面接入文心4.5Turbo、X1Turbo，进一步增强多模态能力

从程序员到架构师看似很简单，实则一点都不难！

程序员高级码农

Java 程序员架构师

《Operating System Concepts》阅读笔记：p794-p807

如何鉴别全彩LED显示屏的品质等级

LED显示屏全彩LED显示屏 led显示屏厂家户内led显示屏

Manus 技术路线的硬伤

软通动力2024年年报：软硬一体战略促营收新高，增幅超78%

邀请函｜2025 Altair区域技术交流会华北站，报名开启！

Altair RapidMiner

AI 电磁仿真 hyperworks 多物理场仿真仿真数据管理

百度智能云推出千帆数据智能平台

YashanDB 知识库｜跨库访问不求人！手把手教你用 DBLink 玩转多库联动

数据库砖家

百度搜索AI开放计划：助力开发者通过MCP Server连接用户和应用

AI MCP 百度搜索开放平台百度AI开放计划 mcpserver

开放平台架构的本质

[翻译]Java内存分配器不做垃圾清理的好处-Java11

等保测评5个等级

黑龙江陆陆信息测评部

YashanDB 知识库｜YMP 报 YAS-04204 创建索引失败？可能是你配置超了并发上限

数据库砖家

YashanDB ｜自研 YFS，为共享集群打造专属“高性能存储引擎”

数据库砖家

Arthas classloader （查看 classloader 的继承树，urls，类加载信息）

ClassLoader Arthas 大模型类加载信息继承树

Semantic Kernel也能充当MCP Client

为自己带盐

semantic kernel MCP

Arthas memory（查看 JVM 内存信息）

JVM 监控 Arthas memory 查看JVM内存信息

如何在 Windows 11 上下载并安装免费版 Microsoft 365？office 365免费产品密钥激活码获取

阿拉灯神丁

Office 365 Microsoft 365 办公软件智能办公 office破解版

百度搜索AI开放计划：让应用连接精准流量的秘诀

MCP 百度搜索开放平台百度AI开放计划 mcpserver create2025

YashanDB 知识库｜共享集群换 IP 怎么操作？这篇教你全流程无坑换网段！

数据库砖家

YashanDB 知识库|主备延迟怎么查?一文教你搞懂根源在哪

数据库砖家

百度慧播星打造高说服力数字人，具备四大能力

匠心打造超级 ping，多运营商多协议全方位测试，sir.net 正式上线!

测试网站 IP

CFD专栏丨FlightStream-基于面元法的快速CFD分析工具

Altair RapidMiner

CAE Hypermesh CFD 流体仿真 FlightStream

全球线上直播会议丨快速赋能企业，仿真技术如何实现降本增效？

Altair RapidMiner

仿真 CAE hyperworks Inspire Simlab

为千行万业开算力通途，为什么是百舸？

新闻速递｜Altair 荣膺 2025 年度 Google Cloud 制造业商业应用合作伙伴大奖

Altair RapidMiner

深度学习制造业 Google Cloud CAE physicsAI

成事：程序员最硬的通货，产品经理最好的PRD

AI时代的一滴水

程序员成长

中昊芯英作为“杭州 AI 18 罗汉”荣登《杭州 AI 卧龙图》