2天时间,聊今年最热的 Agent、上下文工程、AI 产品创新等话题。2025 年最后一场~ 了解详情
写点什么

以大模型“对抗”大模型,2023WAIC 专家热议大模型时代如何保护隐私和安全

  • 2023-07-07
    北京
  • 本文字数:1946 字

    阅读完需:约 6 分钟

以大模型“对抗”大模型,2023WAIC 专家热议大模型时代如何保护隐私和安全

凭借大数据、大算力的“大力出奇迹”, AI 大模型带来的“智能涌现”,让人类又一次站在了技术革命的转折点。与之伴生的用户隐私泄漏、数据滥用等问题被敲响了警钟。作为平衡数据使用与隐私安全的关键技术,隐私计算面临新的机遇和挑战。

 

2023 世界人工智能大会( WAIC )“数据要素与隐私计算高峰论坛”上,复旦大学教授、上海市数据科学重点实验室主任肖仰华与中国信通院云大所大数据与区块链部副主任闫树展开高端对话,深入研讨了大模型时代隐私计算研究发展。


“数据要素与隐私计算高峰论坛”对话大模型时代的隐私计算


两位专家共同认为,总体上大模型是先进生产力,不能因为隐私等的顾虑放弃对大模型的应用。某种程度上,大模型是一种不确定市场,要正面正视隐私等问题,积极应用大模型。

 

但大模型的破坏性已经显化,要兼顾安全,不能盲目发展。要建立大模型安全底线和合规规范,从数据源头把关,加快大模型语料合规性认证等。非常重要的一点是,要用大模型“对抗”大模型,如利用大模型对生成内容的评估,用大模型自身的能力来保护我们的隐私。要用隐私计算的随机性、匿名化等方法,优化大模型数据分层,同时提升隐私计算本身的性能。


“隐私安全是老问题,但是在大模型时代变得特别突出”


“对于 AI 的发展来说,今年可能是比较特殊的一年。各类大模型‘智能涌现’,再一次诠释了数据的重要价值。然而 AI 大模型是把双刃剑,带来了突出的隐私和安全问题,隐私计算作为保护数据安全的技术可以做什么?”闫树强调了加速隐私计算研究的必要性。

 

肖仰华认为,大模型对隐私保护问题带来了前所未有的挑战,主要表现在侵权识别和保护两个层面,比如隐私泄露、版权侵犯。首先,大模型是一个大规模参数化的模型,训练数据来源多样,隐私保护非常困难。其次,生成式大模型往往是一种概率化的生产,是一种海量拼接式的生产,大模型是否侵犯隐私的识别本身很困难。所以传统意义上的隐私侵犯认定,在大模型时代往往会失效。另外,从保护角度来说更困难。大模型是基于深度神经网络的架构,本质上是黑盒模式。它的不同的参数到底习得了什么样的知识或能力我们无从得知。“问题是老问题,但是在大模型时代这些问题变得特别突出”。


解决使用大模型时的隐私安全问题,隐私计算技术已有探索


不止训练大模型带来隐私安全问题,大模型使用的安全问题也是当前的重点。隐私计算如何保证大模型使用的隐私安全?当前业界已经有了一些探索。

 

闫树介绍,现在隐私计算各种各样的路线,包括可信执行环境 TEE 、多方安全计算 MPC 等都有与大模型结合的探索,比如在云端部署 TEE ,用户在推理时将输入数据加密传输至云端,在其内部解密然后进行推理;还有在模型推理阶段使用多方安全计算来提升隐私保护能力,但不可避免地会对模型训练和推理的性能造成影响。

 

肖仰华认为,一是要建立系统性防范体系。从用户角度讲,要建立大模型隐私安全意识,充分意识到使用过中数据有可能被服务方收集;从提供服务的厂商来看,要提升服务的规范性,在用户完全授权的情况下收集用户相关的使用数据,不能超出用户授权范畴。二是从技术本身做创新,比如通过设置网络中间层,在中间层来自很多用户的查询或者使用可以混淆打乱,这时平台方就无法知道哪个用户在查哪个数据。所以传统的随机化匿名化,在大模型时代仍然还是有一定的适用性。

 

大模型时代隐私计算研究的机遇与挑战

 

大模型一定程度上也会改变隐私计算技术的发展和研究,那么该如何更好地适用与大模型?

 

闫树认为,首先可以重点关注隐私计算的可用性研究。就是目前来讲,隐私计算用于大部分训练时,性能是主要问题。另外合规性的探讨也是需要各界携手来,加强技术和法律领域的联合研究,共同探讨隐私计算技术的应用场景和效果,明确隐私计算技术的合规性。

 

肖仰华认为,大模型时代隐私计算迎来全新机遇。传统的隐私计算如差分隐私、联邦学习多是算法层开展工作。但算法工作前提是保护对象是明确的,协作机制清晰。但大模型时代是海量参数化的模型,不透明、无边界、不可解释,对于以前的基于可解释、清晰、可控的技术路线的隐私计算方法提供了全新挑战。包括上升到技术架构层面,大模型的隐私保护,要分层分级保护数据,大模型做基本的智能能力,要保护的数据还是在传统的加密数据库,二者如何协同,这个是从架构层面要研究的。

 

行业已有很多动作助力隐私计算未来更复杂更高要求的应用。在本次论坛上蚂蚁就开源了自研隐语技术栈中的隐语框架 1.0 版,和国产金融安全级 TEE 方案“ HyperEnclave ”,将为行业提供易用通用的技术方案。


2023WAIC,业内首个金融安全级国产 TEE 方案 HyperEnclave 正式开源


由蚂蚁牵头的行业首个“可信执行环境安全”国际标准 IEEE2952-2023 在论坛上正式发布,制定了基于 TEE 技术的安全计算系统的技术框架,为将为业界提供有效指导。

2023-07-07 16:5811753
用户头像
鲁冬雪 GMI Cloud Head of China Marketing

发布了 381 篇内容, 共 330.0 次阅读, 收获喜欢 304 次。

关注

评论

发布
暂无评论
发现更多内容

OneNote Embedded 文件滥用检测

天翼云开发者社区

Onenote

百度优选成全球首家支持MCP的电商平台

极客天地

详解金仓数据库KingbaseES主备流复制集群数据块恢复神器auto_bmr

金仓技术

KingbaseES 金仓数据库

最火向量数据库Milvus安装使用一条龙!

王磊

关于我的第一个产品!

Immerse

“陆海空”立体组网!福建移动助力鹭岛打造5G-A全面示范之城

极客天地

告别重复繁琐!Apipost参数描述库让API开发效率飙升!

数据追梦人

【等保小知识】未联网的独立单位网络是否需要等保备案以及定级?

行云管家

等保 等保测评 等保2.0

BeeWorks Meet:私有化部署视频会议的高效选择

BeeWorks

即时通讯 IM 私有化部署

倒计时!中关村科学城工业软件创新暨开源峰会28日启幕,会议亮点抢先看

极客天地

百度文库、百度网盘联合发布「沧舟OS」内容操作系统,开放MCP Server,华为、三星、牛听听成首批接入客户

极客天地

基于 MCP 的 AI Agent 应用开发实践

字节跳动开源

开源 AI Agent MCP 模型上下文协议 Agent TARS

为什么说BeeWorks即时通讯(IM)系统适合金融行业使用?

BeeWorks

即时通讯 IM 私有化部署 企业级应用

什么是财务管理系统?一文看清其功能及作用!

积木链小链

数字化转型 智能制造

【重磅】敲敲云桌面版正式发布!

JEECG低代码

零代码 桌面应用 敲敲云

告别手动填参数!Apipost黑科技让接口调试效率翻倍

数据追梦人

详解金仓数据库KFS双轨并行不停机方案

金仓技术

KingbaseES 金仓数据库 KFS KES

用友BIP企业AI全栈云:沉浸式体验六大智慧采购新场景

用友BIP

深入研究:Shopee商品列表API接口详解

tbapi

shopee API shopee商品列表接口 shopee商品采集

API 即 MCP|Higress 发布 MCP Marketplace,加速存量 API 跨入 MCP 时代

阿里巴巴云原生

阿里云 云原生 MCP

AI 代码生成工具的未来:飞算 JavaAI 如何定义新标准?

飞算JavaAI开发助手

伊克罗德信息亮相亚马逊云科技合作伙伴峰会,以ECRobot 智能云迁移助手在GenAI Tech Game比赛勇夺金牌!

伊克罗德信息科技

云计算 AI 亚马逊云

“AI赋能·共享城市安全”2025杭州安防产品展·浙江安博会

AIOTE智博会

安徽建工集团上线数智管控平台 驱动高质量发展

用友BIP

别让算力掉队:AI架构里被忽视的关键一环

ScaleFlux

企业级存储 定制化芯片 AI基础架构

百度文库、百度网盘联合发布「GenFlow超能搭子」、「AI笔记」,打造“聪明又能干”的超级生产力

极客天地

APP和小程序需要注册域名吗?

防火墙后吃泡面

RapidFS 为昆仑芯 3 万卡集群加速,国产化平台 TiB 级吞吐让数据随叫随到

Baidu AICLOUD

分布式缓存 JuiceFS #存储加速

五一假期放肆嗨,ROG电竞显示器高刷臻品畅玩游戏!

新消费日报

【行业知识】绿色能源产业使用堡垒机的原因看这里!

行云管家

网络安全 等保 等保测评 等保评测

最终一致性正在成为主流:现代分布式应用的数据管理新范式

tapdata

数据一致性 数据同步 实时数据 最终一致性 强一致性

以大模型“对抗”大模型,2023WAIC 专家热议大模型时代如何保护隐私和安全_阿里巴巴_鲁冬雪_InfoQ精选文章