10 月 23 - 25 日,QCon 上海站即将召开,现在购票,享9折优惠 了解详情
写点什么

腾讯朱雀实验室推出“隐形”水印,助力打击 AI 模型盗取行为

  • 2021-11-12
  • 本文字数:1126 字

    阅读完需:约 4 分钟

腾讯朱雀实验室推出“隐形”水印,助力打击AI模型盗取行为

随着人工智能行业的发展,AI 技术被大量应用到人们的生活中,而 AI 模型作为这些技术的载体,被广泛部署在云端。作为一种数字资产,AI 模型面临着被窃取的风险,其安全性愈发引起业界关注。


北京时间 11 月 11 日至 12 日,全球知名信息安全峰会 POC 2021 正式举办,腾讯朱雀实验室高级研究员 Mengyun Tang 和研究员 Tony 受邀参加,并进行了题为《Towards AI Model Security Protection(AI 模型的安全保护)》的分享。


在此次分享中,腾讯朱雀实验室展示了 AI 模型攻防实例,并提出了一种新的模型水印生成方法,这项技术可以防御多种模型窃取方式,并且对原模型的输出几乎不产生影响,为 AI 模型版权提供有效的保护。

AI 模型维权,取证是难点

    

AI 模型作为技术的核心载体,一旦被窃取,将可能使拥有该技术的企业或组织暴露在风险中。例如,某公司的 AI 模型被黑客恶意盗取后,黑客就可以复制该公司的业务,来抢占市场,获取间接经济利益,或者将模型出售给第三方,甚至勒索该公司,来获取直接经济利益。

    

在模型窃取方式中,代理模型攻击是一种典型的手段,它通过训练与原模型功能相似的代理模型来蒸馏原模型的知识——将原模型的输入作为其输入,原模型的输出作为其训练标签,并进行参数优化,不断拟合原模型的输出,最终达到窃取原模型知识的目的。


模型窃取流程

   

而在面对模型窃取攻击时,模型的原作者往往容易处于被动。因为攻击者并不直接接触原模型,所以原作者无法提供直接证据,证明被窃取的模型中含有自己的知识产权,而陷入维权困难的境地。因此,一旦模型窃取攻击泛滥,将为人工智能的发展带来更多挑战。

“隐形”水印,AI 模型版权保护新方法


针对上述问题,腾讯朱雀实验室结合最新的深度学习技术,推出了一套为 AI 模型提供保护的方法,即对疑似窃取模型进行“取证”,来证明该模型为“盗版”模型。

    

这套方法可以在预先防护阶段,生成肉眼不可见的水印,并将之添加到原模型的输出上,为原模型的输出“烙上”版权信息,同时,对原模型的输出几乎不产生影响。当 AI 模型被攻击时,其附带的水印也会被代理模型学习到,进而使得代理模型的输出中也含有该水印。

    

随后,通过经训练的提取器,可以从代理模型的输出中精准地检测到水印的存在,并将预先嵌入的模型版权信息进行高质量的还原,从而为模型原作者提供有力的技术证据,来对抗侵权行为。


朱雀实验室提出的模型水印生成方法及其保护流程


这项技术为 AI 模型提供了一道“胎记”,其意义在于,不仅能够有效地帮助 AI 模型作者维护自己的知识产权,还能打击“盗版”AI 模型,一定程度地遏制模型窃取行为的发生,促进 AI 行业的生态持续健康发展。

    

腾讯安全平台部下属的腾讯朱雀实验室,致力于实战级 APT 攻击和 AI 安全研究,其建设的 AI 安全威胁风险矩阵,专门针对人工智能行业中的潜在风险提供研究和预案,为 AI 业务提供安全保障。

2021-11-12 16:105355

评论 1 条评论

发布
用户头像
会不会导致一些莫名其妙的BUG?
2021-11-23 08:42
回复
没有更多了
发现更多内容

《2024年金融业生成式AI应用报告》:已有6家上市银行发布大模型技术应用进展

科技热闻

申万宏源基于 StarRocks 构建实时数仓

StarRocks

数据仓库 数据分析 实时数仓 StarRocks

软件测试/测试开发|学习两个个月后拿到4个知名企业Offer,他是怎么做到的?

霍格沃兹测试开发学社

人工智能大模型多场景应用原理解析

百度开发者中心

人工智能 图像识别 大模型

AI大模型低成本快速定制秘诀:RAG和向量数据库

百度开发者中心

人工智能 数据库 大模型

uniapp vuecli项目融合[小记]:将多个项目融合,打包成一个小程序/App,拆分多个H5应用

达摩

小程序 uni-app vue cli

vue-office文档预览跨域问题

麦兜

源码交付:定制软件开发的重要保障

飞算JavaAI开发助手

百度智能云千帆 AppBuilder 构建 AI 原生应用开发新范式

百度Geek说

人工智能 百度智能云

AI大模型在电商商家端自定义报表分析中的应用与实践

百度开发者中心

人工智能 电商 大模型

4个知名企业Offer拿到手软,他是怎么做到的?附面试真题

测试人

软件测试

Atlassian 停服 Bamboo,CI/CD 用不了了?教你快速迁移到极狐GitLab CI

极狐GitLab

隐私计算 互联互通又一成果,相关代码已在隐语社区发布!欢迎加入隐语标准生态

隐语SecretFlow

技术标准 数据安全 隐私计算 数据要素 互联互通

国产 Web 组态软件在玻璃生产线中的应用

图扑物联

vivo 海量基础数据计算架构应用实践

vivo互联网技术

大数据

租赁舞台LED屏的注意事项及问题排除

Dylan

活动 LED显示屏 led显示屏厂家 效果广告

跨境电商如何利用item_get-根据ID取商品详情(shopee.item_get)提升用户体验?

技术冰糖葫芦

API 编排

万字图解|深入揭秘 (数据链路层、物理层) 工作原理

云舒编程

IP 物理层 路由 图解网络 数据链路层

精彩推荐 | 【深入浅出Docker原理及实战】「原理实战体系」零基础+全方位带你学习探索Docker容器开发实战指南(实战技术总结)

码界西柚

Docker 容器 云原生 容器技术 2024年第二十一篇文章

活动回顾|分享成果&展望未来,一起走进隐语年度嘉年华精彩现场叭!

隐语SecretFlow

隐私计算 数据要素流通 隐语开源社区

文心一言 VS 讯飞星火 VS chatgpt (186)-- 算法导论14.1 3题

福大大架构师每日一题

福大大架构师每日一题

CES 2024的亮点仅仅聚焦AI深度赋能和产业创新吗?| DALL-E 3、Stable Diffusion等20+ 图像生成模型综述

GPU算力

热更新适配ibatis原理浅析

京东科技开发者

荣耀开发者大会 2023 · 一张图读懂极致体验分论坛

荣耀开发者服务平台

合合信息启信数据发布园区金融解决方案,助力银行精准服务“十四五”特色产业

合合技术团队

大数据 金融 合合信息 启信慧眼

在游戏里开公司!基于ERNIE SDK的多智能体游戏应用

飞桨PaddlePaddle

百度 paddle 游戏开发 飞桨 飞桨国赛

腾讯朱雀实验室推出“隐形”水印,助力打击AI模型盗取行为_AI&大模型_InfoQ编辑部_InfoQ精选文章