写点什么

腾讯朱雀实验室推出“隐形”水印,助力打击 AI 模型盗取行为

  • 2021-11-12
  • 本文字数:1126 字

    阅读完需:约 4 分钟

腾讯朱雀实验室推出“隐形”水印,助力打击AI模型盗取行为

随着人工智能行业的发展,AI 技术被大量应用到人们的生活中,而 AI 模型作为这些技术的载体,被广泛部署在云端。作为一种数字资产,AI 模型面临着被窃取的风险,其安全性愈发引起业界关注。


北京时间 11 月 11 日至 12 日,全球知名信息安全峰会 POC 2021 正式举办,腾讯朱雀实验室高级研究员 Mengyun Tang 和研究员 Tony 受邀参加,并进行了题为《Towards AI Model Security Protection(AI 模型的安全保护)》的分享。


在此次分享中,腾讯朱雀实验室展示了 AI 模型攻防实例,并提出了一种新的模型水印生成方法,这项技术可以防御多种模型窃取方式,并且对原模型的输出几乎不产生影响,为 AI 模型版权提供有效的保护。

AI 模型维权,取证是难点

    

AI 模型作为技术的核心载体,一旦被窃取,将可能使拥有该技术的企业或组织暴露在风险中。例如,某公司的 AI 模型被黑客恶意盗取后,黑客就可以复制该公司的业务,来抢占市场,获取间接经济利益,或者将模型出售给第三方,甚至勒索该公司,来获取直接经济利益。

    

在模型窃取方式中,代理模型攻击是一种典型的手段,它通过训练与原模型功能相似的代理模型来蒸馏原模型的知识——将原模型的输入作为其输入,原模型的输出作为其训练标签,并进行参数优化,不断拟合原模型的输出,最终达到窃取原模型知识的目的。


模型窃取流程

   

而在面对模型窃取攻击时,模型的原作者往往容易处于被动。因为攻击者并不直接接触原模型,所以原作者无法提供直接证据,证明被窃取的模型中含有自己的知识产权,而陷入维权困难的境地。因此,一旦模型窃取攻击泛滥,将为人工智能的发展带来更多挑战。

“隐形”水印,AI 模型版权保护新方法


针对上述问题,腾讯朱雀实验室结合最新的深度学习技术,推出了一套为 AI 模型提供保护的方法,即对疑似窃取模型进行“取证”,来证明该模型为“盗版”模型。

    

这套方法可以在预先防护阶段,生成肉眼不可见的水印,并将之添加到原模型的输出上,为原模型的输出“烙上”版权信息,同时,对原模型的输出几乎不产生影响。当 AI 模型被攻击时,其附带的水印也会被代理模型学习到,进而使得代理模型的输出中也含有该水印。

    

随后,通过经训练的提取器,可以从代理模型的输出中精准地检测到水印的存在,并将预先嵌入的模型版权信息进行高质量的还原,从而为模型原作者提供有力的技术证据,来对抗侵权行为。


朱雀实验室提出的模型水印生成方法及其保护流程


这项技术为 AI 模型提供了一道“胎记”,其意义在于,不仅能够有效地帮助 AI 模型作者维护自己的知识产权,还能打击“盗版”AI 模型,一定程度地遏制模型窃取行为的发生,促进 AI 行业的生态持续健康发展。

    

腾讯安全平台部下属的腾讯朱雀实验室,致力于实战级 APT 攻击和 AI 安全研究,其建设的 AI 安全威胁风险矩阵,专门针对人工智能行业中的潜在风险提供研究和预案,为 AI 业务提供安全保障。

2021-11-12 16:105637

评论 1 条评论

发布
用户头像
会不会导致一些莫名其妙的BUG?
2021-11-23 08:42
回复
没有更多了
发现更多内容

PMI 的野望

Franklin 许峰

DevOps 敏捷 Lean 规范敏捷 PMI

EMQ X 企业版 v4.4.0 发布:新增三项集成支持、增强异常诊断能力

EMQ映云科技

云原生 物联网 IoT mqtt 规则引擎

【浅谈黑客与学习思路】黑客的种类和行为,初学者应该怎样学习

H

黑客 网络安全 信息安全

一种播放远程TS格式媒体文件的新方案

Changing Lin

12月日更

【12月日更】浅谈Golang两种线程安全的map

小梁编程汇

golang 缓存 高性能 并发 多线程安全

2021年SASE融合战略路线图(一)

devpoint

SD-WAN sase 12月日更

一周信创舆情观察(12.13~12.19)

统小信uos

让“美”势不可挡,DataPipeline助力全球知名化妆品企业数字化营销再提速

DataPipeline数见科技

大数据 中间件 数据融合 数据迁移 数据管理

Python爬虫实战,pymysql模块,Python实现抓取音乐评论

Java全栈架构师

Python MySQL 数据库 程序员 面试

Flutter 应用程序中使用 GridTile 小部件

坚果

28天写作 12月日更

Flutter 高性能、多功能的全场景滚动容器原理与实践

阿里巴巴终端技术

flutter 移动开发 客户端

揭开神秘面纱,如何组织一次分布式压测

博睿数据

如何优雅的关闭 Java 线程池

淡泊明志、宁静致远

线程池

热门招聘丨 XTransfer史上最全产品技术岗位公开招聘

XTransfer技术

产品 技术 招聘 XTransfer

架构实战 - 模块七

唐敏

架构实战营

第七模块总结

张靖

#架构实战营

计算机网络体系结构

淡泊明志、宁静致远

TCP 网络结构

多行内容超出...显示的终极解决方案

CRMEB

三年磨一剑,高德体验优化总结

阿里巴巴终端技术

ios android 性能优化 移动开发 客户端

关于写文章的一点经验

阿里技术

技术管理 技术人生 内容合集

技术三板斧:关于技术规划、管理、架构的思考

阿里技术

技术管理 技术人生 内容合集

王者荣耀商城异地多活架构设计

张靖

#架构实战营

联想企业科技集团与京东耀弘签订战略合作协议 实现合作发展新跨越

科技大数据

阿里技术 技术人成长| 内容合集

阿里技术

技术管理 技术人生 技术专题合集

技术人如何自我成长?

阿里技术

技术管理 技术人生 内容合集

如何写好代码?

阿里技术

技术管理 技术人生 内容合集

高质量的缺陷分析:让自己少写 bug

阿里技术

技术管理 技术人生 内容合集

安装TortoiseGit教程 手把手教学

Z.

git 工具 安装 Tortoisegit

百度API接口智能化测试探索与实践

百度开发者中心

自动化测试 API测试 智能化测试

恒源云(GPUSHARE)_文本数据扩增时,哪些单词 (不) 应该被选择?

恒源云

深度学习 语音识别 语义

腾讯朱雀实验室推出“隐形”水印,助力打击AI模型盗取行为_AI&大模型_InfoQ编辑部_InfoQ精选文章