2025上半年,最新 AI实践都在这!20+ 应用案例,任听一场议题就值回票价 了解详情
写点什么

腾讯朱雀实验室推出“隐形”水印,助力打击 AI 模型盗取行为

  • 2021-11-12
  • 本文字数:1126 字

    阅读完需:约 4 分钟

腾讯朱雀实验室推出“隐形”水印,助力打击AI模型盗取行为

随着人工智能行业的发展,AI 技术被大量应用到人们的生活中,而 AI 模型作为这些技术的载体,被广泛部署在云端。作为一种数字资产,AI 模型面临着被窃取的风险,其安全性愈发引起业界关注。


北京时间 11 月 11 日至 12 日,全球知名信息安全峰会 POC 2021 正式举办,腾讯朱雀实验室高级研究员 Mengyun Tang 和研究员 Tony 受邀参加,并进行了题为《Towards AI Model Security Protection(AI 模型的安全保护)》的分享。


在此次分享中,腾讯朱雀实验室展示了 AI 模型攻防实例,并提出了一种新的模型水印生成方法,这项技术可以防御多种模型窃取方式,并且对原模型的输出几乎不产生影响,为 AI 模型版权提供有效的保护。

AI 模型维权,取证是难点

    

AI 模型作为技术的核心载体,一旦被窃取,将可能使拥有该技术的企业或组织暴露在风险中。例如,某公司的 AI 模型被黑客恶意盗取后,黑客就可以复制该公司的业务,来抢占市场,获取间接经济利益,或者将模型出售给第三方,甚至勒索该公司,来获取直接经济利益。

    

在模型窃取方式中,代理模型攻击是一种典型的手段,它通过训练与原模型功能相似的代理模型来蒸馏原模型的知识——将原模型的输入作为其输入,原模型的输出作为其训练标签,并进行参数优化,不断拟合原模型的输出,最终达到窃取原模型知识的目的。


模型窃取流程

   

而在面对模型窃取攻击时,模型的原作者往往容易处于被动。因为攻击者并不直接接触原模型,所以原作者无法提供直接证据,证明被窃取的模型中含有自己的知识产权,而陷入维权困难的境地。因此,一旦模型窃取攻击泛滥,将为人工智能的发展带来更多挑战。

“隐形”水印,AI 模型版权保护新方法


针对上述问题,腾讯朱雀实验室结合最新的深度学习技术,推出了一套为 AI 模型提供保护的方法,即对疑似窃取模型进行“取证”,来证明该模型为“盗版”模型。

    

这套方法可以在预先防护阶段,生成肉眼不可见的水印,并将之添加到原模型的输出上,为原模型的输出“烙上”版权信息,同时,对原模型的输出几乎不产生影响。当 AI 模型被攻击时,其附带的水印也会被代理模型学习到,进而使得代理模型的输出中也含有该水印。

    

随后,通过经训练的提取器,可以从代理模型的输出中精准地检测到水印的存在,并将预先嵌入的模型版权信息进行高质量的还原,从而为模型原作者提供有力的技术证据,来对抗侵权行为。


朱雀实验室提出的模型水印生成方法及其保护流程


这项技术为 AI 模型提供了一道“胎记”,其意义在于,不仅能够有效地帮助 AI 模型作者维护自己的知识产权,还能打击“盗版”AI 模型,一定程度地遏制模型窃取行为的发生,促进 AI 行业的生态持续健康发展。

    

腾讯安全平台部下属的腾讯朱雀实验室,致力于实战级 APT 攻击和 AI 安全研究,其建设的 AI 安全威胁风险矩阵,专门针对人工智能行业中的潜在风险提供研究和预案,为 AI 业务提供安全保障。

2021-11-12 16:105012

评论 1 条评论

发布
用户头像
会不会导致一些莫名其妙的BUG?
2021-11-23 08:42
回复
没有更多了
发现更多内容

如何抓住新社交风口下的音视频通讯大潮?

融云 RongCloud

建立自己的领导风格

石云升

领导力 28天写作 职场经验 管理经验 4月日更

架构实战营-模块一作业

西伯利亚鼯鼠

架构实战营

阿里云 RTC QoS 弱网对抗之变分辨率编码

阿里云CloudImagine

阿里云 WebRTC 分辨率 视频编解码 视频云

Github连夜下架!阿里新产Java全栈面试突击小册太香了

Java架构之路

Java 程序员 架构 面试 编程语言

1800 美金?Apache ShardingSphere 带薪远程实习招募啦!| 2021 Google 编程之夏

京东科技开发者

Apache 开源 ShardingSphere

有趣的技术知识 3 | GitHub超火科学上网加速器!

Java_若依框架教程

翻墙 佛跳墙 科学上网

荷小鱼 x mPaaS | 借助 H5 容器改善 App 白屏、浏览器兼容等问题

蚂蚁集团移动开发平台 mPaaS

html5 mPaaS 离线包 教育科技

Android AAC音频硬编解码你知道多少?

Engineer-Jsp

已拿到8个Offer!阿里巴巴Java面试参考指南(泰山版)

钟奕礼

Java 编程 程序员 架构 面试

给你看一个开发和运维的效率加速器!

BinTools图尔兹

DevOps 运维 运维工程师 dba 数据库管理工具

漫画Nginx的subfilter

运维研习社

nginx 4月日更

盘点几代会声会影图标

奈奈的杂社

HBase底层读写过程

五分钟学大数据

HBase 4月日更

一体化智能安全防御 京东云星盾安全加速正式发布

京东科技开发者

互联网 网络安全

后端选择java,还是python?

cdhqyj

Java Python 后端 计算机 语言

阿凡提EGGNETWORK恒价通证+加密社交催生新玩法 EFTalk

币圈那点事

区块链版「滴滴+Uber」,让出行带来收益

CECBC

移动互联网

入职字节跳动那一天,我哭了(蘑菇街被裁,奋战7个月拿下offer)

Java 编程 程序员 架构 面试

激光雷达(LiDAR)技术

澳鹏Appen

人工智能 大数据 智能驾驶 激光雷达 点云标注

为什么拥有云原生数据平台对电信公司很重要?

VoltDB

云原生 5G VoltDB 电信

基于区块链技术的建筑供应链金融创新

CECBC

区块链

嘉楠科技发布勘智K210-MicroPython 无需寄存器手册就能上手开发

Github上堪称最全的面试题库(Java岗)到底有多香

钟奕礼

Java 编程 程序员 架构 面试

3.2 Go语言从入门到精通:包管理工具之GOPATH

xcbeyond

Go 语言 4月日更

数字货币,已成为理解现代经济不可排斥的一个因素

CECBC

数字经济

为什么要用 Redis 实现事务的 ACID

escray

redis 学习 极客时间 Redis 核心技术与实战 4月日更

架构实战营模块一作业

日照时间长

架构实战营

Java程序员都要懂得知识点:原始数据类型

华为云开发者联盟

Java 字符串 StringBuffer 原始数据类型 布尔类型

构建用户安全评级,UGC智能化审核应用实践

爱奇艺技术产品团队

人工智能

公安重点人员管控系统搭建,智慧派出所系统

腾讯朱雀实验室推出“隐形”水印,助力打击AI模型盗取行为_AI&大模型_InfoQ编辑部_InfoQ精选文章