限时领|《AI 百问百答》专栏课+实体书(包邮)! 了解详情
写点什么

腾讯朱雀实验室推出“隐形”水印,助力打击 AI 模型盗取行为

  • 2021-11-12
  • 本文字数:1126 字

    阅读完需:约 4 分钟

腾讯朱雀实验室推出“隐形”水印,助力打击AI模型盗取行为

随着人工智能行业的发展,AI 技术被大量应用到人们的生活中,而 AI 模型作为这些技术的载体,被广泛部署在云端。作为一种数字资产,AI 模型面临着被窃取的风险,其安全性愈发引起业界关注。


北京时间 11 月 11 日至 12 日,全球知名信息安全峰会 POC 2021 正式举办,腾讯朱雀实验室高级研究员 Mengyun Tang 和研究员 Tony 受邀参加,并进行了题为《Towards AI Model Security Protection(AI 模型的安全保护)》的分享。


在此次分享中,腾讯朱雀实验室展示了 AI 模型攻防实例,并提出了一种新的模型水印生成方法,这项技术可以防御多种模型窃取方式,并且对原模型的输出几乎不产生影响,为 AI 模型版权提供有效的保护。

AI 模型维权,取证是难点

    

AI 模型作为技术的核心载体,一旦被窃取,将可能使拥有该技术的企业或组织暴露在风险中。例如,某公司的 AI 模型被黑客恶意盗取后,黑客就可以复制该公司的业务,来抢占市场,获取间接经济利益,或者将模型出售给第三方,甚至勒索该公司,来获取直接经济利益。

    

在模型窃取方式中,代理模型攻击是一种典型的手段,它通过训练与原模型功能相似的代理模型来蒸馏原模型的知识——将原模型的输入作为其输入,原模型的输出作为其训练标签,并进行参数优化,不断拟合原模型的输出,最终达到窃取原模型知识的目的。


模型窃取流程

   

而在面对模型窃取攻击时,模型的原作者往往容易处于被动。因为攻击者并不直接接触原模型,所以原作者无法提供直接证据,证明被窃取的模型中含有自己的知识产权,而陷入维权困难的境地。因此,一旦模型窃取攻击泛滥,将为人工智能的发展带来更多挑战。

“隐形”水印,AI 模型版权保护新方法


针对上述问题,腾讯朱雀实验室结合最新的深度学习技术,推出了一套为 AI 模型提供保护的方法,即对疑似窃取模型进行“取证”,来证明该模型为“盗版”模型。

    

这套方法可以在预先防护阶段,生成肉眼不可见的水印,并将之添加到原模型的输出上,为原模型的输出“烙上”版权信息,同时,对原模型的输出几乎不产生影响。当 AI 模型被攻击时,其附带的水印也会被代理模型学习到,进而使得代理模型的输出中也含有该水印。

    

随后,通过经训练的提取器,可以从代理模型的输出中精准地检测到水印的存在,并将预先嵌入的模型版权信息进行高质量的还原,从而为模型原作者提供有力的技术证据,来对抗侵权行为。


朱雀实验室提出的模型水印生成方法及其保护流程


这项技术为 AI 模型提供了一道“胎记”,其意义在于,不仅能够有效地帮助 AI 模型作者维护自己的知识产权,还能打击“盗版”AI 模型,一定程度地遏制模型窃取行为的发生,促进 AI 行业的生态持续健康发展。

    

腾讯安全平台部下属的腾讯朱雀实验室,致力于实战级 APT 攻击和 AI 安全研究,其建设的 AI 安全威胁风险矩阵,专门针对人工智能行业中的潜在风险提供研究和预案,为 AI 业务提供安全保障。

2021-11-12 16:105118

评论 1 条评论

发布
用户头像
会不会导致一些莫名其妙的BUG?
2021-11-23 08:42
回复
没有更多了
发现更多内容

解析单存储库:定义、优势与挑战

龙智—DevSecOps解决方案

谷歌 Monorepo Monolith 单储存库

分布式文件系统FastDFS

会踢球的程序源

Java fastdfs 分布系统

RocketMQ 多级存储设计与实现

阿里巴巴云原生

阿里云 RocketMQ 云原生

某程序员哀叹:写几年代码,回头一看80%都没用,没法写上简历!

Java你猿哥

Java 程序员 面试 简历

ElasticSearch 高级检索,按照顺序进行搜索

alexgaoyh

elasticsearch dsl 顺序搜索 高级检索 与或关系

解决流水线瓶颈、提升编码效率的五个方法(上篇)

龙智—DevSecOps解决方案

ci cicd 持续集成 流水线

OneCode 开源集成开发工具ESD功能介绍

codebee

开源 低代码平台

互联网工程师Java面试八股文及答案整理(2023最新版)

Java你猿哥

Spring Cloud springboot java面试 面经 JVM面试

【Linux】系统中安装Go环境

A-刘晨阳

Go Linux 三周年连更

涅槃重生!字节大牛力荐大型分布式手册,凤凰架构让你浴火成神

Java你猿哥

架构 分布式架构 凤凰架构

人工智能会取代人类成为地球的主宰么?| 社区征文

毛小毛

人工智能 ChatGPT 三周年征文

【经验分享】硬件工程师需要知道的DFM可制造性设计

华秋PCB

工具 电路 PCB PCB设计 可制造性

阿里高工纯手写的《分布式架构手册》仅仅一天GitHub就标星128K

Java你猿哥

架构 分布式 分布式架构

运维审计录像的作用是什么?用什么软件好?

行云管家

堡垒机 运维审计 审计录像

如何解决spring的循环依赖问题?

Java spring 循环依赖

大咖力荐 |《中国企业软件研发管理白皮书》为什么值得看?

万事ONES

优秀的pdf编辑器:Acrobat Pro DC 中文直装版

真大的脸盆

Mac PDF Mac 软件 PDF格式转换

Postman Runner 使用指南

Liam

Java 后端 Postman 接口测试 API 开发

Databend v1.1 版本发布!

Databend

Linux 修改系统时间的两种方式

会踢球的程序源

Java Linux

直播预告 | TDengine & Apache SeaTunnel 联合应用最佳实践

TDengine

Apache tdengine 时序数据库

如何将一个链表分组并对每组进行反转?

Java你猿哥

Java 链表 架构师 SSM框架 链表结构

实战分享丨 MySQL 与 Django 版本匹配相关经验

Java你猿哥

Java MySQL SSM框架 实战 Diango

关于自托管环境,您了解多少?

龙智—DevSecOps解决方案

Atlassian Data Center

缓存一致性设计思路

我爱娃哈哈😍

redis 缓存 缓存一致性

ReentrantLock和Synchronized使用与区别,多线程安全问题

共饮一杯无

synchronized ReentrantLock 三周年连更

打造安全无忧软件应用的十大最佳实践

龙智—DevSecOps解决方案

软件开发 软件开发安全

研究思考丨关于软件复杂度的困局

阿里巴巴云原生

阿里云 云原生 复杂度

云服务是什么意思?有什么用?

行云管家

云计算 云服务

面试了个阿里P7大佬,他让我见识到什么才是“精通高并发与调优”

Java 高并发 性能调优

PostgreSQL技术内幕(七)索引扫描

酷克数据HashData

数据库 postgresql

腾讯朱雀实验室推出“隐形”水印,助力打击AI模型盗取行为_AI&大模型_InfoQ编辑部_InfoQ精选文章