阿里、微众、PingCAP专家分享如何解决可观测性带来的埋点成本上升、观测数据割裂等挑战。戳 了解详情
写点什么

专访微软 Face X-Ray 算法团队,图片自身“DNA”成防伪突破口

  • 2020 年 2 月 27 日
  • 本文字数:1998 字

    阅读完需:约 7 分钟

专访微软Face X-Ray算法团队,图片自身“DNA”成防伪突破口

2019 年 12 月,为了应对 AI 换脸技术滥用的情况,微软亚洲研究院提出了一种检测伪造人脸图像的方法——Face X-Ray,能够检测复杂的伪造人脸图像。

一个多月后,Face X-Ray 论文入选 CVPR 2020,微软亚洲研究院常务副院长郭百宁,微软亚洲研究院高级研究员陈栋在一场线上活动中解读了该论文。InfoQ 作为受邀媒体之一,就相关技术问题,对两位技术专家进行了采访。


自 Deepfake 诞生以来,围绕这项技术的丑闻层出不穷。“AI 换脸”成为了不少网络用户,尤其是社会名人的噩梦,换脸图片、视频在网络上层出不穷,甚至为一些色情网站、假新闻提供了“素材”。去年 6 月,一份报告显示,一名间谍利用 AI 生成的个人资料图片欺骗了 LinkedIn 上的联系人。同年 12 月,Facebook 发现了数百个利用 AI 合成的假脸做头像的虚假账户。


根据郭百宁博士的介绍:研究发现有 30%的用户是猜不出图片真假的。为了鉴别合成图片,微软推出了 Face X-Ray 算法。据介绍,该算法论文已入选 CVPR 2020。郭百宁表示,Face X-Ray 技术类似医院的 X 光,可以鉴别图片真假,不但能识别出图片是否进行过换脸操作,而且还能告诉用户换脸操作的边界。



目前,主流的换脸技术大概有两种:Face Reenactment、Face Replacement,DeepFake 就是基于后者开发的。为了鉴别这些技术生成的照片,业内花费了大量精力。比如,以前鉴别图片的真伪,需要搜集大量真假图片,再利用深度神经网络进行训练,微软亚洲研究院提出的上一代算法也是这样,训练 AI 分类器,让 AI 模型去“学习”大量的换脸图像,从而具有初步鉴别能力。


但是,用分类器的方法存在一个很大的问题,就是一定要收集大量换过脸的图片才能进行训练,而且二分类的方法还存在局限,即只有换脸图像采用的是已知换脸算法,鉴别才有可能达到较高识别率(99%以上),因为 AI 模型就是通过大量学习这些算法生成的人脸图像来提升识别能力的。一旦换脸图像采用了未知算法,其鉴别的识别率会大幅降低至 70%。


郭百宁介绍,Face X-Ray 具有通用性和可解释性,无论换脸图像是采用已知还是未知的算法,Face X-Ray 都可以有较高的识别率,平均达到 95%以上。此外,Face X-Ray 能明确指出合成图像的边界,让普通人也可以容易地理解这一方法的鉴别过程。


详细来说,研究人员在 FaceForensics ++ 上对 Face X-Ray 进行了训练。研究人员评估了 Face X-Ray 归纳四个数据集的能力,其中包括 FaceForensics ++ 语料库的一个子集,Google 发布的上千个可视化 Deepfake 视频,来自 Deepfake 检测挑战的图像 以及包含 408 个真实视频和 795 个合成视频的语料库 Celeb-DF。


结果表明,Face X-Ray 能够分辨出以前从未见过的合成图像,并能准确地预测混合区域。该团队指出,他们的方法是针对合成图像的,因此,它可能不适用于整张完全合成的图像。


注:FaceForensics ++ 是一个大型视频语料库,其中包含四种使用先进人脸操作方法操作的 1000 多个原始剪辑。


郭百宁进一步解释道:每张照片在拍摄的时候都是通过硬件,硬件里面有图像感知器,还要通过压缩(等技术),很多采集出来的图像都有自己的特色,可以说它具有 digital signature(数字签名),人眼看不到,但它是存在的。



不同的两张图像的数字签名,其噪音的特性不一样,都不是人眼能看得到的。例如,上图(a)组经过测试发现,数字签名只有一个。但是,在上图(b)组里就可以看到,有两个不同的数字签名。“每张图片的 DNA 是不一样的,我们把这个不同的 DNA 检测出来,这就是我们能找到的原因。”郭百宁说道。


另外,陈栋博士表示,对于深度学习网络,大数据是极其重要的。大数据可以有效防止过拟合,提高精度,但是带有人工标注的大数据的确很难获得。因此,现在学术上流行使用无监督、半监督,或者自监督的训练方式,减少数据的标注量。Face X-Ray 就使用自监督的方式进行训练,只需要大量的自然人脸图像即可,不需要任何人工标注,可以很轻松的使用大数据。


如今,Deepfake 已经渗透进了不少领域,解决假视频、假照片等问题迫在眉睫,很多技术大厂都开始了“清剿”Deepfake 视频、图片的行动,很多社交平台也纷纷表态要解决这一问题。微软希望通过换脸图像鉴别的最新技术突破,用技术手段去应对新技术所带来的一些问题。两位专家告诉记者:


微软希望每个人、每个组织和机构都能够使用人工智能技术并享受其带来的好处,让人工智能普及化。在微软,我们解决这一问题的途径之一是设立开发和研究人工智能与道德标准(AETHER)委员会。该委员会囊括了来自微软公司开发、研究、咨询和法律部门的高管,专注于积极制定内部政策,以及如何应对所出现的具体问题。AETHER 委员会审查和界定最佳实践,提供指导原则,指导微软人工智能产品和解决方案的开发和部署,并帮助解决微软人工智能研究、产品和客户沟通中产生的伦理和社会影响问题。


在多方力量联合之下,Deepfake 造成的影响或许有希望被遏制。


拓展阅读:Face X-Ray 论文:https://arxiv.org/pdf/1912.13458.pdf


2020 年 2 月 27 日 15:481139
用户头像
陈思 InfoQ编辑

发布了 576 篇内容, 共 229.1 次阅读, 收获喜欢 1255 次。

关注

评论

发布
暂无评论
发现更多内容

自定义View:使用二阶贝塞尔曲线绘制正弦函数

Changing Lin

12月日更

工作不喜欢,但不得不暂时干着,很痛苦,怎么办?

石云升

学习笔记 28天写作 12月日更

单例模式

卢卡多多

单例模式 28天写作 12月日更

低代码发展正当时,中国将取代美国成为低代码开发的全球领导者

金小K

RPA 低代码 低代码开发 低代码平台

🏆【Alibaba中间件技术系列】「RocketMQ技术专题」让我们一起实践RocketMQ的服务搭建及配置操作

浩宇天尚

消息队列 Apache RocketMQ 12月日更

【Promise 源码学习】第十篇 - Promise.prototype.catch 和 Promise.prototype.finally 的实现

Brave

源码 Promise 12月日更

DC EP要统一“ 世界度量衡”,数字货币打开财富大门

CECBC

让每块火腿都留下“数字痕迹”!西媒:区块链将用于保护食品安全

CECBC

【LeetCode】亲密字符串Java题解

HQ数字卡

算法 LeetCode 12月日更

实用机器学习笔记二:数据获取

打工人!

机器学习 学习笔记 12月日更 实用机器学习

MySQL探秘(三):InnoDB的内存结构和特性

程序员历小冰

MySQL 28天写作 12月日更

随笔—写作

圣迪

创业研发团队的组织建设-人才培养

wood

创业 人才培养 28天写作

质量服务“一站式”平台搭建,NQI一站式云服务平台

电微13828808271

云原生:K8s控制器汇总(附视频教程+PDF)

息之

k8s Node Deployment statefulset cronjob

区块链电子合同签署平台,区块链智能合同优势

电微13828808271

智慧社区管理系统,智慧社区一体化平台

电微13828808271

基于云的技术架构设计实践-第2篇

hackstoic

监控系统 签约计划第二季

EasyRecovery如何恢复游戏——英雄联盟

淋雨

数据恢复 EasyRecovery

中年人的沉重3

张老蔫

28天写作

一个基于HTML的可定制轮盘——帮你告别选择困难症

海拥(haiyong.site)

html 大前端 28天写作 签约计划第二季 12月日更

在Linux系统发行版(以CentOS7为例)上部署ElasticSearch集群并启动Kibana和Logstash

为自己带盐

Centos 7 28天写作 Elastic Search 签约计划第二季 12月日更

Python Qt GUI设计:QPrinter打印图片类(基础篇—21)

不脱发的程序猿

Python PyQt GUI设计

声网发布教育新品:灵动课堂全球覆盖学生超400万,互动白板首创H5课件

声网

人工智能 代码

Android C++系列:Linux守护进程

轻口味

c++ android 28天写作 12月日更

33 K8S之访问控制

穿过生命散发芬芳

k8s 28天写作 12月日更

Istio 实践手册 |服务网格框架对比

xcbeyond

istio 28天写作 12月日更 Istio 实践手册

云编辑 | 使用 Cloud Studio 在线撰写预览并发布 Hugo 博客

宋天伦

CloudIDE Hugo Cloud Studio

ONES 与极狐(GitLab)战略合作,强强联手推动 DevOps 发展

万事ONES

DevOps SaaS ONES #GitLab

元宇宙赛道以百万年薪“抢人”未来五大类人才最紧俏

CECBC

大型前端项目 DevOps 沉思录 —— CI 篇d

CODING DevOps

ci DevOps 持续集成 工作流

“一键上链”技术大牛教你快速构建链上应用

“一键上链”技术大牛教你快速构建链上应用

专访微软Face X-Ray算法团队,图片自身“DNA”成防伪突破口_AI_陈思_InfoQ精选文章