【ArchSummit架构师峰会】探讨数据与人工智能相互驱动的关系>>> 了解详情
写点什么

99% 的人并不知道 AI 生成人脸已经达到什么水平

  • 2019-02-22
  • 本文字数:2043 字

    阅读完需:约 7 分钟

99%的人并不知道AI生成人脸已经达到什么水平

近日,利用生成对抗网络(GAN)自动生成动漫头像在网络上引发了热潮,各种或呆萌或高冷的头像并非来自任何一部动漫,而是由神经网络模型直接生成的。此后,一些更加疯狂的开发者搞出了更加不可思议的模型:直接生成人物照片。

先来玩儿个游戏

先来玩儿个简单的小游戏,猜猜看下面这两张图中哪一张是真实的照片:



选好了吗?答案揭晓了,真实的照片是——右边的这位美女!



是不是有些不可思议?左边这张怎么看都像是一张普通的照片啊,怎么会是 AI 生成的呢?但事实就是如此,左边的这张照片中的美女,没有国籍、没有姓名,根本不存在于这个世界。没错,这就是生成对抗网络 GAN 的强大威力。


如果你觉得这道题太简单,你也可以再来一道附加题。猜猜下面这张图中的两个漂亮妹子哪个是真实的?哪个是 AI 生成的?


“在互联网上,没人知道你是一个 AI”

上面的这个游戏是来自这个网站的作品:http://www.whichfaceisreal.com ,感兴趣的读者可以自己去感受一下。


这个网站的作者是来自华盛顿大学的两名教授:Carl T. Bergstrom 和 Jevin D. West,他们分别是生物学教授和信息科学教授。在网站的介绍页面,他们写了这样一段话:



“ 在互联网上,没有人知道你是一只狗。 ”


他们这样写道:


过去的四分之一个世纪里,我们在漫画里展示的教训中不断成长,互联网上的陌生人可能是任何身份、来自任何地方。音乐论坛上的管理员可能是住在他妈妈房子地下室的小屁孩,聊天室里的一个十四岁的女孩可能是一名卧底警察,邮箱中找你重金求子或者让你继承遗产的女富商更是让人一眼看过去就知道是骗子。


虽然我们已经学会不再相信对方的用户名和文字介绍,但是照片却不是这样。我们曾经一直相信,谁都无法凭空地合成一张图片,一张照片上的人物必定是来自现实中的某个人。当然,一个骗子可能用的是其他人的照片,但这样做是一个冒险的策略,在谷歌利用图片搜索进行反向查找,总能找到照片的来源。所以我们倾向于信任图片,带图片的商家资料显然更可信,在约会网站上的照片可能比本人差距要大很多,但是因为有照片,我们总能找到它一定来源于某个人。


可是,新的逆向机器学习算法打破了这一规则,它可以让人们快速生成从未存在过的人的“合成照”。



这些照片都是 AI 生成的,你相信吗?


计算机很好很强大,但你作为人类的视觉处理系统其实更好。如果你了解一些技巧,就可以一眼就看出这些假货,至少目前是这样。用于生成它们的硬件和软件将继续改进,并且可能只用几年时间就能骗过专业的检测系统。


我们的目标是让您了解:网络上的身份可以轻松伪装,并帮助您一目了然地发现这些骗局。

万“恶”之源:StyleGAN

这个网站的作者强调说:他们并不是这套模型的原作者,而是使用者,真正的作者是来自知名半导体公司英伟达的几位工程师:Tero Karras,Samuli Laine 和 Timo Aila,他们基于 Ian Goodfellow 及其同事在 Generative Adversarial Neworks(GANs)的早期工作而进行的研发,做出了这套名为:StyleGAN 的模型。


2019 年 2 月,图形硬件制造商英伟达发布了照片级真实面部生成软件 StyleGAN 的开源代码。该软件采用生成对抗网络(GAN)方法,利用两个神经网络互相训练,一个试图生成与真实照片无法区分的合成图像,另一个试图分辨出差异,这样训练几个星期后,图像创建网络可以生成像上面展示的那样以假乱真的​​图像。



更多依靠 StyleGAN 合成的照片


除了对抗性网络系统的代码之外,NVIDIA 还以神经网络权重的形式发布了数据,用于完整训练的模型,以便用户可以绕过漫长的训练过程并立即开始生成面部合成照。在训练过程中,GAN 需要一组真实的面孔来学习,NVIDIA 提供的网络拥有了两个大型面部照片集合 CELEBA-HQ 和 FFHQ,前者包括数以千计的名人面孔,后者包括根据创意公共许可证发布到 Flickr 的 70,000 张面部照片。



用于训练的来自来自FFHQ数据集的真实面部照片


除了我们上面展示的网站,由 StyleGAN 合成的照片还发布在另一个网站上:http://thispersondoesnotexist.com/


访问者每刷新一次就会生成一张新的照片。不过,毕竟是依靠算法生成的图片,总有玩儿脱的时候,下图展示的就是一些合成失败的案例:



扭曲的下巴与诡异的帽子



“分筋错骨手”

人脸都能合成了,还有安全可言吗?

虽然合成人脸照片很酷,但是这样的做法不免的引起了网友的恐慌。有不少人表示:人脸都能合成,安全问题该如何保证?


我们都知道对话机器人已经部分取代了客服的工作,不少银行、商家的客服都已经是 AI 了。我们的编辑前不久就接到一通来自银行的客服电话,声音虽然仍有明显的合成痕迹,但已经很贴近真实的人声了。


与你对话的是 AI,给你看的照片也是 AI,就连视频里的人物都可以利用 deepfakes 来进行“换脸”,人工智能虽然极大地方便了我们的生活,但由此带来的安全隐患缺不得不引起重视。人脸识别目前几乎是最为普及的 AI 技术了,目前尚不清楚是否能够依靠“换脸”这样的技术手段骗过此类系统,但是由于这种手段的存在,总让人难以放心。

最后彩蛋

附加题图中左边的漂亮妹子是 AI 生成的,而右边则是真实存在的。你猜对了吗?



更多内容,请关注 AI 前线



公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2019-02-22 08:0010283
用户头像
陈思 InfoQ编辑

发布了 576 篇内容, 共 262.5 次阅读, 收获喜欢 1293 次。

关注

评论 6 条评论

发布
用户头像
可以可以
2019-02-22 11:41
回复
s
2019-02-22 16:37
回复
das
2019-02-22 16:37
回复
asd
2019-02-22 16:40
回复
用户头像
我试玩了,两边都点过了,所有点击行为都是真实的照片;然后我尝试点击错误的照片,依然显示真实照片!
2019-02-22 09:38
回复
shi d
2019-02-22 16:46
回复
没有更多了
发现更多内容

前端存储除了 localStorage 还有啥

阿宝哥

Java 大前端 存储

JDBC拾遗

qihuajun

架构师训练营第四周总结:互联网架构概要

hifly

高可用 高性能 极客大学架构师训练营 互联网架构

架构师训练营第三周作业

陈靓-哲露

消息队列(五)如何保证消息的顺序性?

奈何花开

Java MQ 消息队列

第四周作业

芒夏

极客大学架构师训练营

时间管理的本质到底是什么?

非著名程序员

程序员 提升认知 时间管理

架构师训练营 - 作业 - 第四周

心在飞

极客大学架构师训练营

猿灯塔:关于Java面试,你应该准备这些知识点

猿灯塔

面试

作业 - 第4周

Happy-Coming

印度下黑手!59款中国APP被禁用,微信微博QQ抖音等在列

程序员生活志

数据库周刊30丨数据安全法草案将亮相;2020数据库产业报告;云南电网上线达梦;达梦7误删Redo Log;Oracle存储过程性能瓶颈;易鲸捷实践案例……

墨天轮

MySQL 数据库 oracle mongodb 周刊

自己动手编译一个HEIF图片转jpeg工具(Mac平台)

GeorgeMR

HEIF HEIC jpeg 图片

程序员面试与 HR 谈薪资技巧

张小方

程序员 面试 offer 年终奖 月薪

Mac开发环境 React Native0.60 环境 安卓环境Java变量 及~/.zshrc文件配置

蛋蛋

React

架构师训练营——第四周作业

jiangnanage

架构设计之常识篇

魔曦

架构师 极客大学架构师训练营

可读代码编写炸鸡三 - 审美

多选参数

代码质量 代码 代码注释

架构师训练营 - 系统架构

Pontus

极客大学架构师训练营

架构师训练营第四周作业

Bruce Xiong

出海蓝军先锋联想来酷,今夏再征"丝路"

Geek_116789

架构师训练营 第4周作业

坂田吴奇隆

极客大学架构师训练营

消息队列(六)如何处理消费者故障导致的百万消息积压?

奈何花开

Java MQ 消息队列

架构师训练营-第4周总结

坂田吴奇隆

极客大学架构师训练营

分布式计算DAG1-画猫

Hervor。

Python中进行None判断时,为什么用is而不是==

王坤祥

Python 编程 进阶 计算机基础

架构师训练营第 04周——总结

李伟

极客大学架构师训练营

为什么大公司一定要使用DevOps?

张启华

第四周总结

芒夏

极客大学架构师训练营

可读代码编写炸鸡四(上篇) - 来写注释

多选参数

代码质量 代码 代码注释

父亲节会员礼遇免费送,联想来酷重点发力"健康赛道"

Geek_116789

99%的人并不知道AI生成人脸已经达到什么水平_AI&大模型_陈思_InfoQ精选文章