写点什么

AI 合成以假乱真:只需 7 张照片,就能让真人“社死”

  • 2022-12-21
    北京
  • 本文字数:2244 字

    阅读完需:约 7 分钟

AI合成以假乱真:只需7张照片,就能让真人“社死”

经过迅速发展,如今的 AI 技术已经可以利用社交媒体素材轻松伪造出有害照片。


近日,Arstechnica 的研究人员做了一项研究:大家在社交媒体上发布的真实照片,会被 AI 的二次创作“玩坏”吗?


为了找到答案,研究人员联系了一位志愿者,使用其提供的几张真实照片,用 AI 生成假照片。结果显示,这些假照片的威力巨大,很有可能破坏其声誉。最终,研究人员创建了一个名为约翰的虚拟人物,以其作为案例,一起看看 AI 是怎么把约翰“玩坏”的。

提供了 7 张照片后,约翰被 AI“玩坏”了


这位名叫约翰的虚构人物,在假想的场景中是一名小学教师。和大多数人一样,他在过去 12 年里通过 Facebook 发布了不少自己工作、居家和外出时的照片。



以约翰的 7 张照片作为训练数据,就能训练出足以伪造约翰形象的强大 AI 模型,并能把约翰的照片毫无破绽地放在任意背景之下。


这个 AI 模型生成的假照片栩栩如生,甚至到了以假乱真的底部,比如,约翰打扮成小丑跑去喝酒,约翰在周末参加准军事组织的训练,约翰几年前曾入狱服刑。





这些约翰照片来自名为 Stable Diffusion(1.5 版)的 AI 图像生成器,外加名为 Dreambooth 的技术。虽然约翰不是真人,但用真人的 5 张以上图像完全可以重现类似的结果。这类照片不难获取,社交媒体的发布内容可以、视频中的静止帧也行。


整个训练过程大概需要一个小时,训练完成后,图像内容的生成还需要几个小时——这不是因为生成过程太慢,而是研究人员从大量不完美的图片里挑出质量最高的图片。但无论如何,这样还是比亲自动手用 PS 画假约翰简单得多。


在 AI 的支持下,约翰可以是犯罪分子,也可以是变态狂人,如果使用针对色情内容优化的附加 AI 模型,约翰甚至可以成为色情明星。


AI 还能把约翰放置在奇妙的背景下,例如让他成为中世纪的骑士或者宇航员,让他显得年轻或衰老、肥胖或瘦弱、戴眼镜或不戴,也能给他换上不同的服饰。




有的合成图像并不完美。如果仔细观察,有经验的人会发现这些并非真图。但相应的 AI 技术一直在迅速发展,我们可能很快就无法分辨合成照片与真实照片间的区别。而且即使存在缺陷,这些伪造图像仍有可能毁掉约翰的名誉乃至生活。


这就是技术的两面性所在。人们当然可以用 AI 创建天马行空的神奇画面,Lensa 等近期大热的商业服务和应用就是一例。然而,一旦有人未经他人同意就使用对方的面部图像,那么同样的技术也可能造成可怕的后果。

背后的工作原理


计算机科学家们已经找到了利用真实照片教 AI 伪造新画面的高质量方法,在过去的一年里,这项技术正日渐成熟。不过,这项技术一直存在争议,因为除照片之外,它还允许人们在未经许可下模仿在世艺术家的创作风格。


目前最具影响力的 AI 图像生成器之一是 Stable Diffusion。这种深度学习图像合成模型能够利用文本描述生成全新图像,可以运行在 Windows 或 Linux PC 的强大本地 GPU 上,也可以在 Mac 或者租用的云端硬件上起效。


在 Stability AI 雄厚财力的支持下,CompVis 学术组织利用互联网上获取的几亿张公开图像训练出了 Stable Diffusion AI 模型。Stability AI 于 2022 年 8 月 22 日将 Stable Diffusion 以开源软件的形式发布,现在任何人均可免费使用,其功能也被集成至越来越多商业产品当中。


通过强化训练,Stable Diffusion 神经网络学会了单词与图像中各像素位置间的一般统计关联。大家可以给 Stable Diffusion 提供一条文本提示,例如“摩根·弗里曼坐在教室里”,然后就能得到相应的全新图像。


制作这类大明星的图像很简单,因为 Stable Diffusion 的训练数据集里没准有几百张摩根·弗里曼的照片,它知道这位演员长什么样子。但如果想制作约翰这类普通人的图像,就得给 Stable Diffusion 一点额外的帮助。这就是 Dreambooth 的意义所在。

Dreambooth 微调模型


谷歌研究人员于 2022 年 8 月 30 日宣布,Dreambooth 使用一种特殊的“微调”技术帮助 Stable Diffusion 完成了新的学习。



最初,Dreambooth 其实跟 Stable Diffusion 没有任何关系,而且谷歌为了防止被滥用而屏蔽了 Dreambooth 的代码。但在公布不久之后,就有人主动把 Dreambooth 跟 Stable Diffusion 结合了起来,并将其代码作为开源项目免费发布。


从那时起,Dreambooth 开始成为 Stable Diffusion 学习全新艺术风格的重要“家教”。用户们在线上存储库里分享自己的 Dreambooth 微调模型,并供其他人下载以快速获得类似的视觉效果。


但从一开始,谷歌研究人员就知道这种技术完全可以用到人身上,而麻烦也将随之而来。因此他们在公布 Dreambooth 时,使用的是柯基犬的图像。但这点小心思当然躲不过评判者的法眼,《麻省理工科技评论》批评称,AI 科学家显然是在用这种消极的方式回避其成果所带来的潜在负面影响。

用 AI“打败”AI


未来,也许会有新的技术手段来防范这种照片滥用。例如,法律可能要求未来的 AI 图像生成器在输出中嵌入肉眼不可见的水印,以供日后检验。


比如,Stable Diffusion 就默认嵌入水印,但开源版本的用户可以删除或禁用水印组件来解决问题。不过,即使法律强制要求,市面上也还有其他不加水印的 Deepfakes 技术存在。


最近,麻省理工学院的研究人员公布了 PhotoGuard 对抗方法,能用一种不可见的方法巧妙修改照片,借此防止 AI 操纵现有图像。但其目前只适用于 AI 编辑(即「修改」),而非图像训练或生成。


另外,时间也许能解决一切。随着人们对伪造图像认知的增强,社会文化最终也许能够消化掉这些新问题。我们会慢慢接受这样一种新的媒体呈现方式,并开始关注照片是否拥有可信来源。但在适应新形势之前,AI 合成的伪造品肯定会造成一段时期的混乱。

2022-12-21 13:4112750

评论

发布
暂无评论
发现更多内容

hive on spark 和 spark on hive

飞哥

大数据 spark hive

微服务与Kubernetes容器云的边界

穿过生命散发芬芳

微服务 7月月更

一位 sealer maintainer 的心路历程

阿里巴巴云原生

阿里云 开源 云原生 sealer

Flutter 实现小姐姐渐现动画效果

岛上码农

flutter ios 前端 安卓开发 7月月更

瑞云与宜宾职院开展校企合作,同深圳VR联合会共建元宇宙产业学院

3DCAT实时渲染

职业教育 虚拟现实 虚拟仿真 元宇宙

编译器优化那些事儿(4):归纳变量

openEuler

openEuler 毕昇 JDK 开源操作系统 编译器 加速器 编程语言

React Table 表格组件使用教程 排序、分页、搜索过滤筛选功能实战开发

蒋川

排序 React 表格 组件库

聊聊 API 管理-开源版 Yapi 到 SaaS 版 Apifox

Liam

基于ResNet50实现宫颈细胞病变分类

逝缘~

分类神经网络 7月月更

Istio整体架构解析

阿泽🧸

istio 7月月更

什么是hpaPaaS平台?低代码和hpaPaaS是什么关系?

优秀

低代码

一款代替Typora的软件---MarkText

IT蜗壳-Tango

7月月更

普通二本院校如何从所谓的从寒冬破冰?

KEY.L

7月月更

动态广播发送流程

北洋

android 7月月更

深度揭秘阿里云函数计算异步任务能力

阿里巴巴云原生

阿里云 Serverless 云原生 异步 函数计算

几种跨平台方案的对比

Geek_99967b

小程序 跨平台

长安链研究笔记-证书生成工具

长安链

使用 doscify 将文章写成文档一般丝滑

宁在春

GitHub Pages docsify 7月月更

设计稳定的微服务系统时不得不考虑的场景

阿里巴巴云原生

阿里云 微服务 云原生 OpenSergo

避坑:@Around与@Transactional混用导致事务不回滚

Paul

Spring Boot 2 事务失效 spring aop Java’

阿里云架构师马继雨:云超算解决方案全面助力生命科学行业普惠增效

阿里云弹性计算

高性能计算 生命科学 EHPC

6. 对象存储

MASA技术团队

C# .net 对象存储 框架 Framework

3DCAT投屏功能升级,助力企业营销与培训

3DCAT实时渲染

虚拟仿真 实时云渲染 3DCAT 企业营销 实时渲染云

「阿里云 RocketMQ 系列公开课」重磅来袭!

阿里巴巴云原生

Apache 阿里云 RocketMQ 云原生 直播

机器学习-西瓜书小记

AIWeker

机器学习 7月月更

【刷题记录】8. 字符串转换整数 (atoi)

WangNing

7月月更

mac 本地hive2 安装

飞哥

大数据 hadoop hive

小程序遇上Flutter 3.0

Geek_99967b

flutter 小程序

大数据15周作业

Asha

WebRTC 音频抗弱网技术(下)

融云 RongCloud

mac 本地安装spark

飞哥

大数据 spark 数据仓库

AI合成以假乱真:只需7张照片,就能让真人“社死”_文化 & 方法_核子可乐_InfoQ精选文章