2天时间,聊今年最热的 Agent、上下文工程、AI 产品创新等话题。2025 年最后一场~ 了解详情
写点什么

AI 合成以假乱真:只需 7 张照片,就能让真人“社死”

  • 2022-12-21
    北京
  • 本文字数:2244 字

    阅读完需:约 7 分钟

AI合成以假乱真:只需7张照片,就能让真人“社死”

经过迅速发展,如今的 AI 技术已经可以利用社交媒体素材轻松伪造出有害照片。


近日,Arstechnica 的研究人员做了一项研究:大家在社交媒体上发布的真实照片,会被 AI 的二次创作“玩坏”吗?


为了找到答案,研究人员联系了一位志愿者,使用其提供的几张真实照片,用 AI 生成假照片。结果显示,这些假照片的威力巨大,很有可能破坏其声誉。最终,研究人员创建了一个名为约翰的虚拟人物,以其作为案例,一起看看 AI 是怎么把约翰“玩坏”的。

提供了 7 张照片后,约翰被 AI“玩坏”了


这位名叫约翰的虚构人物,在假想的场景中是一名小学教师。和大多数人一样,他在过去 12 年里通过 Facebook 发布了不少自己工作、居家和外出时的照片。



以约翰的 7 张照片作为训练数据,就能训练出足以伪造约翰形象的强大 AI 模型,并能把约翰的照片毫无破绽地放在任意背景之下。


这个 AI 模型生成的假照片栩栩如生,甚至到了以假乱真的底部,比如,约翰打扮成小丑跑去喝酒,约翰在周末参加准军事组织的训练,约翰几年前曾入狱服刑。





这些约翰照片来自名为 Stable Diffusion(1.5 版)的 AI 图像生成器,外加名为 Dreambooth 的技术。虽然约翰不是真人,但用真人的 5 张以上图像完全可以重现类似的结果。这类照片不难获取,社交媒体的发布内容可以、视频中的静止帧也行。


整个训练过程大概需要一个小时,训练完成后,图像内容的生成还需要几个小时——这不是因为生成过程太慢,而是研究人员从大量不完美的图片里挑出质量最高的图片。但无论如何,这样还是比亲自动手用 PS 画假约翰简单得多。


在 AI 的支持下,约翰可以是犯罪分子,也可以是变态狂人,如果使用针对色情内容优化的附加 AI 模型,约翰甚至可以成为色情明星。


AI 还能把约翰放置在奇妙的背景下,例如让他成为中世纪的骑士或者宇航员,让他显得年轻或衰老、肥胖或瘦弱、戴眼镜或不戴,也能给他换上不同的服饰。




有的合成图像并不完美。如果仔细观察,有经验的人会发现这些并非真图。但相应的 AI 技术一直在迅速发展,我们可能很快就无法分辨合成照片与真实照片间的区别。而且即使存在缺陷,这些伪造图像仍有可能毁掉约翰的名誉乃至生活。


这就是技术的两面性所在。人们当然可以用 AI 创建天马行空的神奇画面,Lensa 等近期大热的商业服务和应用就是一例。然而,一旦有人未经他人同意就使用对方的面部图像,那么同样的技术也可能造成可怕的后果。

背后的工作原理


计算机科学家们已经找到了利用真实照片教 AI 伪造新画面的高质量方法,在过去的一年里,这项技术正日渐成熟。不过,这项技术一直存在争议,因为除照片之外,它还允许人们在未经许可下模仿在世艺术家的创作风格。


目前最具影响力的 AI 图像生成器之一是 Stable Diffusion。这种深度学习图像合成模型能够利用文本描述生成全新图像,可以运行在 Windows 或 Linux PC 的强大本地 GPU 上,也可以在 Mac 或者租用的云端硬件上起效。


在 Stability AI 雄厚财力的支持下,CompVis 学术组织利用互联网上获取的几亿张公开图像训练出了 Stable Diffusion AI 模型。Stability AI 于 2022 年 8 月 22 日将 Stable Diffusion 以开源软件的形式发布,现在任何人均可免费使用,其功能也被集成至越来越多商业产品当中。


通过强化训练,Stable Diffusion 神经网络学会了单词与图像中各像素位置间的一般统计关联。大家可以给 Stable Diffusion 提供一条文本提示,例如“摩根·弗里曼坐在教室里”,然后就能得到相应的全新图像。


制作这类大明星的图像很简单,因为 Stable Diffusion 的训练数据集里没准有几百张摩根·弗里曼的照片,它知道这位演员长什么样子。但如果想制作约翰这类普通人的图像,就得给 Stable Diffusion 一点额外的帮助。这就是 Dreambooth 的意义所在。

Dreambooth 微调模型


谷歌研究人员于 2022 年 8 月 30 日宣布,Dreambooth 使用一种特殊的“微调”技术帮助 Stable Diffusion 完成了新的学习。



最初,Dreambooth 其实跟 Stable Diffusion 没有任何关系,而且谷歌为了防止被滥用而屏蔽了 Dreambooth 的代码。但在公布不久之后,就有人主动把 Dreambooth 跟 Stable Diffusion 结合了起来,并将其代码作为开源项目免费发布。


从那时起,Dreambooth 开始成为 Stable Diffusion 学习全新艺术风格的重要“家教”。用户们在线上存储库里分享自己的 Dreambooth 微调模型,并供其他人下载以快速获得类似的视觉效果。


但从一开始,谷歌研究人员就知道这种技术完全可以用到人身上,而麻烦也将随之而来。因此他们在公布 Dreambooth 时,使用的是柯基犬的图像。但这点小心思当然躲不过评判者的法眼,《麻省理工科技评论》批评称,AI 科学家显然是在用这种消极的方式回避其成果所带来的潜在负面影响。

用 AI“打败”AI


未来,也许会有新的技术手段来防范这种照片滥用。例如,法律可能要求未来的 AI 图像生成器在输出中嵌入肉眼不可见的水印,以供日后检验。


比如,Stable Diffusion 就默认嵌入水印,但开源版本的用户可以删除或禁用水印组件来解决问题。不过,即使法律强制要求,市面上也还有其他不加水印的 Deepfakes 技术存在。


最近,麻省理工学院的研究人员公布了 PhotoGuard 对抗方法,能用一种不可见的方法巧妙修改照片,借此防止 AI 操纵现有图像。但其目前只适用于 AI 编辑(即「修改」),而非图像训练或生成。


另外,时间也许能解决一切。随着人们对伪造图像认知的增强,社会文化最终也许能够消化掉这些新问题。我们会慢慢接受这样一种新的媒体呈现方式,并开始关注照片是否拥有可信来源。但在适应新形势之前,AI 合成的伪造品肯定会造成一段时期的混乱。

2022-12-21 13:4113208

评论

发布
暂无评论
发现更多内容

okhttp3 第一次使用

我就感觉到快

智汇华云 | 安超OS为企业数字化转型构建坚实的云基座

华云数据

看图学NumPy:掌握n维数组基础知识点,看这一篇就够了

华为云开发者联盟

Python 机器学习 数组 Numpy

科技赋能传统产业:工业绿色可视化—核电站工艺流程组态仿真

一只数据鲸鱼

物联网 数据可视化 组态软件 绿色工业 核电站

盘点2020| 开启小马哥的新未来

小马哥

盘点2020

2020DevOps状态报告——变更管理

禅道项目管理

DevOps 运维 开发 趋势 自动化测试

进来抄作业:分布式系统中保证高可用性的常用经验

华为云开发者联盟

高可用 运维 设计 分布式系统 系统

Serverless 在 SaaS 领域的最佳实践

Serverless Devs

Serverless 云原生 SaaS

软件测试--selenium安装使用

测试人生路

软件测试

如何对AD和Exchange进行安全加固满足护网需要?

嘉为蓝鲸

安全 asm AD 邮件系统 权限

快抛弃你错误的坚持

石君

生活随想 28天写作

从美国《拜杜法案》到中国供应链体系形成的内在逻辑

JiangX

供应链 28天写作 制造

阿里P8内部架构核心学习知识笔记在各大互联网上流传,限时开放下载

Java架构之路

Java 程序员 架构 面试 编程语言

Socket粘包问题终极解决方案—Netty版(2W字)!

王磊

Java socket Netty

Redis 学习笔记 02:链表

架构精进之路

redis 七日更 28天写作

Java 异常处理

大海

Java java异常处理

林昊获中国计算机学会杰出工程师奖,阿里中间件再获高度肯定,“三位一体”推动技术普惠

阿里巴巴云原生

阿里巴巴 阿里云 开发者 云原生 中间件

顶级!13位专家力荐Spring5为企业级开发提供一站式方案

996小迁

Java spring 编程 架构 面试

港股配资系统搭建

软件开发大鱼V15988750073

金融科技 港股交易系统开发 在线开户系统 CFD交易系统 港股多账户系统

实时媒体AI,打破内容创作天花板,加速视频创新

华为云开发者联盟

人工智能 云原生 媒体 视频

十八般武艺玩转GaussDB(DWS)性能调优:路径干预

华为云开发者联盟

数据库 sql 性能调优 GaussDB 算子

APICloud的发展和应用

anyRTC开发者

ios android 跨平台 sdk APICloud

跨越全场景统一架构三大挑战,MindSpore亮出“四招”

华为云开发者联盟

深度学习 联邦学习 mindspore 算子 ai框架

重学JS | 异步编程 Generator()

梁龙先森

面试 大前端 编程语言 28天写作

Android开发时的多点触控是如何实现的?

博文视点Broadview

高频量化交易机器人系统开发|高频量化交易机器人APP软件开发

系统开发

新鲜出炉!阿里内部开源SpringCloud Alibaba全解(全彩版)全网首发

Java架构追梦

Java 学习 架构 面试 SpringCloud Alibaba

智能合约上链系统开发|智能合约上链APP软件开发

系统开发

开发复杂业务系统,有哪些设计思路

邴越

工业传感器:工业互联网的第一道门

工业互联网

AI合成以假乱真:只需7张照片,就能让真人“社死”_文化 & 方法_核子可乐_InfoQ精选文章