如何用机器学习生成拟真人脸图片？_AI&大模型_Greg Surma



 写点什么

本文中的用于生成虚拟人脸图片的机器学习网络是 Generative Adversarial Networks（GAN）生成对抗网络中的一个应用，Deep Convolutional Generative Adversarial Networks （DCGAN）深度卷积生成式对抗网络。

首先来看一个问题，以下这些面孔中，有哪些是真实存在的？

他们是真的吗？

答案将在文末揭晓，首先先让我们看看如何利用对抗网络生成的虚拟人脸。

深度卷积生成式对抗网络（DCGANs）

作者另一篇文章，利用对抗网络完成卡通图片生成，包含了对抗网络 GAN 的一些基本知识，方便初学者查看。作者同时将这个研究项目分享到了GitHub，以及可以云端运行的Kaggle。

本文中提到的人脸图片生成与卡通图片生成技术都是依据 Redford 等人在 2015 年发布的论文《深度卷积生成网络的无监管学习》。具体模型大致如下

作为机器学习过程中重要的一环，原始数据集，作者选用了CelebA中真实明星照片，并进一步进行裁剪加工为 128x128 大小、仅留下人脸部分的照片。

这项实验研究的目的可以描述为，通过机器学习的不断训练，使生成器与判别器形成一种类似“竞争”的关系，两个网络互相抗衡损失，最终到达一个完美的平衡点。那么对于下列损失函数来说，这样的平衡点在哪里呢？

def model_loss(input_real, input_z, output_channel_dim):    g_model = generator(input_z, output_channel_dim, True)
    noisy_input_real = input_real + tf.random_normal(shape=tf.shape(input_real), mean=0.0, stddev=random.uniform(0.0, 0.1), dtype=tf.float32)        d_model_real, d_logits_real = discriminator(noisy_input_real, reuse=False)    d_model_fake, d_logits_fake = discriminator(g_model, reuse=True)        d_loss_real = tf.reduce_mean(tf.nn.sigmoid_cross_entropy_with_logits(logits=d_logits_real,                                                                         labels=tf.ones_like(d_model_real)*random.uniform(0.9, 1.0)))    d_loss_fake = tf.reduce_mean(tf.nn.sigmoid_cross_entropy_with_logits(logits=d_logits_fake,                                                                         labels=tf.zeros_like(d_model_fake)))    d_loss = tf.reduce_mean(0.5 * (d_loss_real + d_loss_fake))    g_loss = tf.reduce_mean(tf.nn.sigmoid_cross_entropy_with_logits(logits=d_logits_fake,                                                                    labels=tf.ones_like(d_model_fake)))    return d_loss, g_loss

复制代码

在理想的状态下，最终的均衡状态应满足：

生成的样本图像最够真实并且接近于真实图像分布。
判别器收敛到 0.5-50%的正确率使得判别器分辨不出样本是生成的还是真实的。
生成器收敛到 1.0-100%的正确率使得所有生成图片都足够真实，可以骗过判定器。

训练过程

根据最终状态可以得出以下的超参数：

DATASET_SIZE = 100000IMAGE_SIZE = 128NOISE_SIZE = 100LR_D = 0.00004LR_G = 0.0002BATCH_SIZE = 64EPOCHS = 60BETA1 = 0.5WEIGHT_INIT_STDDEV = 0.02EPSILON = 0.00005

复制代码

经过 60 个训练周期后，最终损失情况如下：

训练结果并不完美，但是依然可以看出判别器的损失接近于 0.5，而生成器的损失平均接近于 1.0，并且，随着训练周期的增加，生成的样本图片质量也有显著的提高。这 60 个训练周期是在特斯拉 K80 GPU(Kaggle 云端)上进行的，总共运行时长约为 100 小时。

结论

最终生成的的高保真的样本图片如下，

大部分的人脸看起来拟真度都相当的高，只有一少部分显得有些畸形，在眼镜等一些细节上也有些瑕疵，但总体来说，在考虑训练过程中资源有限的情况下，它的表现还是非常令人满意的。

展望未来

通过这个人脸生成的研究项目，可以证明使用生成对抗网络生成逼真的人脸图片是绝对有可能的。即使是在这种训练资源有限的情况下，还是可以生成足以以假乱真的图片。那么在更大、更先进的研究实验室里，完全可以生成质量更高、分辨率更清晰的图片。

题外话，科技的发展让这些拟真度非常高的虚假人脸生成更加容易，在面对这些面孔的时候我们也应该抱有更高的警戒心。

回到文初的问题，这几张图片全部都是由尖端科技 StyleGAN 生成的虚假照片。

原文链接：

Face Generator - Generating Artificial Faces with Machine Learning

发布

暂无评论

创作场景

如何用机器学习生成拟真人脸图片？

评论

StarRocks 社区一周年：极速统一，感谢遇见！

软件测试 | 测试开发 | 文未有福利 | BAT 名企大厂做接口自动化如何高效使用 Requests ？

软件测试 | 测试开发 | 测试人生 | 入行3年，年薪36W+，从外包到知名互联网公司，疫情之下薪资不止翻倍~

软件测试 | 测试开发 | 测试开发基础|一文搞定计算机网络（一）

内核实战教程第五期 _ SQL 执行引擎的设计与实现

从0到1开发微信小程序（2）——开发第一个小程序

关于运维监控系统实践中的一些tips

C++学习---cstdbool和cstddef源码学习分析

关于数据仓库的特点及组成的概述

Elasticsearch聚合学习之三：范围限定

Solo博客静态部署到码云gitee —— 全网最详细系列

Java知识点锦集1

SpringCloud Gateway 服务网关的快速入门

软件测试 | 测试开发 | 测试面试真题|工作2年，从小厂到大厂，薪资翻倍是怎样的体验？

从0到1开发微信小程序（3）—小程序框架配置

Java知识点锦集2

软件测试 | 测试开发 | 测试人生 | 40+的年龄50W+的年薪，2线城市入职名企，他曾想放弃测试？

软件测试 | 测试开发 | 接口测试项目实战与经典面试题解析，挑战 BAT 大厂必会！

从0到一开发微信小程序（1）——申请账号并安装开发环境

渡过“寒冬”，看云原生数据库如何助力企业降本增效与持续创新

2022-09-14:以下go语言代码输出什么？A：0 0；B：0 1；C：1 1；D：1 0。 package main func main() { println(f(1)) } func

图系列算法在转转推荐算法召回及粗排的实践

数据结构与算法之线性表

为什么Vue中的v-if和v-for不建议一起用

基于开源IM即时通讯框架MobileIMSDK：RainbowChat-iOS端v5.0版已发布

2022年区块链金融场景化应用专题分析

软件测试 | 测试开发 | 测试工程师如何突破职场瓶颈？

跟着卷卷龙一起学Camera--AF

面试突击83：什么情况会导致@Transactional事务失效？

【C语言深度剖析】深入理解const的用法（趣味小故事解析）

创作场景

如何用机器学习生成拟真人脸图片？

评论

更多内容推荐

推荐阅读

电子书

大厂实战PPT下载