最新发布《数智时代的AI人才粮仓模型解读白皮书(2024版)》,立即领取! 了解详情
写点什么

利用深度学习将人脸变成表情包

  • 2017-06-05
  • 本文字数:1089 字

    阅读完需:约 4 分钟

现如今,自拍并分享已经成为许多人的日常习惯。除了社交功能外,自画像长期以来就是一种自我认同的方式。不过,自拍会受到现实的限制,漫画则不同,它让人们可以重新定义自我,而且比现实多了些温情少了些忧伤。

近日,谷歌在 Allo 推出了一项功能,将神经网络和艺术品相结合,把自拍照变成个性化的表情包。用户只需自拍一下,它就可以自动生成漫画版本的照片。它还提供了定制选项,让用户可以进一步对其进行个性化处理。

传统的计算机视觉方法在将自拍照映射到艺术品时会分析图像的像素,读取像素值度量颜色、形状或纹理,然后通过算法确定属性值。但是,人们自拍的光照条件和姿势各种各样。虽然无论光照条件怎样,人都可以轻松地识别定性特征,如眼睛颜色,但这对计算机而言是一项非常复杂的任务。因为人解读的不只是蓝色或绿色的像素值,而是同时考虑了周边的视觉环境。因此,谷歌希望开发一种算法,使用和人类似的方式选取定性特征,而不是采用传统的方法,通过硬编码来解释光照条件、眼睛颜色等的变化。虽然他们自认为可以从头开始训练一个大型的卷积神经网络,但是他们希望通过一种更高效的方式获得结果,因为他们知道,将人脸变成漫画是一个需要反复迭代的过程。

所以,他们在谷歌现有的较为通用的计算机视觉神经网络上运行了一些试验。他们发现,在数以百万计的神经元中,有一些似乎适合创建个性化表情。此外,他们已经弄清楚如何提取他们不需要的东西。所以剩下的是提供一个经过人工标记的、小得多的示例样本,让分类器学习如何分离出神经网络已知的那些图像特征。为了创建出能让你的朋友认出来的漫画,谷歌和一个艺术家团队一起创建了可以代表各种特点的漫画。例如,艺术家们先设计了一套他们认为有代表性的发型,谷歌使用这些发型训练神经网络,从而将恰当的漫画匹配到合适的自拍照,然后由人判断输出的表情的质量。

在美学研究中,有一个著名的问题叫“恐怖谷理论”——如果全仿真机器人和真人几乎完全一样但又有极其细微的差别时会使人反感。在机器学习中,情况变得更为复杂。因此,谷歌认为,与其准确地复制一个人的外表,不如努力实现一个低分辨率模型,如表情符号。

世界上不存在“普同性美感”。人们在同他们的父母、朋友和同事交谈时表现是不一样的,因此,没有一个头像可以代表各种情况下的你。为了解决这个问题,Allo 与许多艺术家一起合作,听取他们的意见,变换表情包的风格。

目前,该特性只在Android 手机上可用,稍后会在iOS 上提供。


感谢陈思对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们。

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2017-06-05 19:002663
用户头像

发布了 1008 篇内容, 共 374.2 次阅读, 收获喜欢 341 次。

关注

评论

发布
暂无评论
发现更多内容

足不出户“逛”银行,37家城商行、农商行手机银行App性能大比拼

博睿数据

APM App 评测 网银 银行

数据产品经理实战-DMP搭建

第519区

产品经理 营销

产品周刊 | 第 16 期(20200524)

八味阁

产品 设计 产品经理 产品设计

zookeeper到nacos的迁移实践

捉虫大师

架构 nacos

使用Spring Boot和Docker构建微服务架构(一)

Tux Hu

Docker 架构 容器 微服务 Spring Boot

Spring Cloud 和 Dubbo 哪个会被淘汰?

程序猿DD

Spring Cloud dubbo

使用Spring Boot和Docker构建微服务架构(三)

Tux Hu

Docker 架构 容器 微服务 Spring Boot

linux 账户及安全管理(一 账户管理)

牧马人

Linux

Java | @Override 不要再把它当成可有可无的了

YoungZY

Java 注解 Override annotation

2020年3月云主机性能评测报告

博睿数据

云计算 运维 机房 数据中心 主机

游戏夜读 | 世界两大游戏评论!

game1night

使用Spring Boot和Docker构建微服务架构(四)

Tux Hu

Docker 架构 容器 微服务 Spring Boot

卡巴斯基产品本地化用时能缩短 77%,怎么做到的?

葛仲君

项目管理 软件开发 本地化 开发流程

短视频时代下的知识摄取

Neco.W

学习 知识管理 知识体系 短视频

后台定时统计任务太耗时如何优化一下

zhuoqianmingyue

线程池

微软:正式发布针对 .NET Core的 Winform 设计器

葡萄城技术团队

.net 微软 Win .net core

配置国内的pip源以提高使用pip安装python软件包的速度

良少

Python pip

是什么在背后支撑起“带货一哥”李佳琦?

博睿数据

负载均衡 APM 压测 秒杀 并发

2020年3月北京BGP机房网络质量评测报告

博睿数据

运维 APM 机房 数据中心 拨测

程序员的修行之路-关于编程语言

牧马人

程序员

微信gif图片大小的规则

石云升

微信 GIF

快速入门 Nacos 作为配置中心操作

zhuoqianmingyue

nacos SpringBoot 2

程序员的修行之路-关于编程语言

牧马人

程序员

ARTS第一周

困到清醒

ARTS 打卡计划 起跑

爬虫框架Scrapy应用实践-淘宝保险频道数据抓取【1】-前期准备

hadesxiong

Python 爬虫 保险 Scrapy

Jsp页面报错后如何找到提示信息中的_jsp.java文件

阡陌r

代码刚提交暂存区,组长突然要我把新增代码 Commit另一分支怎么办?

zhuoqianmingyue

git

玩转SpringBoot2.x之缓存对象

zhuoqianmingyue

redis springboot

程序员的修行之路-保持良好的心态

牧马人

程序员

企业微信机器人在大型财务共享中心的应用实践

DT极客

使用Spring Boot和Docker构建微服务架构(二)

Tux Hu

Docker 架构 容器 微服务 Spring Boot

利用深度学习将人脸变成表情包_语言 & 开发_谢丽_InfoQ精选文章