在 2025 收官前,看清 Data + AI 的真实走向,点击查看 BUILD 大会精华版 了解详情
写点什么

利用深度学习将人脸变成表情包

  • 2017-06-05
  • 本文字数:1089 字

    阅读完需:约 4 分钟

现如今,自拍并分享已经成为许多人的日常习惯。除了社交功能外,自画像长期以来就是一种自我认同的方式。不过,自拍会受到现实的限制,漫画则不同,它让人们可以重新定义自我,而且比现实多了些温情少了些忧伤。

近日,谷歌在 Allo 推出了一项功能,将神经网络和艺术品相结合,把自拍照变成个性化的表情包。用户只需自拍一下,它就可以自动生成漫画版本的照片。它还提供了定制选项,让用户可以进一步对其进行个性化处理。

传统的计算机视觉方法在将自拍照映射到艺术品时会分析图像的像素,读取像素值度量颜色、形状或纹理,然后通过算法确定属性值。但是,人们自拍的光照条件和姿势各种各样。虽然无论光照条件怎样,人都可以轻松地识别定性特征,如眼睛颜色,但这对计算机而言是一项非常复杂的任务。因为人解读的不只是蓝色或绿色的像素值,而是同时考虑了周边的视觉环境。因此,谷歌希望开发一种算法,使用和人类似的方式选取定性特征,而不是采用传统的方法,通过硬编码来解释光照条件、眼睛颜色等的变化。虽然他们自认为可以从头开始训练一个大型的卷积神经网络,但是他们希望通过一种更高效的方式获得结果,因为他们知道,将人脸变成漫画是一个需要反复迭代的过程。

所以,他们在谷歌现有的较为通用的计算机视觉神经网络上运行了一些试验。他们发现,在数以百万计的神经元中,有一些似乎适合创建个性化表情。此外,他们已经弄清楚如何提取他们不需要的东西。所以剩下的是提供一个经过人工标记的、小得多的示例样本,让分类器学习如何分离出神经网络已知的那些图像特征。为了创建出能让你的朋友认出来的漫画,谷歌和一个艺术家团队一起创建了可以代表各种特点的漫画。例如,艺术家们先设计了一套他们认为有代表性的发型,谷歌使用这些发型训练神经网络,从而将恰当的漫画匹配到合适的自拍照,然后由人判断输出的表情的质量。

在美学研究中,有一个著名的问题叫“恐怖谷理论”——如果全仿真机器人和真人几乎完全一样但又有极其细微的差别时会使人反感。在机器学习中,情况变得更为复杂。因此,谷歌认为,与其准确地复制一个人的外表,不如努力实现一个低分辨率模型,如表情符号。

世界上不存在“普同性美感”。人们在同他们的父母、朋友和同事交谈时表现是不一样的,因此,没有一个头像可以代表各种情况下的你。为了解决这个问题,Allo 与许多艺术家一起合作,听取他们的意见,变换表情包的风格。

目前,该特性只在Android 手机上可用,稍后会在iOS 上提供。


感谢陈思对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们。

2017-06-05 19:003366
用户头像

发布了 1008 篇内容, 共 449.9 次阅读, 收获喜欢 346 次。

关注

评论

发布
暂无评论
发现更多内容

【万字长文】探讨可信构架之道

华为云开发者联盟

架构 服务端

使用开源软件构建工业互联网的平台

刘旭东

工业互联网 Odoo thingsboard

呕心沥血,整理200+最新面试题,面试之前看一下,事半功倍

小Q

Java 学习 程序员 架构 面试

云图说 | GPU共享型AI容器,让AI开发更普及

华为云开发者联盟

AI 容器

教师节特别活动:第四范式多项自研技术及其应用实践分享

天枢数智运营

人工智能 推荐系统 第四范式 个性化推荐

[翻译]Go Concurrency Patterns[Go 并发模式]

卓丁

Rob Pike Go Concurrency Patterns Concurrency Go 语言

The Go Blog-Article index

卓丁

合约跟单app,永续合约交易所带单交易软件

新基建夯实粤港澳大湾区高质量发展基础

CECBC

区块链 人工智能 大数据

模板方法模式——看看 JDK 和 Spring 是如何优雅复用代码的

Java架构师迁哥

协同新机遇:让研发敏捷起来

人称T客

未读消息(小红点),前端与 RabbitMQ实时消息推送实践,贼简单~

程序员小富

Java RabbitMQ mqtt

Polkadot初识,不止于跨链

QTech

polkadot 跨链

CSS常用样式——绘制单(双)箭头的多种方法(2)

程序员学院

CSS html 程序员

20张图,大学四年都没整明白的操作系统就这么学会了

小Q

Java 程序员 架构 操作系统

一步搞定任意圆角背景

mengxn

android xml 圆角

未来经济 数字优先 | 大数据专场

腾讯云大数据

大数据

[翻译]The Go scheduler[Go调度]

卓丁

Go scheduler Go 语言

大厂运维必备技能:PB级数据仓库性能调优

华为云开发者联盟

架构 数据

当心这些“坑”!阿里云服务器部署前后端分离项目

麦洛

nginx 前后端分离 跨域

LeetCode题解:225. 用队列实现栈,两个队列,压入 -O(1), 弹出 -O(n),JavaScript,详细注释

Lee Chen

大前端 LeetCode

indexOf原理,Java,javascript,python实现

叫练

算法

传统产业数字化转型的思考与建议

CECBC

经济转型 企业经济

物联网通信技术最全科普!你一定要了解的NB-IoT

华为云开发者联盟

物联网

甲方日常10

句子

工作 随笔杂谈 日常

市值做市机器人,操盘做市系统搭建

去中心化交易所搭建,虚拟币去中心化交易系统

交易所开发

MySQL高性能架构设计原则

码界西柚

Redis 哨兵模式

是老郭啊

redis redis哨兵模式 redis哨兵 redis哨兵集群

XSKY ClickHouse如何实现存算分离

XSKY星辰天合

边缘计算,如何啃下集群管理这块硬骨头?

BoCloud博云

云计算 容器 边缘计算 PaaS 博云

利用深度学习将人脸变成表情包_语言 & 开发_谢丽_InfoQ精选文章