写点什么

利用深度学习将人脸变成表情包

  • 2017-06-05
  • 本文字数:1089 字

    阅读完需:约 4 分钟

现如今,自拍并分享已经成为许多人的日常习惯。除了社交功能外,自画像长期以来就是一种自我认同的方式。不过,自拍会受到现实的限制,漫画则不同,它让人们可以重新定义自我,而且比现实多了些温情少了些忧伤。

近日,谷歌在 Allo 推出了一项功能,将神经网络和艺术品相结合,把自拍照变成个性化的表情包。用户只需自拍一下,它就可以自动生成漫画版本的照片。它还提供了定制选项,让用户可以进一步对其进行个性化处理。

传统的计算机视觉方法在将自拍照映射到艺术品时会分析图像的像素,读取像素值度量颜色、形状或纹理,然后通过算法确定属性值。但是,人们自拍的光照条件和姿势各种各样。虽然无论光照条件怎样,人都可以轻松地识别定性特征,如眼睛颜色,但这对计算机而言是一项非常复杂的任务。因为人解读的不只是蓝色或绿色的像素值,而是同时考虑了周边的视觉环境。因此,谷歌希望开发一种算法,使用和人类似的方式选取定性特征,而不是采用传统的方法,通过硬编码来解释光照条件、眼睛颜色等的变化。虽然他们自认为可以从头开始训练一个大型的卷积神经网络,但是他们希望通过一种更高效的方式获得结果,因为他们知道,将人脸变成漫画是一个需要反复迭代的过程。

所以,他们在谷歌现有的较为通用的计算机视觉神经网络上运行了一些试验。他们发现,在数以百万计的神经元中,有一些似乎适合创建个性化表情。此外,他们已经弄清楚如何提取他们不需要的东西。所以剩下的是提供一个经过人工标记的、小得多的示例样本,让分类器学习如何分离出神经网络已知的那些图像特征。为了创建出能让你的朋友认出来的漫画,谷歌和一个艺术家团队一起创建了可以代表各种特点的漫画。例如,艺术家们先设计了一套他们认为有代表性的发型,谷歌使用这些发型训练神经网络,从而将恰当的漫画匹配到合适的自拍照,然后由人判断输出的表情的质量。

在美学研究中,有一个著名的问题叫“恐怖谷理论”——如果全仿真机器人和真人几乎完全一样但又有极其细微的差别时会使人反感。在机器学习中,情况变得更为复杂。因此,谷歌认为,与其准确地复制一个人的外表,不如努力实现一个低分辨率模型,如表情符号。

世界上不存在“普同性美感”。人们在同他们的父母、朋友和同事交谈时表现是不一样的,因此,没有一个头像可以代表各种情况下的你。为了解决这个问题,Allo 与许多艺术家一起合作,听取他们的意见,变换表情包的风格。

目前,该特性只在Android 手机上可用,稍后会在iOS 上提供。


感谢陈思对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们。

2017-06-05 19:003350
用户头像

发布了 1008 篇内容, 共 448.8 次阅读, 收获喜欢 346 次。

关注

评论

发布
暂无评论
发现更多内容

免费教程!【20小时通关工业级RAG】变现千万的RAG优化经验!

商汤万象开发者

人工智能 大模型 LLM rag 免费课程

CST软件如何计算半导体的光电生成速率_达索官方授权

思茂信息

cst CST软件 CST Studio Suite

如何检测 Sliver C2 框架活动

天翼云开发者社区

sliver

我的内存去哪儿了?

TiDB 社区干货传送门

监控 TiKV 底层架构

RapidFS 为昆仑芯 3 万卡集群加速,国产化平台 TiB 级吞吐让数据随叫随到

Baidu AICLOUD

分布式缓存 JuiceFS #存储加速

OneNote Embedded 文件滥用检测

天翼云开发者社区

Onenote

【等保小知识】未联网的独立单位网络是否需要等保备案以及定级?

行云管家

等保 等保测评 等保2.0

伊克罗德信息亮相亚马逊云科技合作伙伴峰会,以ECRobot 智能云迁移助手在GenAI Tech Game比赛勇夺金牌!

伊克罗德信息科技

云计算 AI 亚马逊云

最终一致性正在成为主流:现代分布式应用的数据管理新范式

tapdata

数据一致性 数据同步 实时数据 最终一致性 强一致性

人工智能与气候模拟:如何用AI模拟和预测气候变化影响?

天津汇柏科技有限公司

人工智能 AI

PingCAP “一号员工”唐刘:回顾我与 TiDB 的十年成长之旅

TiDB 社区干货传送门

数智化转型进阶之路:从数据底座到业务增长,企业需要怎样的数据库支撑?

TiDB 社区干货传送门

数据库架构选型

TiDB 企业管理器:TEM v3.0.0 体验

TiDB 社区干货传送门

面对开源大模型浪潮,基础模型公司如何持续盈利?

Baihai IDP

开源 AI 商业模式 基础模型 LLM

关于我的第一个产品!

Immerse

告别手动填参数!Apipost黑科技让接口调试效率翻倍

数据追梦人

倒计时!中关村科学城工业软件创新暨开源峰会28日启幕,会议亮点抢先看

极客天地

百度文库、百度网盘联合发布「沧舟OS」内容操作系统,开放MCP Server,华为、三星、牛听听成首批接入客户

极客天地

详解金仓数据库KFS双轨并行不停机方案

金仓技术

KingbaseES 金仓数据库 KFS KES

“AI赋能·共享城市安全”2025杭州安防产品展·浙江安博会

AIOTE智博会

百度优选成全球首家支持MCP的电商平台

极客天地

百度文库、百度网盘联合发布「GenFlow超能搭子」、「AI笔记」,打造“聪明又能干”的超级生产力

极客天地

五一假期放肆嗨,ROG电竞显示器高刷臻品畅玩游戏!

新消费日报

告别重复繁琐!Apipost参数描述库让API开发效率飙升!

数据追梦人

【行业知识】绿色能源产业使用堡垒机的原因看这里!

行云管家

网络安全 等保 等保测评 等保评测

基于 MCP 的 AI Agent 应用开发实践

字节跳动开源

开源 AI Agent MCP 模型上下文协议 Agent TARS

利用深度学习将人脸变成表情包_语言 & 开发_谢丽_InfoQ精选文章