写点什么

利用深度学习将人脸变成表情包

  • 2017-06-05
  • 本文字数:1089 字

    阅读完需:约 4 分钟

现如今,自拍并分享已经成为许多人的日常习惯。除了社交功能外,自画像长期以来就是一种自我认同的方式。不过,自拍会受到现实的限制,漫画则不同,它让人们可以重新定义自我,而且比现实多了些温情少了些忧伤。

近日,谷歌在 Allo 推出了一项功能,将神经网络和艺术品相结合,把自拍照变成个性化的表情包。用户只需自拍一下,它就可以自动生成漫画版本的照片。它还提供了定制选项,让用户可以进一步对其进行个性化处理。

传统的计算机视觉方法在将自拍照映射到艺术品时会分析图像的像素,读取像素值度量颜色、形状或纹理,然后通过算法确定属性值。但是,人们自拍的光照条件和姿势各种各样。虽然无论光照条件怎样,人都可以轻松地识别定性特征,如眼睛颜色,但这对计算机而言是一项非常复杂的任务。因为人解读的不只是蓝色或绿色的像素值,而是同时考虑了周边的视觉环境。因此,谷歌希望开发一种算法,使用和人类似的方式选取定性特征,而不是采用传统的方法,通过硬编码来解释光照条件、眼睛颜色等的变化。虽然他们自认为可以从头开始训练一个大型的卷积神经网络,但是他们希望通过一种更高效的方式获得结果,因为他们知道,将人脸变成漫画是一个需要反复迭代的过程。

所以,他们在谷歌现有的较为通用的计算机视觉神经网络上运行了一些试验。他们发现,在数以百万计的神经元中,有一些似乎适合创建个性化表情。此外,他们已经弄清楚如何提取他们不需要的东西。所以剩下的是提供一个经过人工标记的、小得多的示例样本,让分类器学习如何分离出神经网络已知的那些图像特征。为了创建出能让你的朋友认出来的漫画,谷歌和一个艺术家团队一起创建了可以代表各种特点的漫画。例如,艺术家们先设计了一套他们认为有代表性的发型,谷歌使用这些发型训练神经网络,从而将恰当的漫画匹配到合适的自拍照,然后由人判断输出的表情的质量。

在美学研究中,有一个著名的问题叫“恐怖谷理论”——如果全仿真机器人和真人几乎完全一样但又有极其细微的差别时会使人反感。在机器学习中,情况变得更为复杂。因此,谷歌认为,与其准确地复制一个人的外表,不如努力实现一个低分辨率模型,如表情符号。

世界上不存在“普同性美感”。人们在同他们的父母、朋友和同事交谈时表现是不一样的,因此,没有一个头像可以代表各种情况下的你。为了解决这个问题,Allo 与许多艺术家一起合作,听取他们的意见,变换表情包的风格。

目前,该特性只在Android 手机上可用,稍后会在iOS 上提供。


感谢陈思对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们。

2017-06-05 19:003305
用户头像

发布了 1008 篇内容, 共 444.0 次阅读, 收获喜欢 346 次。

关注

评论

发布
暂无评论
发现更多内容

TextIn MCP Server正式发布,无代码搭建智能文档处理Agent!

合合技术团队

人工智能 算法 #大数据

DataWorks Copilot 集成 Qwen3-235B-A22B混合推理模型,AI 效能再升级!

阿里云大数据AI技术

Copilot MoE Dataworks MCP Qwen3

本地部署阿里通义千问Qwen3:一键远程访问,还能解决Ollama安全隐患

贝锐

AI 内网穿透 通义千问 Qwen3

YashanDB|执行计划突然变差?小心统计信息时间戳不一致!

数据库砖家

数据库

初探 YashanDB 共享集群:重新定义高可用数据库的新范式

数据库砖家

数据库

老牌原声鼓音源Toontrack EZDrummer for Mac安装教程

Rose

初学者视角下的思考|YashanDB 安装流程能不能再友好一点?

数据库砖家

数据库

PS/LR滤镜插件套装Nik Collection 6安装教程

Rose

YashanDB|OCI 接口快速上手指南:从环境配置到代码实战,一文带你搞定!

数据库砖家

数据库

RAG vs. MCP: 你不知道你需要的 AI 充电接口

数据追梦人

在iPhone / iPad上轻松模拟GPS位置AnyGo

Rose

Audition 2025(AU2025)中文直装版-Mac/win

Rose

Nipper 3.7.0 Windows x64 - 网络设备漏洞评估

sysin

Nipper

程序编程必备工具:SQLPro Studio可视化数据库管理

Rose

3D动画和视觉特效(VFX) SideFX Houdini for Mac

Rose

苹果Mac截图和屏幕录制工具:CleanShot X

Rose

YashanDB 在 GIS 领域的实践与优势解析

数据库砖家

数据库

JEB Pro v5.28 (macOS, Linux, Windows) - 逆向工程平台

sysin

JEB

2025 简易Scrum指南(简体中文版)

ShineScrum

敏捷

浅析金仓数据库KingbaseES自治事务

金仓技术

KingBase 金仓数据库

安全企业内部im,BeeWorks即时通讯

BeeWorks

即时通讯 IM 私有化部署 企业级应用

2024全新AI脚本插件合集182款

Rose

Mermaid代码生成流程图全攻略!办公绘图不要太简单!

职场工具箱

AI 流程图 AIGC Mermaid AI 绘图

YashanDB|数据文件损坏怎么查?教你用 dump + rowid 快速定位!

数据库砖家

数据库

YashanDB|一文读懂 Outline 功能实战验证:绑定、失效、主备、升级全覆盖!

数据库砖家

数据库

PHP集成开发环境 JetBrains PhpStorm v2025.1.0.1 最新激活秘钥

Rose

YashanDB Docker 镜像实践指南:一次配置,多处部署!

数据库砖家

数据库

Microsoft System Center 2025 version 2503 Multilanguage - Windows 服务器管理软件

sysin

Windows Server

如何让 MCP 集成 API 更顺畅、无烦恼

数据追梦人

Microsoft System Center 2022 version 2503 Multilanguage - Windows 服务器管理软件

sysin

Windows Server

Splunk Enterprise 9.4.2 发布 - 机器数据管理和分析

sysin

Splunk Enterprise

利用深度学习将人脸变成表情包_语言 & 开发_谢丽_InfoQ精选文章