阿里云飞天发布时刻,领先大模型限免,超7000万 tokens免费体验 了解详情
写点什么

利用深度学习将人脸变成表情包

  • 2017-06-05
  • 本文字数:1089 字

    阅读完需:约 4 分钟

现如今,自拍并分享已经成为许多人的日常习惯。除了社交功能外,自画像长期以来就是一种自我认同的方式。不过,自拍会受到现实的限制,漫画则不同,它让人们可以重新定义自我,而且比现实多了些温情少了些忧伤。

近日,谷歌在 Allo 推出了一项功能,将神经网络和艺术品相结合,把自拍照变成个性化的表情包。用户只需自拍一下,它就可以自动生成漫画版本的照片。它还提供了定制选项,让用户可以进一步对其进行个性化处理。

传统的计算机视觉方法在将自拍照映射到艺术品时会分析图像的像素,读取像素值度量颜色、形状或纹理,然后通过算法确定属性值。但是,人们自拍的光照条件和姿势各种各样。虽然无论光照条件怎样,人都可以轻松地识别定性特征,如眼睛颜色,但这对计算机而言是一项非常复杂的任务。因为人解读的不只是蓝色或绿色的像素值,而是同时考虑了周边的视觉环境。因此,谷歌希望开发一种算法,使用和人类似的方式选取定性特征,而不是采用传统的方法,通过硬编码来解释光照条件、眼睛颜色等的变化。虽然他们自认为可以从头开始训练一个大型的卷积神经网络,但是他们希望通过一种更高效的方式获得结果,因为他们知道,将人脸变成漫画是一个需要反复迭代的过程。

所以,他们在谷歌现有的较为通用的计算机视觉神经网络上运行了一些试验。他们发现,在数以百万计的神经元中,有一些似乎适合创建个性化表情。此外,他们已经弄清楚如何提取他们不需要的东西。所以剩下的是提供一个经过人工标记的、小得多的示例样本,让分类器学习如何分离出神经网络已知的那些图像特征。为了创建出能让你的朋友认出来的漫画,谷歌和一个艺术家团队一起创建了可以代表各种特点的漫画。例如,艺术家们先设计了一套他们认为有代表性的发型,谷歌使用这些发型训练神经网络,从而将恰当的漫画匹配到合适的自拍照,然后由人判断输出的表情的质量。

在美学研究中,有一个著名的问题叫“恐怖谷理论”——如果全仿真机器人和真人几乎完全一样但又有极其细微的差别时会使人反感。在机器学习中,情况变得更为复杂。因此,谷歌认为,与其准确地复制一个人的外表,不如努力实现一个低分辨率模型,如表情符号。

世界上不存在“普同性美感”。人们在同他们的父母、朋友和同事交谈时表现是不一样的,因此,没有一个头像可以代表各种情况下的你。为了解决这个问题,Allo 与许多艺术家一起合作,听取他们的意见,变换表情包的风格。

目前,该特性只在Android 手机上可用,稍后会在iOS 上提供。


感谢陈思对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们。

2017-06-05 19:003050
用户头像

发布了 1008 篇内容, 共 421.3 次阅读, 收获喜欢 346 次。

关注

评论

发布
暂无评论
发现更多内容

如何在一个基座上安装更多的 Koupleless 模块?

SOFAStack

开源之夏经验分享|MOSN 社区韦鑫:做自己认为很酷的事

SOFAStack

热门敏捷工具盘点:国内团队常用的7款选择

易成研发中心

敏捷工具

我如何增强 Loki 支持 PB 级日志查询

阿南

日志 可观测性 索引 Loki Observability

数据爆炸时代的“中枢神经系统”

秃头小帅oi

OgPhone云手机:全球化数字业务的跨场景解决方案

Ogcloud

模拟器 云手机 海外云手机 云手机群控 手机群控

开源之夏经验分享|Layotto 社区 郑浩宁:尝试,就会有收获!

SOFAStack

销售增长新解法:DeepSeek企业知识库驱动效率革命

ToB行业头条

知识库

美国加密战略储备:重塑全球金融格局的“数字黄金”革命

TechubNews

TRUMP 美元

MortiseAI 创业日志 #002 我看到

MortiseAI@HugoHu

创业 人生修炼 AI Agent

YashanDB守护进程

YashanDB

数据库 yashandb

YashanDB初始数据库

YashanDB

数据库 yashandb

直播预约丨就在明天,声网对话式 AI 引擎发布会

声网

开源之夏经验分享|SOFARPC 社区郑佳莉:开源的收获不止代码

SOFAStack

06 HarmonyOS Next性能优化之LazyForEach 列表渲染基础与实现详解 (一)

全栈若城

HarmonyOS NEXT

爬取跨境电商AI选品分析

Yan-英杰

Python TCP 爬虫

YashanDB环境变量

YashanDB

数据库 yashandb

征程 6 工具链 BEVPoolV2 算子使用教程 1 - BEVPoolV2 算子详解

地平线开发者

自动驾驶 算法工具链 地平线征程6

《Operating System Concepts》阅读笔记:p188-p199

codists

操作系统

开源之夏经验分享|Koupleless 社区魏照华:开源精神是场永不停歇的接力

SOFAStack

9款热门产品研发项目管理工具,告别项目延期

易成研发中心

产品研发项目管理软件

在MWC2025,读懂华为如何以行践言

脑极体

AI

天润融通AI助理,让客服工作更轻松高效

天润融通

开源之夏经验分享|Koupleless 社区黄兴抗:在开源中培养工程思维

SOFAStack

MortiseAI 创业日志 #001 走出去

MortiseAI@HugoHu

创业 人生修炼 LLM AI 产品

YashanDB分布式可视化部署

YashanDB

数据库 yashandb

喜报!Apache Seata (incubating) 荣获 2024 开源创新榜单“年度开源项目”!

SOFAStack

场景题:10亿QQ用户,如何统计在线人数?

卷福同学

Java 面试 社招 场景题

CoreDNS 可观测最佳实践

观测云

CoreDNS

利用深度学习将人脸变成表情包_语言 & 开发_谢丽_InfoQ精选文章