东亚银行、岚图汽车带你解锁 AIGC 时代的数字化人才培养各赛道新模式! 了解详情
写点什么

利用深度学习将人脸变成表情包

  • 2017-06-05
  • 本文字数:1089 字

    阅读完需:约 4 分钟

现如今,自拍并分享已经成为许多人的日常习惯。除了社交功能外,自画像长期以来就是一种自我认同的方式。不过,自拍会受到现实的限制,漫画则不同,它让人们可以重新定义自我,而且比现实多了些温情少了些忧伤。

近日,谷歌在 Allo 推出了一项功能,将神经网络和艺术品相结合,把自拍照变成个性化的表情包。用户只需自拍一下,它就可以自动生成漫画版本的照片。它还提供了定制选项,让用户可以进一步对其进行个性化处理。

传统的计算机视觉方法在将自拍照映射到艺术品时会分析图像的像素,读取像素值度量颜色、形状或纹理,然后通过算法确定属性值。但是,人们自拍的光照条件和姿势各种各样。虽然无论光照条件怎样,人都可以轻松地识别定性特征,如眼睛颜色,但这对计算机而言是一项非常复杂的任务。因为人解读的不只是蓝色或绿色的像素值,而是同时考虑了周边的视觉环境。因此,谷歌希望开发一种算法,使用和人类似的方式选取定性特征,而不是采用传统的方法,通过硬编码来解释光照条件、眼睛颜色等的变化。虽然他们自认为可以从头开始训练一个大型的卷积神经网络,但是他们希望通过一种更高效的方式获得结果,因为他们知道,将人脸变成漫画是一个需要反复迭代的过程。

所以,他们在谷歌现有的较为通用的计算机视觉神经网络上运行了一些试验。他们发现,在数以百万计的神经元中,有一些似乎适合创建个性化表情。此外,他们已经弄清楚如何提取他们不需要的东西。所以剩下的是提供一个经过人工标记的、小得多的示例样本,让分类器学习如何分离出神经网络已知的那些图像特征。为了创建出能让你的朋友认出来的漫画,谷歌和一个艺术家团队一起创建了可以代表各种特点的漫画。例如,艺术家们先设计了一套他们认为有代表性的发型,谷歌使用这些发型训练神经网络,从而将恰当的漫画匹配到合适的自拍照,然后由人判断输出的表情的质量。

在美学研究中,有一个著名的问题叫“恐怖谷理论”——如果全仿真机器人和真人几乎完全一样但又有极其细微的差别时会使人反感。在机器学习中,情况变得更为复杂。因此,谷歌认为,与其准确地复制一个人的外表,不如努力实现一个低分辨率模型,如表情符号。

世界上不存在“普同性美感”。人们在同他们的父母、朋友和同事交谈时表现是不一样的,因此,没有一个头像可以代表各种情况下的你。为了解决这个问题,Allo 与许多艺术家一起合作,听取他们的意见,变换表情包的风格。

目前,该特性只在Android 手机上可用,稍后会在iOS 上提供。


感谢陈思对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们。

公众号推荐:

2024 年 1 月,InfoQ 研究中心重磅发布《大语言模型综合能力测评报告 2024》,揭示了 10 个大模型在语义理解、文学创作、知识问答等领域的卓越表现。ChatGPT-4、文心一言等领先模型在编程、逻辑推理等方面展现出惊人的进步,预示着大模型将在 2024 年迎来更广泛的应用和创新。关注公众号「AI 前线」,回复「大模型报告」免费获取电子版研究报告。

AI 前线公众号
2017-06-05 19:002660
用户头像

发布了 1008 篇内容, 共 373.7 次阅读, 收获喜欢 340 次。

关注

评论

发布
暂无评论
发现更多内容

Bun v1.0.30 正式发布,即将提供 Windows 稳定版本!

一纸忘忧

JavaScript node.js 前端

python后端开发学到什么程度就可以找工作了?

算法的秘密

Cardhop for Mac(通讯录管理工具)v2.2.17汉化版

影影绰绰一往直前

TunesKit Audio Capture for Mac(音频录制和音乐嗅探软件)v3.1.0激活版

影影绰绰一往直前

Covalent Network借助大规模的历史Web3数据集,推动人工智能发展

股市老人

GTC 2024 开幕,英伟达发布新一代 GPU 架构;Apple ID 或将淘汰丨 RTE 开发者日报 Vol.168

声网

ProtoBuf-gRPC实践

杨充

平凯星辰入选 2023 北京市数字经济标杆企业

编程猫

经典控制算法——PID算法原理分析及优化

二哈侠

算法 控制 PID 鲁棒性

Finder Windows for mac(Finder浮动窗口查找器)v1.5.16激活版

影影绰绰一往直前

MWeb Pro for mac(好用的博客生成编辑器)v4.5.8中文激活版

影影绰绰一往直前

Partisia区块链推出MOCCA方案,让资产管理更加可信化且可编程

石头财经

一文读懂Partisia区块链的MOCCA 方案:让资产管理可信且可编程

长安区块链

一文读懂Partisia区块链的MOCCA 方案:让资产管理可信且可编程

股市老人

Unclutter for mac(下拉菜单隐藏工具)v2.2.8中文激活版

影影绰绰一往直前

国产搜索引擎崛起:Elasticsearch 国产化加速

极限实验室

elasticsearch 国产化 国产化替代 easysearch

Github每日热榜2024.03.19(Github Trending Daily)

天马行空的大杂烩

GitHub 程序员 开源软件

深入探究Dubbo SPI的原理与强大

小白牙

Java dubbo 后端 spi

Partisia区块链的MOCCA 方案,让资产管理可信且可编程

BlockChain先知

em5 SPECPU2006测试说明

源芯

开源 芯片 模拟器

一文读懂Partisia区块链的MOCCA 方案:让资产管理可信且可编程

股市老人

Hype 4 Pro for Mac(HTML5动画制作软件)v4.1.15中文激活版

影影绰绰一往直前

Dropshare 5 for mac(专业的网络文件共享工具)v5.49激活版

影影绰绰一往直前

场景化感知智能,重构企业数字化综合能力

脑极体

AI

Linux中的chsh命令及示例

百度搜索:蓝易云

Linux 运维 Shell 云服务器 chsh

Redis.conf详解

百度搜索:蓝易云

redis 云计算 Linux 运维 云服务器

解决git clone时出现Failed to connect to 127.0.0.1 port 1573问题

百度搜索:蓝易云

云计算 Linux 运维 IP 云服务器

Easy New File for Mac(右键增强工具)v5.8中文激活版

影影绰绰一往直前

从 Linux 内核角度探秘 JDK MappedByteBuffer

bin的技术小屋

jdk RocketMQ JVM Linux内核 java nio

Java深入理解LinkedList

小白牙

Java List 链表

redis报错WRONGTYPE Operation against a key holding the wrong kind of value

百度搜索:蓝易云

redis 云计算 Linux 运维 云服务器

利用深度学习将人脸变成表情包_语言 & 开发_谢丽_InfoQ精选文章