写点什么

利用深度学习将人脸变成表情包

  • 2017-06-05
  • 本文字数:1089 字

    阅读完需:约 4 分钟

现如今,自拍并分享已经成为许多人的日常习惯。除了社交功能外,自画像长期以来就是一种自我认同的方式。不过,自拍会受到现实的限制,漫画则不同,它让人们可以重新定义自我,而且比现实多了些温情少了些忧伤。

近日,谷歌在 Allo 推出了一项功能,将神经网络和艺术品相结合,把自拍照变成个性化的表情包。用户只需自拍一下,它就可以自动生成漫画版本的照片。它还提供了定制选项,让用户可以进一步对其进行个性化处理。

传统的计算机视觉方法在将自拍照映射到艺术品时会分析图像的像素,读取像素值度量颜色、形状或纹理,然后通过算法确定属性值。但是,人们自拍的光照条件和姿势各种各样。虽然无论光照条件怎样,人都可以轻松地识别定性特征,如眼睛颜色,但这对计算机而言是一项非常复杂的任务。因为人解读的不只是蓝色或绿色的像素值,而是同时考虑了周边的视觉环境。因此,谷歌希望开发一种算法,使用和人类似的方式选取定性特征,而不是采用传统的方法,通过硬编码来解释光照条件、眼睛颜色等的变化。虽然他们自认为可以从头开始训练一个大型的卷积神经网络,但是他们希望通过一种更高效的方式获得结果,因为他们知道,将人脸变成漫画是一个需要反复迭代的过程。

所以,他们在谷歌现有的较为通用的计算机视觉神经网络上运行了一些试验。他们发现,在数以百万计的神经元中,有一些似乎适合创建个性化表情。此外,他们已经弄清楚如何提取他们不需要的东西。所以剩下的是提供一个经过人工标记的、小得多的示例样本,让分类器学习如何分离出神经网络已知的那些图像特征。为了创建出能让你的朋友认出来的漫画,谷歌和一个艺术家团队一起创建了可以代表各种特点的漫画。例如,艺术家们先设计了一套他们认为有代表性的发型,谷歌使用这些发型训练神经网络,从而将恰当的漫画匹配到合适的自拍照,然后由人判断输出的表情的质量。

在美学研究中,有一个著名的问题叫“恐怖谷理论”——如果全仿真机器人和真人几乎完全一样但又有极其细微的差别时会使人反感。在机器学习中,情况变得更为复杂。因此,谷歌认为,与其准确地复制一个人的外表,不如努力实现一个低分辨率模型,如表情符号。

世界上不存在“普同性美感”。人们在同他们的父母、朋友和同事交谈时表现是不一样的,因此,没有一个头像可以代表各种情况下的你。为了解决这个问题,Allo 与许多艺术家一起合作,听取他们的意见,变换表情包的风格。

目前,该特性只在Android 手机上可用,稍后会在iOS 上提供。


感谢陈思对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们。

2017-06-05 19:003246
用户头像

发布了 1008 篇内容, 共 439.4 次阅读, 收获喜欢 346 次。

关注

评论

发布
暂无评论
发现更多内容

对比解读发币平台:从野蛮爆发走向精细化运营

区块链软件开发推广运营

交易所开发 dapp开发 链游开发 代币开发 交易所开发公链开发

鸿蒙带来的机会比想象中更大

最新动态

深入解析 Spring AI 系列:解析请求参数处理

不在线第一只蜗牛

人工智能 spring

CouchDB 可观测最佳实践

观测云

couchdb

模型即组件的技术实现路径 ——iVX 量子化架构对 GPT-4o/Mediapipe 的封装解析

代码制造者

低代码 组件化 封装 组件化开发

共话科学智能!航遥中心于峻川老师分享LLM技术演进与AI+遥感实证研究

ModelWhale

人工智能 AI4S 航遥中心

DApp开发全流程解析:模式设计、功能参考与合约管理实践

区块链软件开发推广运营

交易所开发 dapp开发 链游开发 公链开发 公链开发代币开发

虚拟币制度钱包开发:功能设计与成本全解析

区块链软件开发推广运营

交易所开发 dapp开发 链游开发 代币开发 交易所开发公链开发

【浪潮海岳inDatax数据中台专栏】主数据管理中基于属性的物料编号生成技术

inBuilder低代码平台

NotebookLM 推出移动版本,音频概览支持实时互动;豆包 AI 耳机支持外教语音智能体 Owen丨日报

声网

深度解读「摩根士丹利」双研报:头部人形机器人、核心供应链公司梳理和投资分析(附报告)

机器人头条

机器人 科技 人形机器人 具身智能

AI模型的回调能力的理解和实现

不在线第一只蜗牛

php 人工智能

Doris Manager 24.3 版本正式发布,增强集群巡检能力

SelectDB

Apache 数据库 数据分析 实时数仓 OLAP

永久免费!专为 Apache Doris 打造的可视化数据管理工具 SelectDB Studio V1.1.0 重磅发布!

SelectDB

数据库 大数据 数据分析 实时数仓 可视化工具

RocketMQ实战—订单系统面临的技术挑战

量贩潮汐·WholesaleTide

数据库 RocketMQ

全职接单后才发现,其实不只是技术重要

程序员郭顺发

Flink从入门到实战,经历了30个日日夜夜,终于悟道了!

程序员高级码农

大数据 flink 程序员

自己动手,从零开始编写Raft算法来实现分布式一致性算法

程序员高级码农

程序员 分布式 算法

Arthas getstatic(查看类的静态属性 )

刘大猫

监控 Arthas 监控工具 getstatic 查看类静态属性

《算法导论(第4版)》阅读笔记:p91-p94

codists

算法

深度解读「摩根士丹利」双研报:头部人形机器人、核心供应链公司梳理和投资分析(附报告)

机器人头条

科技 大模型 人形机器人 具身智能

智机器人推出具身智能一站式开发平台,Genie Studio 想让“训机器人”像搭积木一样简单?

AgiBot World

RocketMQ原理—高可用+高并发+高性能架构

量贩潮汐·WholesaleTide

架构 RocketMQ

数据仓库是什么?常见问题解答

镜舟科技

数据仓库 数据湖 OLAP 数据模型 数据存储

Arthas 全攻略:让调试变得简单

刘大猫

人工智能 算法 监控 Arthas 监控工具

没有设计稿也能很漂亮,非常适合独立开发:Trae + 飞个马MCP

秦少卫

#开源项目 开源图片编辑器 #AI编程

非凸科技受邀出席“第二届人工智能应用大会”,共话AI赋能产业新未来

非凸科技

使用kookeey代理IP配置Undetectable指纹浏览器教程

kookeey代理严选

代理IP 跨境电商 代理商 kookeey代理 Undetectable指纹浏览器

高能预警!Community Day 20+议题大公开

声网

联想控股·和鲸科技首期AI通识课圆满举办

ModelWhale

数据脱敏的这6种方案,真香!

电子尖叫食人鱼

Java

利用深度学习将人脸变成表情包_语言 & 开发_谢丽_InfoQ精选文章