【AICon】AI 基础设施、LLM运维、大模型训练与推理,一场会议,全方位涵盖! >>> 了解详情
写点什么

人脸年龄估计研究现状

  • 2019-09-25
  • 本文字数:3905 字

    阅读完需:约 13 分钟

人脸年龄估计研究现状


今天给大家带来一篇人脸识别中的年龄估计技术,年龄特征作为人类的一种重要生物特征,计算机要如何基于人脸图像估计年龄呢?

01 概述

简单地说,基于人脸图像的年龄估计是指机器根据面部图像推测出人的大概年龄或所属的年龄范围( 年龄段)。


基于人脸图像的年龄估计系统一般分为人脸检测与定位,年龄特征提取,年龄估计,系统性能评价几个部分。根据提取特征方式的不同又分为传统方法和深度学习方法。


同一张图在不同应用中的测定(左商汤右年龄检测器)



不同的人脸在同一应用中测定(百度云 AI 为例)



不同年龄不同肤色在年龄估计系统中评分测试



如果基于人脸图像的年龄估计问题得到解决,那么在日常生活中基于年龄信息的各种人机交互系统将在现实生活中有着极大的应用需求。


市场主流年龄估计软件包括商汤科技,face++,百度云 AI 体验中心,腾讯云 AI 体验中心,年龄检测仪。我们随机拿了一些名人照片做测试,总体说来 face++在测试集上表现最好。

02 人脸年龄数据集与算法评价指标

2.1 公开数据集

2.1.1 The IMDB-WIKI dataset 数据集 【1】


网址:https://data.vision.ee.ethz.ch/cvl/rrothe/imdb-wiki/


介绍:从 IMDb 和维基百科上爬取的名人图片,根据照片拍摄时间戳和出生日期计算得到的年龄信息。应该是目前最大的人脸年龄数据集


大小: 共 523051 张 face images


标签:年龄和性别




2.1.2 Adience Benchmark Of Unfiltered Faces For Gender And Age Classification 数据集【2】


网址:https://www.openu.ac.il/home/hassner/Adience/data.html#frontalized


介绍:iPhone5 或更新的智能手机拍摄


标签:年龄段(0-2, 4-6, 8-13, 15-20, 25-32, 38-43, 48-53, 60+)


大小:26580 张, 2284 人



2.1.3 Cross-Age Celebrity Dataset (CACD)【3】


网址:http://bcsiriuschen.github.io/CARC/


描述:与数据集 2.1.1 类似


标签:年龄


大小:163446 张名人图片,约 4.4G


2.2 算法评价指标

目前常用的年龄估计评价指标包括平均绝对误差( MAE) 和累积指数( CS) 。


2.2.1 MAE


平均绝对误差是指估计年龄和真实年龄之间绝对误差的平均值,其表达式为 



2.2.2 CS


年龄估计性能评价中,人们关注更多的是所估计出的年龄值的绝对误差范围是否在人们能接受的范围内,因此累积指数被用于年龄估计的性能评价中,累积指数的定义如下:



式中,Nθ≤j 表示测试图像中估计年龄与真实年龄的绝对误差不超过 j 年的测试图像数,分母 N 为所有测试图像的总数。因此 CS 越大,说明估计年龄越接近真实年龄,年龄估计越准确。

03 传统方法研究思路

传统方法研究思路,自然就是手动提取特征,我们基于参考文献【4】来做说明。


传统方法即手动提取特征,传统方法可粗略划分为手动提取特征和年龄估计两个阶段。


根据特征所反映的人脸信息,可以将常用的人脸年龄特征分为形状特征、纹理特征、代数特征以及混合特征。由于每种类型的特征均从不同角度描述了人脸图像,为了充分利用各种特征的优点,研究人员通常综合集成多种人脸特征,并采用不同的数学方法对其进行处理,从而形成了各具特色的面部年龄特征提取模型。常见的特征提取模型包括人体测量学模型( anthropometric models) 、特征子空间模型( AGES) 、柔性模型( flexible models) 、流形学习( age manifold)以及外观模型( appearance model) 等。

3.1 特征提取模型

3.1.1 人体测量学模型


a) 主要内容:


人体测量学模型利用了人脸的几何形状特征进行年龄分类,主要是描述随着年龄的增长人脸整体轮廓变化的数学规律,它所测量的是人脸的一种结构信息。主要过程归纳为人脸轮廓检测,人脸特征点定位,多种几何比例测量(如两眼之间的间距、两眼之间的间距等),最后利用几何比例进行年龄段的区分。


b) 适用范围:


主要适合于对未成年人进行年龄分类


c) 局限性:


由于该模型对人体姿态变换比较敏感,因此主要适用于提取正面人脸图像的年龄特征



3.1.2 柔性模型


a) 主要内容:


柔性模型将人脸的形状与灰度/纹理有机结合起来,从整体入手,充分提取人脸图像的形状信息和全局纹理信息,可以看作是人体测量学模型的升级版,其典型的代表是主动形状模型( ASM) 和主动外观模型( AAM)。


b) 适用范围:


该模型可以更好地适应复杂图像的特征点定位和特征提取,不仅适用于对青少年进行年龄分类,也适用于对中老年人进行分类。


c) 局限性:


1) 随着年龄的增长,人脸纹理的变化更多地体现在局部区域,如额头、眼角、脸颊等,因此采用该模型进行特征提取时,将会丢失掉很多局部纹理信息,可能不利于对老年人进行年龄估计。


2) 在训练过程中,柔性模型通常将形状和纹理空间分别进行训练,这将会损失掉大量纹理和形状之间的有效信息。


 3) 此外柔性模型的确定依赖于很多脸部特征点的准确定位,一旦定位出现误差,这种误差将很容易在后续处理中被放大。



3.1.3 外观模型


a) 主要内容:


外观模型将人脸几何特征与全局信息,局部信息(如面部纹理信息、频率信息和肤色信息)相融合进行人脸描述,进而进行年龄估计,可以看作是柔性模型的升级版,目前应用最为广泛。


b) 适用范围:


它较好地描述了面部的纹理特性,并常常与形状特征相融合,可以较好地实现全年龄段的年龄估计。


c) 局限性:


只能用于粗略估计,给出一个大概的年龄段。

3.2 年龄估计

基于人脸图像的年龄估计是一类“特殊”的模式识别问题: 一方面由于每个年龄值都可以看作是一个类,所以年龄估计可以被看作是一种分类问题;另一方面,年龄值的增长是一个有序数列的不断变化过程,因此年龄估计也可被视为一种回归问题。有研究者通过对已有年龄估计工作进行总结后认为: 针对不同的年龄数据库和不同的年龄特征、分类模式和回归模式具有各自的优越性,因此将二者有机融合可以有效提高年龄估计的精度。由于传统的年龄估计模式忽略了人脸衰老的动态性,最近研究人员又将 Rank 模型引入到年龄估计方法中,并取得了较好的效果。


3.2.1 分类模型


每个年龄值都可以看作是一个类,所以年龄估计可以被看作是一种分类问题。分类模式采用模式分类的理念与方法实现年龄的估计。可以分为对年龄段进行分类和对具体年龄值进行分类。


3.2.2 回归模型


年龄值的增长是一个有序数列的不断变化过程,因此年龄估计也可被视为一种回归性问题。回归模式运用回归分析的方法,通过建立表征人脸年龄变化规律的函数模型来实现年龄的估计。


3.2.3 Rank 模型


人类衰老是一个“动态”变化的个性化过程。传统的基于分类模式的年龄估计把年龄分成了若干个年龄段,没有考虑到不同年龄之间的相互关系,因此损失了很多重要的信息; 传统的回归模式虽然考虑到了年龄之间的相关性,但是却假设人的衰老是一个“静态”过程,即不同年龄的人的衰老变化规律一致。此外,在日常生活中,我们对一个人进行年龄判定时,总是将该人脸与我们熟悉的且知道相应年龄的人脸图像进行比较,通过综合大量的比较结果进行年龄判断。


因此,年龄估计过程可以看成是对大量人脸有效信息对进行比较的过程,也就是通过若干组二值分类结果就可以得到相应的年龄估计值,通过寻找当前年龄标签在年龄序列中的相对位置来确定最终的年龄值,从而有效克服了传统的年龄估计方法忽略了人类面部衰老过程中的动态性、模糊性以及个性化的特点.


3.2.4 混合年龄估计模型


不同的估计模式具有不同的优势,因此可以将各种估计模式综合起来进行年龄的估计。所谓混合年龄估计模式就是使用多个不同的年龄估计器代替单个年龄估计器来进行年龄估计。

04 深度学习方法研究思路

近年来伴随着深度学习的火爆,应用深度学习方法解决人脸年龄估计问题成为了主流。


实际上,就是利用深度学习自己学习特征,替换掉了上面传统方法提取的一系列特征。在大数据的加持下,模型的鲁棒性远超传统方法。下图就是文献【1】,夺得 ChaLearn LAP 2015 challenge 的 pipeline。


该文是多个模型的融合,将年级估计问题作为一个 0~100 岁的 101 类的分类问题来研究。



有的文献【5】会利用神经网络提取特征后做一些 PCA 的维度,实际上笔者认为没有这个必要。


在经过正确的人脸检测和对齐后,现有的深度学习模型完全能够 end-to-end 的解决这个问题。

总结

基于人脸的年龄估计仍然是一个可以继续研究的问题,因为以美颜等为代表的技术,干扰着算法的准确性。


不过,年龄的估计本身就不一定能反映真实的生理年龄,有的人就是比同龄人显得年轻很多或者老很多,所以该技术不可能像指纹识别或者人脸识别一样,在非常重要的应用中独当一面,而只能作为辅助算法。不过,研究研究还是很好玩的。


参考文献:


[1] Rothe R, Timofte R, Gool L V. Deep Expectation of Real and Apparent Age from a Single Image Without Facial Landmarks[J]. International Journal of Computer Vision, 2016:1-14…


[2] Hassner T, Harel S, Paz E, et al. Effective face frontalization in unconstrained images[J].  2014:4295-4304.


[3] Chen B C, Chen C S, Hsu W H. Face Recognition and Retrieval Using Cross-Age Reference Coding With Cross-Age Celebrity Dataset[J]. IEEE Transactions on Multimedia, 2015, 17(6):804-815.


[4]王先梅,梁玲燕,王志良,胡四泉. 人脸图像的年龄估计技术研究 [J].中国图象图形学报,2012, 17( 6) : 603-618.


[5] 郑德鹏, 杜吉祥, 翟传敏. 基于深度学习MPCANet 的年龄估计 [J]. 南京师大学报(自然科学版),  2017, 40(1):20-26.


作者介绍


陈英豪,公众号“有三 AI”作者,计算机视觉专业在读;


言有三,真名龙鹏,曾先后就职于奇虎 360AI 研究院、陌陌深度学习实验室,6 年多计算机视觉从业经验,拥有丰富的传统图像算法和深度学习图像项目经验,拥有技术公众号《有三 AI》,著有书籍《深度学习之图像识别:核心技术与案例实战》。


原文链接


https://mp.weixin.qq.com/s/fnEqr-1dxLm-NL8STURY_A


公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2019-09-25 15:511759

评论

发布
暂无评论
发现更多内容

集世界杯+GameFi元素的MetaElfLand,为何将在世界杯期间爆发?

股市老人

助力双12,Quick Stock-瓴羊交易9.9元畅享打单发货

瓴羊企业智能服务

PMO推行制度落地陷入困境怎么办?

PMO实践

项目管理 PMO 项目经理

【保姆级】github博客快速搭建

Shen-Xmas

GitHub 前端 后端 博客 博客搭建

学历低可以参加大数据培训吗

小谷哥

Serverless Devs 社区联合信通院邀请您参加 2022 中国 Serverless 用户调查

阿里巴巴云原生

阿里云 Serverless 云原生

分布式存储之 etcd 的集群管理

焱融科技

云计算 分布式系统 etcd 高性能 分布式存储

一文详解GaussDB(DWS) 的并发管控和内存管控

华为云开发者联盟

大数据 后端 华为云

Amazon Braket 与量子计算

亚马逊云科技 (Amazon Web Services)

量子计算 Hero 专栏 Amazon Braket

前端自学能学会吗,培训怎么学

小谷哥

云原生系列 二【轻松入门容器基础操作】

叶秋学长

云原生 沙箱实验 11月月更

在大数据培训学习中怎么成为优秀的程序员

小谷哥

年终最重磅!云原生实时数仓 SelectDB 首次产品发布等你来约!

SelectDB

数据库 云计算 大数据 实时计算

云小课|帮您高效快速上传组件至私有依赖库

华为云开发者联盟

云计算 后端 华为云

如何通过 NFTScan 浏览器查询 NFT项目的 Metadata 数据【教程】

NFT Research

区块链 NFT

哪些人适合参加前端培训?

小谷哥

阿里云云原生加速器成员企业袋鼠云创始人陈吉平:深耕国产自研数字化技术与服务,持续为客户创造价值

阿里巴巴云原生

阿里云 云原生

企业数字化转型中面临的开源供应链的挑战及应对措施

安势信息

开源 企业数字化转型 开源软件供应链 软件供应链安全 安势信息

如何将项目经理负责制落到实处?完成这3个前置条件!

PMO实践

项目管理 PMO 项目经理

元器件科普 | 无源元件之——电容基础知识(超详细)

元器件秋姐

元器件采购 华秋商城 电容 电容器 电解电容器

怎么判断自己适不适合做大数据培训

小谷哥

集世界杯+GameFi元素的MetaElfLand,推出世界杯专场活动

EOSdreamer111

Stable Diffusion半秒出图;VLIW的前世今生;YOLOv5全面解析教程 | AI系统前沿动态

OneFlow

人工智能 深度学习 VLIW

集世界杯+GameFi元素的MetaElfLand,推出世界杯专场活动

小哈区块

如何写出一份“有结果”的年度工作总结【超极实用!】

PMO实践

项目管理 PMO 项目经理 工作总结

进场感知,主动服务|诚迈联手华为打造HarmonyOS原子化服务解决方案

最新动态

BANI时代下PMO如何求得生存?

PMO实践

项目管理 PMO 2022

Stack Memory vs Heap Memory in Java

Mahipal_Nehra

Java heap memory Stack memory Java development

万恶的strpos函数

J.Smile

自学php

Chrome 103支持使用本地字体,纯前端导出PDF优化

葡萄城技术团队

chrome 前端 HTTP PDF

10分钟为你全面解答HDFS的SecondaryNamenode的作用

好程序员IT教育

大数据 hdfs

人脸年龄估计研究现状_AI&大模型_言有三_InfoQ精选文章