一文道尽“人脸数据集”_AI&大模型_言有三



 写点什么

这一次我将从人脸检测、关键点检测、人脸识别、人脸表情、人脸年龄、人脸姿态等几个方向整理出人脸领域有用的数据集清单，不全也有 9 成全吧。

01

人脸检测

所谓人脸检测任务，就是要定位出图像中人脸的大概位置。

1.1 Caltech 10000

数据集地址：

http://www.vision.caltech.edu/Image_Datasets/Caltech_10K_WebFaces/

发布于 2007 年，这是一个灰度人脸数据集，使用 Google 图片搜索引擎用关键词爬取所得，包含了 7,092 张图，10,524 个人脸，平均分辨率在 304x312，除此之外还提供双眼，鼻子和嘴巴共 4 个坐标位置。在早期被使用的较多，现在的方法已经很少用灰度数据集做评测。

1.2 AFW

发布于 2013 年。AFW 数据集是人脸关键点检测非常早期使用的数据集，共包含 205 个图像，其中有 473 个标记的人脸。每一个人脸提供了方形边界框，6 个关键点和 3 个姿势角度的标注。目前官网数据链接已经失效，可以通过其他渠道获得。

1.3 FDDB

数据集地址：http://vis-www.cs.umass.edu/fddb/index.html

发布于 2010 年，这是被广泛用于人脸检测方法评测的一个数据集，FDDB 全称是 Face Detection Data Set and Benchmark，它的提出是用于研究无约束人脸检测。所谓无约束指的是人脸表情、尺度、姿态、外观等具有较大的可变性。FDDB 的图片都来自于 Faces in the Wild 数据集，图片来源于美联社和路透社的新闻报道图片，所以大部分都是名人，而且是自然环境下拍摄的。共 2845 张图片，里面有 5171 张人脸图像。

通常人脸检测数据集的标注采用的是矩形标注，即通过矩形将人脸的前额，脸颊和下巴通过矩形包裹起来，但是由于人脸是椭圆状的，所以不可能给出一个恰好包裹整个面部区域而无干扰的矩形。

在 FDDB 当中采用了椭圆标记法，它可以适应人脸的轮廓。具体来说，每个标注的椭圆形人脸由六个元素组成。(ra, rb, Θ, cx, cy, s)，其中 ra，rb 是椭圆的半长轴、半短轴，cx, cy 是椭圆的中心点坐标，Θ是长轴与水平轴夹角（头往左偏Θ为正，头往右偏Θ为负），s 则是置信度得分。标注的结果是通过多人独立完成标注之后取标注的平均值，而且排除了以下的样本。

长或宽小于 20 个像素的人脸区域。
设定一个阈值，将像素低于阈值的区域标记为非人脸。
远离相机的人脸区域被标记为非人脸。
人脸被遮挡，2 个眼睛都不在区域内的标记为非人脸。

1.4 WIDER Face

数据集地址：http://mmlab.ie.cuhk.edu.hk/projects/WIDERFace/

发布于 2015 年，FDDB 评测标准由于只有几千张图像，这样的数据集在人脸的姿态、尺度、表情、遮挡和背景等多样性上非常有限，训练出来的模型难以被很好的评判，算法很快就达到饱和。在这样的背景下香港中文大学提出了 Wider-face 数据集，在很长一段时间里，大型互联网公司和科研机构都在 Wider-face 上做人脸检测算法竞赛。

Wider-face 总共有 32203 张图片，共有 393703 张人脸,比 FDDB 数据集大 10 倍，而且在面部的尺寸、姿势、遮挡、表情、妆容、光照上都有很大的变化，算法不仅标注了框，还提供了遮挡和姿态的信息，自发布后广泛应用于评估性能比传统方法更强大的卷积神经网络。

1.5 MALF 数据集

数据集地址：http://www.cbsr.ia.ac.cn/faceevaluation/

发布于 2015 年，全称 Multi-Attribute Labelled Faces ，MALF 是为了更加细粒度地评估野外环境中人脸检测模型而设计的数据库。数据主要来源于 Internet，包含 5250 个图像，11931 个人脸。每一幅图像包含正方形边界框，头部姿态的俯仰程度，包括小中大三个等级的标注。该数据集忽略了小于 20*20 或者非常难以检测的人脸，共包含大约 838 个人脸，占该数据集的 7%。同时该数据集还提供了性别，是否带眼镜，是否遮挡，是否是夸张的表情等辅助信息。

02

关键点检测

检测到人脸后，通常都需要定位出图像的轮廓关键点，关键点是人脸形状的稀疏表示，在人脸跟踪，美颜等任务中都很重要，现在已经从最开始的 5 个关键点发展到了超过 200 个关键点的标注。

2.1 HELEN 等

首先集中介绍一些比较小和比较老的数据集，AFW 前面已经介绍。

XM2VTS，发布于 1999 年，

http://www.ee.surrey.ac.uk/CVSSP/xm2vtsdb/，包含 295 个人，2360 张正面图，标注了 68 个关键点，大部分的图像是无表情，而且在同样的光照环境下。

AR Face Database 发布于 1998 年，

http://www2.ece.ohio-state.edu/~aleix/ARdatabase.html，

包括 126 个人，超过 4000 张图，标注了 22 个关键点。

FGVC-V2 发布于 2005 年，

https://www.nist.gov/programs-projects/face-recognition-grand-challenge-frgc，共 466 个人的 4950 张图，包括均匀的光照条件下的高质量图和不均匀的光照条件下的低质量图，标注了 5 个关键点。

LFPW 人脸数据库，发布于 2011 年，

https://neerajkumar.org/projects/face-parts/，

包括 1432 张图像，标注了 29 个关键点。

Helen 人脸数据库，发布于 2012 年，

http://www.ifp.illinois.edu/~vuongle2/helen/，包括训练集和测试集，测试集包含了 330 张人脸图片，训练集包括了 2000 张人脸图片，都被标注了 68 个特征点。

IBUG，发布于 2013 年，

https://ibug.doc.ic.ac.uk/resources/facial-point-annotations/，这是随着 300W 一起发布的数据集，包含了 135 张人脸图片，每张人脸图片被标注了 68 个特征点。

2.2 AFLW

数据集地址：

https://www.tugraz.at/institute/icg/research/team-bischof/lrs/downloads/aflw/

AFLW(Annotated Facial Landmarks in the Wild)是一个包括多姿态、多视角的大规模人脸数据库，一般用于评估面部关键点检测效果，图片来自于 flickr 的爬取。总共有 21,997 张图，25,993 张面孔，每张人脸标注 21 个关键点，共 380k 个关键点，由于是肉眼标记，不可见的关键点不进行标注。

除了关键点之外，还提供了矩形框和椭圆框的脸部位置标注，其中椭圆框的标注方法与 FDDB 相同。另外还有从平均 3D 人脸重建提供的 3D 的人脸姿态角标注。

大部分图像是彩色图，也有少部分是灰度图，59%为女性，41%为男性，这个数据集非常适合做多角度多人脸检测，关键点定位和头部姿态估计，是关键点检测领域里非常重要的一个数据集。

2.3 300W

数据集地址：https://ibug.doc.ic.ac.uk/resources/300-W/

发布于 2013 年，包含了 300 张室内图和 300 张室外图，其中数据集内部的表情，光照条件，姿态，遮挡，脸部大小变化非常大，因为是通过 Google 搜索“party”, “conference”等较难等场景搜集而来。该数据集标注了 68 个关键点，一定程度上在这个数据集能取得好结果的，在其他数据集也能取得好结果。

300-W challenge 是非常有名的用于评测关键点检测算法的基准，在 ICCV 2013 举办了第一次人脸关键点定位竞赛。300-W challenge 所使用的训练数据集实际上并不是一个全新的数据集，它是采用了半监督的标注工具，将 AFLW，AFW，Helen，IBUG，LFPW，FRGC-V2，XM2VTS 等数据集进行了统一标注然后得到的，关键信息是 68 个点。

在 ICCV2015 年拓展成了视频标注，即 300 Videos in the Wild (300-VW)，数据集地址是https://ibug.doc.ic.ac.uk/resources/300-VW/，感兴趣读者可以关注。

2.4 MTFL/MAFL

数据集地址：http://mmlab.ie.cuhk.edu.hk/projects/TCDCN.html

发布于 2014 年，这里包含了两个数据集。Multi-Task Facial Landmark (MTFL) 数据集包含了 12,995 张脸，5 个关键点标注，另外也提供了性别，是否微笑，是否佩戴眼镜以及头部姿态的信息。Multi-Attribute Facial Landmark (MAFL) 数据集则包含了 20,000 张脸，5 个关键点标注与 40 个面部属性，实际上后面被包含在了 Celeba 数据集中，该数据集我们后面会进行介绍。这两个数据集都使用 TCDCN 方法将其拓展到了 68 个关键点的标注。

2.5 WFLW 数据集

数据集地址：https://wywu.github.io/projects/LAB/WFLW.html

WFLW 包含了 10000 张脸，其中 7500 用于训练，2500 张用于测试，共 98 个关键点。除了关键点之外，还有遮挡，姿态，妆容，光照，模糊和表情等信息的标注。

由于人脸关键点是整个人脸任务中非常基础和重要的，所以在工业界有更多的关键点的标注，目前 96 点，106 点都是非常常见的。因为商业价值，这些数据集一般不会进行公开。

03

人脸识别

人脸检测和关键点检测都是比较底层的任务，而人脸识别是更高层的任务，它就是要识别出检测出来的人脸是谁，完成身份比对等任务，也是人脸领域里被研究最多的任务。

3.1 FERET

数据库地址：http://www.nist.gov/itl/iad/ig/colorferet.cfm

发布于 1993 年至 1996 年，由 FERET 项目创建，包含 14,051 张多姿态，不同光照的灰度人脸图像，每幅图中均只有一个人脸，在早期的人脸识别领域应用非常广泛。

3.2 Yale/YaleB

数据集地址：

http://vision.ucsd.edu/~iskwak/ExtYaleDatabase/Yale%20Face%20Database.htm

Yale 人脸数据库与 YALE 人脸数据库 B 分别发布于 1997 年和 2001 年，这是两个早期的灰度数据集。Yale 人脸数据库由耶鲁大学计算视觉与控制中心创建，包含 15 位志愿者的 165 张图片，包含光照，表情和姿态的变化。

后面将其拓展到 YALE 人脸数据库 B，包含了 10 个人的 5760 幅多姿态，多光照的图像。具体包括 9 个姿态，64 种光照变化，在实验室严格控制的条件下进行。虽然每个人的图像很多，但是由于采集人数较少,该数据库的进一步应用受到了比较大的限制。

3.3 CAS-PEAL

数据集地址：http://www.jdl.ac.cn/peal/

发布于 2008 年，CAS-PEAL 数据集是中国科学院收集建立的，它主要是为了提供一个大规模的中国人脸数据集用于训练和评估对应东方人的算法，有灰度图和彩色图两个版本。

目前，CAS-PEAL 人脸数据库由 1040 个人（595 名男性和 445 名女性）的 99594 张图像组成，在特定环境下具有不同的姿势、表情、照明条件、表情以及是否佩戴眼镜等信息。对于每个被拍摄的人，通过 9 个相机来同时捕获不同姿态的图像，平均每一个人采集了约 900 张图像。

3.4 LFW 数据集

数据集地址：http://vis-www.cs.umass.edu/lfw/index.html#download

发布于 2007 年，Labeled Faces in the Wild(简称 LFW)，是为了研究非限制环境下的人脸识别问题而建立，这是比较早期而重要的测试人脸识别的数据集，所有的图像都必须要能够被经典的人脸检测算法 VJ 算法检测出来。

该数据集包含 5749 个人的 13233 张全世界知名人士的图像，其中有 1680 人有 2 张或 2 张以上人脸图片。它是在自然环境下拍摄的，因此包含不同背景、朝向、面部表情。

3.5 CMU PIE

CMU PIE 数据集地址：https://www.ri.cmu.edu/publications/the-cmu-pose-

illumination-and-expression-pie-database-of-human-faces/

Multi-PIE 数据集地址：

http://www.cs.cmu.edu/afs/cs/project/PIE/MultiPie/Multi-Pie/Home.html

CMU PIE 数据集发布于 2000 年，PIE 就是姿态(Pose)，光照(Illumination)和表情(Expression)的缩写。包含 68 位志愿者的 41,368 张图，每个人有 13 种姿态条件，43 种光照条件和 4 种表情。其中的姿态和光照变化图像也是在严格控制的条件下采集的，它在推动多姿势和多光照的人脸识别研究方面具有非常大的影响力，不过仍然存在模式单一多样性较差的问题。

为了解决这些问题，卡内基梅隆大学的研究人员在 2009 年建立了 Multi-PIE 数据集。它包含 337 个人，在 15 个角度，19 个照明条件和不同的表情下记录，最终超过 750000 个图像。由于图像质量较高，原始的图片大小超过了 300G，需要购买。

3.6 Pubfig

数据集地址：http://www.cs.columbia.edu/CAVE/databases/pubfig/

发布于 2010 年，这是哥伦比亚大学的公众人物脸部数据集，包含有 200 个人的 58797 张人脸图像，主要用于非限制场景下的人脸识别。与 LFW 相比，这个数据集更大，但是人更少，每个人的图片更多。

3.7 MSRA-CFW

数据集地址：

https://link.zhihu.com/?target=http%3A//research.microsoft.com/en-us/projects/msra-cfw/；

发布于 2012 年，由 MSRA 收集整理，包含 1,583 个人的 202,792 张图像，采用了自动标注的方法。

3.8 CASIA WebFace

数据集地址：http://classif.ai/dataset/casia-webface/

发布于 2014 年，这是李子青实验室开放的国内非常有名的数据集，包含 10575 个人 494414 张图。

3.9 Celeba

数据集地址：http://mmlab.ie.cuhk.edu.hk/projects/CelebA.html

发布于 2015 年，这是由香港中文大学汤晓鸥教授实验室发布的大型人脸识别数据集。该数据集包含 10,177 个名人的 202,599 张人脸图片，人脸属性有 40 多种，包括是否戴眼镜，是否微笑等，主要用于人脸属性的识别。

3.10 FaceScrub

数据集地址：http://vintage.winklerbros.net/facescrub.html

发布于 2016 年，总共包含了 530 个人的 106863 张图片，其中男性女性各占 265，每个人大概 200 张图。

3.11 UMDFaces

数据集地址：http://www.umdfaces.io/

发布于 2016 年，这个数据集有静态图和视频两部分，其中静态图包含 8277 个人的 367,888 张脸，视频包含 22,075 个视频中的 3,107 个人的 3,735,476 张图。同时标注了 21 个关键点，性别信息，以及人的 3 个姿态。

3.12 MegaFace

数据集地址：

http://megaface.cs.washington.edu/dataset/download.html

发布于 2016 年，MegaFace 数据集包含一百万张图片，共 690000 个不同的人，所有数据都是华盛顿大学从 Flickr 组织收集。

这是第一个在一百万规模级别的面部识别算法测试基准。现有脸部识别系统仍难以准确识别超过百万的数据量。为了比较现有公开脸部识别算法的准确度，华盛顿大学在 2017 年底开展了一个名为“MegaFace Challenge”的公开竞赛。这个项目旨在研究当数据库规模提升数个量级时，现有的脸部识别系统能否维持可靠的准确率。

3.13 MS-Celeb-1M

数据集地址：https://www.msceleb.org/

发布于 2016 年，这是目前世界上规模最大、水平最高的图像识别赛事之一，由 MSRA（微软亚洲研究院）发起，每年定期举办。参赛队伍被要求基于微软云服务，搭建包括人脸检测、对齐、识别的完整人脸识别系统，而且识别系统必须先通过远程实验评估。

训练集合包含 10M 图片，具体的操作是从 1M 个名人中，根据他们的受欢迎程度，选择 100K 个。然后，利用搜索引擎，给 100K 个人，每人搜大概 100 张图片。共得到 100K*100=10M 个图片。测试集包括 1000 个名人，这 1000 个名人来自于 1M 个明星中随机挑选，每个名人大概有 20 张图片。

3.14 VGG Face

数据集地址：

http://www.robots.ox.ac.uk/~vgg/data/vgg_face/

http://www.robots.ox.ac.uk/~vgg/data/vgg_face2/

VGG Face 发布于 2015 年，包括 2622 个对象，每个对象拥有约 1000 副静态图像；

VGG Face2 发布于 2017 年，包含了 9131 个人的 3.31 百万张图片，平均每一个人有 362.6 张图。这个数据集人物 ID 较多，且每个 ID 包含的图片个数也较多。数据集覆盖了大范围的姿态、年龄和种族，其中约有 59.7%的男性。除了身份信息之外，数据集还包括人脸框，5 个关键点、以及估计的年龄和姿态。

3.15 IMDB-Face

数据集地址：

https://github.com/fwang91/IMDb-Face#data-download

发布于 2018 年，包含 590000 个人，17000000 张图，是现在人脸最多的数据集了。

3.16 YouTube Faces

数据集地址：http://www.cs.tau.ac.il/~wolf/ytfaces/results.html

发布于 2011 年，它包含了 1,595 个人的 3,425 段视频，最短的为 48 帧，最长的为 6070 帧。和 LFW 不同的是，在这个数据集下，算法需要判断两段视频里面是不是同一个人。有不少在照片上有效的方法，在视频上未必有效/高效。

还有一些其他的视频数据集，此处不再一一介绍，感兴趣可以自行关注。

3.17 IARPA Janus

数据集地址：

https://www.iarpa.gov/index.php/research-programs/janus

这是进几年开启的人脸识别比赛，由美国国家技术标准局（NIST）在 2015 年召开的 CVPR 上发布，当时是 IJB-A 人脸验证与识别数据集, 包含 500 个对象的 5396 副静态图像和 20412 帧的视频数据。

被拍摄者来自世界不同国家、地区和种族，具有广泛的地域性，在完全无约束环境下采集的。面部姿态变化巨大，光照变化剧烈，所以难度非常大。

另外，数据集引入了“模板”的概念，一个模板就是一个集合，集合包括被拍摄者的静态图像和视频片段，最终的人脸验证与识别不是基于单个图像，而是基于集合对集合。

此后，2017 年迭代到 IARPA Janus B，2018 年迭代到 IARPA Janus C，包括了 138000 人脸，11000 个视频，10000 张非人脸，在这里拿下好名次，才能称为真正的人脸识别好手。

人脸识别虽然在百万级别的数据集如 MegaFace 等都已经达到相当高的水准，但是在现实世界中面临各种姿态，分辨率，遮挡等问题，仍然有较大的研究空间。

04

人脸表情

人脸表情识别(facial expression recognition, FER)是人脸属性识别技术中的一个重要组成部分，在人机交互、安全控制、直播娱乐、自动驾驶等领域都非常具有应用价值，因此在很早前就已经得到了研究。

4.1 JAFFE

数据集链接：http://www.kasrl.org/jaffe.html

1998 年发布，这是比较小和老的数据库。该数据库是由 10 位日本女性在实验环境下根据指示做出各种表情，再由照相机拍摄获取的人脸表情图像。整个数据库一共有 213 张图像，10 个人，全部都是女性，每个人做出 7 种表情，这 7 种表情分别是：sad, happy, angry, disgust, surprise, fear, neutral，每组大概 20 张样图。

4.2 KDEF 与 AKDEF

数据集地址：http://www.emotionlab.se/kdef/

发布于 1998 年，这个数据集最初是被开发用于心理和医学研究目的。它主要用于知觉，注意，情绪，记忆等实验。在创建数据集的过程中，特意使用比较均匀，柔和的光照，被采集者身穿统一的 T 恤颜色。这个数据集，包含 70 个人，35 个男性，35 个女性，年龄在 20 至 30 岁之间。没有胡须，耳环或眼镜，且没有明显的化妆。7 种不同的表情，每个表情有 5 个角度。总共 4900 张彩色图，尺寸为 562*762 像素。

4.3 GENKI

数据集地址：http://mplab.ucsd.edu

发布于 2009 年，GENKI 数据集是由加利福尼亚大学的机器概念实验室收集。该数据集包含 GENKI-R2009a，GENKI-4K，GENKI-SZSL 三个部分。GENKI-R2009a 包含 11159 个图像，GENKI-4K 包含 4000 个图像，分为“笑”和“不笑”两种，每个图片拥有不同的尺度大小，姿势，光照变化，头部姿态，可专门用于做笑脸识别。这些图像包括广泛的背景，光照条件，地理位置，个人身份和种族等。

4.4 RaFD

数据集地址：http://www.socsci.ru.nl:8180/RaFD2/RaFD?p=main

发布于 2010 年，该数据集是 Radboud 大学 Nijmegen 行为科学研究所整理的，这是一个高质量的脸部数据库，总共包含 67 个模特，其中 20 名白人男性成年人，19 名白人女性成年人，4 个白人男孩，6 个白人女孩，18 名摩洛哥男性成年人。总共 8040 张图，包含 8 种表情，即愤怒，厌恶，恐惧，快乐，悲伤，惊奇，蔑视和中立。每一个表情，包含 3 个不同的注视方向，且使用 5 个相机从不同的角度同时拍摄的。

4.5 CK

数据集地址：http://www.pitt.edu/~emotion/ck-spread.htm

发布于 2010 年，这个数据库是在 Cohn-Kanade Dataset 的基础上扩展来的，它包含 137 个人的不同人脸表情视频帧。这个数据库比起 JAFFE 要大的多。而且也可以免费获取，包含表情的标注和基本动作单元的标注。

4.6 Fer2013

数据集地址：https://www.kaggle.com/c/challenges-in-representation-learning-facial-expression-recognition-challenge/data

发布于 2013 年，该数据集包含共 26190 张 48*48 灰度图，图片的分辨率比较低，共 6 种表情。分别为 0 anger 生气、1 disgust 厌恶、2 fear 恐惧、3 happy 开心、4 sad 伤心、5 surprised 惊讶、6 normal 中性。

4.7 RAF

数据集地址：http://www.whdeng.cn/RAF/model1.html

发布于 2017 年，包含总共 29672 张图片，其中 7 个基本表情和 12 个复合表情，而且每张图还提供了 5 个精确的人脸关键点，年龄范围和性别标注。

4.8 EmotionNet

数据集地址：http://cbcsl.ece.ohio-state.edu/EmotionNetChallenge/

发布于 2017 年，共 950,000 张图，其中包含基本表情，复合表情，以及表情单元的标注。

另外还有一些需要申请的数据集如 SCFace 等就不再介绍，表情识别目前的关注点已经从实验室环境下转移到具有挑战性的真实场景条件下，研究者们开始利用深度学习技术来解决如光照变化、遮挡、非正面头部姿势等问题，仍然有很多的问题需要解决。

另一方面，尽管目前表情识别技术被广泛研究，但是我们所定义的表情只涵盖了特定种类的一小部分，尤其是面部表情，而实际上人类还有很多其他的表情。表情的研究相对于颜值年龄等要难得多，应用也要广泛的多，相信这几年会不断出现有意思的应用。

05

人脸年龄与性别

人脸的年龄和性别识别在安全控制，人机交互领域有着非常广泛的使用，而且由于人脸差异性，人脸的年龄估计仍然是一个难点。

5.1 FGNet

数据集地址：

http://www-prima.inrialpes.fr/FGnet/html/benchmarks.html

发布于 2000 年，这是第一个意义重大的年龄数据集，包含了 82 个人的 1002 张图，年龄范围是 0 到 69 岁。

5.2 CACD2000

数据集地址：http://bcsiriuschen.github.io/CARC/

发布于 2013 年，这是一个名人数据集，包含了 2,000 个人的 163446 张名人图片，其范围是 16 到 62 岁。

5.3 Adience

数据集地址：

https://www.openu.ac.il/home/hassner/Adience/data.html#frontalized

发布于 2014 年，这是采用 iPhone5 或更新的智能手机拍摄的数据，共 2284 个人 26580 张图像。它的标注采用的是年龄段的形式而不是具体的年龄，其中年龄段为（0-2, 4-6, 8-13, 15-20, 25-32, 38-43, 48-53, 60+）。

5.4 IMDB-wiki

数据集地址：https://data.vision.ee.ethz.ch/cvl/rrothe/imdb-wiki/

发布于 2015 年，IMDB-WIKI 人脸数据库是由 IMDB 数据库和 Wikipedia 数据库组成，其中 IMDB 人脸数据库包含了 460,723 张人脸图片，而 Wikipedia 人脸数据库包含了 62,328 张人脸数据库，总共 523,051 张人脸数据。都是从 IMDb 和维基百科上爬取的名人图片，根据照片拍摄时间戳和出生日期计算得到的年龄信息，以及性别信息，对于年龄识别和性别识别的研究有着重要的意义，这是目前年龄和性别识别最大的数据集。

5.5 MORPH

数据集地址：http://www.faceaginggroup.com/morph/

发布于 2017 年，包括 13,000 多个人的 55,000 张图，年龄范围是 16 到 77。

06

人脸姿态

人脸的姿态估计在考勤，支付以及各类社交应用中有非常广泛的应用。

6.1 3DMM

数据集地址：https://faces.dmi.unibas.ch/

发布于 1999 年，这是随着著名的 3DMM 模型一起诞生的数据集，通过结构光和激光进行采集，未处理前每一个模型由 70000 个点描述，处理后由 53490 个点描述。

在数据库的处理过程中，将所有模型的每一个点的位置都进行了精确一一匹配，也就是说，每一个点都有实际的物理意义，可能有右嘴角，可能是鼻尖。

数据集包含 100 个男性和 100 个女性的 3D 扫描数据，是人脸三维重建领域影响最大的数据集，堪称 3D 人脸领域的“hello world”。在该数据集中，还标注了表情系数，纹理系数，68 个关键点的坐标，以及相机的 7 个坐标。

6.2 Bosphorus

数据集地址：http://bosphorus.ee.boun.edu.tr/default.aspx

发布于 2009 年，这是一个研究三维人脸表情的数据集，通过结构光采集。包含 105 个人， 4666 张人脸，每一个人脸有 35 种表情以及不同的仿真姿态。

6.3 BIWI

数据集地址：http://www.vision.ee.ethz.ch/datasets/b3dac2.en.html

发布于 2010 年，包含 1000 个高质量的 3D 扫描仪和专业麦克风采集的 3D 数据,其中 14 个人，6 个男性，8 个女性。采集以每秒 25 帧的速度获取密集的动态面部扫描。

6.4 HPD

数据集地址：

http://www-prima.inrialpes.fr/perso/Gourier/Faces/HPDatabase.html

发布于 2013 年，为灰度图数据集，在实验室采集，标注包括垂直角度和水平角度。包括 5580 张图，其中 372 个人，每个人 15 张图。

6.5 BIWI kinect

数据集地址：

https://data.vision.ee.ethz.ch/cvl/gfanelli/head_pose/head_forest.html

发布于 2013 年，使用 kinect 进行采集，包含 20 个人的 15000 张图片，有 3D 的标注，图片大小为 640*480。

6.6 FaceWarehouse

数据集地址：http://www.kunzhou.net/#facewarehouse

发布于 2014 年，这是浙江大学周昆实验室开源的 3D 人脸数据集，与 3DMM 数据集的构建相似，不过数据集是中国人。共包含了 150 个人，年龄从 7-80 岁。相比于 3DMM 数据集，它增加了表情，每个人包含了 20 种不同的表情，1 个中性表情，19 个张嘴，微笑等表情。

6.7 TMU

发布于 2015 年，这是一个面部视频数据库，包含 31,500 个 100 名志愿者的视频。每个志愿者在 7 个照明条件下由 9 组同步网络摄像头拍摄，并被要求完成一系列指定的动作，有不同的遮挡，照明，姿势和表情的面部变化。与现有数据库相比，THU 人脸数据库提供了具有严格时间同步的多视图视频序列，从而能够对注视校正方法进行评估。

6.8 UPNA

数据集地址：http://gi4e.unavarra.es/databases/hpdb/

发布于 2016 年，10 个人，其中 6 个男性，4 个女性，每个人 12 个视频，6 个规定的动作，6 个自由的动作。分辨率 1280*720，30fps，每一个视频 10s，有 3D 标注信息。

6.9 300W-LP

数据集地址：

http://www.cbsr.ia.ac.cn/users/xiangyuzhu/projects/3DDFA/main.htm

这是基于 300W 数据集和 3DMM 模型仿真得到的 3D 数据集，这是 3D 领域里使用最大，使用最广泛的仿真数据集，包含了 68 个关键点，相机参数以及 3DMM 模型的系数的标注。

其他的还有 USF Human ID 3-D Database，ICT-3DHP database，IDIAP 等，读者可以线下了解。由于 3D 数据集的构建代价很高，所以仿真数据集经常被使用，即通过从 2D 图像构建 3D 模型然后进行姿态仿真。当然另一方面，研究摆脱 3D 数据集的运用的方法也不断被提出，而且精度已经和基于 3D 数据集的方法可以比拼，因此这可能也是未来的重要研究方向。

07

其他数据集

人脸的应用领域还有美颜，风格化等，我们不再一一展开介绍，下面介绍在颜值和化妆领域比较重要的两个数据集。

7.1 SCUT-FBP

数据集地址：https://github.com/HCIILAB/SCUT-FBP5500-Database-Release

发布于 2017 年，数据集共 5500 个正面人脸，年龄分布为 15-60，全部都是自然表情。包含不同的性别分布和种族分布（2000 亚洲女性，2000 亚洲男性，750 高加索男性，750 高加索女性），数据分别来自于数据堂，US Adult database 等。每一张图由 60 个人进行评分，共评为 5 个等级，这 60 个人的年龄分布为 18～27 岁，均为年轻人。适用于基于 apperance/shape 等的模型研究。同时，每一个图都提供了 86 个关键点的标注。

7.2 MakeUp

数据集地址：http://www.antitza.com/makeup-datasets.html

发布于 2012 年，这是一个女性面部化妆数据集，可用于研究化妆对面部识别的影响。

总共包括 4 个子数据集：

YMU（YouTube 化妆）：这是从 YouTube 视频化妆教程中获取的面部图像，

YouTube 网址为

http://www.antitza.com/URLs_YMU.txt。

VMU（虚拟化妆）：

这是将从 FRGC 数据库（http://www.nist.gov/itl/iad/ig/frgc.cfm）

中采集的高加索女性受试者的面部图像，使用公开的软件（www.taaz.com）来合成的虚拟化妆样本。

MIW：从互联网获得有化妆和没有化妆的受试者的前后对比面部图像。

MIFS：化妆诱导面部欺骗数据集：这是从 YouTube 化妆视频教程的 107 个化妆。每一组包含 3 张图片，其中一张图片是目标的化妆前的主体图像，一个是化妆后的，另一个是其他人化同样的妆试图进行欺骗。

作者介绍

言有三，真名龙鹏，曾先后就职于奇虎 360AI 研究院、陌陌深度学习实验室，6 年多计算机视觉从业经验，拥有丰富的传统图像算法和深度学习图像项目经验，拥有技术公众号《有三 AI》，著有书籍《深度学习之图像识别：核心技术与案例实战》。

原文链接

https://mp.weixin.qq.com/s/aPlNov77l-3hBRePbIEOrg

评论 1 条评论

发布

码一回

人脸数据不好找啊。

2019-12-06 15:45

 0 回复

没有更多了

创作场景

一文道尽“人脸数据集”

01

1.1 Caltech 10000

1.2 AFW

1.3 FDDB

1.4 WIDER Face

1.5 MALF 数据集

02

2.1 HELEN 等

2.2 AFLW

2.3 300W

2.4 MTFL/MAFL

2.5 WFLW 数据集

03

3.1 FERET

3.2 Yale/YaleB

3.3 CAS-PEAL

3.4 LFW 数据集

3.5 CMU PIE

3.6 Pubfig

3.7 MSRA-CFW

3.8 CASIA WebFace

3.9 Celeba

3.10 FaceScrub

3.11 UMDFaces

3.12 MegaFace

3.13 MS-Celeb-1M

3.14 VGG Face

3.15 IMDB-Face

3.16 YouTube Faces

3.17 IARPA Janus

04

4.1 JAFFE

4.4 RaFD

4.5 CK

4.6 Fer2013

4.7 RAF

05

5.1 FGNet

5.2 CACD2000

5.3 Adience

5.4 IMDB-wiki

5.5 MORPH

06

6.1 3DMM

6.2 Bosphorus

6.3 BIWI

6.4 HPD

6.5 BIWI kinect

6.6 FaceWarehouse

6.7 TMU

6.8 UPNA

6.9 300W-LP

07

7.1 SCUT-FBP

7.2 MakeUp

作者介绍

原文链接

评论 1 条评论

更多内容推荐

推荐阅读

电子书

大厂实战PPT下载