写点什么

人脸识别技术的真相

2018 年 6 月 13 日

人脸识别是机器学习的直接应用,这项技术已经被消费者、行业和执法机关广泛采用,它可能为我们的日常生活带来了便利,但也有严重的隐私问题。人脸识别已经超过了人类的工作效率,但是,在某些应用中实际实现时还存在问题。

立足于九十年代 MIT 的 Eigenfaces 方法,人脸识别第一次成功的大规模实现是 2014 年 Facebook 的 DeepFace 项目,准确性在实验室条件下达到了人类水平。从 2014 年开始,更大的训练数据集、GPU 以及神经网络架构的快速发展进一步提高了人脸识别在通向现实世界可靠应用的更为丰富的上下文中的效率。

人脸识别的应用可以分类两类:身份验证和识别。这两种场景起初都会把一组已知的主体注册到系统中(图库),在测试期间,提供一个新的主体(测试图像)。人脸验证会计算图库和测试图像之间一对一的相似性,从而确定两副图像是否是相同的主体。例如, iPhone X 基于人脸的登录功能或者机场的边境检查就是使用了这样的生物特征身份认证解决方案。目前, HSBC Ticketmaster 都考虑在他们的移动应用程序中使用人脸验证。另一方面,人脸识别计算一对多的相似性,从而在预先做好识别的人物图库中正确地识别出测试图像。它的主要应用是把未标记的照片和已知的资料进行匹配。其中,执法机关会使用这项技术从人群中识别出他们感兴趣的人。

人脸识别技术还可以用于推断人的特征和行为,如情绪、年龄或健康状况。斯坦福大学最近一项颇具争议的研究表明,基于一个从Tinder 抽取的数据集,使用人脸分析方法预测一个人的性取向时准确率可达81%。

全球人脸识别市场主要在消费品、工业应用和执法三个领域,据 Allied Market Research Report Buyer 介绍,到 2022 年,这个市场有望达到 90 亿美元。生物识别解决方案市场的主要参与者包括 Safran(FR) NEC Corporation(JA) Cognitec(DE) Face++(CH)

但是,人脸识别是一种不同于其他技术的生物识别工具。乔治敦隐私& 技术法律中心执行董事、人脸识别专家 Alvaro Bedoya 在近日接受 USA Today采访时说,“你可以删除cookies。你可以修改浏览器设置。你可以把手机忘家里,但你不能删除你的脸,你不能把它忘家里”。人脸识别是一种不需要同意的生物认证工具。

越来越多的公民自由和隐私协会指出人脸识别的使用存在违反公民自由和隐私的危险,包括 ACLU 人权观察电子前线基金会以及英国的老大哥观察。有40 家协会在一封给Amazon 的、有关人脸识别系统Rekognition 的邮件上签名,要求Amazon 不再允许政府使用 AWS Rekognition 。2016 年,作为 Amazon Web Services 云业务的一部分,Amazon 推出了 Rekognition 。Facebook 在加利福尼亚州也面临着一场根据生物信息隐私法案提起的针对其使用人脸识别的集体诉讼。在谷歌上搜索“ Facebook Face Recognition ”,第一页的前 10 个结果中,有 6 个是关于关闭人脸识别特性,这可以说明人们对这项技术的广泛质疑。

这项技术已经发展了好多年,在标准训练集上得分很高。不过,现实环境会带来一些特殊的挑战。例如,由于姿势的原因,一个人脸部的差别可能比不同人脸部的差别还要大。光照、表情、年龄和眼镜、帽子等遮挡物的差异也会妨碍识别。我们并不是总能获得主体的正面照,使用其他角度的照片会让处理过程增加额外的校准步骤。英国大都会警察局最近在节日期间使用人脸识别的情况就可以说明在现场人群中推广实验室实验还存在困难,超过95% 的匹配都是误报

可靠起见,人脸识别需要大型的训练数据集和强大的匹配模型。谷歌和Facebook 利用人们上传到其平台的照片构造了大型的专有数据集。也有开源的大型数据集可供使用。Wild 中的 Labeled Faces (LFW)于 2007 年发布,其中包含 6000 人的 13000 张正面图像。 MS-Celeb-1M 是当前最大的名人人脸识别公共数据集,其中包含 10K 名顶级知名人士的 10M 图像,而 MegaFace 的训练集中包含 670K 不同个体的 4.7M 照片和 1M 的干扰项。

一般来说,人脸识别分为三个步骤:定位、标准化和识别。系统首先会定位图像中的人脸并探明轮廓。标准化是调整原始照片,使它接近于正面版本。然后,人脸识别模块会作用于这些经过重定位的人脸。标准化步骤有一种变体,为了模拟不同的姿势,它会通过生成正面照的多种表示来扩大目标空间。从 2D 图像重构出3D 模型,生成姿势的各种变化,然后重新投射到各种2D 的变化,就是这种增强技术的一个例子。

从90 年代开始,人脸识别就已经不再以手工创建的局部特征为基础,而是转而使用深度学习模型。Facebook 的 Deepface 模型是在 LFW 数据集上训练的,这是第一个达到人类效率的模型。经典的卷积神经网络(CNN)和架构,如 AlexNet VGGNet GoogleNet ResNet ,被广泛地用作人脸识别的基线模型。后来,这些模型被用于专门为促进识别和泛化而设计有激活函数和损失函数的人脸识别。 Face++ MegaFace FaceNet 是其他一些专门设计用来人脸识别的神经网络模型

当前,人脸识别面临的挑战包括实现不同姿势、不同年龄人脸变体识别的健壮性、使用“照片简图(photo-sketches)”代替真正的照片、处理低分辨率照片、识别遮挡、彩妆及欺骗技术。

查看英文原文: The Lowdown on Face Recognition Technology

2018 年 6 月 13 日 03:398440
用户头像

发布了 1008 篇内容, 共 314.4 次阅读, 收获喜欢 283 次。

关注

欲了解 AWS 的更多信息,请访问【AWS 技术专区】

评论

发布
暂无评论
发现更多内容

2020第十三届南京国际智慧工地装备展览会

InfoQ_caf7dbb9aa8a

2020第十三届南京国际大数据产业博览会

InfoQ_caf7dbb9aa8a

MySQL-技术专题-实战技巧

李浩宇/Alex

讲一讲我所认为的「人生三最」,你或许能够参悟到什么

非著名程序员

程序员 个人成长 时间管理 精力管理

2020第十三届南京国际智慧新零售暨无人售货展览会

InfoQ_caf7dbb9aa8a

从戚家军看组织战斗力塑造(组织的六脉神剑)

异想的芦苇

组织

数字货币交易所系统开发源码,交易平台搭建

WX13823153201

数字货币交易所系统开发

典型的大型互联网应用系统的技术方案和手段

2020第十三届(南京)智慧城市技术与应用产品展览会

InfoQ_caf7dbb9aa8a

MySQL-技术专题-Join语法以及性能优化

李浩宇/Alex

2020第十三届南京国际智慧停车展览会

InfoQ_caf7dbb9aa8a

技术革新的脉络及趋势

异想的芦苇

技术 进步

轻言业务架构图

异想的芦苇

架构 企业架构 架构设计 架构设计原则 业务架构

“三段三域法”应用架构模型

异想的芦苇

架构 架构设计 技术架构

手把手教你锤面试官 04——假装精通redis

慵懒的土拨鼠

什么是 Kubeless?| 玩转 Kubeless

donghui

Kubernetes kubeless

MySQL-技术专题-SQL性能分析

李浩宇/Alex

LeetCode题解:104. 二叉树的最大深度,递归,JavaScript,详细注释

Lee Chen

LeetCode 前端进阶训练营

全屋智能2020第十三届(南京)国际智能家居展览会

InfoQ_caf7dbb9aa8a

2020南京国际工业互联网及工业通讯展览会

InfoQ_caf7dbb9aa8a

2020南京国际人工智能产品展览会

InfoQ_caf7dbb9aa8a

人工智能

架构方法论之“极限审视法”

异想的芦苇

架构 方法论 设计思维

快讯2020第十三届亚洲国际物联网展览会-南京站

InfoQ_caf7dbb9aa8a

架构师训练营第 1 期 - 第四周学习总结

Anyou Liu

极客大学架构师训练营

20年开源老司机手把手教你玩开源——openEuler入门指南

openEuler

Linux 开源 系统操作

Java 客户端操作 FastDFS 实现文件上传下载替换删除

哈喽沃德先生

Java 文件系统 分布式文件存储 fastdfs 文件服务器

我就不服了,看完这篇文章,5大常见消息队列开发你还学不会

小Q

Java 编程 程序员 开发 消息队列

java安全编码指南之:lock和同步的正确使用

程序那些事

java安全编码 java安全 java安全编码指南 java编码

坚持写技术博客一年能有多少收获!

小傅哥

Java 面试题 架构师 编程经验 技术博客

高难度对话读书笔记——目的篇

wo是一棵草

架构师训练营第一期 - 第四周课后 - 作业二

极客大学架构师训练营

2021年全国大学生计算机系统能力大赛操作系统设计赛 技术报告会

2021年全国大学生计算机系统能力大赛操作系统设计赛 技术报告会

人脸识别技术的真相-InfoQ