近十万字的腾讯云技术汇编来啦,即刻下载,获悉行业最新动向! 了解详情
写点什么

人脸识别技术的真相

  • 2018-06-13
  • 本文字数:2069 字

    阅读完需:约 7 分钟

人脸识别是机器学习的直接应用,这项技术已经被消费者、行业和执法机关广泛采用,它可能为我们的日常生活带来了便利,但也有严重的隐私问题。人脸识别已经超过了人类的工作效率,但是,在某些应用中实际实现时还存在问题。

立足于九十年代 MIT 的 Eigenfaces 方法,人脸识别第一次成功的大规模实现是 2014 年 Facebook 的 DeepFace 项目,准确性在实验室条件下达到了人类水平。从 2014 年开始,更大的训练数据集、GPU 以及神经网络架构的快速发展进一步提高了人脸识别在通向现实世界可靠应用的更为丰富的上下文中的效率。

人脸识别的应用可以分类两类:身份验证和识别。这两种场景起初都会把一组已知的主体注册到系统中(图库),在测试期间,提供一个新的主体(测试图像)。人脸验证会计算图库和测试图像之间一对一的相似性,从而确定两副图像是否是相同的主体。例如, iPhone X 基于人脸的登录功能或者机场的边境检查就是使用了这样的生物特征身份认证解决方案。目前, HSBC Ticketmaster 都考虑在他们的移动应用程序中使用人脸验证。另一方面,人脸识别计算一对多的相似性,从而在预先做好识别的人物图库中正确地识别出测试图像。它的主要应用是把未标记的照片和已知的资料进行匹配。其中,执法机关会使用这项技术从人群中识别出他们感兴趣的人。

人脸识别技术还可以用于推断人的特征和行为,如情绪、年龄或健康状况。斯坦福大学最近一项颇具争议的研究表明,基于一个从Tinder 抽取的数据集,使用人脸分析方法预测一个人的性取向时准确率可达81%。

全球人脸识别市场主要在消费品、工业应用和执法三个领域,据 Allied Market Research Report Buyer 介绍,到 2022 年,这个市场有望达到 90 亿美元。生物识别解决方案市场的主要参与者包括 Safran(FR) NEC Corporation(JA) Cognitec(DE) Face++(CH)

但是,人脸识别是一种不同于其他技术的生物识别工具。乔治敦隐私& 技术法律中心执行董事、人脸识别专家 Alvaro Bedoya 在近日接受 USA Today采访时说,“你可以删除cookies。你可以修改浏览器设置。你可以把手机忘家里,但你不能删除你的脸,你不能把它忘家里”。人脸识别是一种不需要同意的生物认证工具。

越来越多的公民自由和隐私协会指出人脸识别的使用存在违反公民自由和隐私的危险,包括 ACLU 人权观察电子前线基金会以及英国的老大哥观察。有40 家协会在一封给Amazon 的、有关人脸识别系统Rekognition 的邮件上签名,要求Amazon 不再允许政府使用 AWS Rekognition 。2016 年,作为 Amazon Web Services 云业务的一部分,Amazon 推出了 Rekognition 。Facebook 在加利福尼亚州也面临着一场根据生物信息隐私法案提起的针对其使用人脸识别的集体诉讼。在谷歌上搜索“ Facebook Face Recognition ”,第一页的前 10 个结果中,有 6 个是关于关闭人脸识别特性,这可以说明人们对这项技术的广泛质疑。

这项技术已经发展了好多年,在标准训练集上得分很高。不过,现实环境会带来一些特殊的挑战。例如,由于姿势的原因,一个人脸部的差别可能比不同人脸部的差别还要大。光照、表情、年龄和眼镜、帽子等遮挡物的差异也会妨碍识别。我们并不是总能获得主体的正面照,使用其他角度的照片会让处理过程增加额外的校准步骤。英国大都会警察局最近在节日期间使用人脸识别的情况就可以说明在现场人群中推广实验室实验还存在困难,超过95% 的匹配都是误报

可靠起见,人脸识别需要大型的训练数据集和强大的匹配模型。谷歌和Facebook 利用人们上传到其平台的照片构造了大型的专有数据集。也有开源的大型数据集可供使用。Wild 中的 Labeled Faces (LFW)于 2007 年发布,其中包含 6000 人的 13000 张正面图像。 MS-Celeb-1M 是当前最大的名人人脸识别公共数据集,其中包含 10K 名顶级知名人士的 10M 图像,而 MegaFace 的训练集中包含 670K 不同个体的 4.7M 照片和 1M 的干扰项。

一般来说,人脸识别分为三个步骤:定位、标准化和识别。系统首先会定位图像中的人脸并探明轮廓。标准化是调整原始照片,使它接近于正面版本。然后,人脸识别模块会作用于这些经过重定位的人脸。标准化步骤有一种变体,为了模拟不同的姿势,它会通过生成正面照的多种表示来扩大目标空间。从 2D 图像重构出3D 模型,生成姿势的各种变化,然后重新投射到各种2D 的变化,就是这种增强技术的一个例子。

从90 年代开始,人脸识别就已经不再以手工创建的局部特征为基础,而是转而使用深度学习模型。Facebook 的 Deepface 模型是在 LFW 数据集上训练的,这是第一个达到人类效率的模型。经典的卷积神经网络(CNN)和架构,如 AlexNet VGGNet GoogleNet ResNet ,被广泛地用作人脸识别的基线模型。后来,这些模型被用于专门为促进识别和泛化而设计有激活函数和损失函数的人脸识别。 Face++ MegaFace FaceNet 是其他一些专门设计用来人脸识别的神经网络模型

当前,人脸识别面临的挑战包括实现不同姿势、不同年龄人脸变体识别的健壮性、使用“照片简图(photo-sketches)”代替真正的照片、处理低分辨率照片、识别遮挡、彩妆及欺骗技术。

查看英文原文: The Lowdown on Face Recognition Technology

2018-06-13 03:399476
用户头像

发布了 1008 篇内容, 共 348.0 次阅读, 收获喜欢 330 次。

关注

评论

发布
暂无评论
发现更多内容

从观察者模式到Java事件处理机制(上)

老农小江

设计模式 java 编程 事件机制

超详细FL Studio水果2023新版更新功能讲解!80项更新与改进!

茶色酒

FL Studio FL Studio 21 FL Studio21

架构实战营模块一作业

周烨

ChatGPT中文版杀疯了,已登录AI模型市场

felix

ReactDOM.render在react源码中执行之后发生了什么?

flyzz177

React

设计原则 — 基于接口而非实现编程

Lemoon Can

面向对象设计原则 设计原则

架构实战模块一:架构图

小飞同学

#架构实战营

React源码解读之React Fiber

flyzz177

React

群晖DS218+做maven私服(nexus3)

程序员欣宸

maven 12月月更 群晖

从汽车之家效能平台建设看汽车行业研发数字化之路

之家技术

数字化 汽车 构架 效能度量 效能

API安全中的数据隐私保护步骤

穿过生命散发芬芳

API安全 12月月更

从观察者模式到Java事件处理机制(下)

老农小江

设计模式 java 编程 事件机制

React源码分析1-jsx转换及React.createElement

goClient1992

React

架构实战营(第10期)模块一作业

Geek_e5f2e5

React源码分析3-render阶段(穿插scheduler和reconciler)

goClient1992

React

React源码分析2-深入理解fiber

goClient1992

React

2022-12-07:删除重复的电子邮箱。删除重复数据后,id=3的数据被删除。请问sql语句如何写? DROP TABLE IF EXISTS `person`; CREATE TABLE `per

福大大架构师每日一题

数据库 福大大

FL Studio2023新版本功能爆料将引入4款全新插件!创作力UP!

茶色酒

FL Studio

架构实战营-模块1-作业

zealot0317

微信业务架构图 & 学生管理系统

chinandy

架构设计

模块七-王者荣耀商城异地多活架构设计

Geek_b35d92

商城 构架 王者荣耀

十大开源测试工具和框架

FunTester

模块一:课程作业

peter

#架构实战营

全面进化!Apache Doris 1.2.0 Release 版本正式发布|版本通告

SelectDB

数据库 大数据 开源 数据分析 Doris

FL Studio21正式版本发布更新附送85款主题下载

茶色酒

FL Studio 21 FL Studio21

ZBC登录iZUMi Finance双挖池APY高达189%,极致通缩的典范

石头财经

设计原则 — 多用组合,少用继承

Lemoon Can

面向对象设计原则 设计原则

王者荣耀商城异地多活设计

π

架构实战营-模块一作业

落叶挂云霄

Verilog 设计方法

向阳逐梦

流程 Verilog 设计方法

MySQL执行计划之explain详解

@下一站

程序 MySQL优化 dba 11月日更 11月月更

人脸识别技术的真相_安全_Alexis Perrier_InfoQ精选文章