写点什么

滴滴 AI Labs 包揽 WIDER FACE 评测五项世界第一

  • 2019-09-17
  • 本文字数:1292 字

    阅读完需:约 4 分钟

滴滴 AI Labs 包揽 WIDER FACE 评测五项世界第一

近日,世界最权威的人脸检测公开评测集 WIDER FACE 公布最新评测结果,滴滴 AI Labs 团队联合北京邮电大学 PRIS 团队提出的人脸检测 DFS 算法,在 WIDER FACE 的 Easy、Medium 和 Hard 三个评测子集的六项评估结果中, 超过了国内外众多科技公司和高校院所,取得了五项第一、一项第二的好成绩,充分彰显了滴滴在人脸检测领域的创新能力。


WIDER FACE 是目前业界公开的数据规模最大、检测难度最高的人脸检测数据集之一,由香港中文大学于 2016 年建立,共包含 32,203 张图像和 393,703 个人脸标注。其中 40% 的数据为训练集 (Training),10% 的数据为验证集 (Validation),50% 的数据为测试集 (Testing)。每个集合中的数据根据人脸检测的难易程度分为 Easy、Medium、Hard。


由于汇集了人脸尺寸大小变化、拍照角度引起的人脸姿态变化、不同程度的人脸遮挡、表情变化、光照强弱差异以及化妆等多种影响因素,该数据集在全球人脸检测领域极具挑战性,每次评测均会吸引多家国内外科技巨头及高校院所(包含卡耐基梅隆大学、加州大学圣地亚哥分校、北航、浙大、京东、腾讯优图、百度、华为云、IBM 沃森研究院等)在这个数据集上验证了自己的算法效果。


最新评测结果显示,DFS 算法在 WIDER FACE 人脸检测平台中,在官方验证集和测试集的六项评估结果中取得五项第一、一项第二。


其中在 Easy、Medium 和 Hard 三个测试子集中,DFS 算法性能分别达到 96.3% AP,95.4% AP,90.7% AP。



图 1:验证集性能曲线图(图片来源)



图 2: 测试集性能曲线图(图片来源)


DFS 算法以卷积神经网络中的特征融合为切入点,为了防止高层特征图上的语义信息覆盖低层特征图上的细节信息,提出了特征融合金字塔(Feature Fusion Pyramid)结构,其以空间和通道注意力机制的方式融合高低层特征,在不失细节信息的同时将语义信息作为上下文线索(contextual cues)增强低层特征。


另外,DFS 算法提出了一种辅助训练单阶段检测器的语义分割分支(Semantic Segmentation branch),促使检测网络以一种自监督的方式实现注意力机制以及学到更好的特征。具体地说,DFS 算法独特的语义分割分支分层地利用更强的语义分割监督信息监督训练网络,使得用于预测人脸的各级特征图专注于各自最适宜检测到的不同尺寸的人脸。



图 3: DFS 算法网络框架图


目前人脸检测和识别技术已经在滴滴平台广泛使用,用于司机人不符检测、行程中车内录像时的乘客隐私保护等场景,并已形成成熟的技术解决方案,帮助外部合作伙伴进一步提高效率。


实际上,滴滴已经多次在图像视频领域相关竞赛或评测中获得世界级第一。在去年 7 月的 CVPR 2018 WAD 自动驾驶挑战赛中,揽获了二、三、四名的好成绩;而在去年 9 月 ECCV 2018 COCO & Mapillary 挑战赛中,滴滴技术团队首次参赛即获得 Mapillary 街景检测单项世界第一。


此次人脸检测技术再破世界纪录,也充分体现了滴滴在计算机视觉领域强大技术实力,滴滴将持续进行更多探索,不断优化出行交通感知理解、智能交互等技术,用先进的 AI 技术提升用户体验、助力行业转型升级,进而构建智能出行新生态。


本文转载自公众号滴滴技术(ID:didi_tech)。


原文链接:


https://mp.weixin.qq.com/s/shV1caOr9KnaG3Ct-GwE6Q


2019-09-17 15:011022
用户头像

发布了 52 篇内容, 共 26.9 次阅读, 收获喜欢 169 次。

关注

评论

发布
暂无评论
发现更多内容

OPPO小布助手算法系统探索、实践与思考

安第斯智能云

算法

10个Node.js 开发人员必须使用的IDE

编程江湖

node.js

面试被问一致性hash?看这一篇就够了

公众号:程序猿成神之路

【转】java开发之spring面试题

@零度

JAVA开发 spring框架

大数据开发Hive之如何进行数据抽样

@零度

大数据 hive

技术揭秘!百度搜索中台低代码的探索与实践

百度Geek说

中台 后端 低代码 搜索

带你熟悉鸿蒙轻内核Kconfig使用指南

华为云开发者联盟

Python 鸿蒙 LiteOS-M Kconfig kconfiglib

云原生时代,需要什么样的数据库?

博文视点Broadview

版本不兼容Jar包冲突该如何是好?

vivo互联网技术

jar Java 开发

SpringBoot应用和PostgreSQL数据库部署到Kubernetes上的一个例子

汪子熙

Kubernetes k8s 28天写作 docker build 12月日更

Arctic:网易数帆开放式流批一体表服务 | BDTC 精彩回顾

网易数帆

大数据 数据湖 iceberg 流批一体 Arctic

给弟弟的信第26封|做一个懂得感恩的人

大菠萝

28天写作

一文带你了解数据库连接池的必要性

编程江湖

数据库 JAVA开发

PassJava 开源 (九) :Spring Cloud 整合 Gateway 网关

悟空聊架构

SpringCloud Gateway passjava 悟空聊架构

Jira Software 年度总结:12个重要功能大放送!

Atlassian

DevOps 敏捷 Atlassian Jira ITSM

初探语音识别ASR算法

华为云开发者联盟

算法 语音识别 ASR 语音转写文章 声学模型

最强最全面的大数据SQL系列

五分钟学大数据

sql 大数据 hive

网络安全好学吗?网络安全入门篇,安装渗透测试系统kali全套教学

学神来啦

运维 网络安全 渗透测试· kali基础 kali Linux

华为与湖北三所高校共建首批鲲鹏&昇腾产教融合育人基地

科技热闻

滴滴数据通道服务演进之路

Kafka中文社区

饿了么资深架构师分享云上基础架构演进

阿里云弹性计算

云上架构 运维峰会

共筑AI开源繁荣生态 | 新一代人工智能院士高峰论坛深度学习框架分论坛成功举办

OpenI启智社区

PingCAP x 亚马逊云科技,为 TiDB 云端体验“加冕”

PingCAP

Soul运维总监尤首智:企业如何从0到1建设云上运维体系

阿里云弹性计算

阿里云 云上架构 运维峰会

kafka丢失和重复消费数据

编程江湖

大数据 kafka

智算未来 | 2021新一代人工智能院士高峰论坛智算网络分论坛成功举办

OpenI启智社区

Golang协程之了解管道的缓存能力

恒生LIGHT云社区

Go golang

迭代你好,我是冲刺

华为云开发者联盟

Scrum 开发 迭代 冲刺 迭代增量开发

确保关键基础设施精确授时与同步的弹性、冗余和安全性

科技热闻

行业分析| AR远程协助-企业的好帮手

anyRTC开发者

音视频 远程协助 远程医疗 远程培训

教你Python字符串的基本操作:拆分和连接

华为云开发者联盟

Python 连接 字符串 拆分 拆分字符串

滴滴 AI Labs 包揽 WIDER FACE 评测五项世界第一_AI&大模型_滴滴技术_InfoQ精选文章