写点什么

滴滴 AI Labs 包揽 WIDER FACE 评测五项世界第一

  • 2019-09-17
  • 本文字数:1292 字

    阅读完需:约 4 分钟

滴滴 AI Labs 包揽 WIDER FACE 评测五项世界第一

近日,世界最权威的人脸检测公开评测集 WIDER FACE 公布最新评测结果,滴滴 AI Labs 团队联合北京邮电大学 PRIS 团队提出的人脸检测 DFS 算法,在 WIDER FACE 的 Easy、Medium 和 Hard 三个评测子集的六项评估结果中, 超过了国内外众多科技公司和高校院所,取得了五项第一、一项第二的好成绩,充分彰显了滴滴在人脸检测领域的创新能力。


WIDER FACE 是目前业界公开的数据规模最大、检测难度最高的人脸检测数据集之一,由香港中文大学于 2016 年建立,共包含 32,203 张图像和 393,703 个人脸标注。其中 40% 的数据为训练集 (Training),10% 的数据为验证集 (Validation),50% 的数据为测试集 (Testing)。每个集合中的数据根据人脸检测的难易程度分为 Easy、Medium、Hard。


由于汇集了人脸尺寸大小变化、拍照角度引起的人脸姿态变化、不同程度的人脸遮挡、表情变化、光照强弱差异以及化妆等多种影响因素,该数据集在全球人脸检测领域极具挑战性,每次评测均会吸引多家国内外科技巨头及高校院所(包含卡耐基梅隆大学、加州大学圣地亚哥分校、北航、浙大、京东、腾讯优图、百度、华为云、IBM 沃森研究院等)在这个数据集上验证了自己的算法效果。


最新评测结果显示,DFS 算法在 WIDER FACE 人脸检测平台中,在官方验证集和测试集的六项评估结果中取得五项第一、一项第二。


其中在 Easy、Medium 和 Hard 三个测试子集中,DFS 算法性能分别达到 96.3% AP,95.4% AP,90.7% AP。



图 1:验证集性能曲线图(图片来源)



图 2: 测试集性能曲线图(图片来源)


DFS 算法以卷积神经网络中的特征融合为切入点,为了防止高层特征图上的语义信息覆盖低层特征图上的细节信息,提出了特征融合金字塔(Feature Fusion Pyramid)结构,其以空间和通道注意力机制的方式融合高低层特征,在不失细节信息的同时将语义信息作为上下文线索(contextual cues)增强低层特征。


另外,DFS 算法提出了一种辅助训练单阶段检测器的语义分割分支(Semantic Segmentation branch),促使检测网络以一种自监督的方式实现注意力机制以及学到更好的特征。具体地说,DFS 算法独特的语义分割分支分层地利用更强的语义分割监督信息监督训练网络,使得用于预测人脸的各级特征图专注于各自最适宜检测到的不同尺寸的人脸。



图 3: DFS 算法网络框架图


目前人脸检测和识别技术已经在滴滴平台广泛使用,用于司机人不符检测、行程中车内录像时的乘客隐私保护等场景,并已形成成熟的技术解决方案,帮助外部合作伙伴进一步提高效率。


实际上,滴滴已经多次在图像视频领域相关竞赛或评测中获得世界级第一。在去年 7 月的 CVPR 2018 WAD 自动驾驶挑战赛中,揽获了二、三、四名的好成绩;而在去年 9 月 ECCV 2018 COCO & Mapillary 挑战赛中,滴滴技术团队首次参赛即获得 Mapillary 街景检测单项世界第一。


此次人脸检测技术再破世界纪录,也充分体现了滴滴在计算机视觉领域强大技术实力,滴滴将持续进行更多探索,不断优化出行交通感知理解、智能交互等技术,用先进的 AI 技术提升用户体验、助力行业转型升级,进而构建智能出行新生态。


本文转载自公众号滴滴技术(ID:didi_tech)。


原文链接:


https://mp.weixin.qq.com/s/shV1caOr9KnaG3Ct-GwE6Q


2019-09-17 15:011041
用户头像

发布了 52 篇内容, 共 27.2 次阅读, 收获喜欢 169 次。

关注

评论

发布
暂无评论
发现更多内容

透视星环科技上市:基础工具、技术融合、场景应用三维击穿

易观分析

数据

Java中只有8大数据类型吗?看了本文,你会收获颇丰

wljslmz

Java 数据类型 9月月更

九月书单

图灵教育

科普 计算机 新书

2022年中国HR SaaS行业洞察

易观分析

HR SaaS

Spring Security 介绍中的 servlet 和 reactive

HoneyMoose

也谈“我们开发者根本不想做运维!”

愚夫一得

DevOps 语言 & 开发 文化 & 方法 技术中台 运维‘

leetcode 226. Invert Binary Tree 翻转二叉树(简单)

okokabcd

LeetCode 数据结构与算法

【编程实践】利用Python看看那些QQ好友都在QQ空间发了啥

迷彩

词云图 selenium Python爬虫 9月月更 结巴分词

VolareFinance 测试网教程(更新)

鳄鱼视界

VUE 数据分页

HoneyMoose

联通研究院霍龙社博士深度解析“AI项目到底适不适合开源”

OpenI启智社区

人工智能 OpenI启智社区 AI开源 CubeAI智立方

云渲染比自己的电脑好用太多,这4个因素要考虑

Finovy Cloud

人工智能 云计算 渲染 云渲染

【kafka异常】使用Spring-kafka遇到的坑

石臻臻的杂货铺

Kafk 9月月更

APISIX是怎么跑起来的

geange

lua api 网关 APISIX 网关 APISIX的源码解析

OptaPlanner快速入门-helloworld

积木编程

2022-09-29:在第 1 天,有一个人发现了一个秘密。 给你一个整数 delay ,表示每个人会在发现秘密后的 delay 天之后, 每天 给一个新的人 分享 秘密。 同时给你一个整数 forg

福大大架构师每日一题

算法 rust 福大大

物联网平台常见问题与答案汇总

阿里云AIoT

数据 物联网平台 物联网 协议 mqtt

Java中synchronized关键字到底怎么用,这个例子一定要看!

wljslmz

Java synchronized 9月月更

还不了解堆栈和队列吗?数据结构最基础、最重要的概念必须掌握!

wljslmz

数据结构 堆栈 队列 9月月更

【云原生 | 从零开始学Kubernetes】十三、k8s的容器探测以及启动探测

泡泡

云计算 容器 云原生 k8s 9月月更

Python之如何判断闰年

芯动大师

9月月更 判断闰年 format格式化字符串

数据结构第六章查找,期末不挂科指南

梦想橡皮擦

数据结构 9月月更

九月书单

图灵社区

科普 计算机 新书

React 新提案 useEvent 已死?不,它将涅盘重生。

清秋

React useEvent RFC 提案

Python应用之九九乘法表

芯动大师

9月月更 九九乘法表的实现 变量和循坏的应用

Python应用之求100以内的奇数和

芯动大师

9月月更 变量和循坏的应用 递归求和

数据结构第五章图,期末不挂科指南

梦想橡皮擦

9月月更

【web 开发基础】php 开发基础快速入门 (4)-PHP常量详解

迷彩

php 常量 9月月更 魔术常量

万字详文,剖析企业数字化的降“本”增效

阿里技术

数字化 降本增效

【web 开发基础】php 开发基础快速入门 (3)-PHP程序符号标记和程序注释的使用及空白符详解

迷彩

php开源 9月月更 web开发基础

数据结构第七章排序,期末不挂科指南

梦想橡皮擦

数据结构 9月月更

滴滴 AI Labs 包揽 WIDER FACE 评测五项世界第一_AI&大模型_滴滴技术_InfoQ精选文章