AICon 上海站|90%日程已就绪,解锁Al未来! 了解详情
写点什么

滴滴 AI Labs 包揽 WIDER FACE 评测五项世界第一

  • 2019-09-17
  • 本文字数:1292 字

    阅读完需:约 4 分钟

滴滴 AI Labs 包揽 WIDER FACE 评测五项世界第一

近日,世界最权威的人脸检测公开评测集 WIDER FACE 公布最新评测结果,滴滴 AI Labs 团队联合北京邮电大学 PRIS 团队提出的人脸检测 DFS 算法,在 WIDER FACE 的 Easy、Medium 和 Hard 三个评测子集的六项评估结果中, 超过了国内外众多科技公司和高校院所,取得了五项第一、一项第二的好成绩,充分彰显了滴滴在人脸检测领域的创新能力。


WIDER FACE 是目前业界公开的数据规模最大、检测难度最高的人脸检测数据集之一,由香港中文大学于 2016 年建立,共包含 32,203 张图像和 393,703 个人脸标注。其中 40% 的数据为训练集 (Training),10% 的数据为验证集 (Validation),50% 的数据为测试集 (Testing)。每个集合中的数据根据人脸检测的难易程度分为 Easy、Medium、Hard。


由于汇集了人脸尺寸大小变化、拍照角度引起的人脸姿态变化、不同程度的人脸遮挡、表情变化、光照强弱差异以及化妆等多种影响因素,该数据集在全球人脸检测领域极具挑战性,每次评测均会吸引多家国内外科技巨头及高校院所(包含卡耐基梅隆大学、加州大学圣地亚哥分校、北航、浙大、京东、腾讯优图、百度、华为云、IBM 沃森研究院等)在这个数据集上验证了自己的算法效果。


最新评测结果显示,DFS 算法在 WIDER FACE 人脸检测平台中,在官方验证集和测试集的六项评估结果中取得五项第一、一项第二。


其中在 Easy、Medium 和 Hard 三个测试子集中,DFS 算法性能分别达到 96.3% AP,95.4% AP,90.7% AP。



图 1:验证集性能曲线图(图片来源)



图 2: 测试集性能曲线图(图片来源)


DFS 算法以卷积神经网络中的特征融合为切入点,为了防止高层特征图上的语义信息覆盖低层特征图上的细节信息,提出了特征融合金字塔(Feature Fusion Pyramid)结构,其以空间和通道注意力机制的方式融合高低层特征,在不失细节信息的同时将语义信息作为上下文线索(contextual cues)增强低层特征。


另外,DFS 算法提出了一种辅助训练单阶段检测器的语义分割分支(Semantic Segmentation branch),促使检测网络以一种自监督的方式实现注意力机制以及学到更好的特征。具体地说,DFS 算法独特的语义分割分支分层地利用更强的语义分割监督信息监督训练网络,使得用于预测人脸的各级特征图专注于各自最适宜检测到的不同尺寸的人脸。



图 3: DFS 算法网络框架图


目前人脸检测和识别技术已经在滴滴平台广泛使用,用于司机人不符检测、行程中车内录像时的乘客隐私保护等场景,并已形成成熟的技术解决方案,帮助外部合作伙伴进一步提高效率。


实际上,滴滴已经多次在图像视频领域相关竞赛或评测中获得世界级第一。在去年 7 月的 CVPR 2018 WAD 自动驾驶挑战赛中,揽获了二、三、四名的好成绩;而在去年 9 月 ECCV 2018 COCO & Mapillary 挑战赛中,滴滴技术团队首次参赛即获得 Mapillary 街景检测单项世界第一。


此次人脸检测技术再破世界纪录,也充分体现了滴滴在计算机视觉领域强大技术实力,滴滴将持续进行更多探索,不断优化出行交通感知理解、智能交互等技术,用先进的 AI 技术提升用户体验、助力行业转型升级,进而构建智能出行新生态。


本文转载自公众号滴滴技术(ID:didi_tech)。


原文链接:


https://mp.weixin.qq.com/s/shV1caOr9KnaG3Ct-GwE6Q


2019-09-17 15:01968
用户头像

发布了 52 篇内容, 共 20.1 次阅读, 收获喜欢 169 次。

关注

评论

发布
暂无评论
发现更多内容

Zookeeper安装与基础命令操作

石臻臻的杂货铺

zookeeper 11月月更

PCB焊接出问题了,是PCB工程师的锅吗?

华秋PCB

PCB PCB设计 焊接

微服务平滑迁移上云最佳实践

阿里巴巴云原生

阿里云 微服务 云原生

Fruity Loops Studio2023最新版水果编曲软件下载

茶色酒

Fruity Loops Studio

「美团」Java岗150道面试题:集合+JVM+设计模式+spring+Redis等

钟奕礼

Java java程序员 java面试 java编程

静态WEB容器镜像最小化实践

mengzyou

DevOps Web Docker 镜像

Nacos 中的配置文件如何实现加密传输

小小怪下士

Java 程序员 微服务 SpringCloud

2020最新阿里P7岗面试真题、简历模板,搞懂吊打面试官不是问题

钟奕礼

Java Java 面试 java程序员 java编程

IDC 2022上半年中国IT安全软件市场15.1亿美元,行云管家为企业信息安全持续赋能

行云管家

信息安全 数据安全 企业安全

行业首个测试开发技术大赛开始报名啦~ 10万现金奖励等你来挑战

测试人

软件测试 自动化测试 测试开发 测试比赛

浅析分布式事务的底层实现模型

移动云大数据

Java面试读这一篇就够了:100个互联网大厂Java面试真题整理

钟奕礼

Java Java 面试 java程序员 java编程

Rancher 全球化部署最佳实践

Rancher

Kubernetes k8s rancher

Camtasia2023如下免费下载?有啥新功能

茶色酒

Camtasia Camtasia2023

JAVA面试基础经典百问,拿下大厂offer

钟奕礼

Java java程序员 java面试 java编程

5年Java开发4面阿里挂在JVM,临走时面试官给了我一份JVM手册

钟奕礼

Java java程序员 java面试 java编程

深度学习框架新手快速上手指南

MegEngineBot

深度学习 开源 教程 MegEngine 新手入门

java的这些多线程面试专题,你都知道吗?

钟奕礼

Java 程序员 java面试 java编程

万级并发分布式全链路压测工具 autotest 实践

车江毅

自动化测试 全链路测试 性能压测 生产环境全链路压测

Java 反射 (二) Class类

浅辄

Java 反射 11月月更

剖析一下"抢茅台"脚本底层逻辑

京东科技开发者

接口 后端 脚本 风险识别 风险控制

我服了,阿里挖过来的leader连垃圾回收都说不清楚

钟奕礼

Java java程序员 java面试 java编程

ITSM | 企业如何管理变更、响应事件以及创立知识库——专访龙智技术专家与顾问

龙智—DevSecOps解决方案

BI工具中哪一种使用体验更好?

夏日星河

2022 Java 企业面试题汇总

钟奕礼

Java java程序员 java面试 java编程

现在啥软件都有开源,BI 呢?

陈橘又青

数据库

影响LED显示屏使用的因素有哪些?

Dylan

LED显示屏 led显示屏厂家

深圳等级保护测评机构新名单看这里!

行云管家

等保 深圳 等级保护 等级保护机构

什么是组织孤岛?它会带来哪些影响?可以这样去对付它

Baklib

CleanMyMac2023体验版苹果电脑管家

茶色酒

CleanMyMac CleanMyMac2023

2022年秋招成功斩获offer秘籍:九大核心知识+1000道大厂面试真题

程序知音

Java java面试 大厂面试 java架构 Java面试八股文

滴滴 AI Labs 包揽 WIDER FACE 评测五项世界第一_AI&大模型_滴滴技术_InfoQ精选文章