写点什么

百度飞桨 PaddleCV 全景图曝光 视觉技术能力三方面重磅更新

2020 年 3 月 25 日

百度飞桨PaddleCV全景图曝光 视觉技术能力三方面重磅更新

2020 年,“新基建”正给中国科技发展带来新的重大机遇,人工智能基础设施面临全面升级。深度学习框架正是推动产业智能化进阶的重要基础设施。近日,深度学习开源平台——百度飞桨,在智能视觉领域实现多项能力升级。


此次,PaddleCV 最新全景图首度曝光。其中,PaddleDetection、PaddleSeg、PaddleSlim 和 Paddle Lite 重磅升级;全新发布 3D 视觉和 PLSC 超大规模分类 2 项能力。同时,PaddleCV 新增了 15 个在产业实践中广泛应用的算法,整体高质量算法数量达到 73 个;35 个高精度预训练模型,总数达到 203 个。



PaddleCV 全景图


如全景图所示,PaddleCV 主要从三方面更新核心技术能力:


第一,核心技术能力升级,基于产业实践真实场景打磨,多场景视觉任务上模型准确率全面提升。


PaddleDetection 模块种类与性能全面提升,YOLOv3 大幅增强,精度提升 4.3%,训练提速 40%,推理提速 21%;人脸检测模型 BlazeFace 新增 NAS 版本,体积压缩 3 倍,推理速度提速 122%;新增 IoU 损失函数类型,精度再提升 1%,不增加预测耗时。在模型方面,新增 3 个类型,基于 COCO 数据集的精度最高开源模型 CBNet,高达 53.3%;Libra-RCNN 模型精度提升 2%;Open Images V5 成为目标检测比赛最佳单模型。


PaddleSeg 新增基于 HRNet 的高精度图像分割模型,其最大的特点是将图像在整个处理过程中保持高分辨率特征,这和大多数模型所使用的从高分辨率到低分辨率网络产生的低分辨率特征中恢复高分辨率特征有所不同。同时,获得实时语义分割模型 Fast-SCNN,它的最大特点是“小快灵”,即该模型在推理计算时仅需要较小的 FLOPs,就可以快速推理出一个不错的结果。



Fast-SCNN 网络结构图


PaddleCV 还新增了 3D 点云分类、分割和检测的 PointNet++和 PointRCNN 模型。PointNet++在 ModelNet40 数据集上,分类精度高达 90%;PointRCNN 在 KITTI(Car)的 Easy 数据子集上,检测精度高达 86.66%。和此前 PaddleCV 支持的数十种模型一样,基于飞桨框架,开发者无需全新开发代码,只要进行少量修改,就能快速在工业领域实现 3D 图像的分类、语义分割和目标检测任务。


图像分类新增预训练模型 SENet-vd、Res2Net、HRNet 系列模型。Res2Net 可以更细粒度表示多尺度特征,HRNet 全程都可以保持高分辨率。截至目前,飞桨图像分类模型包含了 ResNet、ResNet-vd、ResNet_ACNet、MobileNet、ShuffleNet、EfficientNet 等系列近 20 类图像分类算法,105 个预训练模型,也可供目标检测、图像分割等任务应用。其中,ResNet-vd 系列相比 ResNet 系列模型,在不增加推理耗时的情况下,精度提高 1%-2%,EfficientNet 推出了 small 版本,在 GPU 上速度提升 1.59 倍。


第二,PaddleCV 端到端能力大幅提升,打通了模型开发、训练、压缩、部署全流程,更好地服务于产业实践。


目标检测模型在实际部署时,由于耗时和内存占用,仍然存在很大挑战。基于此,PaddleSlim 提供了多种高效的模型压缩方法,助推 PaddleDetection 性能到达全新高度。使用蒸馏模型压缩方案可提升验证精度 2%;裁剪模型压缩方案大幅降低 FLOPs;蒸馏+裁剪模型压缩方案,基于 COCO 数据集进行测试,可以加速 2.3 倍。此外,PaddleDetection 还为开发者提供了从训练到部署的端到端流程,并提供一个跨平台的图像检测模型的 C++预测部署方案。


跟目标检测模型类似,语义分割模型在实际部署时也会面临耗时、内存占用的挑战。PaddleSlim 为 PaddleSeg 提供了多种分割模型的压缩方案,FLOPs 减少 51%,提升部署成功率。


针对超大规模人脸识别等应用挑战,正式发布 PLSC 超大规模分类工具。一方面,通过多机分布式训练可以将全连接层参数切分到更多的 GPU 卡,从而支持千万类别分类,并且飞桨大规模分类库在理论上可支持分类类别数随着使用 GPU 卡数的增加而增加。另一方面,PLSC 的训练精度和效率高,在多个数据集上得 SOTA 的训练精度,同时支持混合精度训练,单机 8 张 Nvidia Tesla v100 GPU 配置下混合精度训练速度提升 42%。PLSC 让开发者通过五行代码即可实现千万类别分类网络的构建和训练,提供大规模分类任务从训练到部署的全流程解决方案。同时,支持训练 GPU 卡数的动态调整、Base64 格式图像数据预处理。


PaddleCV 与飞桨分布式训练能力全面结合,对于人脸识别等广泛的场景应用提供了推动作用。3 月初,百度开源的“戴口罩人脸识别算法”中,即通过 PLSC 实现了快速对数百万 ID 的训练数据进行训练;同时采用飞桨模型压缩库 PaddleSlim 进行模型搜索与压缩,产出了高性能的人脸识别模型;最后基于 Paddle Lite,实现了云端和移动端的快速部署。


第三,PaddleCV 全面打通了模型算法、开发框架和 AI 芯片,实现软硬一体化。


首先,PaddleCV 基于 Paddle Lite 多硬件支持能力的优势,与昆仑芯片进行深度联合优化,实现端到端软硬一体能力的完全领先和自主可控。以制造业为例,百度与微亿智造联合打造了智能自动化监测设备“表面缺陷视觉检测设备”,区别于传统人工肉眼检查电子零件的方式,既保障质检环节的检查质量与效率,也进一步缓解了由于疫情原因造成的人力缺乏问题。


此次合作,借由百度昆仑芯片、百度智能云的加持,以及基于百度飞桨深度学习平台的目标检测模型,微亿构建完成了一个从智能硬件到算法软件再到算力供给的智能制造解决方案大闭环,具备了端到端软硬一体能力,实现了完全的自主可控。此外,在央视《新闻联播》2 月 10 日报道中还提到,江苏常州的精研科技借助“表面缺陷视觉检测设备”,解决了工人无法复工情况下的生产难题,在精研科技的精密零部件制造车间,十台无人值守的智能化检测设备 24 小时工作,比人工检测效率提升近 10 倍。



百度与微亿智造打造的工业智能质检设备


PaddleCV 的重磅升级,飞桨为视觉领域提供了更为强大且应用广泛的工具,加速不同产业的 AI 落地。除了在视觉领域,飞桨也形成了语音、视觉、NLP 等全方位的能力体系。飞桨还充分发挥全硬件平台能力的优势,与昆仑芯片深度融合优化,打造技术领先、自主可控的软硬一体技术平台。


目前,飞桨已累计服务 150 多万开发者,帮助 6.5 万企业用户,作为百度大脑的坚实底座,在很多领域发挥着实实在在的作用。


2020 年 3 月 25 日 08:00485

评论

发布
暂无评论
发现更多内容

NVidia-Docker2 性能优化

薛磊

Docker gpu nvidia container

中台之路,从平台到中台的思考与实践(二)

孤岛旭日

架构 中台 企业中台 企业架构

Kylin 实时流处理技术探秘.笔记

迹_Jason

大数据

ELF文件格式

韩超

ArrayList、LinkedList 你真的了解吗?

Damon

Java

苏宁云商向江旭:是时候让技术成为新司机了!

TGO鲲鹏会

开源这件事儿,越来越“声势浩大”了

赵钰莹

Apache GitHub 阿里巴巴 开源 腾讯

服务降级的常见套路

松花皮蛋me

Java

redis数据结构介绍-第一部分 SDS,链表,字典

Nick

redis 源码 数据结构 源码分析 算法

字节跳动的增长密码

池建强

字节跳动 张一鸣

中台之路,从平台到中台的思考与实践(一)

孤岛旭日

架构 中台 企业中台 企业架构

聊聊分心这件事

Jackey

从西游到武侠——确定性与不确定性

伯薇

个人成长 管理 确定性 不确定性

Doris 一种实时多维分析的解决方案

迹_Jason

大数据

面试官,不要再问我三次握手和四次挥手

猿人谷

面试 TCP 三次握手 四次挥手

Gitlab CI/CD 中的 Cache 机制

Chong

DevOps gitlab cicd

Linux的proc文件系统编程

韩超

我使用了哪些生产力工具?

ikook

效率工具 软件 Alfred Notion 推荐

特定系统的Linux的构建

韩超

自动驾驶复苏在2020

陈思

人工智能 自动驾驶

NVidia Docker介绍

薛磊

Docker

3000w人民币的学费——我的决策反思

孤岛旭日

数据中台 架构 中台 企业中台 企业架构

[KubeFlow] MPI-Operator深度解读

薛磊

Docker gpu kubeflow Kubernetes

人间至味——苦瓜

三只猫

人生 美食 生活

Docker Swarm 踩坑

ikook

Docker Docker Swarm 技术 容器 踩坑

纯技术改造,技术如何驱动需求,我有话说

一叶而不知秋

项目管理 架构 技术

基于RocketMQ实现分布式事务 - 完整示例

清幽之地

Java 分布式事务 RocketMQ 微服务

百度主任架构师谭待:打造非职权技术管理机制

TGO鲲鹏会

高手和普通人的差距,不看不知道,一看吓一跳

熊斌

学习

程序员通过哪些方式来赚钱?

一尘观世界

程序员 外包 自由职业 副业 赚钱

【JAVA】感受下JDK14的空指针提示

遇见

Java jdk jep

InfoQ 极客传媒开发者生态共创计划线上发布会

InfoQ 极客传媒开发者生态共创计划线上发布会

百度飞桨PaddleCV全景图曝光 视觉技术能力三方面重磅更新-InfoQ