NVIDIA 初创加速计划,免费加速您的创业启动 了解详情
写点什么

自动驾驶领域中的图像分割应用

  • 2019-10-15
  • 本文字数:1826 字

    阅读完需:约 6 分钟

自动驾驶领域中的图像分割应用


通勤是我们日常生活的一个重要组成部分,而其中包括的车辆驾驶问题一直是人工智能的热门话题。本文我们就谈谈自动驾驶中的图像分割应用,主要介绍了基于视觉系统的自动驾驶问题,并给出常见的三种模式。在此基础上,分析了应用于自动驾驶领域的一些图像分割方法和其对应的实验结果。

介绍

相对于机器人视觉而言,自动驾驶问题所需要输出的决策相对简单——速度和转角。当前,基于视觉的自动驾驶算法大致有如下图所示的三种模式:间接感知(MP)、行为反射(BR)和直接感知(DP)。



常见基于视觉的自动驾驶模式(图片来源于参考文献 1)


间接感知方法通常会利用多种与驾驶相关的目标来判断车辆所处的环境,比如指示线、路标、路灯、其他车辆、行人等统一的路况判断依据。基于这种方法的自动驾驶系统会在作出判断之前,考虑所有捕获到的信息,也就意味着所有的细节都会被考虑进去。尽管这样做看起来面面俱到,但是对于算法的要求很高,否则各种小细节的引入会增加决策的难度。


行为反射方法直接将传感器获取到的信息映射成驾驶行为。在训练过程中,自动驾驶系统记录沿途的图像和司机的操作转角作为训练数据。这种方法虽然简洁,但是要适应复杂的路况和因人而异的驾驶习惯,难度还是很大的。


直接感知方法是介于前两种方法之间,既非理解整个场景,也非完全不加分析地直接映射。这种方法只学习场景内的重要路况,比如车辆相对于路面的角度、车辆到指示线的距离,以及车辆距离当前车道内和相邻车道内其他车辆的距离。



直接感知方法示意图(图片来源于参考文献 1)


基于纯视觉图像分割的自动驾驶

基于图像分割方法实现自动驾驶的方式可以有很多。比如可以直接从图像入手,分析场景内所有或部分的语义信息,根据不同语义给出不同的反馈;也可以通过分割提取图像内的可解释信息,区分出可驾驶的路面和不可驾驶的路面,从而作出驾驶决策。


对基于纯视觉方法的自动驾驶分辨技术,图像分割的精度是决定自动驾驶效果的重要因素。为了提高图像分割的精度,除了有三 AI(公众号)《图像分割模型》专栏中介绍的常用模型及改进方式外,还可以利用不同类别标注间的关系来全局约束分割结果。


如下图所示,CMSMR 网络结构利用多标签共同学习、协同优化的方式,实现了高分辨率图像下的图像分割。



DMSMR 网络结构(图片来源于参考文献 2)



单条前向排序优化网络(图片来源于参考文献 2)


除了车载设备获取的路面信息外,这种方式也可以利用到遥感图像上。如下图所示,实现遥感图像下的道路分割不仅有助于车辆的自动驾驶,也有助于道路规划、交通疏导等宏观规划问题的解决。



自动驾驶相关遥感图片下的图像分割(图片来源于参考文献 2)


基于多传感器融合的自动驾驶

除了单纯利用车上的视觉系统外,也可以结合车上搭载的其他传感器,实现联合信息下的自动驾驶决策判断。


下图是结合雷达信息实现自动驾驶中道路分割的网络结构图。输入为 RGB 图像和激光雷达所获取的信息,经过特征提取和 RFU 模块融合,实现对道路的分割。



结合雷达的图像分割自动驾驶系统(图片来源于参考文献 3


下图为上图中橙色部分对应的 RFU 模块:



RFU 模块(图片来源于参考文献 3)


参考文献:


[1] C. Chen, A. Seffetc, A. Kornhauser, and J. Xiao. DeepDriving: Learning Affordance for Direct Perception in Autonomous Driving[C]. 2015.


[2] M. Zhang, X. Hu, L. Zhao, Y. Lv, M. Luo, and S. Pang. Learning Dual Multi-Scale Manifold Ranking for Semantic Segmentation of High-Resolution Images[J]. 2017


[3] H. Liu, Y. Yao, Z. Sun, X. Li, K. Jia, and Z. Tang. Road Segmentation with Image-LiDAR Data Fusion[J]. 2019


作者介绍


孙叔桥,公众号“有三 AI”作者。该公号聚焦于让大家能够系统性地完成 AI 各个领域所需的专业知识的学习。


原文链接


https://mp.weixin.qq.com/s/qlyj4H_qh6okNuZ6TKKDTw


公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2019-10-15 17:332939

评论

发布
暂无评论
发现更多内容

革故鼎新:企业数字化转型繁荣互联网生态建设,驱动ICT设施升级

科技热闻

推荐系统之数据与特征工程(二十三)

数据与智能

数据 推荐系统 技术特征

聊聊知乎订单系统迁移

知一

监控 软件开发 系统架构 重构 订单系统

开源商业化:满足各方底层需求

茶陵後

开源 开源社区 开源文化

2021,云原生避坑经验分享|CIC 阵容官宣

青云技术社区

容器 云原生

智能运维(AIOps)系列之一:个人对智能运维的理解

micklongen

AIOPS 智能运维

vue keep-alive(1):vue router如何保证页面回退页面不刷新?

zhoulujun

Vue vue-router keep-alive 页面缓存

【Flutter 专题】129 图解 ToggleButtons 按钮切换容器组

阿策小和尚

Flutter 小菜 0 基础学习 Flutter Android 小菜鸟 7月日更

提升中台化体系产研效能的ParisFlow方法与实践

downgoon

【源码系列】Spring 过滤器和拦截器

Alex🐒

spring 源码 Spring Framework

如何做好IT项目管理?

万事ONES

IT 项目经理 项目管理工具

构筑高质量的数据中心基础设施,华为助力创造互联网全新体验

科技热闻

5分钟速读之Rust权威指南(三十三)Send&Sync

wzx

rust

中层管理者的工作五步法

石云升

读书笔记 职场经验 管理经验 6月日更

vue keep-alive(2):剖析keep-alive的实现原理—学习笔记整理

zhoulujun

Vue vue源码解读 keep-alive实现原理

《面试补习》- Java集合知识梳理

九灵

Java 面试 集合

SQL 居然还能在 Apache ShardingSphere 上实现这些功能?

SphereEx

Linux之head命令

入门小站

Linux

在线图片转base64工具

入门小站

工具

Camtasia实用技巧之视频剪辑

淋雨

视频剪辑 Camtasia 录屏软件

Java的多线程和高并发详解

北游学Java

Java 多线程

漏洞都有哪些分类

网络安全学海

网络安全 信息安全 渗透测试 漏洞 漏洞分析

网络攻防学习笔记 Day60

穿过生命散发芬芳

网络攻防 6月日更

我们常说的算法时间复杂度和空间复杂度到底是什么?

编程三昧

编程 算法复杂度

【LeetCode】传递信息Java题解

Albert

算法 LeetCode 7月日更

中国大学MOOC Android 客户端开发提效之页面信息

有道技术团队

android 服务端 客户端

双碳打开新机遇 华为互联网数据中心基础设施筑起“绿色基石”

科技热闻

Rust从0到1-函数式编程-性能比较

rust 函数式编程 Performance 性能比较

华为云原生媒体网络,升级传统,赋能未来

华为云开发者联盟

云原生 直播 TechWave 媒体网络 云视频

智能技术与生物技术共同绘就生命“藏宝图”,对你我意味着什么?

脑极体

卢卡开专栏了

卢卡多多

数据库 MySQL 高可用 6月日更

自动驾驶领域中的图像分割应用_AI&大模型_孙叔桥_InfoQ精选文章