2025上半年,最新 AI实践都在这!20+ 应用案例,任听一场议题就值回票价 了解详情
写点什么

L4 自动驾驶中感知系统遇到的挑战及解决方案

  • 2019-05-17
  • 本文字数:2794 字

    阅读完需:约 9 分钟

L4自动驾驶中感知系统遇到的挑战及解决方案

本次分享的大纲


  • Perception Introduction

  • Sensor Setup & Sensor Fusion

  • Perception Onboard System

  • Perception Technical Challenges

1. Perception Introduction

Perception 系统是以多种 sensor 的数据,以及高精度地图的信息作为输入,经过一系列的计算及处理,对自动驾驶车的周围的环境精确感知。能够为下游模块提供丰富的信息,包括障碍物的位置、形状、类别及速度信息,也包括对一些特殊场景的语义理解(包括施工区域,交通信号灯及交通路牌等)。


Perception 系统包括多个方面及子系统:


  1. 传感器:传感器的安装,视场角,探测距离,数据吞吐、标定精度,时间同步。因为用到的传感器比较多,时间同步的解决方案这里会起到非常重要的作用。

  2. 目标检测及分类:为了保证车辆百分百的安全,能够达到近似百分之百的召回率及非常高的准确率;这里会涉及到深度学习方面的工作,包括 3D 点云及 2D Image 上的物体检测及多传感器融合方面等。

  3. 多目标追踪:跟进多帧的信息计算并预测障碍物的运动轨迹。

  4. 场景理解,包括交通信号灯,路牌,施工区域,以及特殊类别,比如校车,警车。

  5. 机器学习分布式训练基础架构及相关的 Evaluation 评价系统。

  6. 数据:大量的标注数据,这里包括 3D 点云数据及 2D 的图片数据等。


目前传感器主要分为 3 个类别:


  1. Lidar 激光雷达;

  2. Camera 相机;

  3. Radar 毫米波雷达。




这张图相当于 Perception 物体检测的输出,能够检测车辆周围的障碍物,包括车辆、行人、自行车等,同时结合高精度地图,会对周边的 Background 信息进行输出。


图中绿颜色的是一辆车,橙色的是一辆摩托车,黄颜色的是一个行人,灰颜色是一些背景如植被信息。



结合多帧的信息,对运动的行人和车辆的速度,方向,进行精确的输出。

2. Sensor Setup & Sensor Fusion

以上是 Perception 系统从输入到输出的一个大概介绍。接下来总体介绍 Pony.ai 第三代车辆的传感器安装方案以及传感器融合的解决方案。


目前我们的整个传感器安装的解决方案,是能够覆盖 360 度,范围 200 米的感知距离。从不同传感器的安装,不同角度来看,首先用到了 3 个激光雷达,顶部和两侧。激光雷达有 100 米的感知距离。同时通过 4 个广角的摄像头来覆盖相机 360 度的视野。远处的视野通过前向的毫米波雷达以及长焦的相机,将感知距离扩到 200 米的范围。这套传感器配置能保证我们的自动驾驶车辆在居民区、商业区、工业区这样的场景进行自动驾驶。



18 年 9 月份世界人工智能大会上推出的第 3 代的传感器配置方案。



前边的相机两个广角,一个长焦。使得可以看到更远距离的信号灯的信息,两百米内红绿灯的状态。


上面介绍了整个传感器的安装方案。下面主要介绍下多传感器融合的解决方案。


第一个要解决的问题是把不同的传感器的数据标定到同一个坐标系里。包括相机的内参标定,Lidar 到相机的外参标定,雷达到 GPS 的外参标定。


传感器融合重要的前提是要能把标定精度提高到非常高的一个精度,不管是做结果层面的传感器融合,还是元数据层面的传感器融合,是一个必要的基础。



这张图可以看到,我们将 3D 的激光点云投射到影像上,可以看到传感器标定的精度还是挺高的。


整个标定的工作基本上已经做到完全自动化的方式。不同传感器标定的方案:



首先是相机内参的标定,内参的标定平台对每一个相机能够在两到三分钟之内做到传感器的标定。



这个图是相机到激光雷达的外参标定,激光雷达是 360 度旋转的方式,每旋转一周是 100 毫秒。相机是某一瞬时曝光的问题,所以涉及到时间同步的一个方式,通过 Lidar 来触发相机曝光。比如说我们有 4 个相机,能够通过激光雷达去保证时间同步。


3D 和 2D 彼此互补,二者更好的融合能够对感知会有更精确的输出。




下面是整个的一个 demo,大家可以看下:


00:00 / 00:00
    1.0x
    • 3.0x
    • 2.5x
    • 2.0x
    • 1.5x
    • 1.25x
    • 1.0x
    • 0.75x
    • 0.5x
    网页全屏
    全屏
    00:00


    Raw Sensor-fused Output

    3. Perception Onboard

    上面大概介绍了整个 perception 的 sensor 的 setup,以及 sensor fusion 做法。接下来介绍车载的 Perception Onboard 的架构是什么样的,以及解决方案是什么。



    这是整个 Perception Onboard 的架构。首先用 LiDAR,Camera,Radar 三种 sensor 数据通过时间同步,所有的时间误差控制在 50 毫秒以内。结合 sensor 的数据,进行 frame wise 的 detection 及 classification 等计算,最后利用多 frame 信息进行多目标跟踪,最后将相关结果输出。这里涉及到 Sensor Fusion, Deep Learning 相关的技术细节,这里不做过多的讨论。


    整个 Perception 系统的解决方案要保证这 5 点:


    1. 首先是安全,保证近乎百分之百的 detection 的 recall

    2. Precision 要求非常高,如果低于某个阈值,造成 False Positive,车辆在自动驾驶状态下会非常不舒适

    3. 尽量输出所有对行车有帮助的信息,包括路牌,交通信号灯及其它场景理解的信息

    4. 保证高效的运行,能够近实时的处理大量的 sensor 的数据

    5. scalability 可扩展性也很重要,deep learning 依赖大量数据,整个模型的泛化能力如何都是非常重要的。能够让我们的 model 和一些新的算法能够去适配更多的城市和更多的国家。

    4. Perception Technical Challenges

    下面分享有挑战性的一些场景:


    第一部分:precision 和 recall 的 balance;


    第二部分:长尾场景。



    这是晚高峰的十字路口的繁忙场景,有大量行人摩托车穿过十字路口。



    通过 3D 点云数据能够看到的对应的原始数据。



    这是目前我们 Perception 的输出,正确的 segmentation 结果和类别。


    00:00 / 00:00
      1.0x
      • 3.0x
      • 2.5x
      • 2.0x
      • 1.5x
      • 1.25x
      • 1.0x
      • 0.75x
      • 0.5x
      网页全屏
      全屏
      00:00


      雨天的问题。自动驾驶系统在一些特殊的或者恶劣的天气条件下,处理是非常难的。


      比如,激光雷达是能打到水花的。图中白色的是对水花的 filter。如果不能对水花进行准确的识别和过滤,会对自动驾驶车辆造成麻烦。这里看到我们目前系统的处理结果,结合 Lidar & Camera 的数据,对水花有很高的识别率。


      长尾的问题



      这个是我们在路测时,遇到的两种洒水车。左边是向上喷的雾炮,右边是向两侧喷的洒水车。人类司机可以很容易超过洒水车,但是对于感知系统来说,需要花很多的时间去处理和识别这类场景和车辆,最后让自动驾驶车辆在遇到类似场景获得更好的体感。


      小物体的检测



      意想不到的事件,路测时比如流浪的小猫小狗的突然出现,我们期望感知系统能够对小物体能够有准确的召回。



      对红绿灯来说会更有挑战。会一直遇到新的场景。因为在不同的城市或国家会遇到各种各样的红绿灯。



      逆光的问题,或者突然从桥洞下边出来相机曝光的问题。通过动态的去调整相机曝光等方式去解决。



      这个也是红绿灯的场景,红绿灯上有倒计时,我们需要识别出倒计时,能够让自动驾驶车辆遇到黄灯时,乘车体验更好。



      雨天摄像头的防水问题,也是处理极端气候条件下所必须具备的。



      红绿灯进进度条的识别,绿等快变黄要减速。


      图中部分图片来自互联网,只用做交流学习,若涉及侵权,请联系 DataFun 删除。

      作者介绍:


      李阳光,Pony.ai Tech lead,中科院计算机研究所硕士,此前就职于百度广告搜索部和自动驾驶事业部,任感知系统工程架构负责人,目前在 Pony.ai 负责自动驾驶感知技术研发。


      本文来自 李阳光 在 DataFun 社区的演讲,由 DataFun 编辑整理。


      2019-05-17 08:006932

      评论

      发布
      暂无评论
      发现更多内容

      Java上进了,JDK21 要来了,并发编程再也不是噩梦了

      Java你猿哥

      Java jdk ssm

      写给程序员的可逆计算理论辨析补遗

      canonical

      低代码 可逆计算 范畴论

      硬核!力扣官方首发了这套1568页LeetCode算法刷题笔记(彩页版)

      Java你猿哥

      面试 算法 LeetCode ssm

      华为云GaussDB以技术创新引领金融行业分布式转型

      YG科技

      如何从零实现一个简单的Spring Bean容器

      Java你猿哥

      Java spring ssm Spring Bean Java web

      深度解析Seata AT 模式中性能优化与隔离保障的平衡之道

      Java你猿哥

      Java 数据 ssm 脏读

      强渡大渡河!华为云GaussDB支撑华为MetaERP系统全面替换

      YG科技

      行业DBA走进华为,共建数据库生态

      YG科技

      阿里、字节大佬共创的Netty核心原理手册,必须是全网No.1

      程序知音

      Java Netty java架构 Java进阶 后端技术

      从BeyondCampus最佳实践,洞察高校零信任发展趋势

      权说安全

      你还在用 BeanUtils?试试 MapStruct,优雅的对象转换解决方案!

      Java你猿哥

      Java ssm map

      开源赋能 普惠未来|元遨/CARSMOS诚邀您参与2023开放原子全球开源峰会

      开放原子开源基金会

      开源 CARSMOS 元遨

      如何在企业中培养平台工程文化?

      SEAL安全

      平台工程 平台工程文化

      爱了,Spring Cloud Alibaba内部微服务架构笔记真的太牛了

      Java你猿哥

      Java 微服务 微服务架构 Spring Cloud ssm

      技术驱动,数据赋能,华为云GaussDB给世界一个更优选择

      YG科技

      【2023华为云CodeArts Build 实战训练营】云端实战-玩转编译构建

      华为云PaaS服务小智

      云计算 华为云 华为开发者大会2023

      火山引擎DataLeap的Catalog系统搜索实践(三):Learning to rank与后续工作

      字节跳动数据平台

      数据湖 数据化 数据平台 大数据分析 DataLeap

      Csdn上20W+阅读,这份“Java核心万字宝典”霸榜9天,太香了

      Java

      软件测试/测试开发丨接口自动化测试学习笔记分享

      测试人

      程序员 软件测试 自动化测试 接口测试 测试开发

      面渣逆袭必看!Java中高级面试指南,Github标星4.3k+!

      Java java面试 Java八股文 Java面试题 Java面试八股文

      简单好用的便利贴工具:Sticky 激活版

      真大的脸盆

      Mac Mac 软件 便利贴工具 便利贴软件

      自动化回归测试平台 AREX 前端架构演变史 —— Tabs 动态组件设计

      AREX 中文社区

      Vue 前端 软件测试

      开源赋能 普惠未来|腾讯寄语2023开放原子全球开源峰会

      开放原子开源基金会

      开源 开放原子全球开源峰会 开放原子

      开源赋能 普惠未来|OpenHarmony诚邀您参与2023开放原子全球开源峰会

      开放原子开源基金会

      开源 OpenHarmony 开放原子

      🔥笔下生花,与时舒卷,InfoQ写作社区6月优质更文活动来啦!

      InfoQ写作社区官方

      热门活动 6 月 优质更文活动

      App Cleaner & Uninstaller:mac专业的系统清理优化工具

      Rose

      App Cleaner 系统清理工具 苹果mac系统优化 App Cleaner 破解

      5年Java经验字节社招:15天3次面试,成功拿下Offer

      程序知音

      Java java面试 大厂面试 后端技术 Java面试八股文

      宝兰德应用服务器软件与华为云GaussDB完成兼容互认证

      YG科技

      国产自研数据库是更新换代首选

      YG科技

      [EuroSys2023 Best Poster] 面向动态图的极低时延GNN推理采样服务

      阿里云大数据AI技术

      人工智能 机器学习 推理 企业号 6 月 PK 榜 DGS

      大语言模型的创意能力到底几何?探索从GPT-2到GPT-4的演进

      Baihai IDP

      人工智能 自然语言处理 大模型 白海科技 企业号 6 月 PK 榜

      L4自动驾驶中感知系统遇到的挑战及解决方案_AI&大模型_DataFunTalk_InfoQ精选文章