写点什么

预测技术已经超越感知,成为无人驾驶领域最大的挑战

  • 2020 年 2 月 27 日
  • 本文字数:2413 字

    阅读完需:约 8 分钟

预测技术已经超越感知,成为无人驾驶领域最大的挑战

无人驾驶技术包含了感知、决策和控制等技术,目前,感知技术已经取得了阶段性成果,但是,在复杂的动态环境中运行的无人驾驶汽车,仅仅有感知还是远远不够的。无人驾驶要想“更上一层楼”,就需要在新的领域发力研究。这个领域是什么呢?那就是:预测。InfoQ 中文站翻译了无人驾驶技术公司 Voyage 的联合创始人兼 CEO 亲自撰写的这篇文章,解读无人驾驶领域未来需要重点深耕的技术,以飨读者!

本文最初发表在 Oliver Cameron 的个人博客,经原作者授权,InfoQ 中文站翻译并分享。


为什么预测已经超越感知,成为该领域最大的挑战?


在过去的十年里,无人驾驶机器学习社区内的大多数讨论都集中在目标检测(object detection)上。动态目标对所有安全导航至关重要,我们该如何提高无人驾驶汽车检测和跟踪这些动态目标的能力呢?2010 年,在深度学习普及之前,感知是无人驾驶汽车能力的主要限制。对于一台 3 吨重的机器来说,有着如此之高的误报率和漏报率,都是不可接受的。最能说明这一点的是 ImageNet 的分类正确率,在这方面,最先进的解决方案在 2010 年仅达到 50% 的正确率(相比之下,今天的正确率为 88%)。尽管 ImageNet 的分类与当前最先进的目标检测技术相提并论,但它确实可以作为计算机视觉进步的一个代表。



两年后的 2012 年,AlexNet 成为首批利用卷积神经网络进行深度学习的 ImageNet 竞赛的参赛者之一。AlexNet 也许是计算机视觉领域最有影响力的论文,2012 年就在 ImageNet 上实现了当时最先进的正确率。


深度学习,无论是应用于激光雷达、摄像头,还是雷达,都在 2014 年左右开始涉足无人驾驶技术。Google 最著名的一个例子是,它的无人驾驶汽车碰到了一名老太太坐着电动轮椅在车辆前面转来转去追赶一只鸭子的场景,当即就做出了躲避的行为,这一例子说明了感知技术从 2010 年发展到现在已经走了多远。



今天,用于感知的深度学习在无人驾驶汽车中已经很普遍了,我们也因此不断看到性能的惊人提升。去年以来,像 VoxelNetPIXORPointPillars 这样的网络推动了我们在计算机视觉方面的思考。尽管我们不应认定现在的机器人已经实现了完美的感知能力,但计算机视觉领域的发展如此之快,可以说,它现在已经不再是无人驾驶汽车商业化应用的主要障碍了。


注:我有严重的偏见,但以上的说法,是基于一款具备多钟传感器模式的无人驾驶汽车,包括一个飞行时间传感器,它会返回物理上准确的深度信息,并提供给感知模型。对不起了,特斯拉!


既然感知已经不再是无人驾驶技术的星星之火,那下一步是什么呢?预测!


既然我们可以安全地探测到我们周围的关键物体,那么,我们现在就必须预测它们下一步要做什么。正确的预测意味着我们将在正确的时间执行正确的操作,同时考虑周围人们的行动。错误的预测意味着我们可能会将自己推向危险的境地。作为人类,我们使用数以千计的环境输入来直观地进行这种预测。


正如我在第一篇关于无人驾驶汽车的强化学习和模仿学习的博文中所讨论的那样,让我们来看看机器人无人驾驶汽车如何处理没有保护的左转弯。


预测问题是无保护左转弯实例化的核心问题,该问题也是最困难的。在执行左转弯之前,无人驾驶汽车必须预测周围所有动态目标的未来动作,这项任务比无人驾驶中的其他问题需要更多的智能。人类驾驶员虽然不完美,但在很大程度上只需依靠一般智力、现实世界的驾驶经验和社会线索(如轻推或手势),就能够成功执行无保护的左转弯。

尽管机器比人类有着明显的优势(如 360°远程视野),但与人类相比,无人驾驶技术的传统预测可能还相当原始。

  1. 感知器模块输出无人驾驶汽车特定半径内的一组目标检测(例如车辆、行人),然后将其输入到预测模块。

  2. 预测模块使用当前(例如方向、速度)和先前的观察结果来生成每个目标在接下来 5 秒内可能会做什么动作的单独预测。

  3. 通过将所有这些单独预测输入到一个算法中,就可以生成关于无人驾驶汽车可以执行的最安全动作的假设。

  4. 无人驾驶骑车开始规定的动作,并每 100 毫秒重新评估该决策。


你可以想象得出,这种机器人的方式会导致不舒服甚至潜在的危险驾驶行为,在人口稠密的城市环境中尤为如此。在过去的几年里,我们看到了深度学习方法进行预测的实验爆炸式增长。这些方法有显著提高预测正确率的潜力,能够将它们从机器人转变为类似人类的预测。


用数据驱动的方法解决这些原始的预测,与 2010 年代中期深度学习如何取代经典感知的方式有着惊人的相似之处。


下面是一些实际应用的例子。


  • Cruise 的感知工程经理进行了一次精彩的演讲,讲述了他们是如何将学习预测作为一个分类问题来处理的。我对他们构建的工具特别感兴趣,除了他们场景自动标记的“车队学习”(Fleet learning)的能力之外,他们还构建了支持快速实验的工具。

  • Uber 分享了他们在 DRF-Net 上的工作,该网络增强了行人预测的能力:“大量实验表明,我们的模型表现出高可能性、低误差、低熵和高多模态,优于几个强基线。DRF-Net 离散预测的强大性能对于基于成本和约束的机器人规划提供了很好的前景。”

  • Apple 发表了一篇关于强化学习的新论文,题为《最坏情况下的策略梯度》(Worst Cases Policy Gradients):“构建智能系统的关键挑战之一,是开发在复杂环境中做出健壮且安全的连续决策的能力。”

  • isee 在 2019 年的 CVPR 峰会发表了关于学习预测方法的研究成果:“这种 MAT 编码自然地处理具有不同数量的动态目标和场景,并通过 AMT 上的卷积运算来预测场景中所有动态目标的轨迹,并且计算复杂度与动态目标的数量呈线性关系。”


虽然预测目前还没有达到它所需的性能要求,但我很清楚,我们将看到数据驱动方法在预测性能方面上的巨大飞跃,就像深度学习对经典感知的影响一样。这些即将到来的飞跃,无疑将极大改善无人驾驶汽车的决策能力,从而为乘客带来更安全、更顺畅的乘车体验。


作者介绍:


Oliver Cameron,Voyage 联合创始人兼 CEO。Voyage 致力于兑现无人驾驶汽车的承诺。


原文链接:


https://olivercameron.substack.com/p/the-next-leap-in-self-driving-prediction


2020 年 2 月 27 日 14:00954

评论

发布
暂无评论
发现更多内容

淘宝杨宽:淘宝直播低延迟架构演进和实践丨ECUG Meetup 回顾

七牛云

音视频 淘宝 ECUG 七牛云

网络攻击的高频出现,高防服务器是最佳的选择

九河云安全

四色建模:用户转化率 KPI

escray

学习 极客时间 如何落地业务建模 8月日更 四色建模

破解三大安防视频痛点,看华为4大硬核视频上云技术

华为云开发者社区

视频 华为云视频 安防 摄像头 安防视频

Vue进阶(二十一):ES6 知识储备

No Silver Bullet

Vue ES6 8月日更

Python代码阅读(第8篇):列表元素逻辑判断

Felix

Python 编程 Code Programing 阅读代码

【Vue2.x 源码学习】第三十一篇 - diff算法-比对优化(下)

Brave

源码 vue2 8月日更

手撸二叉树之最小深度

HelloWorld杰少

数据结构与算法 8月日更

百度大脑DuMix AR携明星数字员工首次亮相China Joy,智能虚拟形象系统全面升级

百度大脑

人工智能 ChinaJoy 虚拟偶像 数字人

WeLink的杀手锏和远程办公软件的另一面

华为云开发者社区

远程办公 华为云 welink 视频会议 数字化办公

书单 | 振聋发聩,撼世经典!总有那么一些书经得住时间的考验

博文视点Broadview

netty系列之:基于流的数据传输

程序那些事

Java Netty nio 程序那些事

Apache APISIX 在移动云的应用

Apache APISIX 中国社区

开源 网关 APISIX

Compose管理状态

Changing Lin

8月日更

Prometheus 监控SpringCloud微服务

Rubble

Prometheus SpringCloud 8月日更

索信达控股:打造新一代中小银行智能营销平台体系的道与术

索信达控股

从0开始的TypeScriptの三:TS的类型

空城机

typescript 前端 8月日更

同为电动小车热门,欧拉白猫比拼零跑T03,谁更胜一筹?

科技热闻

探究Presto SQL引擎(1)-巧用Antlr

vivo互联网技术

sql 编译器 presto antlr4

百度BaikalDB在同程艺龙的成功应用实践剖析

百度Geek说

数据库 后端 架构·

Go 学习笔记之 Goroutines

架构精进之路

Go 语言 8月日更

带你读AI论文:基于Transformer的直线段检测

华为云开发者社区

模型 目标检测 Transformer 线段检测 LETR

BERT模型为什么这么强?

博文视点Broadview

【LeetCode】0~n-1中缺失的数字Java题解

HQ数字卡

算法 LeetCode 8月日更

当 CloudQuery 遇到大数据

CloudQuery社区

大数据 hive ES 数据库管理

Vue进阶(二十三):Promise 详解

No Silver Bullet

Vue Promise 异步请求 8月日更

TCP如何保证数据的可靠传输

W🌥

计算机网络 TCP/IP 8月日更

十大排序算法--基数排序

Ayue、

排序算法 8月日更

生产环境全链路压测平台Takin

数列科技

开源 高可用 全链路压测 性能压测

“互联网+”大赛之AI创新应用赛题攻略:大胆脑洞,共绘智慧生活蓝图

华为云开发者社区

HarmonyOS 大赛 互联网+ AI创新应用 HMS Core

带你了解Go怎样实现二级缓存

Regan Yue

redis 二级缓存 Go 语言 8月日更

Flutter 自动化测试

Flutter 自动化测试

预测技术已经超越感知,成为无人驾驶领域最大的挑战-InfoQ