【QCon】精华内容上线92%,全面覆盖“人工智能+”的典型案例!>>> 了解详情
写点什么

CVPR 无人车焦点讨论:三年后实现安全标准化?自动驾驶落地真的需要 LiDAR 吗?

  • 2019-08-07
  • 本文字数:5202 字

    阅读完需:约 17 分钟

CVPR 无人车焦点讨论:三年后实现安全标准化?自动驾驶落地真的需要 LiDAR 吗?

本文为 Robin.ly 授权转载,文章版权归原作者所有,转载请联系原作者。


2019 年计算机视觉顶会 CVPR 前不久刚在美国长滩闭幕。Robin.ly 在大会现场独家采访 20 多位热点论文作者,为大家解读论文干货。继前两篇CVPR2019 获奖论文现场解读最新CVPR热点论文解读后,再次推出三篇无人车研究相关的热门讲座、研讨会解读。


  1. 讲座:基于机器学习的视觉深度测量

  2. Learning-based Depth Estimation from Stereo and Monocular Images

  3. 研讨会: 安全性是无人驾驶的首要课题

  4. Safe Artificial Intelligence for Automated Driving

  5. 研讨会: CARLA 自动驾驶挑战赛

  6. CARLA Autonomous Driving Challenge


基于机器学习的视觉深度测量

视觉深度测量是计算机视觉领域的重要问题。它在自动驾驶、智能机器人、目标检测和跟踪、智能交通、三维建模和 3D 视频制作等领域都有广泛的应用。近几年来,机器学习和深度学习一直被应用于深度测量领域。CVPR 的指导性讲座“Learning-based Depth Estimation from Stereo and Monocular Images”介绍并总结了他们这几年来机器学习技术在 3D 传感领域尤其在自动驾驶领域的应用。


讲座的发起人之一,来自意大利博洛尼亚大学(University of Bologna)的博士后研究员 Matteo Poggi 在 CVPR 大会现场接受 Robin.ly 专访时,给我们大家介绍了他们的讲座以及他们的研究。以下是访谈实录和视频。



Matteo Poggi 在美国长滩 CVPR2019 现场接受 Robin.ly 访谈


Wenli: 能介绍一下这个讲座吗?


Matteo Poggi:


这个讲座主要是关于机器学习技术在 3D 传感领域的应用,特别是对单一或少数几个图像进行深度测量。其中强调了过去三年中我们如何从手动设计的方法转变为基于机器学习的方法。在手动设计的方法中,开发人员需要设计参数,不断试验和调整算法;在机器学习中,算法可以直接从数据中学习规律,人工干预的程度比较低,整体而言更高效。


最近几年,机器学习和深度学习领域都实现了技术上的突破,我们认为是时候总结一下这些重要的发展和变化了。去年在意大利 Verona 举办的一个小型会议 3DV 上,我们就提出过这个想法。我们在 GDB Tutorial 的平台上获得了非常积极的反馈,于是决定在 CVPR 大会上推广这个项目。


Wenli: 您认为初级和资深研究人员分别能从中学到什么呢?


Matteo Poggi:


对于初级研究人员,他们会了解到几年前,在机器学习和深度学习尚未成为主流的时代,哪些是人们所遵循的最先进的技术和理念。我们设计的机器学习方法其实是受到了前人工作的启发,比如在机器学习应用,新架构设计和训练阶段仍然使用了几何和立体匹配的方法。我认为认识到这一点对新一代研究人员来说非常重要,能够让他们学习过去的经验和教训,在此基础上采用基于深度学习的方法获得新的发现。


对于资深研究人员来说,这可能是一个难得的机会。我们简要的总结了人们所提出的设想和已经实现的技术,让他们能够在几个小时内了解该领域过去五年的技术进步和涉及到的数据。



评估数据演变图示,来源:Matteo Poggi


Wenli: 我们在未来能看到哪些商业应用?现在这个领域还面临什么样的挑战?


Matteo Poggi:


比如基于增强现实的应用就可以从这些技术中受益,特别是使用单个图像的技术。因为现在的智能手机都至少安装了一个摄像头,利用小部分的场景信息就可以实现很多增强现实的应用。比如在桌子上显示出一个物体,或者创造出一些四处奔跑的小动物。对于自动驾驶或其他应用,我们可以利用立体匹配,目前这已经是一种非常成熟的技术了。即使是现有的机器学习技术也可以提供更强大的解决方案。一个主要的挑战就是我们要想办法让这些技术在任何地方都能正常运行而不受环境的限制。


Wenli: 你认为意大利与美国的研究环境相比有什么不同?


Matteo Poggi:


最早的时候我所在的研究小组只有四个人,规模远不及迄今为止我在美国看到的许多研究小组。当然,与很多有不同背景的人合作可以让你接触到不同的观点,帮助你更全面更深入的思考问题。这对于研究人员来说非常重要。而对于一个比较小的团队,成员之间彼此更容易相互了解,同事之间的关系更像朋友。这种凝聚力有助于团队协作,让大家更容易,也更快的在解决方案上达成一致。


讲座信息

Learning-based Depth Estimation from Stereo and Monocular Images

组织机构:University of Bologna,Stevens Institute of Technology

信息链接:

https://sites.google.com/view/cvpr-2019-depth-from-image/home

安全性是无人驾驶的首要课题

深度学习技术在自动驾驶领域取得了巨大成功,其优点是精准性高,鲁棒性强,以及成本低。该学习技术中主要挑战之一是如何对算法提高安全性。CVPR 的研讨会 “Safe Artificial Intelligence for Automated Driving” 针对在无人驾驶领域中,如何提高人工智能算法的安全性,进行了深入讨论。


研讨会的组织者之一,来自世界顶级汽车零部件供应商法雷奥(Valeo)安全驾驶技术总监 Timo Sämann 在 CVPR 大会现场接受 Robin.ly 专访,介绍了他们的研讨会以及他们的研究。以下是访谈实录和视频。



Timo Sämann 在美国长滩 CVPR2019 现场接受 Robin.ly 访谈


Margaret Laffan: 法雷奥(Valeo)作为全球汽车零部件供应商,你能为我们介绍一下公司的愿景和目标吗?


Timo Sämann:


我的工作地点在德国 Kronach 市,法雷奥拥有 10 万多名员工,包含有四个主要的业务部门:可视化系统、热力系统、动力传动系统以及舒适的驾驶辅助系统。我所在的驾驶辅助系统部门的目标是开发能够让驾驶变得更安全,自主性更高、更直观、更具连接性的技术。


Margaret Laffan: 你这次组织的研讨会叫 “Safe Artificial Intelligence for Automated Driving” 的研讨会。为什么要组织这个研讨会?


Timo Sämann:


想要实现自动驾驶,我们就必须理解深度学习方法。在移动行业中使用深度学习方法的一个主要挑战是如何对算法提高安全性,而我们认为 DNN (深度神经网络)的“黑盒子”属性在科学研究中基本被忽略了。我们组织这次研讨会就是为了强调这一方向的重要性,引起更多的关注。


这个研讨会实际上属于一个德国资助的安全人工智能项目,将在下个月启动。该项目的目标是制定一个能够让我们安全使用 AI 的策略,最终提出 AI 算法必须满足的安全条件的标准。这一点非常重要,因为我们必须在将 AI 算法应用于自动驾驶汽车之类的产品之前确认其安全性是否满足要求。我们跟超过 30 个组织和个人合作,计划在 3 年后实现安全标准化。



剑桥大学研究员 Alex Kendall 在研讨会现场,来源:SAIAD Workshop 2019


Margaret Laffan:安全人工智能目前面临的一些挑战是什么?你在本次研讨会中是否涉及到了相关的解决方案?


Timo Sämann:


针对这个问题,我同意一种观点,就是整个安全空间分为三个子空间。第一个是规则,也就是如何为 DNN(深度神经网络)指定具体的行为,尤其是能否将交通规则或物理定律等先验知识倒入 DNN。这是一个悬而未决的问题。


第二个是鲁棒性。我们如何才能在孵化阶段中获得对抗干扰,比如应对对抗性攻击,外分布实例或恶劣的天气条件的鲁棒性。


第三个是认证。这涉及到如何验证和监控自动驾驶相关活动。是否有可能利用统计学上的相关信息在现实世界中对测试进行调整,还是必须在模拟环境中测试?需要基于什么样的 KPI 来证明 AI 比人类驾驶员更安全?


Margaret Laffan:你认为这个研讨会对于同领域的研究人员来说最大的收获是什么呢?


Timo Sämann:


在研讨会中有一位演讲人一语中的,指出目前为止大家主要关注的是基准问题,也就是人们开发的算法在基准测试中是否表现出色。但是在过去已经出现了很多基准,是否值得为 0.2%的收益付出这么多努力呢? 因此,我们需要更深入的了解算法的工作原理,并降低对基准的关注。


我还想补充一点。虽然 Elon Musk 并不看好 LiDAR,但 LiDAR 传感器对于自动驾驶的安全性仍然非常重要。本次 CVPR 的很多参会者也同意我的观点,我也没有看到有 AI 会取代 LiDAR 的迹象。我只认为我们需要在相对较短的时间内为自动驾驶提供安全的 AI 技术即可。


Margaret Laffan: 你作为研究人员主要的研究兴趣是什么?如何平衡创新和安全?


Timo Sämann:


我对扩展神经网络(Extending Neural Networks) 很感兴趣,也就是利用视频数据的时间一致性。今天大多数 DNN 只使用单帧,这意味着我们从之前的时间中获得的所有信息在当前时间步骤中几乎没有被用于预测。我的目标就是实现更强的抗干扰能力。我在上周的 ICML 研讨会上还发表了一篇关于不确定性和鲁棒性的论文。说实话,我不认为必须要在创新和安全之间做出权衡,这反而会刺激我们更深入的了解 AI 算法,我认为这是开发高级人工智能的关键所在。


研讨会信息

Safe Artificial Intelligence for Automated Driving

组织机构:Valeo,BMW,Volkswagen,Intel,Fraunhofer,German Research Center for Artificial Intelligence

信息链接:

https://sites.google.com/view/saiad-wscvpr19/home?authuser=0

CARLA 自动驾驶挑战赛

CARLA(名字取自 Car Learning to Act)是 Intel Visual Computing Lab 推出的一款用于城市自动驾驶研究的开源模拟器。CARLA 支持城市自动驾驶系统底层开发、训练和验证。2019 年的 CVPR 现场,Intel 智能实验室的负责人 German Ros 等人组织发起了一场基于 CARLA 模拟器上的自动驾驶挑战赛。


以下是 German Ros 与 Robin.ly 主持人 Wenli 在 CVPR 现场的访谈实录和视频。



German Ros 在美国长滩 CVPR2019 现场接受 Robin.ly 访谈


Wenli: 非常感谢您接受我们的采访。能介绍一下自己和这个挑战吗?


German Ros:


我叫 German Ros,是 Inten CARLA 自动驾驶挑战环节的组织者,领导 CARLA 模拟团队。


CARLA 是在云端进行的自动驾驶挑战赛,目的是通过不同的任务考察各个团队所提交的智能体系统是否能够从起始位置移动到终点,并合理应对途中的各种复杂情况,遵守交通规则,保证行驶安全。我们考察它们是否能够到达指定位置和目的地,以及途中违规的次数,比如与其他车辆发生碰撞,闯红灯和忽略让行标志。如果出现违规行为就会被扣分。


Wenli: 您当时邀请了哪些人作为演讲嘉宾?


German Ros:


我们希望平衡工业界和学术界的研究进程,所以邀请了来自这两个领域的专家。在学术界,我们邀请了 Andreas Geiger,多年以来他为自动驾驶社区做出了很多贡献,是著名的 KITTI 基准的创造者。另外一个是加州大学伯克利分校的 Trevor Darrell 教授,他一直在通过各种活动积极推动自动驾驶的发展。在工业界,特斯拉,Uber 和 Waymo 都是重要的参与者。我们邀请了 Uber ATG 的首席科学家 Raquel Urtasun,Waymo 感知部门负责人 Drago Anguelov,还有特斯拉自动驾驶负责人 Andrej Karpathy。



挑战赛模拟路线图,来源:CARLA 自动驾驶挑战赛


Wenli: 你们是第一次举办这次挑战,有什么收获吗?


German Ros:


在过去几年,自动驾驶领域取得了令人瞩目的成就,这也是我们举办这次挑战的动机。我记得几年前,让无人车沿着车道行驶都很困难;而现在,我看到来自世界各地的团队已经有能力处理不同场景中的复杂情况,我从没想过能有这么多的人涉足这个领域。我们正在迎接很多新的挑战,我认为这非常令人兴奋。


明年我们希望有越来越多的人能够参与这个挑战,也期待参与者能够慷慨的分享他们的代码,让新的团队可以在前一年研究成果的基础上优化当前的方案。除了通过竞争促进创新,我还希望看到团队之间实现真正的合作,共同创建一个社区,让人们能够共享和改进各种技术和工具。


Wenli: 您认为您的工作会有哪些商业化的应用?


German Ros:


我们想要预测技术的发展趋势。比如现在使用更多的是传统的自动驾驶方法,比如基于模块的模型。我们在考虑是否能通过不同的方法解决问题,比如是否可以转变为数据驱动。我正在与伯克利合作开展的一个大项目,利用一个模拟器,也就是 CARLA 来训练智能体学习如何在模拟环境中驾驶并应对不同的交通情况。我们发明了可以将 AI 模型直接应用于无人车的技术,让车辆可以通过体验虚拟世界就能实现在真实世界中导航,而不需要接触任何真实数据,虽然偶尔还是会用到。


Wenli: 您觉得学术界和工业界之间存在哪些差异?


German Ros:


我认为这两者之间的差距正在扩大,主要是因为工业界拥有大量的数据和硬件资源,也有足够的财力雇佣庞大的团队,处理更复杂的案件,相比之下学术界仍在研究如何应对简单的场景。我认为只有来自工业的创新是很片面的。自动驾驶是一个远未解决的问题,需要学术界和工业界的人共同努力。但是如果学术界的人无法获得相同的资源,无法使用公共数据或公共工具,他们就没办法做出重要贡献。


另外,目前不同的公司所报告的自动驾驶性能结果大相径庭。因为缺少足够的背景信息,我们根本无法以同样的标准比较孰优孰劣。所以我们正在努力推动标准化平台的建设和共享数据的方法学,希望能够开发出一种人们普遍认可的评估方法。


研讨会信息

CARLA Autonomous Driving Challenge

组织者:German Ros,Vladlen Koltun,Felipe Codevilla,Antonio M. Lopez

信息链接:

https://carlachallenge.org/


原文链接


https://www.robinly.info


公众号推荐:

2024 年 1 月,InfoQ 研究中心重磅发布《大语言模型综合能力测评报告 2024》,揭示了 10 个大模型在语义理解、文学创作、知识问答等领域的卓越表现。ChatGPT-4、文心一言等领先模型在编程、逻辑推理等方面展现出惊人的进步,预示着大模型将在 2024 年迎来更广泛的应用和创新。关注公众号「AI 前线」,回复「大模型报告」免费获取电子版研究报告。

AI 前线公众号
2019-08-07 08:006323
用户头像
Robin.ly 硅谷AI科技、创业、领导力访谈

发布了 49 篇内容, 共 18.0 次阅读, 收获喜欢 59 次。

关注

评论

发布
暂无评论
发现更多内容

机器学习项目是如何开发和部署的?

陆道峰

人工智能 学习

地铁上看书的老外引发的思考

小天同学

写作 读书 个人感想 日常思考

最香远程开发解决方案!手把手教你配置VS Code远程开发工具,工作效率提升N倍

程序员柠檬

Linux 后台开发 vscode 后端

券商也“网红”,证券行业IT服务运维发展按下“快进键”

博睿数据

运维 APM 证券 券商 行情

关于软件测试的三点思考

卓然

软件测试 测试 测试的价值 联现技术咖

这场大数据+AI Meetup,一次性安排了大数据当下热门话题

Apache Flink

大数据 flink 流计算 实时计算

如何设计数据中台

数据社

大数据 数据中台 数据仓库

只用CSS实现响应式Full-Width img 2种方法

寇云

CSS css3

自定义列表样式

寇云

CSS css3

python实现·十大排序算法之基数排序(Radix Sort)

南风以南

Python 排序算法 基数排序

Python deepcopy一个优化

么么哒

Python

自定义构造python白名单__builtins__

么么哒

Python

HTML中实现合并单元格

JDoe

html

为什么第三方联调应该先行?

大伟

git | IDEA 中如何压缩提交(压缩commit后再push 图文演示)

YoungZY

开发者工具 IDEA 开发工具

“新基建”方兴未艾,Smartbi Mining如何为产业数字化转型赋能?

infoq小陈

Server Queue 提高 QPS

风含叶

Python kafka 后端 队列

如何通过样本数据推断其分布

张利东

Python

一款开源且具有交互视图界面的实时 Web 日志分析工具!

JackTian

开源 GoAccess 实时 Web 日志分析工具 交互式查看器

原创 | 使用JUnit、AssertJ和Mockito编写单元测试和实践TDD (十一)JUnit概述

编程道与术

Java 编程 软件测试 TDD 单元测试

写给产品经理的信(5):谈谈项目管理(青铜-王者)

punkboy

产品 极客时间,项目管理 项目管理 产品经理 项目

偏头疼告诉我的,我想告诉每一个人

zkback

团队与领导力健康检查 | 体检表

Bob Jiang

团队建设

前端工程化之创建项目

春生

大前端 全栈工程师

GitHub 上十个好用的软件

彭宏豪95

GitHub 效率 工具

纯CSS“返回顶部”特效

寇云

CSS css3

为什么要学习 Markdown?究竟有什么用?

JackTian

markdown markdown语法 markdown编辑器

写代码没几天,遇到一堆报错,我该怎么办

刘早起😶

Python 程序员 程序人生

做好领路人——写给技术新人的导师建议

南方

管理 新人

重学 Java 设计模式:实战原型模式

小傅哥

Java 设计模式 小傅哥 复杂代码优化 重构

互联网省份数据大揭秘,看看哪些地方是互联网的戈壁滩?

非著名程序员

程序员 互联网 IT

CVPR 无人车焦点讨论:三年后实现安全标准化?自动驾驶落地真的需要 LiDAR 吗?_AI&大模型_Robin.ly_InfoQ精选文章