阿里云「飞天发布时刻」2024来啦!新产品、新特性、新能力、新方案,等你来探~ 了解详情
写点什么

自动驾驶创业方向有变化?如何突破技术瓶颈?

  • 2022-08-24
    北京
  • 本文字数:3623 字

    阅读完需:约 12 分钟

自动驾驶创业方向有变化?如何突破技术瓶颈?

自动驾驶无疑是截至目前,今年最受投资青睐的一个细分领域。据业内人士介绍,这是继 2014、2015 年以来,自动驾驶领域的又一次投资热潮。有专业人士认为,这次投资热潮中有明显的投资趋势转变特征出现。具体表现在,与 2022 年 Q1 偏向 ADAS 以及高级别自动驾驶系统级解决方案提供商不同,Q2 获投技术领域分布比较均匀,从感知层的毫米波雷达、激光雷达到决策层的芯片、计算平台,再到执行层的智能底盘领域,均有企业获得了新一轮融资。这种转变的背后,是否展现了自动驾驶未来技术演进的方向?带着这样的疑问,InfoQ 编辑采访了智行者 CTO 王肖和智行者联合创始人、研发中心副总经理张放,以及多位机构投资人。


难以突破的自动驾驶核心技术


多位机构投资人和创业者均表示,投资方向的转变并不是近期发生的。事实上,投资方向转变需要放置到自动驾驶及其相关产业的整体发展进程来判断。从风险投资早期阶段来看,投资是紧跟随产业发展需求的脉络进行的布局。比如,早期投资机构联想之星 2014 年就入局投资自动驾驶,称得上是行业的先行者。2014 年起,联想之星投资了 ADAS、毫米波雷达、 AEB (自动紧急制动)、激光雷达自动驾驶零部件方案的供应商。2015 时,自动驾驶研发迎来大爆发,联想之星投资了解决方案提供商 Pony 。2018 年开始,联想之星先后投资了以小马智行为代表的自动驾驶整体解决方案的初创公司。2018 年后,自动驾驶从此前追求单车智能,逐渐转变为“聪明的车+智慧的路”。 联想之星的投资也向着更广的方向发展,投资了地图、智慧交通等领域的公司。不难看出,联想之星的投资布局动线图,紧跟着自动驾驶及其相关产业的整体创业趋势。不少投资人坦言:“最近,我们并没有观测到有新的技术突破。”

 

软硬件在短时间内很难发生实质性的突破。所以,智行者 CTO 王肖认为:“L4 未来的趋势是要满足常用场景的商业化落地,把实现无人驾驶的成本降下来。产品策略方面也是需要自动驾驶提供商需要突破的关键所在。”

 

自动驾驶是人工智能深度学习的一种应用。自动驾驶汽车关键技术主要包括环境感知、精准定位、决策与规划、控制与执行、高精地图与车联网以及自动驾驶汽车测试与验证技术等。简单说,自动驾驶核心技术体系可概括为“感知、决策与控制执行”(如下图所示)。


图 1:自动驾驶核心技术

 

感知与决策与是无人驾驶中最难突破的两个模块,也正是这两个模块决定了自动驾驶等级。这两个模块可通过车载摄像机、激光雷达、毫米波雷达、超声波等传感器来感知周围环境,实时动态监测周边环境变化,并依据所获取的信息进行决策判断,形成安全合理的路径规划。

 

市面上推出的自动驾驶解决方案,也基本是围绕着这两个模块展开。这两个模块构成了自动驾驶的决策规划能力。面对人工智能算法以及以毫米波雷达为代表的感知系统方面的现有局限性,自动驾驶方案提供商需要在极度安全与极度智能这两个维度中找到平衡点。投资人普遍认为,软硬件的突破确实不易,如何在产品策略方面推出能够落地商业化综合应用是众多玩家未来的主要策略。


深度学习算法以及感知能力的瓶颈该如何解决?


目前,深度学习还有尚未突破的痛点。比如,在高速路上行驶,广告牌上若有人像,汽车“大脑”会误认为是人,发出提示音。原因是深度学习尚未达到与人类相同的判断能力。 “基于深度学习的视觉系统,不可能把万事万物都学习一遍。”王肖解释道。

 

再有,近期出现的多起电动汽车安全事故,都是撞上了高速路上的静态物。这不仅有上述的深度学习原因,也有感知层面中毫米波雷达的固有弊端。最常见的有,由毫米波雷达对金属比较敏感,有时会误将龙门架识别为汽车。

 

以上提及的深度学习算法以及感知能力到底该如何解决?如果是特斯拉这样单纯使用视觉识别是否可行?纵观业内众多解决方案,主要是两种方法。一是多融合感知方案,用决策逻辑弥补感知问题;二是在云端自动化的实现算法迭代,通过数据驱动的强化学习来训练决策逻辑。在本月 17 日,召开了新品发布会的智行者,向外界发布了“轻地图,重感知”的解决方案。这套解决方案包含了以上两种方法。

 

张放直言,智行者不是纯视觉支持者。“如果后端决策规划能力没有上来之前,采用纯视觉识别永远是有问题的。最典型的是夜间场景。我们推出的 H-INP 系统恰恰弥补了这一缺点。”

据悉,H-INP 采用了 6 颗摄像头+5 个毫米波雷达的多融合感知方案。这种解决方案可以减少对高清地图的依赖,从而实现“轻地图,重感知”。不依赖高清地图,也是中国自动驾驶厂商未来拓展海外市场必须具备的能力。

 

此外,在硬件架构配置方面,H-INP 还采用了智行者自主研发的车规级高算力域控制器,算力可达 128TOPS,CPU 计算能力达 30K DMIPS。结合上述的多融合感知方案,实现了成本的有效控制,既满足了车辆安全运行的需求,又达到了前装量产的标准。据智行者介绍,目前 H-INP 的成本在数千人民币。智行者希望通过低成本的方式,快速推进自动驾驶落地,进而形成商业闭环。目前,这套系统还处于原型测试阶段,预计今年第四季度推出量产版本。

 

据张放介绍,H-INP 采用了平台化设计,可在此统一架构下开发出系列产品,满足不同场景的需求。在整体系统架构的设计方面,H-INP 具有功能模块化、接口抽象化等特点,具体表现为:

1.将架构进行了分层解耦,可以更加便利地利用最新技术成果;

2.算法模块化复用,通过图形化工具实现应用设计、开发、集成和调试,将研发聚焦在算法本身;

3.深度优化的通信和调度机制,提供多级通信机制与模块部署的局部性特点相适应,提供确定性和 CPU-GPU 联合调度。


图 2:智行者 CTO 王肖

 

在构建多融合感知方案中,智行者实施了以下三个步骤,以通过语义理解生成一个实时的云端地图。整个过程,还原和模拟了人在开车时的真实情境。“通过眼睛感知外部事物,从而在大脑中形成了外界地图。”

 

第一步是准确的目标和准确的检测能力。通过传感器准确传回所需要的数据,要精确的“看到”车道线、标志牌等道路元素。

 

第二步 3D 场景重建的能力。在感知算法的基础上,尽可能在 3D 场景中准确还原传感器传回的“图景”,并把离散在不同时空中的每一帧融合为一个完整的物理世界。

 

第三步是语义理解,理解周遭环境的能力。只有经过逻辑关系和拓扑关系处理之后,才能做出最终的决策规划。比如,经过前两步实现了完整清晰的物理世界,抓取到了车道线等道路基本相关信息。那么,接下来,车辆在行驶中要如何利用这些抓取到的这些信息,来判断是左拐还是右拐?这就需要第三步逻辑关系去处理,形成决策规划,然后输送给控制单元进行实施。

 

用数据驱动迭代算法,从而提升自动驾驶能力也是智行者着重提升的能力维度之一。这其中涉及到如何去快速挖掘数据,清洗数据和更新云端的算法模型。张放认为,有用的数据才能反馈出真实问题,提升算法。快速发现数据就是要自动化的挖掘有意义的数据。这些数据通常是在边界或者目前尚未解决的场景。张放补充到,在此环节,智行者先采用仿真系统测试一遍算法模型,之后再将有效的数据运用到真实车辆进行试验。这样做可以提升开发效率。

 

综上,智行者用在夯实能力的基础上,使用了产品策略来实现其从特殊场景、特种车辆等场景延伸至乘用车领域。


“必经战事”:商业化场景落地


今年 8 月初,百度发布了一个声明:已获得中国武汉、重庆两个城市的批准,可以向乘客提供全无人驾驶网约车( Robotaxi )有偿服务。但这并不意味着无人驾驶可以进行大范围商业应用。只有达到现有网约车相同的实用性,彻底拿掉安全员、不限目的地、不限区域的自动驾驶,才是真正的商业化。我们熟悉的理想、蔚来、小鹏以及特斯拉实质上应用的都是 L2 级别的辅助驾驶系统。L5 级别的自动驾驶(完全无人驾驶)实现还需要很长时间的探索和落地试验。传感器、算法软件等将是无人驾驶技术本身需要攻克的难关。另一方面,能否在现实场景中实现无人驾驶与整个交通体系密切相关,这又取决于智慧交通的发展。


图 3:合流分流


在这篇文章创作之初,InfoQ 编辑曾联系过多家曾经投出了自动驾驶明星项目的早期投资机构。事实上,已经有投资机构将注意力转移到了其他领域。有关人士指出,目前各个赛道的竞争格局已经形成,加之技术创新周期长的原因,接下里的竞争主要集中在商业化落地场景中。此前,毕马威中国则预测,中国主要城市将在 2030 年实现自动驾驶的大规模应用。自动驾驶很可能在下个十年以网约车或物流配送车的形式进入市场。

 

据智行者介绍,其已在特种场景和室外无人环卫车细分市场中进行了布局,且所占市场份额不低。此次发布的高速领航系统 H-INP(Highway – Idriver+ Navigation Pilot)表明智行者正式进入了乘用车领域。未来,还将打造适用于城市场景的城市领航系统 C-INP 系统,可实现不同时段(白天/夜间),人车混行交通流下的辅助驾驶。

 

上述的感知与决策模块,以及商业化场景落地探索问题,都可以采取产品策略进行缓解。但是,还有许多业内人士指出,算力已是制约当前自动驾驶向前发展的一个重大考验,同时也是自动驾驶系统得以大规模落地以及进一步实现商业化的前提条件。在提及算力之前,当前芯片短缺已成为汽车行业的巨大痛点。

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2022-08-24 18:067758

评论 1 条评论

发布
用户头像
这种计算,识别应该比较费电吧。
2022-08-25 12:12 · 广东
回复
没有更多了
发现更多内容

图说前端-ArrayBuffers 和 SharedArrayBuffers(2/3)

梦见君笑

大前端 内存管理

架构师训练营第六周总结

烟雨濛濛

数据分析之AB testing实战(附Python代码)

JackTian

Python 编程 程序员 数据分析 AB testing实战

“新基建”来了!云南三年投资3776亿!

CECBC

redis里的数据结构

流沙

redis

基础篇:Object对象

csc

Java Java 25 周年

11个提高产品经理工作效率的必备工具,果断收藏

马踏飞机747

大数据 设计 产品经理

北京区块链规划重点发展海淀朝阳通州等区,加大对代币监管力度

CECBC

北京行动计划 四个高地 需求导向 为政务服务

SpringBoot2.x入门:应用打包与启动

Throwable

springboot

Java 线程的生老病死

武培轩

Java 线程 多线程 并发 线程状态

DolphinScheduler-1.3.0-dev功能体验

Eights

大数据 hadoop

架构师训练营第六周作业

Melo

Newbe.Claptrap 框架中为什么用 Claptrap 和 Minion 两个词?

newbe36524

Docker .net core netcore ASP.NET Core

Vagrant 快速入门

FeiLong

vagrant

那些让程序员目瞪口呆的Bug

Java小咖秀

程序员 bug

架构师训练营第六周总结

陈靓-哲露

图说前端-内存管理(1/3)

梦见君笑

大前端 内存

ARTS 打卡 第2周

Scotty

RESTful 架构及实践

pingan8787

Java 大前端 RESTf

不会有人还不知道全文检索工具Lucene怎么用吧?文字长文教程

给你买橘子

Java 搜索引擎 lucene 程序员 开发工具

基础篇:JAVA基本类型

csc

Java Java 25 周年

百万级别数据Excel导出优化

Throwable

架构设计 springboot

计算机的时钟(一):NTP协议

ElvinYang

架构师训练营第六周作业

烟雨濛濛

图说前端-使用Atomics避免SharedArrayBuffers中的race conditions(3/3)

梦见君笑

大前端 内存管理

架构师训练营第六周作业

张明森

分布式系统的一些基础理论

俊俊哥

分布式事务 CAP Base

java 后端博客系统文章系统——No3

猿灯塔

【计算机网络】网络层——路由器与路由选择协议

烫烫烫个喵啊

计算机网络 网络层

云原生实践系列:概述

孤岛旭日

Serverless 微服务 Service Mesh 服务架构

并行流ParallelStream中隐藏的陷阱

Throwable

Java

自动驾驶创业方向有变化?如何突破技术瓶颈?_AI&大模型_李阳_InfoQ精选文章