【QCon】精华内容上线92%,全面覆盖“人工智能+”的典型案例!>>> 了解详情
写点什么

自动驾驶创业方向有变化?如何突破技术瓶颈?

  • 2022-08-24
    北京
  • 本文字数:3623 字

    阅读完需:约 12 分钟

自动驾驶创业方向有变化?如何突破技术瓶颈?

自动驾驶无疑是截至目前,今年最受投资青睐的一个细分领域。据业内人士介绍,这是继 2014、2015 年以来,自动驾驶领域的又一次投资热潮。有专业人士认为,这次投资热潮中有明显的投资趋势转变特征出现。具体表现在,与 2022 年 Q1 偏向 ADAS 以及高级别自动驾驶系统级解决方案提供商不同,Q2 获投技术领域分布比较均匀,从感知层的毫米波雷达、激光雷达到决策层的芯片、计算平台,再到执行层的智能底盘领域,均有企业获得了新一轮融资。这种转变的背后,是否展现了自动驾驶未来技术演进的方向?带着这样的疑问,InfoQ 编辑采访了智行者 CTO 王肖和智行者联合创始人、研发中心副总经理张放,以及多位机构投资人。


难以突破的自动驾驶核心技术


多位机构投资人和创业者均表示,投资方向的转变并不是近期发生的。事实上,投资方向转变需要放置到自动驾驶及其相关产业的整体发展进程来判断。从风险投资早期阶段来看,投资是紧跟随产业发展需求的脉络进行的布局。比如,早期投资机构联想之星 2014 年就入局投资自动驾驶,称得上是行业的先行者。2014 年起,联想之星投资了 ADAS、毫米波雷达、 AEB (自动紧急制动)、激光雷达自动驾驶零部件方案的供应商。2015 时,自动驾驶研发迎来大爆发,联想之星投资了解决方案提供商 Pony 。2018 年开始,联想之星先后投资了以小马智行为代表的自动驾驶整体解决方案的初创公司。2018 年后,自动驾驶从此前追求单车智能,逐渐转变为“聪明的车+智慧的路”。 联想之星的投资也向着更广的方向发展,投资了地图、智慧交通等领域的公司。不难看出,联想之星的投资布局动线图,紧跟着自动驾驶及其相关产业的整体创业趋势。不少投资人坦言:“最近,我们并没有观测到有新的技术突破。”

 

软硬件在短时间内很难发生实质性的突破。所以,智行者 CTO 王肖认为:“L4 未来的趋势是要满足常用场景的商业化落地,把实现无人驾驶的成本降下来。产品策略方面也是需要自动驾驶提供商需要突破的关键所在。”

 

自动驾驶是人工智能深度学习的一种应用。自动驾驶汽车关键技术主要包括环境感知、精准定位、决策与规划、控制与执行、高精地图与车联网以及自动驾驶汽车测试与验证技术等。简单说,自动驾驶核心技术体系可概括为“感知、决策与控制执行”(如下图所示)。


图 1:自动驾驶核心技术

 

感知与决策与是无人驾驶中最难突破的两个模块,也正是这两个模块决定了自动驾驶等级。这两个模块可通过车载摄像机、激光雷达、毫米波雷达、超声波等传感器来感知周围环境,实时动态监测周边环境变化,并依据所获取的信息进行决策判断,形成安全合理的路径规划。

 

市面上推出的自动驾驶解决方案,也基本是围绕着这两个模块展开。这两个模块构成了自动驾驶的决策规划能力。面对人工智能算法以及以毫米波雷达为代表的感知系统方面的现有局限性,自动驾驶方案提供商需要在极度安全与极度智能这两个维度中找到平衡点。投资人普遍认为,软硬件的突破确实不易,如何在产品策略方面推出能够落地商业化综合应用是众多玩家未来的主要策略。


深度学习算法以及感知能力的瓶颈该如何解决?


目前,深度学习还有尚未突破的痛点。比如,在高速路上行驶,广告牌上若有人像,汽车“大脑”会误认为是人,发出提示音。原因是深度学习尚未达到与人类相同的判断能力。 “基于深度学习的视觉系统,不可能把万事万物都学习一遍。”王肖解释道。

 

再有,近期出现的多起电动汽车安全事故,都是撞上了高速路上的静态物。这不仅有上述的深度学习原因,也有感知层面中毫米波雷达的固有弊端。最常见的有,由毫米波雷达对金属比较敏感,有时会误将龙门架识别为汽车。

 

以上提及的深度学习算法以及感知能力到底该如何解决?如果是特斯拉这样单纯使用视觉识别是否可行?纵观业内众多解决方案,主要是两种方法。一是多融合感知方案,用决策逻辑弥补感知问题;二是在云端自动化的实现算法迭代,通过数据驱动的强化学习来训练决策逻辑。在本月 17 日,召开了新品发布会的智行者,向外界发布了“轻地图,重感知”的解决方案。这套解决方案包含了以上两种方法。

 

张放直言,智行者不是纯视觉支持者。“如果后端决策规划能力没有上来之前,采用纯视觉识别永远是有问题的。最典型的是夜间场景。我们推出的 H-INP 系统恰恰弥补了这一缺点。”

据悉,H-INP 采用了 6 颗摄像头+5 个毫米波雷达的多融合感知方案。这种解决方案可以减少对高清地图的依赖,从而实现“轻地图,重感知”。不依赖高清地图,也是中国自动驾驶厂商未来拓展海外市场必须具备的能力。

 

此外,在硬件架构配置方面,H-INP 还采用了智行者自主研发的车规级高算力域控制器,算力可达 128TOPS,CPU 计算能力达 30K DMIPS。结合上述的多融合感知方案,实现了成本的有效控制,既满足了车辆安全运行的需求,又达到了前装量产的标准。据智行者介绍,目前 H-INP 的成本在数千人民币。智行者希望通过低成本的方式,快速推进自动驾驶落地,进而形成商业闭环。目前,这套系统还处于原型测试阶段,预计今年第四季度推出量产版本。

 

据张放介绍,H-INP 采用了平台化设计,可在此统一架构下开发出系列产品,满足不同场景的需求。在整体系统架构的设计方面,H-INP 具有功能模块化、接口抽象化等特点,具体表现为:

1.将架构进行了分层解耦,可以更加便利地利用最新技术成果;

2.算法模块化复用,通过图形化工具实现应用设计、开发、集成和调试,将研发聚焦在算法本身;

3.深度优化的通信和调度机制,提供多级通信机制与模块部署的局部性特点相适应,提供确定性和 CPU-GPU 联合调度。


图 2:智行者 CTO 王肖

 

在构建多融合感知方案中,智行者实施了以下三个步骤,以通过语义理解生成一个实时的云端地图。整个过程,还原和模拟了人在开车时的真实情境。“通过眼睛感知外部事物,从而在大脑中形成了外界地图。”

 

第一步是准确的目标和准确的检测能力。通过传感器准确传回所需要的数据,要精确的“看到”车道线、标志牌等道路元素。

 

第二步 3D 场景重建的能力。在感知算法的基础上,尽可能在 3D 场景中准确还原传感器传回的“图景”,并把离散在不同时空中的每一帧融合为一个完整的物理世界。

 

第三步是语义理解,理解周遭环境的能力。只有经过逻辑关系和拓扑关系处理之后,才能做出最终的决策规划。比如,经过前两步实现了完整清晰的物理世界,抓取到了车道线等道路基本相关信息。那么,接下来,车辆在行驶中要如何利用这些抓取到的这些信息,来判断是左拐还是右拐?这就需要第三步逻辑关系去处理,形成决策规划,然后输送给控制单元进行实施。

 

用数据驱动迭代算法,从而提升自动驾驶能力也是智行者着重提升的能力维度之一。这其中涉及到如何去快速挖掘数据,清洗数据和更新云端的算法模型。张放认为,有用的数据才能反馈出真实问题,提升算法。快速发现数据就是要自动化的挖掘有意义的数据。这些数据通常是在边界或者目前尚未解决的场景。张放补充到,在此环节,智行者先采用仿真系统测试一遍算法模型,之后再将有效的数据运用到真实车辆进行试验。这样做可以提升开发效率。

 

综上,智行者用在夯实能力的基础上,使用了产品策略来实现其从特殊场景、特种车辆等场景延伸至乘用车领域。


“必经战事”:商业化场景落地


今年 8 月初,百度发布了一个声明:已获得中国武汉、重庆两个城市的批准,可以向乘客提供全无人驾驶网约车( Robotaxi )有偿服务。但这并不意味着无人驾驶可以进行大范围商业应用。只有达到现有网约车相同的实用性,彻底拿掉安全员、不限目的地、不限区域的自动驾驶,才是真正的商业化。我们熟悉的理想、蔚来、小鹏以及特斯拉实质上应用的都是 L2 级别的辅助驾驶系统。L5 级别的自动驾驶(完全无人驾驶)实现还需要很长时间的探索和落地试验。传感器、算法软件等将是无人驾驶技术本身需要攻克的难关。另一方面,能否在现实场景中实现无人驾驶与整个交通体系密切相关,这又取决于智慧交通的发展。


图 3:合流分流


在这篇文章创作之初,InfoQ 编辑曾联系过多家曾经投出了自动驾驶明星项目的早期投资机构。事实上,已经有投资机构将注意力转移到了其他领域。有关人士指出,目前各个赛道的竞争格局已经形成,加之技术创新周期长的原因,接下里的竞争主要集中在商业化落地场景中。此前,毕马威中国则预测,中国主要城市将在 2030 年实现自动驾驶的大规模应用。自动驾驶很可能在下个十年以网约车或物流配送车的形式进入市场。

 

据智行者介绍,其已在特种场景和室外无人环卫车细分市场中进行了布局,且所占市场份额不低。此次发布的高速领航系统 H-INP(Highway – Idriver+ Navigation Pilot)表明智行者正式进入了乘用车领域。未来,还将打造适用于城市场景的城市领航系统 C-INP 系统,可实现不同时段(白天/夜间),人车混行交通流下的辅助驾驶。

 

上述的感知与决策模块,以及商业化场景落地探索问题,都可以采取产品策略进行缓解。但是,还有许多业内人士指出,算力已是制约当前自动驾驶向前发展的一个重大考验,同时也是自动驾驶系统得以大规模落地以及进一步实现商业化的前提条件。在提及算力之前,当前芯片短缺已成为汽车行业的巨大痛点。

公众号推荐:

2024 年 1 月,InfoQ 研究中心重磅发布《大语言模型综合能力测评报告 2024》,揭示了 10 个大模型在语义理解、文学创作、知识问答等领域的卓越表现。ChatGPT-4、文心一言等领先模型在编程、逻辑推理等方面展现出惊人的进步,预示着大模型将在 2024 年迎来更广泛的应用和创新。关注公众号「AI 前线」,回复「大模型报告」免费获取电子版研究报告。

AI 前线公众号
2022-08-24 18:067740

评论 1 条评论

发布
用户头像
这种计算,识别应该比较费电吧。
2022-08-25 12:12 · 广东
回复
没有更多了
发现更多内容

Rust从0到1-代码组织-use关键字

rust 代码组织 use

15个问题告诉你如何使用Java泛型

华为云开发者联盟

Java 接口 参数 Java泛型 泛型对象

关于软件IT专业大学生对专业认知情况的调查问卷

花花

签约计划

网易云课堂个性化推荐实践与思考

有道技术团队

推荐系统

政采云:数据可视化探索之SpreadJS 表格控件

葡萄城技术团队

华为云FusionInsight MRS:千余节点滚动升级业务无中断

华为云开发者联盟

大数据 数据湖 节点 集群 华为云FusionInsight MRS

anyRTC 智能硬件解决方案

anyRTC开发者

音视频 WebRTC IoT 智能硬件

探讨 JS 对象如何缓存属性的值

零维

JavaScript 大前端 设计模式

五一小长假最新产物:阿里巴巴面试的参考指南(泰山版)

学Java关注我

Java 编程 程序员 架构 计算机

HTTP/2做错了什么?刚刚辉煌2年就要被弃用了

学Java关注我

Java 编程 架构 程序人生 计算机

10行C++代码实现高性能HTTP服务

万俊峰Kevin

c c++ workflow Open Source

面向软件 IT 专业的高校大学生职业思考调查问卷

程序员架构进阶

职业规划 调查报告 就业 28天写作 4月日更

圆梦阿里之后,我收集整理了这份“2021春招常见面试真题汇总”

比伯

Java 编程 架构 程序人生 计算机

软件IT专业大学生就业意向问卷调查

三掌柜

签约计划 问卷调查

阿里云 RTC QoS 弱网对抗之 LTR 及其硬件解码支持

阿里云视频云

阿里云 音视频 WebRTC 视频解码 视频云

五一啃透这份阿里巴巴Java面试指导手册(泰山版),节后直接面试找工作!

Java架构追梦

Java 阿里巴巴 架构 面试 泰山版

如何基于 PANO SDK 实现 iOS 端屏幕共享互动

拍乐云Pano

ios sdk

IT专业本科生毕业选择【就业】/【攻读硕士】调查问卷

Aldeo

考核 大学生毕业 问卷调查

安全知识

笑春风

大学生读书情况调研

hepingfly

读书 调研 大学生 阅读

可能有点长的Spring MVC入门篇

北游学Java

Java spring ssm Spring MVC

如何构造更好的团队

soolaugust

团队管理 架构

Worktile 权限设计与实现

PingCode研发中心

项目管理 后端 权限管理

视频后期怎么添加AR贴图?一招教你搞定!

奈奈的杂社

视频剪辑 视频后期 剪辑 会声会影

鸿蒙系统(HOS)终于上线,微内核操作系统科普

北游学Java

Java 操作系统 微内核

为什么越来越多的人不敢结婚?

徐说科技

婚姻 情感 恐婚

Windows系统下电脑强制卡死、关机的邪恶方法

不脱发的程序猿

程序人生 技术人 4月日更 系统关机 计算机小技巧

大学生IT就业方向以及就业培训的调查问卷

麦洛

调查报告 调查采访能力考核 问卷调查

【InfoQ 写作平台 1 周年】我和写作平台剪不断的“孽缘”

三掌柜

征稿 InfoQ 写作平台 1 周年

水性硅胶防滑透明浆

C13713145387

索引的正确“打开姿势”

华为云开发者联盟

数据库 索引 B-tree Psort 分区

自动驾驶创业方向有变化?如何突破技术瓶颈?_AI&大模型_李阳_InfoQ精选文章