写点什么

自动驾驶创业方向有变化?如何突破技术瓶颈?

  • 2022-08-24
    北京
  • 本文字数:3623 字

    阅读完需:约 12 分钟

自动驾驶创业方向有变化?如何突破技术瓶颈?

自动驾驶无疑是截至目前,今年最受投资青睐的一个细分领域。据业内人士介绍,这是继 2014、2015 年以来,自动驾驶领域的又一次投资热潮。有专业人士认为,这次投资热潮中有明显的投资趋势转变特征出现。具体表现在,与 2022 年 Q1 偏向 ADAS 以及高级别自动驾驶系统级解决方案提供商不同,Q2 获投技术领域分布比较均匀,从感知层的毫米波雷达、激光雷达到决策层的芯片、计算平台,再到执行层的智能底盘领域,均有企业获得了新一轮融资。这种转变的背后,是否展现了自动驾驶未来技术演进的方向?带着这样的疑问,InfoQ 编辑采访了智行者 CTO 王肖和智行者联合创始人、研发中心副总经理张放,以及多位机构投资人。


难以突破的自动驾驶核心技术


多位机构投资人和创业者均表示,投资方向的转变并不是近期发生的。事实上,投资方向转变需要放置到自动驾驶及其相关产业的整体发展进程来判断。从风险投资早期阶段来看,投资是紧跟随产业发展需求的脉络进行的布局。比如,早期投资机构联想之星 2014 年就入局投资自动驾驶,称得上是行业的先行者。2014 年起,联想之星投资了 ADAS、毫米波雷达、 AEB (自动紧急制动)、激光雷达自动驾驶零部件方案的供应商。2015 时,自动驾驶研发迎来大爆发,联想之星投资了解决方案提供商 Pony 。2018 年开始,联想之星先后投资了以小马智行为代表的自动驾驶整体解决方案的初创公司。2018 年后,自动驾驶从此前追求单车智能,逐渐转变为“聪明的车+智慧的路”。 联想之星的投资也向着更广的方向发展,投资了地图、智慧交通等领域的公司。不难看出,联想之星的投资布局动线图,紧跟着自动驾驶及其相关产业的整体创业趋势。不少投资人坦言:“最近,我们并没有观测到有新的技术突破。”

 

软硬件在短时间内很难发生实质性的突破。所以,智行者 CTO 王肖认为:“L4 未来的趋势是要满足常用场景的商业化落地,把实现无人驾驶的成本降下来。产品策略方面也是需要自动驾驶提供商需要突破的关键所在。”

 

自动驾驶是人工智能深度学习的一种应用。自动驾驶汽车关键技术主要包括环境感知、精准定位、决策与规划、控制与执行、高精地图与车联网以及自动驾驶汽车测试与验证技术等。简单说,自动驾驶核心技术体系可概括为“感知、决策与控制执行”(如下图所示)。


图 1:自动驾驶核心技术

 

感知与决策与是无人驾驶中最难突破的两个模块,也正是这两个模块决定了自动驾驶等级。这两个模块可通过车载摄像机、激光雷达、毫米波雷达、超声波等传感器来感知周围环境,实时动态监测周边环境变化,并依据所获取的信息进行决策判断,形成安全合理的路径规划。

 

市面上推出的自动驾驶解决方案,也基本是围绕着这两个模块展开。这两个模块构成了自动驾驶的决策规划能力。面对人工智能算法以及以毫米波雷达为代表的感知系统方面的现有局限性,自动驾驶方案提供商需要在极度安全与极度智能这两个维度中找到平衡点。投资人普遍认为,软硬件的突破确实不易,如何在产品策略方面推出能够落地商业化综合应用是众多玩家未来的主要策略。


深度学习算法以及感知能力的瓶颈该如何解决?


目前,深度学习还有尚未突破的痛点。比如,在高速路上行驶,广告牌上若有人像,汽车“大脑”会误认为是人,发出提示音。原因是深度学习尚未达到与人类相同的判断能力。 “基于深度学习的视觉系统,不可能把万事万物都学习一遍。”王肖解释道。

 

再有,近期出现的多起电动汽车安全事故,都是撞上了高速路上的静态物。这不仅有上述的深度学习原因,也有感知层面中毫米波雷达的固有弊端。最常见的有,由毫米波雷达对金属比较敏感,有时会误将龙门架识别为汽车。

 

以上提及的深度学习算法以及感知能力到底该如何解决?如果是特斯拉这样单纯使用视觉识别是否可行?纵观业内众多解决方案,主要是两种方法。一是多融合感知方案,用决策逻辑弥补感知问题;二是在云端自动化的实现算法迭代,通过数据驱动的强化学习来训练决策逻辑。在本月 17 日,召开了新品发布会的智行者,向外界发布了“轻地图,重感知”的解决方案。这套解决方案包含了以上两种方法。

 

张放直言,智行者不是纯视觉支持者。“如果后端决策规划能力没有上来之前,采用纯视觉识别永远是有问题的。最典型的是夜间场景。我们推出的 H-INP 系统恰恰弥补了这一缺点。”

据悉,H-INP 采用了 6 颗摄像头+5 个毫米波雷达的多融合感知方案。这种解决方案可以减少对高清地图的依赖,从而实现“轻地图,重感知”。不依赖高清地图,也是中国自动驾驶厂商未来拓展海外市场必须具备的能力。

 

此外,在硬件架构配置方面,H-INP 还采用了智行者自主研发的车规级高算力域控制器,算力可达 128TOPS,CPU 计算能力达 30K DMIPS。结合上述的多融合感知方案,实现了成本的有效控制,既满足了车辆安全运行的需求,又达到了前装量产的标准。据智行者介绍,目前 H-INP 的成本在数千人民币。智行者希望通过低成本的方式,快速推进自动驾驶落地,进而形成商业闭环。目前,这套系统还处于原型测试阶段,预计今年第四季度推出量产版本。

 

据张放介绍,H-INP 采用了平台化设计,可在此统一架构下开发出系列产品,满足不同场景的需求。在整体系统架构的设计方面,H-INP 具有功能模块化、接口抽象化等特点,具体表现为:

1.将架构进行了分层解耦,可以更加便利地利用最新技术成果;

2.算法模块化复用,通过图形化工具实现应用设计、开发、集成和调试,将研发聚焦在算法本身;

3.深度优化的通信和调度机制,提供多级通信机制与模块部署的局部性特点相适应,提供确定性和 CPU-GPU 联合调度。


图 2:智行者 CTO 王肖

 

在构建多融合感知方案中,智行者实施了以下三个步骤,以通过语义理解生成一个实时的云端地图。整个过程,还原和模拟了人在开车时的真实情境。“通过眼睛感知外部事物,从而在大脑中形成了外界地图。”

 

第一步是准确的目标和准确的检测能力。通过传感器准确传回所需要的数据,要精确的“看到”车道线、标志牌等道路元素。

 

第二步 3D 场景重建的能力。在感知算法的基础上,尽可能在 3D 场景中准确还原传感器传回的“图景”,并把离散在不同时空中的每一帧融合为一个完整的物理世界。

 

第三步是语义理解,理解周遭环境的能力。只有经过逻辑关系和拓扑关系处理之后,才能做出最终的决策规划。比如,经过前两步实现了完整清晰的物理世界,抓取到了车道线等道路基本相关信息。那么,接下来,车辆在行驶中要如何利用这些抓取到的这些信息,来判断是左拐还是右拐?这就需要第三步逻辑关系去处理,形成决策规划,然后输送给控制单元进行实施。

 

用数据驱动迭代算法,从而提升自动驾驶能力也是智行者着重提升的能力维度之一。这其中涉及到如何去快速挖掘数据,清洗数据和更新云端的算法模型。张放认为,有用的数据才能反馈出真实问题,提升算法。快速发现数据就是要自动化的挖掘有意义的数据。这些数据通常是在边界或者目前尚未解决的场景。张放补充到,在此环节,智行者先采用仿真系统测试一遍算法模型,之后再将有效的数据运用到真实车辆进行试验。这样做可以提升开发效率。

 

综上,智行者用在夯实能力的基础上,使用了产品策略来实现其从特殊场景、特种车辆等场景延伸至乘用车领域。


“必经战事”:商业化场景落地


今年 8 月初,百度发布了一个声明:已获得中国武汉、重庆两个城市的批准,可以向乘客提供全无人驾驶网约车( Robotaxi )有偿服务。但这并不意味着无人驾驶可以进行大范围商业应用。只有达到现有网约车相同的实用性,彻底拿掉安全员、不限目的地、不限区域的自动驾驶,才是真正的商业化。我们熟悉的理想、蔚来、小鹏以及特斯拉实质上应用的都是 L2 级别的辅助驾驶系统。L5 级别的自动驾驶(完全无人驾驶)实现还需要很长时间的探索和落地试验。传感器、算法软件等将是无人驾驶技术本身需要攻克的难关。另一方面,能否在现实场景中实现无人驾驶与整个交通体系密切相关,这又取决于智慧交通的发展。


图 3:合流分流


在这篇文章创作之初,InfoQ 编辑曾联系过多家曾经投出了自动驾驶明星项目的早期投资机构。事实上,已经有投资机构将注意力转移到了其他领域。有关人士指出,目前各个赛道的竞争格局已经形成,加之技术创新周期长的原因,接下里的竞争主要集中在商业化落地场景中。此前,毕马威中国则预测,中国主要城市将在 2030 年实现自动驾驶的大规模应用。自动驾驶很可能在下个十年以网约车或物流配送车的形式进入市场。

 

据智行者介绍,其已在特种场景和室外无人环卫车细分市场中进行了布局,且所占市场份额不低。此次发布的高速领航系统 H-INP(Highway – Idriver+ Navigation Pilot)表明智行者正式进入了乘用车领域。未来,还将打造适用于城市场景的城市领航系统 C-INP 系统,可实现不同时段(白天/夜间),人车混行交通流下的辅助驾驶。

 

上述的感知与决策模块,以及商业化场景落地探索问题,都可以采取产品策略进行缓解。但是,还有许多业内人士指出,算力已是制约当前自动驾驶向前发展的一个重大考验,同时也是自动驾驶系统得以大规模落地以及进一步实现商业化的前提条件。在提及算力之前,当前芯片短缺已成为汽车行业的巨大痛点。

2022-08-24 18:068092

评论 1 条评论

发布
用户头像
这种计算,识别应该比较费电吧。
2022-08-25 12:12 · 广东
回复
没有更多了
发现更多内容

日志审计是什么?为什么企业需要日志审计?

ServiceDesk_Plus

日志审计 合规性管理 审计日志

万界星空科技专门针对数字化改造申报的MES

万界星空科技

可视化 数字化 智能制造 mes 万界星空科技mes

ArkWeb高级安全模式 - 提升应用安全性

秃头小帅oi

测试人生 | 双非院校,2年工作经验年薪近20万

测吧(北京)科技有限公司

测试

为什么选择租用香港服务器?

Ogcloud

服务器 服务器租用 云服务器租用

GreptimeDB vs. InfluxDB 性能测试报告

Greptime 格睿科技

时序数据库 查询 写入

创新突破!天翼云荣膺CCF HPC China 2024高性能计算创新大奖

天翼云开发者社区

云计算 高性能计算

2024算力中国·年度重大成果!天翼云成功入选!

天翼云开发者社区

人工智能 云计算

TapData 知识库 | 一文吃透数据整合(Data Consolidation)

tapdata

数据库 什么是ETL

ChatGPT背后的AI背景、技术门道和商业应用(万字长文,建议收藏)

京东科技开发者

过关斩将!天翼云红盾安全团队荣获双项大奖!

天翼云开发者社区

云计算 互联网大会 天翼云

一次彻底讲清如何处理mysql 的死锁问题

快乐非自愿限量之名

MySQL 数据库

趣味科普:人的大脑相当于什么水平的CPU和GPU

伤感汤姆布利柏

火盾云APP盾的 防御机制及其应用场景

HUODUNYUN

节点 DDoS 应用安全防护 APP盾 游戏盾

区块链开发入门: 原理、技术与实践

区块链软件开发推广运营

交易所开发 区块链开发 链游开发 dapp开发链游开发 链游开发代币开发

什么是 Spring Cloud?它解决了哪些问题?

我爱娃哈哈😍

微服务 SpringCloud

鸿蒙开发案例:推箱子

zhongcx

解析阿里巴巴商品详情API返回的JSON数据结构

技术冰糖葫芦

API 接口 API 文档 API 测试 API 性能测试

公链数字钱包开发:加密钱包App原生开发指南

区块链软件开发推广运营

交易所开发 dapp开发 链游开发 NFT开发 公链开发

五种编程语言运行速度对比

高端章鱼哥

云手机与传统手机的不同之处

Ogcloud

云手机 海外云手机 云手机海外版 云手机群控 手机群控

创新数据新要素发展新质生产力!天翼云助力数字经济高质量发展

天翼云开发者社区

云计算 天翼云

京东APP百亿级商品与车关系数据检索实践

京东科技开发者

简单三步完成 Telegram 生态的 Web3 冷启动

Footprint Analytics

Telegram Web 3.0

第三届OpenHarmony技术大会展区亮点纷呈,全方位洞见智慧互联未来

科技热闻

Java栈溢出|内存泄漏|内存溢出

EquatorCoco

Java

Java常用类——包装类 小白版个人推荐

不在线第一只蜗牛

Java

关于并发编程与线程安全的思考与实践

京东科技开发者

淘宝商品详情数据接口抓取商品视频参数

tbapi

淘宝商品详情接口 淘宝商品视频接口

如何理解分布式事务

我爱娃哈哈😍

分布式 分布式事务 微服务

Higress 重磅更新:AI 能力全面开源,云原生能力再升级

阿里巴巴云原生

阿里云 云原生 Higress

自动驾驶创业方向有变化?如何突破技术瓶颈?_AI&大模型_李阳_InfoQ精选文章