NVIDIA 初创加速计划,免费加速您的创业启动 了解详情
写点什么

自动驾驶生成式大模型 DriveGPT 来了:基于 4000 万公里量产车驾驶数据训练,参数规模 1200 亿

  • 2023-04-12
    北京
  • 本文字数:1937 字

    阅读完需:约 6 分钟

自动驾驶生成式大模型DriveGPT来了:基于4000万公里量产车驾驶数据训练,参数规模1200亿

4 月 11 日,InfoQ 获悉,自动驾驶创企毫末智行发布了业内首个自动驾驶生成式大模型 DriveGPT,中文名“雪湖·海若”。


自动驾驶生成式大模型 DriveGPT 雪湖·海若


自动驾驶生成式大模型 DriveGPT 雪湖·海若,有望成为大模型技术落地自动驾驶新范式。


毫末智行 CEO 顾维灏介绍了雪湖·海若名字的来源:“‘海若’出自《庄子·秋水》,里面有两个神话人物河伯和北海若。河伯请教北海若,何谓大小之分,北海若教导,不因天地而觉大,不因毫末而觉小。毫末雪湖·海若,寓意智慧包容、海纳百川,为行业发展贡献力量。”



毫末 DriveGPT 雪湖·海若通过引入驾驶数据建立 RLHF(人类反馈强化学习)技术,对自动驾驶认知决策模型进行持续优化。它的最终目标是实现端到端自动驾驶,现阶段主要用于解决自动驾驶的认知决策问题,后续持续会将毫末多个大模型的能力整合到 DriveGPT。


目前,毫末 DriveGPT 雪湖·海若实现了模型架构与参数规模的升级,参数规模达到 1200 亿,预训练阶段引入 4000 万公里量产车驾驶数据,RLHF 阶段引入 5 万段人工精选的困难场景接管 Clips。


DriveGPT 雪湖·海若的底层模型采用 GPT(Generative Pre-trained Transformer)生成式预训练大模型,与 ChatGPT 使用自然语言进行输入与输出不同,DriveGPT 输入是感知融合后的文本序列,输出是自动驾驶场景文本序列,即将自动驾驶场景 Token 化,形成“Drive Language”,最终完成自车的决策规控、障碍物预测以及决策逻辑链的输出等任务。(DriveGPT 雪湖·海若)DriveGPT 雪湖·海若的实现过程是,首先在预训练阶段通过引入量产驾驶数据,训练初始模型,再通过引入驾驶接管 Clips 数据完成反馈模型(Reward Model)的训练,然后再通过强化学习的方式,使用反馈模型去不断优化迭代初始模型,形成对自动驾驶认知决策模型的持续优化。同时,DriveGPT 雪湖·海若还会根据输入端的提示语以及毫末 CSS 自动驾驶场景库的决策样本去训练模型,让模型学习推理关系,从而将完整驾驶策略拆分为自动驾驶场景的动态识别过程,完成可理解、可解释的推理逻辑链生成。


在应用方面,DriveGPT 雪湖·海若的首发车型是新摩卡 DHT-PHEV,即将量产上市。顾维灏提到,DriveGPT 雪湖·海若可以逐步应用到城市 NOH、捷径推荐、智能陪练以及脱困场景中。有了 DriveGPT 雪湖·海若的加持,车辆行驶会更安全;动作更人性、更丝滑,并有合理的逻辑告诉驾驶者,车辆为何选择这样的决策动作。对于普通用户来说,车辆越来越像老司机,用户对智能产品的信任感会更强,理解到车辆的行为都是可预期、可理解的。



目前,毫末 DriveGPT 雪湖·海若已正式对外开放,开启对限量首批客户的合作,北京交通大学计算机与信息技术学院、高通、火山引擎、华为云、京东科技、四维图新、魏牌新能源、英特尔等已经加入。毫末 DriveGPT 的对外开放及服务,将促进自动驾驶的从业者和研究机构快速构建基础能力。


毫末 DriveGPT 雪湖·海若将率先探索四大应用能力,包括智能驾驶、驾驶场景识别、驾驶行为验证、困难场景脱困。当前,毫末在使用数据过程中,逐步建立起一套基于 4D Clips 驾驶场景识别方案,具备极高性价比。在行业上,给出正确的标注结果,一张图片需要约 5 元;如果使用 DriveGPT 雪湖·海若的场景识别服务,一张图片的价格将下降到 0.5 元。单帧图片整体标注成本仅相当于行业的 1/10。接下来,毫末会将图像帧及 4D Clips 场景识别服务逐步向行业开放使用,这将大幅降低行业使用数据的成本,提高数据质量,从而加速自动驾驶技术的快速发展。



大模型研发离不开庞大的算力支撑。


顾维灏介绍,毫末在 2023 年 1 月发布的中国自动驾驶行业最大的智算中心 MANA OASIS(雪湖· 绿洲)此次从算力优化等层面升级了三大能力,进一步支持 DriveGPT 雪湖·海若的算力。首先,毫末与火山引擎全新搭建了“全套大模型训练保障框架”,实现了异常任务分钟级捕获和恢复能力,可以保证千卡任务连续训练数个月没有任何非正常中断,有效保证了大模型训练稳定性;其次,毫末研发出以真实数据回传为核心的增量学习技术,并将其推广到了大模型训练,构建了一个大模型持续学习系统,自主研发任务级弹性伸缩调度器,分钟级调度资源,集群计算资源利用率达到 95%;最后,MANA OASIS 通过提升数据吞吐量来降本增效,满足 Transformer 大模型训练效率,通过引入火山引擎提供的 Lego 算子库实现算子融合,端到端吞吐提升 84%。


毫末打造的自动驾驶数据智能体系 MANA,在经过一年多的应用迭代后,也迎来了全面的升级,正式开放赋能。顾维灏介绍,MANA 计算基础服务针对大模型训练在参数规模、稳定性和效率方面做了专项优化,并集成到 OASIS 中;其次,MANA 感知和认知相关大模型能力统一整合到 DriveGPT 雪湖·海若中;第三,增加了使用 NeRF 技术的数据合成服务,降低 Corner Case 数据的获取成本;同时针对多种芯片和多种车型的快速交付难题优化了异构部署工具和车型适配工具。

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2023-04-12 15:125390
用户头像
刘燕 InfoQ高级技术编辑

发布了 1112 篇内容, 共 494.1 次阅读, 收获喜欢 1967 次。

关注

评论

发布
暂无评论
发现更多内容

情感语音识别技术在心理健康领域的应用与挑战

来自四九城儿

量子计算和量子通信技术:引领潜力无限的未来

EquatorCoco

量子通信 量子计算 量子模拟

另辟蹊径者 PoseiSwap:背靠潜力叙事,构建 DeFi 理想国

EOSdreamer111

九凌网络分享外贸快车实现迅速出口的目标

九凌网络

EMQX ECP 2.0 工业互联数据平台产品发布会

EMQ映云科技

数字化转型 工业4.0 智慧工厂

有什么好用的IP代理吗?要求速度快,使用方便

Geek_ccdd7f

如何寻找优质的谷歌seo优化公司来提升你的外贸网站排名

九凌网络

快手SL200芯片获选2023世界互联网大会“创新发展典型案例”

Geek_2d6073

2023 IoTDB Summit 正式“官宣”,邀您见证“从数据到洞察”的未来!

Apache IoTDB

另辟蹊径者 PoseiSwap:背靠潜力叙事,构建 DeFi 理想国

石头财经

云主机使用的硬盘类型及对应的存储类型详解

天翼云开发者社区

云计算 存储 硬盘

阿里面试:看过框架源码吗?举例说明一下

王磊

Java

如何使用 NFTScan NFT API 在 zkSync 网络上开发 Web3 应用

NFT Research

NFT\ NFTScan nft工具

一文读懂 Fabarta ArcGraph 图数据库丨技术解读

Fabarta

人工智能 AI 图数据库 大模型 向量数据库

VR虚拟现实应用——原型制作

3DCAT实时渲染

虚拟现实 实时云渲染 VR虚拟现实

海外IP代理使用三年的经验之谈

Geek_ccdd7f

网站引流绝技:如何通过外链持续给网站带来高质量流量

九凌网络

低代码平台实践

这我可不懂

软件开发 低代码 JNPF

低代码平台的探究与分析

互联网工科生

软件开发 低代码 零代码 JNPF

极狐GitLab CI 助力 .Net 项目研发效率和质量双提升

极狐GitLab

.net ci 持续集成 代码规范 gitlab ci

十大项目管理主流方法论介绍

PingCode

项目管理 项目管理方法

数字政府!3DCAT实时云渲染助推上海湾区数字孪生平台

3DCAT实时渲染

实时渲染 实时云渲染

向量数据库:释放数据潜能,重塑信息世界

熬夜磕代码、

向量数据库

定制开发APP软件和网站的优势在哪里?

Geek_16d138

软件

低代码平台,业务开发的“银弹”

树上有只程序猿

软件开发 低代码平台 JNPF

文心一言 VS 讯飞星火 VS chatgpt (131)-- 算法导论11.2 3题

福大大架构师每日一题

福大大架构师每日一题

2023年的低代码:数字化、人工智能、趋势及未来展望

快乐非自愿限量之名

软件开发 低代码 低代码开发

2023云栖大会的新鲜事

法医

8款好用的AI流程图软件推荐,高颜值流程图轻松绘制!

彭宏豪95

人工智能 流程图 在线白板 AIGC 流程图绘制

智驾未来:自主创新才是真正握住了命脉

不在线第一只蜗牛

华为 智能驾驶 小鹏汽车 问界

强化您的应用安全,从app加固开始

雪奈椰子

自动驾驶生成式大模型DriveGPT来了:基于4000万公里量产车驾驶数据训练,参数规模1200亿_AI&大模型_刘燕_InfoQ精选文章