【AICon】 如何构建高效的 RAG 系统?RAG 技术在实际应用中遇到的挑战及应对策略?>>> 了解详情
写点什么

汽车“元宇宙”的初尝试

  • 2022-11-21
    北京
  • 本文字数:3582 字

    阅读完需:约 12 分钟

汽车“元宇宙”的初尝试

元宇宙的概念自 2021 年下半年以来就一直热度不减。根据 IDC 预测数据,从 2020 至 2024 的 5 年间,全球虚拟现实产业规模年均增长率将达到 54%。元宇宙犹如时代的列车呼啸而至,众多互联网巨头争相“搭乘“,而一直在寻找数字化转型解决方案的汽车行业也不甘落后,车企们纷纷在元宇宙领域施展拳脚。于是,InfoQ 特别采访了汽车之家主机厂事业部技术总监陈超,深度了解一下元宇宙技术在汽车行业的应用与实践。

 

陈超认为,“汽车元宇宙是以数字孪生的汽车为中心,通过布置虚实结合的环境再结合智能数字人组成而成的可与现实世界交互的虚拟世界。”

 

作为国内领先的汽车消费者在线服务平台,汽车之家积极尝试为用户带来全新的感官体验,通过虚拟数字人的方式充分发挥其情感链接价值,提供多元的品牌营销场景,拉紧了用户与品牌之间的共同纽带;又借助元宇宙技术,使用户能够在汽车之家能源空间站完成浏览、对比、试驾多个品牌新能源汽车的一站式操作;此外还采用 3D 虚拟展馆技术赋能“中国春季云车展”和“818 全球超级车展”,以颠覆性的创新能力和强大的科技实力展示了自己在元宇宙领域内的底蕴。

 

一、通过“虚拟数字人”讲好汽车品牌故事

 

借助虚拟数字人这一元宇宙载体,汽车品牌可以通过在虚拟空间进行互动,把过去无法实现的创意和效果得以实践,全方位展示品牌故事,并且可以和其他生态在虚拟空间进行联名创新。今年 818 汽车节中,汽车之家 AI 体验官宫玖羽、汽车之家品牌代言人谷爱凌“数字人”陆续亮相。

 


二者在 3D 人物模型方面区别比较大,宫玖羽是之家内部完全虚构的一个人物角色,在设计的时候更偏重往人物虚拟化 IP 方向打造,以突出人物独特性;谷爱凌则是由专业模型制作团队 1:1 真人复刻还原的孪生数字人形象,由于谷爱凌是一个家喻户晓的体育明星,所以对模型细节的要求很高。为了更真实的还原谷爱凌的形象,其终版人物模型三角面数量高达 1 亿多个,同时还要对谷爱凌的表情、动作和声纹进行了数据采集,应用了动作绑定和 TTS 等 AI 技术。



“超写实虚拟人需要尽量逼真写实还原真人效果,让用户感觉到是在和一个真人互动。”陈超表示,这其中涉及到高精模型制作、丰富的真人表情、流畅的动作、真人语音效果对话、智能实时对话等技术实现:

 

  • 在人物形象方面,谷爱凌对真人形象的细节还原度较高,只采集本人的声纹数据;宫玖羽则更多侧重打磨人物个性 IP,对多套真人声纹数据进行采集,可以随意切换不同版本的声音;

  • 在全流程实时渲染方面,两款虚拟人都应用了汽车之家自研的高性能 3D 实时渲染技术,依托云端高性能 GPU 显卡主机做实时渲染,以高清视频流的方式推送到各个边缘设备节点,提升渲染性能的同时可以覆盖支持更多低端边缘设备;

  • 在音频识别方面,汽车之家打造的这两款虚拟人可以理解普通话、四川话等多种方言,并能流畅地使用方言和用户进行对话。

 

当然,虚拟数字人不是独立存在的,它需要依托于场景、车等其他虚拟化,大量级的实时渲染对服务器造成了很大压力,并且拓展性也非常差。为此,汽车之家实现了一套信号融合架构,把之前一台设备、一套技术框架内的运算任务都通过高清视频信号的方式接入到 3D 元宇宙车展中,并针对其中涉及到的漫反射和透视问题编写定制化脚本,优化视觉感受。

 

未来,汽车之家除了通过持续升级数据样本和算法模型来提升虚拟人的智能化水平,让数字人更智能、更懂用户外,还会把数字人推广到全息舱、MR、真人、虚拟人混流直播等更多的场景中,让虚拟人技术赋能整个汽车行业。


二、“全息体验仓”颠覆汽车行业传统营销方式

 

“虚拟数字人+虚拟场景”等虚拟元素链接到实际营销活动中已十分普遍,不仅为品牌和企业提供了年轻化营销的创新思路,也为各行业如何用虚拟营销与 Z 世代产生链接带来更多启发,除了虚拟数字人之外,汽车之家还将虚拟场景链接到了实际营销当中,不断提升消费者的体验,在汽车之家能源空间站上海体验店中一站式浏览、对比和试驾多个品牌的新能源汽车。

 

空间站中最大的亮点就是“全息体验舱”,“全息技术”是“全息体验舱“的关键所在,汽车之家调研了国内外的一些 3D 虚拟化呈现技术,通过对比发现全息膜与环境非常契合,但考虑到全息膜上的舞台剧十分逼真,而汽车对效果的要求更高,汽车是否适合全息膜的场景尚未可知。为此,汽车之家专门做了一辆车通过视频的方式投射到全息膜上进行测试,发现效果差强人意,着手选用高级别的硬件在总部搭建了测试版全息舱,精心挑选供应商、硬件设备、3D 程序、中控指令台等,之后再对物理空间、图像文字清晰度、灯光、音响和背景亮度等进行打磨,最终在面前呈现了一台栩栩如生的汽车。



正如陈超所说,真正的狭义全息技术并不常见,它起于全息照相技术,应用于全息光栅光波导技术中,全息照相的过程十分复杂,很难为普通消费者所用,目前国内外消费级的狭义定义全息产品还没有。大部分的消费级产品分两类,一类是借助近眼显示设备和 3D 实时渲染技术呈现的“感知全息”,比如 Oculus 和 Hololens,这种目前国内外都有不错的消费级产品落地。还有一类就是我们说的类全息平面投影,通过借助半透半反的膜层把平面显示器的内容反射到观察者眼中,营造出立体感。好处是对用户设备没有要求,比较适合展厅类效果呈现。

 

纵观整个全息技术领域,目前要实现真正的狭义上的全息技术还存在较多的技术难点,如全息照相技术中所使用的全息光栅镜片的曝光制备技术,对光学实验环境有着很高的要求,无法在消费级产品中大规模量产。一个比较可行的方案是拓展 AR 类全息技术,例如 Magic Leap 公司的光场全息技术,但是这项技术对 AR 眼镜硬件设备的要求也很高。

 

目前,汽车之家在 3D 车的呈现方面专门针对类全息平面做了深度的效果优化,汽车之家在国内类全息平面投影技术的使用和整合程度上来说已是领先水平。未来,汽车之家上线接入更多的全息车辆,持续打磨更好的全息效果,并通过结合虚拟数字人和全息投影来打造更多的全息场景。


三、“3D 虚拟展馆”打造用车、看车新体验

 

虚拟展馆是指在互联网平台上发布的利用 VR 技术构建的数字化展览馆,是互联网新技术与传统会展领域的新融合。它是一种三维互动体验方式,不仅突破了时空限制,节约了建造成本,还可以发挥无限的想象创意,使观众能够随时随地在网络平台上感受展馆及展品,用仿真互动的方式体验“身临其境,畅游无限”的精彩。

 

汽车之家从三个方面应用 3D 虚拟展馆技术赋能车展,首先,打造了一个通用的 3D 展馆和 3D 模型技术中台,依托中台的低代码能力完成展馆的分钟级搭建,同时提供 2D/2.5D 层自定义能力,支持自助搭建各种不同效果的展厅,极大提升车展上线效率;其次,进行车展 3D 功能组件化封装,抽象地提炼出了 50 余个 3D 功能组件供多个展馆间进行快捷方便的复用;第三,将外部合作业务以插件化的方式接入,汽车之家设计了一套通用的插件化接入机制,实现外部合作业务,通过编写插件的方式快速接入展馆。



然而,罗马非一日建成,在 3D 虚拟展馆技术方面,汽车之家也进行了大量探索。比如手机是我们目前最常使用的设备,但手机的内容表现力往往受屏幕尺寸、电池、处理器(CPU、GPU)以及带宽等因素的限制,为了能让用户尽情在手机上逛展看车,汽车之家做了如下探索:

  • 在视觉方面,大量使用 2.5D 技术,同时,使用懒加载技术从各种方面替用户节省带宽;

  • 在 3D 技术应用方面,通过贴图压缩、模型压缩、GC、增加大量场景可承载内容等大量改进来补足引擎基础能力,加载速度也因此提升了 80%;

  • 采用并优化了智能逛展、智能讲车和用户智能推荐等智能化技术,让用户能够轻松逛展。

 

当下,汽车之家仍在致力于攻克虚拟数字人和 3D 云渲染等技术。陈超表示,“未来汽车之家将把所有的 2D 产品体验升级成 3D 体验,期望给用户带来完全不一样的看车、买车、用车和换车体验。”


四、写在最后

 

过去几年,汽车之家在元宇宙领域不断“秀肌肉”的同时,也为汽车产业发展注入了新动力,让人们的看车、试车变得有趣、便捷。我们甚至可以大胆畅想,在元宇宙发展成熟的未来,在一台五菱宏光上甚至也能模拟出开 F1 的快感,这种快感绝非如今的模拟声浪技术,而是真正集视觉、触觉和听觉于一体的体验。

 

回溯根本,元宇宙是物理世界、虚拟世界和人类社会三者高度融合的世界,主要有 3 项核心技术:一是扩展现实技术,包括 VR 和 AR,用以提供沉浸式的体验;二是数字孪生,把现实世界镜像到虚拟世界里面去;三是区块链技术,以搭建经济体系。然而目前元宇宙无论是底层技术还是应用场景上都还远未达成熟形态,整体发展尚处初级阶段,汽车元宇宙亦然。

 

当下,随着新能源汽车等智能化汽车的异军突起,汽车上承载的功能会越来越多,比如自动驾驶、模拟各个虚拟场景等,这必然对硬件的输入输出能力、芯片的算力、云计算能力等各方面都有非常高的要求,整个也是未来一段时间内智能汽车行业亟须解决的课题。而车企如果能与元宇宙结合得当,将会给行业带来更多的机会与未来。

2022-11-21 10:477977
用户头像
鲁冬雪 InfoQ 主编

发布了 322 篇内容, 共 178.0 次阅读, 收获喜欢 265 次。

关注

评论

发布
暂无评论
发现更多内容

C++ 使用getline():从文件中读取一行字符串

攻城狮Wayne

探索AI技术对古彝文保护与研究应用

袁袁袁袁满

每天打卡,跟冰河肝这些项目,技术能力嗖嗖往上提升

冰河

程序员 分布式 微服务 架构师 项目实战

简单好用的清理工具 BuhoCleaner激活中文版

mac大玩家j

Mac软件 清洁工具 清洁优化软件

关于可逆计算的讨论--答圆角骑士魔理沙

canonical

低代码 领域模型 可逆计算 Nop平台

OpenHarmony定义组件重用样式:@Styles装饰器

OpenHarmony开发者

OpenHarmony

Databend 源码阅读:配置管理

Databend

构建DevSecOps中的代码三层防护体系

华为云PaaS服务小智

云计算 敏捷开发 软件开发 华为云

JavaScript中的浮点数之谜:为什么0.1 + 0.2 不等于 0.3?

Lee Chen

JavaScript 前端

开源大咖说 | openEuler: 技术引领,走向世界

openEuler

Linux 开源 操作系统 openEuler 资讯

喜迎双节,测评征文活动等你来参加!

InfoQ写作社区官方

AI 大模型

DxO PhotoLab 6 for Mac(raw图片处理软件) 6.10.0.57中文激活版

mac

raw图片处理软件 苹果mac Windows软件 DxO PhotoLab 6

华为负一屏手机充值限时优惠来袭,快来薅羊毛

最新动态

Dubbo源码浅析(一)—RPC框架与Dubbo | 京东云技术团队

京东科技开发者

spring dubbo RPC RPC框架 企业号9月PK榜

文件和图像比较软件:Kaleidoscope激活最新版

胖墩儿不胖y

Mac软件 对比工具 对比软件

为什么 Lettuce 会带来更长的故障时间?

阿里技术

TCP

软件开发全套资料获取

金陵老街

百度交易中台之内容分润结算系统架构浅析

百度Geek说

大数据 架构 交易 调度任务 企业号9月PK榜

汽车“元宇宙”的初尝试_AI&大模型_鲁冬雪_InfoQ精选文章