写点什么

模拟仿真系统中的汽车和行人模型

  • 2019-08-17
  • 本文字数:1677 字

    阅读完需:约 6 分钟

模拟仿真系统中的汽车和行人模型

在模拟仿真的环境中,一部分属于静态的物体,以背景为主,比如高架桥、楼房、街道、树木、河流和山丘等等,另一部分是动态的物体,比如汽车、行人、摩托车、自行车和动物等等。静态的环境数据需要 3-D 模型或者 IBR 模型,而动态的活动模型,就需要提供运动学和动力学模型。


在汽车工业,有众多成熟的仿真模拟公司做汽车 CAD 模型和车体运动学/动力学模型,比如 MSC 软件公司的 VIRES、西门子收购的公司 TASS 开发的 PreScan、IPG 公司的 CarMaker、Mechanical Simulation 公司的 CarSim 和 dSpace 的 Automotive Simulation Models(ACM)等。如下图分别是 CarMaker、CarSim 和 ACM 的汽车模型。





图片来自黄浴的知乎


人体模型以及人脸模型是模拟行人的基础,作为外观的服装也需要 3-D 建模,至于更多的细节如皮肤和头发部分,对自动驾驶环境仿真的效果不那么敏感。同时作为一个运动物体,本身需要提供其骨架模型(skeleton model),行走或者其他动作,如倒地和蹲下等,需要运动学模型确定,甚至摩托车手和自行车手也可以在一些动作细节上做工作,体现出其特有的动作模型。面部表情和人体动作一样,也需要提供变形模型(也有肌肉模型和表情单元模型等)和运动学方程决定仿真的面部动作,如惊讶,微笑,甚至哭泣等等。手指运动类似于人体运动,有独特的骨架模型描述。


在对人体运动理解和建模困难的情况下,以前动画游戏制作者会采用运动捕获技术,即在运动物体身上贴红外标记(marker),在红外摄影数据中得到人体模型的运动模式。


在计算机视觉研究领域,一些研究者探索如何通过真实图像的数据采用机器学习和概率方法对人体(包括提到的人脸,服装等)的外观和运动(包括表情和手势)进行建模,其中还是和计算机图形学的 3-D 模型结合,即 IBR 或者 VBR(video-based rendering)技术。


基于视频数据重建 3-D 人体模型:



图片来自黄浴的知乎


一个交互式服装建模和编辑的工具:



图片来自黄浴的知乎


一种基于深度学习得到运动转换的方法,这里将基于视觉捕获的人体运动传递到另外一个人身上。



图片来自黄浴的知乎


基于深度学习 GAN 理论学习一个面部表情的转换方法,基于视觉的面部显著标记(landmark)处理,可以将一个人的表情传递到另外一个人脸上。



图片来自黄浴的知乎


对一些表观和运动细节的把握也有一些研究工作,如下图基于深度学习从图像中直接头发建模:



图片来自黄浴的知乎


对自行车手的特技动作进行建模,得到其运动学模型表示:



图片来自黄浴的知乎


参考文献:


1、CarMaker


2、CarSim


3、ACM


4、Alldieck et al., “Video Based Reconstruction of 3D People Models”, SIGGRAPH 2018


5、N Umetani et al., “Sensitive Couture for Interactive Garment Modeling and Editing”, SIGGRAPH 2011.


6、C Chan et al., “Everybody Dance Now”,arXiv 1808.07371,2018


7、E Zakharov et al.,“Few-Shot Adversarial Learning of Realistic Neural Talking Head Models“,arXiv 1905.08233,2019


8、M Chai et al., “AutoHair: Fully Automatic Hair Modeling from A Single Image”,SIGGRAPH,2016


9、J Tan et al.,“Learning Bicycle Stunts”,SIGGRAPH 2014


本文来源:


https://zhuanlan.zhihu.com/p/66962321


2019-08-17 18:026641

评论

发布
暂无评论
发现更多内容

科兴未来|第二届T-MAX“科创太仓”国际创新创业--先进材料专场赛

科兴未来News

知识图谱之《海贼王-ONEPICE》领域图谱项目实战(含码源):数据采集、知识存储、知识抽取、知识计算、知识应用、图谱可视化、问答系统(KBQA)等

汀丶人工智能

自然语言处理 知识图谱 信息抽取

深入解析Redis的LRU与LFU算法实现

vivo互联网技术

redis LRU LFU

户外led显示屏常见规格有哪些

Dylan

广告 屏幕亮度 像素 LED显示屏 户外LED显示屏

Kurator v0.4.0版本更新4大内容,满足多云环境的复杂需求

华为云开发者联盟

云原生 后端 华为云 华为云开发者联盟 企业号 7 月 PK 榜

智能电视APP鲜时光,如何应用AB测试打造极致的用户观看体验?

字节跳动数据平台

万字血书React—走近React

不在线第一只蜗牛

React 教程分享

飞桨和硬件伙伴们在WAIC 2023!

飞桨PaddlePaddle

人工智能 百度 paddle 飞桨 百度飞桨

5个祖传的Python自动化办公项目,治愈你的抑郁

程序员晚枫

Python 微信 自动化 机器人 办公

PoseiSwap 更新第二期空投,持有 Zepoch 节点数量将决定空投回报

鳄鱼视界

企业内容管理升级 3.0:构建生态协同,助力合规成长

风来兮

软件 电子档案 OCR 合规 #人工智能

INFINI Labs 产品更新 | Easysearch 新增 kNN 搜索功能、Console 支持 LDAP 认证登录等

极限实验室

console Gateway 产品更新 easysearch 极限科技

手把手教学构建农业知识图谱:农业领域的信息检索+智能问答,命名实体识别,关系抽取,实体关系查询

汀丶人工智能

人工智能 深度学习 nlp 知识图谱 智能问答

基于知识图谱的《红楼梦》人物关系可视化及问答系统(含码源):命名实体识别、关系识别、LTP简单教学

汀丶人工智能

人工智能 深度学习 nlp 知识图谱 智能问答

代码随想录训练营 Day09 - 字符串(下)

jjn0703

手把手教学构建证券知识图谱/知识库(含码源):网页获取信息、设计图谱、Cypher查询、Neo4j关系可视化展示

汀丶人工智能

人工智能 自然语言处理 nlp 知识图谱

区块链生态架构 | 社区征文

TiAmo

区块链 Baas 年中技术盘点

Git操作不规范,战友提刀来相见!

树上有只程序猿

Pytorch: 数据读取机制Dataloader与Dataset

timerring

人工智能

深度剖析之由浅入深揭秘JavaScript类型转换(最全总结篇)

Immerse

JavaScript 类型转换 隐式转换 类型 强制类型转换

几天不写React,已经看不懂语法了

伤感汤姆布利柏

中国大模型的落地DNA,写在这个双螺旋结构里

脑极体

AI

如何优化Flutter的性能?

没有用户名丶

谈谈我这两年的前端开发经验

树上有只程序猿

王海峰最新发声!

飞桨PaddlePaddle

人工智能 百度 paddle 飞桨 百度飞桨

模拟仿真系统中的汽车和行人模型_AI&大模型_黄浴_InfoQ精选文章