【ArchSummit】如何通过AIOps推动可量化的业务价值增长和效率提升?>>> 了解详情
写点什么

谷歌 AI 和 Facebook 提出 AI 模型 QuaterNet,改善 3D 人体姿势预测

  • 2019-01-25
  • 本文字数:1079 字

    阅读完需:约 4 分钟

谷歌AI和Facebook提出AI模型QuaterNet,改善3D人体姿势预测

预测 3D 人体姿势可能不属于大多数人关注的范畴,但机器人技术、计算机图形学和其他关注运动学的领域(与物体运动有关的力学分支)却可以从能够做到这一点的系统中受益匪浅。此前,由谷歌提出的姿势预测成为应用人工智能(AI)的任务之一,但先前的相关工作遇到了一些障碍:数字关节和骨骼会向不自然的方向拉伸,特别是当关节旋转时。


幸运的是,Facebook 的人工智能研究部门,谷歌大脑和苏黎世联邦理工学院的新研究有望解决这个问题。在本周发布在 Arxiv.org 预印论文网站上的一篇论文(《基于四元数的人体运动神经网络》)中,研究人员提出了一个人工智能系统——QuaterNet,它通过将关节旋转表示为四元数的复数系统,以及惩罚关节位置错误来改善姿势生成。



正如本文的共同作者所解释的那样,循环神经网络(一种能够学习长期相关性的 AI 算法)历来被用于执行短期和长期姿态预测,而卷积神经网络 (非常擅长于分析视觉图像的算法)已成功应用于长期生成运动(从一个位置移动到另一个位置)。但由于人体姿势的固有随机性,是否能获得一个完美的模型仍然难以预测。


“人体运动是一个具有高度不确定性的随机过程,”研究人员写道。“对于一个给定的过去情景,未来会有多个可能的未来帧序列,并且不确定性会随着持续时间而增加。”


大多数模型使用转换运算符来预测先前姿势的下一个姿势。它们从摄取的记录帧中输出记录的目标帧,这在大多数情况下都很有效。但这个过程不会暴露它的错误,因此会阻阻碍它学习,以避免重蹈覆辙。



上图:AI 模型生成的姿势。


相比之下,研究人员提出的系统采用卷积神经网络,它可以查看过去的帧,通过持续将自己暴露于预测中不断学习进行长期预测。同时,损失函数(将一个或多个变量的值映射到实数上的函数)输入关节旋转并计算每个关节的位置。共同作者表示,这既改善了模型的稳定性,又减少了误差。


为了验证该模型的短期姿势预测能力,研究人员在 Human3.6M 上进行测试,这是一个开源 3D 人体姿势数据集,包含来自 7 名演员演示的 15 个动作的 360 万个人类姿势以及相应的图像。而长期生成测试评估在包含运动样本的其他数据集上进行。


在短期预测任务中,报告显示该模型在 Human3.6M 上的性能有所提升。另外,在长期姿势生成任务中,其目标是在给定平均速度和地面轨迹的情况下生成姿势序列,该模型的表现与最近的工作相比为“定性地”,同时时间和空间限制更好。


未来,QuaterNet 将扩展到其他与运动相关的任务中,例如动作识别或视频的姿势估计,以及采用“直接在四元数域中执行计算”的神经网络。


原文链接:


https://venturebeat.com/2019/01/24/facebook-and-googles-ai-generates-3d-human-poses/


公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2019-01-25 14:375703
用户头像

发布了 98 篇内容, 共 62.6 次阅读, 收获喜欢 285 次。

关注

评论

发布
暂无评论
发现更多内容

Python爬取高质量电脑壁纸,还是很好看的,面试总结

程序媛可鸥

Python 程序员 面试

Python爬虫入门教程15:音乐网站数据的爬取,我了解到的面试的一些小内幕

程序媛可鸥

Python 程序员 面试

Red Hat:疫情促使企业拥抱开源

WorkPlus

招贤纳士 | 中国联通数据库团队

openGauss

全卷积网络(FCN)实战:使用FCN实现语义分割

华为云开发者联盟

语义分割 CNN 图像分割 FCN 全卷积网络

Python3通过函数名调用函数的几种场景实现,贼厉害

程序媛可鸥

Python 程序员 面试

python中strip(),lstrip(),rstrip()函数的使用讲解,Python开发知识点

程序媛可鸥

Python 程序员 面试

python中函数作用域,高级Python开发面试解答之线程篇

程序媛可鸥

Python 程序员 面试

想了解 spring-cloud-kubernetes,那就先来实战一把官方demo

华为云开发者联盟

spring Kubernetes Spring Cloud Spring Boot

Python爬取淘宝商品数据,价值千元的爬虫外包项目,最新美团点评Python团队面试题

程序媛可鸥

Python 程序员 面试

详解《send》源码中NodeJs静态文件托管服务实现原理

CRMEB

Python数据结构与算法(2,阿里一线架构师技术图谱

程序媛可鸥

程序员 面试

Apache Flink 在斗鱼的应用与实践

Apache Flink

大数据 flink 开源 编程 实时计算

万里数据库加入openGauss社区,共促数据库生态繁荣与产品创新

openGauss

Python 中进程和线程的用法基本一样,跪了

程序媛可鸥

Python 程序员 面试

Python 蜻蜓fm有声书批量下载 支持账号登录 原创源码,斩获offer

程序媛可鸥

Python 程序员 面试

Python两个内置函数locals 和globals,Python项目开发如何设计整体架构

程序媛可鸥

Python 程序员 面试

Python爬取51job招聘信息,全网独家首发

程序媛可鸥

Python 程序员 面试

经验分享 | FAQ制作工具推荐

小炮

数据库人才招聘 | 中国移动

openGauss

Python 金融量化 随机指标交易策略,闭关60天学懂NDK+Flutter

程序媛可鸥

Python 程序员 面试

Python数据分析 之 制作酷炫的可视化大屏,特简单,我把所有Python框架整理成了PDF

程序媛可鸥

Python 程序员 面试

Python数据类型——字典,一次哔哩哔哩面试经历

程序媛可鸥

Python 程序员 面试

Python文字转换语音,让你的文字会「说话,Python面试项目包装

程序媛可鸥

Python 程序员 面试

云和恩墨数据库人才招聘

openGauss

数据库人才招聘 | 海量数据

openGauss

openGauss 兰州用户组正式成立

openGauss

技术创想 | shiro550和721反序列化简谈

领创集团Advance Intelligence Group

反序列化

Python实现Singleton模式的几种方式,正在准备面试

程序媛可鸥

Python 程序员 面试

10个月,15亿,阿里云如何赋能企业打造交付和创新竞争力

阿里云云效

云计算 阿里云 云原生 研发 研发运维

深度学习下运维日志分析的趋势解读与应用实践

云智慧AIOps社区

人工智能 深度学习 日志分析 智能运维

谷歌AI和Facebook提出AI模型QuaterNet,改善3D人体姿势预测_AI&大模型_KYLE WIGGERS_InfoQ精选文章