【ArchSummit】如何通过AIOps推动可量化的业务价值增长和效率提升?>>> 了解详情
写点什么

英伟达重大突破:用 AI 自动建模渲染图像,加快 3D 游戏开发

  • 2018-12-04
  • 本文字数:2119 字

    阅读完需:约 7 分钟

英伟达重大突破:用AI自动建模渲染图像,加快3D游戏开发

AI 前线导读: 这个简单的驾驶模拟器将变革视频游戏图像处理领域。


更多干货内容请关注微信公众号“AI 前线”(ID:ai-front)



(真实视频录像和英伟达 AI 生成视频对比)


最近,人工智能领域的繁荣已取得让人惊叹的成果,尤其是在图像和视频生成领域。最新的成果来自于芯片设计商英伟达,今天,该公司演示了如何结合传统视频游戏引擎和 AI 生成视频。这个混合型的图像系统将来可能会被用于视频游戏、电影和虚拟现实应用中去。


英伟达应用深度学习副总裁 Bryan Catanzaro 表示,“这是一种使用深度学习生成视频的新方法,很明显英伟达很重视生成图像,并在思考 AI 将如何变革这个领域。”


英伟达的这一工作成果其实不是真实的,和大部分 AI 生成的图像一样,英伟达生成的视频中商标也是模糊的。这也并非一项全新的技术。在一篇研究论文中,该公司的工程师解释了他们如何基于一些现有方法,包括一个名为 pix2pix 的有影响力的开源系统,部署了生成对抗网络(GAN)。这种神经网络被广泛用于 AI 图像生成,包括最近由佳士得出售的AI肖像


但英伟达此次有所创新,发布了第一个由 AI 生成图像的视频游戏演示。利用这个简单的驾驶模拟器,玩家可以在 AI 生成的几个城市街区空间中导航,但不能离开车内或以其他方式与世界互动。该演示仅使用一个 GPU 即可实现,这一点非常领先。(虽然不可否认,他们使用的 GPU 是该公司价值 3000 美元的顶级产品 Titan V,据称是“有史以来最强大的 PC GPU”,而且通常用于高级模拟处理而不是游戏。)


英伟达系统可以在几个步骤内生成图像。


  1. 收集训练数据,数据来自用于自动驾驶研究的开源数据集。

  2. 将该镜头分段,每个帧被分成不同的类别:天空、车、树木、道路、建筑物等。

  3. 使用分段数据训练生成对抗网络,生成这些对象的新版本。

  4. 工程师使用传统流行的游戏引擎 Unreal Engine 4 创建虚拟环境的基本拓扑。使用此环境作为框架,深度学习算法实时生成每个不同类别项目的图像,将它们粘贴到游戏引擎的模型上。


“结构还是用传统的方法创建,”Catanzaro 解释说,“人工智能生成的唯一东西就是图像。”他补充道,演示本身是基本的操作,由一名工程师完成。 “这是概念验证,而不是一个有趣的游戏。”



(AI 生成图像比较:左上角是分割图;右上角是 pix2pixHD;左下角 COVST;右下角,英伟达系统 vid2vid。图片来源:英伟达)


为了创建这个系统,英伟达的工程师必须解决许多问题,其中最大的挑战是对象持久性。即如果深度学习算法以每秒25帧的速率生成现实世界的图像,他们如何保持对象看起来相同?Catanzaro说这个问题意味着系统初期的生成结果将会“看起来像个灾难”,因为颜色和纹理“每帧都会改变”。


解决方案是给系统一个短期记忆,以便将每个新帧与之前的帧进行比较。它尝试预测这些图像中的运动等因素,并创建与屏幕上的内容一致的新帧。所有这些计算都很昂贵,因此游戏只能以每秒 25 帧的速度运行。


Catanzaro 强调,这项技术处于早期阶段,而且人工智能生成的图像可能需要几十年时间才能成为消费级产品。他将这种情况与光线跟踪的发展进行了比较,光线跟踪是当前图像渲染的热门技术,它能实时生成单独的光线,在虚拟环境中创建逼真的反射、阴影和不透明度。“第一次交互式光线追踪演示发生在很久很久以前,但直到几周前,我们还没有在游戏中得实现它,”他说。


这项工作确实在其他研究领域有应用潜力,包括机器人和自动驾驶汽车,它可以用来生成训练环境。不久之后,它可能会出现在消费产品中,尽管范围有限。


例如,该技术可用于混合图像系统,其中大多数游戏使用传统方法渲染,但使用 AI 创建人或物体的相似性。消费者可以使用智能手机自己获取素材,然后将这些数据上传到云端,算法将学习复制并将其插入到游戏中。例如,它可以更容易地创建看起来和玩家相似的头像。


然而,这种技术引起了一些明显的问题。近年来,专家越来越担心别有用心之人使用 AI 生成的伪造品进行虚假宣传。研究人员已经证明,生成一些政治家和名人从未说过的话合或做过的事非常简单,AI 将变成一把双刃剑。


同时,英伟达还提出,该技术可能会用于生成一些具有误导性的内容。Catanzaro 表示,英伟达正在和合作伙伴合作探索检测虚假 AI 的方法,但这种假消息最终是“信任问题”。和之前很多信任问题相似,此问题需要一些列的方法来解决,而不仅是技术手段。


Catanzaro 表示,英伟达需要负一部分责任,“难道 AI 生成假视频,发明电力的公司也需要负责任吗?”


对于英伟达来说,推动 AI 生成图像技术总的来说将会对其有益:它将帮助英伟达售卖更多的硬件,英伟达的股价也随着 2010 年深度学习的火爆而上升(虽然最近有下降的趋势),因为该公司的芯片与机器学习发展的需求非常契合。


原文链接:


https://www.theverge.com/2018/12/3/18121198/ai-generated-video-game-graphics-nvidia-driving-demo-neurips



链接:http://t.cn/E28YBT9


公众号推荐:

2024 年 1 月,InfoQ 研究中心重磅发布《大语言模型综合能力测评报告 2024》,揭示了 10 个大模型在语义理解、文学创作、知识问答等领域的卓越表现。ChatGPT-4、文心一言等领先模型在编程、逻辑推理等方面展现出惊人的进步,预示着大模型将在 2024 年迎来更广泛的应用和创新。关注公众号「AI 前线」,回复「大模型报告」免费获取电子版研究报告。

AI 前线公众号
2018-12-04 18:412176

评论 1 条评论

发布
暂无评论
发现更多内容

Wallys-Waterproof Enclosure Metal Outdoor

wallys-wifi6

IPQ4019 802.11ac

还在为模型加速推理发愁吗?不如看看这篇吧。手把手教你把pytorch模型转化为TensorRT,加速推理

AI浩

EfficientNet实战:tensorflow2.X版本,EfficientNetB0图像分类任务(小数据集)

AI浩

图像分类

深度探索通过数据共享(data sharing)优化 Amazon Redshift 工作负载分解

亚马逊云科技 (Amazon Web Services)

数据 负载

如何评估服务是否内存泄漏了?

BUG侦探

缓存 容器 内存泄漏

鸿蒙生态 | 从开发到运营,如何步步为“赢”?

最新动态

MobileVIT实战:使用MobileVIT实现图像分类

AI浩

图像分类实战:mobilenetv2从训练到TensorRT部署(pytorch)

AI浩

Kafka 万亿级消息实践之资源组流量掉零故障排查分析

vivo互联网技术

大数据 kafka 监控

面试突击50:单例模式有几种写法?

王磊

Java java面试

Wallys-QCN9074 /802.11ax/4x4 MU-MIMO /6GHz wifi6E

wallys-wifi6

VIT实战总结:非常简单的VIT入门教程,一定不要错过

AI浩

一文看懂博睿数据AIOps场景、算法和能力

博睿数据

AIOPS 智能运维 博睿数据

亚马逊云科技 2022 年 3 月新服务新功能强势来袭

亚马逊云科技 (Amazon Web Services)

服务 亚马逊

你想学Python爬虫?看看这篇关于开发者工具神器的博客吧

梦想橡皮擦

5月月更

聊武侠、讲段子,为了帮小白入门Spring Boot,这书有多拼!

博文视点Broadview

ResNet实战:单机多卡DDP方式、混合精度训练

AI浩

如何为服务网格做端到端测试

Flomesh

测试 Service Mesh 服务网格

如何写好产品手册?

小炮

SWA实战:使用SWA进行微调,提高模型的泛化

AI浩

数字化转型背景下,企业如何做好知识管理?

小炮

企业知识管理

BladeDISC 0.2.0更新发布

阿里云大数据AI技术

深度学习 存储 并行计算 异构计算 算法框架/工具

STM32F103系列开发_点亮LED灯

DS小龙哥

5月月更

HashMap 源码分析-新增

zarmnosaj

5月月更

OpenHarmony 3.1 Release版本特性解析——OpenHarmony硬件资源池化架构介绍

OpenHarmony开发者

OpenHarmony 多设备协同

开源集结令!参与开源之夏 EMQ 项目开发,赢最高 12000 元奖金

EMQ映云科技

开源 物联网 emq 开源之夏 5月月更

如何通过 Amazon Textract 改善新冠疫情期间的 PPP 贷款效率

亚马逊云科技 (Amazon Web Services)

效率 Amazon

Swin Transformer实战: timm使用、Mixup、Cutout和评分一网打尽,图像分类任务

AI浩

中国信通院发布“可信开源”全景观察 成立三大开源产业组织

中国IDC圈

开源 开源治理

数字孪生智慧物流之 Web GIS 地图应用

一只数据鲸鱼

GIS 数据可视化 智慧物流 数字孪生 三维仿真

ABAP Code Inspector 的一些高级功能分享

Jerry Wang

编程语言 代码扫描 SAP abap 5月月更

英伟达重大突破:用AI自动建模渲染图像,加快3D游戏开发_AI&大模型_James Vincent_InfoQ精选文章