最新发布《数智时代的AI人才粮仓模型解读白皮书(2024版)》,立即领取! 了解详情
写点什么

谷歌联合哈佛大学发布最新研究,使用 NeRF 创建 360 度完整神经场景视频

  • 2021-12-16
  • 本文字数:1290 字

    阅读完需:约 4 分钟

谷歌联合哈佛大学发布最新研究,使用NeRF创建360度完整神经场景视频

Google Research 与哈佛大学最新的合作研究,提出了一种称为“Mip-NeRF 360”的新方法。该方法使用 NeRF(Neural Radiance Fields)创建 360 度完整神经场景(neural scene)的视频,进一步推动了 NeRF 适用于在任何环境中随意抽象,不再受限于桌面模型封闭室内场景


不同于大多数前期方法,Mip-NeRF 360 给定了对光线的解释方式,并通过建立关注区域边界降低了原本冗长的训练时间,实现可处理背景的扩展和天空这样的“非受限”场景。


新论文的标题为“Mip-NeRF 360: Unbounded Anti-Aliased Neural Radiance Fields”,由 Google Research 高级研究科学家 Jon Barron 牵头完成的。


为深入理解该论文的技术突破,首先对基于 NeRF 的图像生成做一个基础的阐释。

什么是 NeRF?


NeRF 网络并非真正地去描述一个视频,而是使用对单张照片和视频各帧的多个视角拼接出场景,因此更类似于一种基于 AI 实现的完全 3D 虚拟环境。该场景从技术上看只存在于机器学习算法的隐空间(latent space),但可从中任意抽取出大量的视角和视频。


图1 多摄像头捕获点示意图(左图);NeRF获取各捕获点,并拼接出神经场景(右图)


给定一张照片,通过训练其中的信息,生成一个类似于传统 CGI 工作流中体素网格(Voxel grids)的矩阵。矩阵中为 3D 空间中的每个点赋予了一个值,形成可被访问的场景。


图2:体素矩阵示例,其中以三维空间存储像素信息。像素通常采用二维形式表示,例如JPEG文件的像素网格。图片来源:ResearchGate。


该方法在完成各照片间必要的间质空间计算后,通过“光线追踪”确定光照路径上每张照片的每个可能像素点,并对其分配一个颜色值和透明度值。如果没有指定透明度,那么神经矩阵可能是完全不透明的,也可能是完为空的。


NeRF 矩阵与基于 CGI 的三维坐标空间不同,但与体素网格类似,其中的“封闭”对象并不存在任何内部表示。例如,一个架子鼓对象在 CGI 中是可以拆开查看其内部的,但在 NeRF 中一旦将该对象的表面不透明度值设置为 1,那么这台架子鼓就会消失。

像素视角的扩展


Mip-NeRF 360 是对2021年3月发表的一项研究的进一步拓展。该研究提出的 Mip-NeRF 方法通过在 NeRF 中引入有效的抗锯齿,避免做过量的超采样(supersampling)。


NeRF 一般只计算单条像素路径,易于产生早期互联网图像格式和游戏系统中所特有的“锯齿感”。为消除锯齿感边缘,已有方法通常是对相邻像素进行采样,并给出平均表示。


针对传统 NeRF 仅对单条像素路径采样,Mip-NeRF 提出了一种类似宽光束手电筒的“锥形”汇集区,对相关相邻像素提供了充分的信息,形成细节改进的低代价抗锯齿方法。


图3 Mip-NeRF使用的“锥形”汇集区被切片成视锥(下图),并做进一步的模糊化处理,生成用于计算像素精度和锯齿的高斯空间。图片来源:https://www.youtube.com/watch?v=EpH175PY1A0


该方法显著改进了标准 NeRF 实现,如下图所示:


图4 发表于2021年3月的Mip-NeRF方法(右图)。它通过更全面和低代价的锯齿流水线而非对像素的模糊化处理,实现细节改进,避免边缘产生锯齿状。图片来源:https://jonbarron.info/mipnerf/

无界 NeRF


但 Mip-NeRF 依然存在三个尚未解决的问题。首先,要应用于天空这样的无界环境中,其中可能包含超远距离的对象。Mip-NeRF 360 通过对 Mip-NeRF 高斯空间应用Kalman扭曲解决了该问题。


第二,更大的场景需要更高的处理能力和更长的训练时间。为解决该问题,Mip-NeRF 360 使用小规模“提议”多层感知器(MLP,multi-layer perceptron)去“提炼”场景的几何形状。MLP 根据大规模标准 NeRF MLP 预测的几何形状,预先限定了当前形状范围,将训练速度提高了三倍。


第三,更大的场景往往会导致需解构几何体的离散化存在模糊不清的问题,进而导致输出游戏玩家可能非常熟知的“画面撕裂”伪影。Mip-NeRF 360 通过新建对 Mip-NeRF 射线间隔的正则化处理而解决了该问题。


图5 图右侧使用Mip-NeRF,难以对如此规模的场景进行界定,因此产生了不必要的伪影。图左侧使用了新的正则化处理,完全可优化消除这些干扰。


原文链接: Neural Rendering: NeRF Takes a Walk in the Fresh Air

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2021-12-16 15:042194

评论

发布
暂无评论
发现更多内容

Wolfram Mathematica 13 中文激活+安装教程最新

胖墩儿不胖y

Mac软件 数学计算软件 计算工具

代码随想录 Day51 - 动态规划(十二)

jjn0703

蓝易云:IT知识百科:什么是分布式云?

百度搜索:蓝易云

云计算 Linux 运维 云服务器 分布式云

窗口到底有多滑动?揭秘TCP/IP滑动窗口的工作原理

华为云开发者联盟

后端 开发 华为云 华为云开发者联盟 企业号 8 月 PK 榜

[小笔记] Java 线程池

java易二三

Java 程序员 线程 线程池 计算机

Forrester首次面向中国的开源报告:阿里云在云原生领域开源布局最全面

阿里巴巴云原生

阿里云 开源 云原生

SpringBoot 的优雅的接口参数验证

java易二三

Java 编程 程序员 计算机

一文了解JVM对象内存布具以及内存分配规则

java易二三

Java 程序员 JVM 计算机

盲盒商城模式玩法,盲盒商城系统开发搭建

V\TG【ch3nguang】

盲盒商城 盲盒开发

Presto 设计与实现(八):Presto JDBC

冰心的小屋

数据湖 JDBC presto 设计与实现 presto jdbc

Parallels Desktop 19:支持Touch ID的免密码登录功能

晴雯哥

小灯塔系列-中小企业数字化转型系列研究——文档协作测评报告

向量智库

OpenHarmony 4.0 Beta2新版本发布,邀您体验

OpenHarmony开发者

OpenHarmony

如何基于 Kubernetes 实现优质开发者平台体验?

SEAL安全

Kubernetes IdP 平台工程 内部开发者平台

Java 面试题——MySQL 索引篇

郑在暴富中

Java 面试题 MySQL索引

R语言之 dplyr 包

timerring

R 语言

解锁多核处理器的力量:探索数据并行化在 Java 8 Stream 中的应用

java易二三

Java 程序员 计算机

多币种挖矿dapp流动性LP令牌质押开发搭建[源码部署]

V\TG【ch3nguang】

质押挖矿 流动性挖矿

火山引擎DataLeap基于Apache Atlas自研异步消息处理框架

字节跳动数据平台

数据中台 数据治理 数据安全 数据研发 企业号 8 月 PK 榜

蓝易云:如何在Linux系统服务器中测试存储/磁盘I/O性能?

百度搜索:蓝易云

Linux 运维 io 磁盘

联邦学习:对“数据隐私保护”和“数据孤岛”困境的破局

vivo互联网技术

人工智能 联邦学习 数据隐私 数据安全 gdpr

Python案例|Matplotlib库实现的数据分析

TiAmo

Python 数据挖掘 数据分析

超级AI助手:全新提升!中文NLP训练框架,快速上手,海量训练数据

汀丶人工智能

人工智能 大语言模型 ChatGLM-6B bloom

移动端应用程序的一些测试方案和策略

QE_LAB

移动端测试

酷睿轻薄本也能运行大语言模型,英特尔推动 PC 生成式 AI 落地

E科讯

全套解决方案:中文NLP训练框架,支持大模型训练和文本生成,快速上手,海量训练数据!

汀丶人工智能

人工智能 自然语言处理 大语言模型

ARTS 0819 打卡

冰封的鸢尾花

ARTS 打卡计划

Parallels Desktop 19 新功能 pd19虚拟机最新中文破解版安装图文教程、破解方法

晴雯哥

最新中文 Keka for Mac(压缩解压工具) v1.3.3

mac大玩家j

解压缩软件 解压软件 解压缩工具

谷歌联合哈佛大学发布最新研究,使用NeRF创建360度完整神经场景视频_文化 & 方法_Martin Anderson_InfoQ精选文章