NVIDIA 初创加速计划,免费加速您的创业启动 了解详情
写点什么

CVPR 2019 最佳论文得主专访:非视距形状重建的费马路径理论

  • 2019-07-13
  • 本文字数:3063 字

    阅读完需:约 10 分钟

CVPR 2019 最佳论文得主专访:非视距形状重建的费马路径理论

本文为 Robin.ly 授权转载,文章版权归原作者所有,转载请联系原作者。


本期Robin.ly CVPR 2019 专题访谈特邀大会最佳论文奖获得者辛书冕和 Ioannis Gkioulekas 教授现场对话,分享他们的研究成果和获奖体会。辛书冕本科毕业于西安交通大学电气工程专业,目前是卡内基·梅隆大学机器人研究所的在读博士生,Ioannis 是该所的助理教授。他们合作的论文 “A Theory of Fermat Paths for Non-Line-of-Sight Shape Reconstruction” 获得了本年度 CVPR 大会的最佳论文奖。


如评选委员会的颁奖词所述:“这篇论文为非视距(non-line-of-sight ,NLOS)重建做出了重大贡献,尤其是赋予了智能体看到角落的能力。这是一篇出色的、鼓舞人心的论文,它帮助我们继续推进计算机视觉领域的探索极限。“


下文为 Robin.ly 主持人 Margaret Laffan 与辛书冕和 Ioannis Gkioulekas 教授的访谈实录。

获奖论文简介

主持人:书冕和 Ioannis 教授,感谢两位参与我们的谈话。祝贺你们获得了今年 CVPR 大会的最佳论文奖。能简单介绍一下自己吗?


辛书冕:


我叫辛书冕,是卡内基梅隆大学机器人研究所的二年级博士生。我跟随 Srinivasa Narasimhan 和 Ioannis Gkioulekas 教授一起研究非视距成像问题。这篇论文介绍的也是这方面的一些研究成果。


Ioannis:


大家好,我是 Ioannis Gkioulekas,在卡内基梅隆大学机器人研究所担任助理教授,从事计算机成像和计算机视觉方面的工作。



CVPR 2019 最佳论文颁奖现场


(来源:卡内基·梅隆大学)


主持人:你能介绍一下这篇获奖论文“A Theory of Fermat Paths for Non-Line-of-Sight Shape Reconstruction”吗?你们团队完成这篇论文大概花了多长时间?


辛书冕:


我们在这项工作中要解决的问题是如何重建被遮挡住的、以及在摄像机或传感器视野之外的物体。我们会观察其他的表面,比如墙壁,反射的一些关于非视距对象的信息,然后使用飞行时间传感器收集这些信息来重建非视距对象的形貌。我做这个课题差不多有两年的时间,这篇文章介绍的是我们尝试过的很多方法中的一种。这个课题我们还会继续做一段时间。


主持人:那么这项研究最重要的贡献是什么?


辛书冕:


我们很高兴看到所重建的非视距对象的质量已经非常接近视距的对象,也就是相机视野范围内的对象。这就好像我们让整个世界变得像镜面一样,这样我们就可以在任何地方重建那里的对象。


主持人:这项研究在实际生活中有哪些应用呢?


辛书冕:


这种 NLOS 技术有很多重要的应用。例如,在医疗领域,我们可以使用这种技术进行微创手术。医生只需要用光线照射你的喉咙,测量一下从身体内部反射回来的光子,就能了解到你体内大概的情况。在自动驾驶领域,能够提前了解行驶路线的周围环境,特别是位于视线之外的情况。另外,如果发生火灾,这项技术可以帮助救援人员观察到被火挡住的地方,为救援工作提供帮助。

选择课题的初衷

主持人:的确都是非常重要的应用场景。你们为什么当初选择了这个课题?


辛书冕:


这个课题本身就很有意思,看不见的地方是什么情况还是很让人好奇的。实际上在 2009 年的 ICCV 大会上,来自麻省理工学院的 Ramesh Raskar 团队就做了第一个 NLOS 重建工作,向我们展示了这项技术的可能性。目前整个计算成像领域正在将这种技术推向更高的水平,我希望能见证这项技术的发展,所以就选择了这个课题。


主持人:很多人会用 LiDAR 来解决类似的问题。你为什么选择了不同的方法?


辛书冕:


实际上我们使用的方法与 LiDAR 没有显著的差别。因为 LiDAR 用的是第一个返回的光子来估算深度,但我们使用的是飞行时间传感器收集到的一些后续光子信息来进行 NLOS 重建。我们观察的是墙,如果像 LiDAR 那样只使用第一个返回的光子,那重建出来的只能是那堵墙;所以必须收集间接的从这些对象传回传感器的后续光子才能重建被挡住的对象。与 LiDAR 类似,我们只使用时间信息进行深度估算,因为时间乘以光速就是路径长度,这样就可以直接重建这些对象的形貌。



非视距成像示例:被遮光板遮挡(a)和被漫射板遮挡(b)的物体表面重建结果与视距扫描结果(c)对比。详情见论文:http://imaging.cs.cmu.edu/fermat_paths/assets/cvpr2019.pdf

NLOS 成像领域的展望

主持人:教授,你对这项研究的进展有什么看法?


Ioannis:


做非视距成像方面的研究很有意思,就像书冕说的,计算成像领域有很多人正在研究这个问题。而且有几个团队已经在这个领域取得了一些不错的成绩,比如我们研究所的 Matthew O’Toole,斯坦福大学的 Gordon Wetzstein 和威斯康星大学的 Andreas Velten。他们的成果为我们继续推进这方面的研究铺平了道路。我很高兴能见证这个领域多年来的发展,也很期待看到我们的文章对这个领域有一定的贡献。


主持人:能不能展望一下这个领域下一阶段的发展?


Ioannis:


NLOS 成像中的一个主要的问题是如何提高信噪比。我们一直在尝试测量一些反弹了多次的光子,但这样的光子很少,能测量到的只有十几个,跟噪音水平相当。所以要提高信噪比才能实现书冕刚才提到的那些应用,这也是我们下一步要重点推进的方向。这是第一步,信号增强之后我们会尝试在限制更少的场景中运用这个技术。



辛书冕(右二)、Ioannis Gkioulekas 教授(右一)与 Robin.ly 主持人 Margaret 在美国长滩 CVPR2019 现场对话

团队合作

主持人:这篇论文有六个作者,分别来自来自三个研究单位。书冕,能不能给我们介绍一下论文背后的这个团队。你们是如何合作的?大家平时怎么沟通?


辛书冕:


Srinivasa Narasimhan (CMU 机器人研究所教授)和 Ioannis Gkioulekas 都是我的导师。我和 Ioannis 每天都会沟通研究进展。Srinivasa 也经常来我的办公室询问实验情况,我会跟他交流当时的进度和下一步的计划。


实际上关于这个课题最初的想法是 Ioannis 和 Aswin Sankaranarayanan(CMU 机器人研究所助理教授)提出来的。Kiriakos Kutulakos (多伦多大学教授)在这项研究中也付出了很多心血,他们在多伦多大学为我们提供了初始阶段的硬件设置。早期比较繁琐的实验工作都是 Sotiris Nousias (伦敦大学学院博士生、多伦多大学访问学者)做的。有了他们的帮助,我们才能取得今天的成果,朝着正确的方向努力。



实验室里的辛书冕(来源:卡内基·梅隆大学)


主持人:教授,从你和学校的角度是怎么看待这次合作的?


Ioannis:


这是一次非常有趣的合作。Kyros 和 Srinivasa 都是我们这个领域的资深研究人员,总是会带来很多独特的见解。最初是我和 Aswin 提出了这样的一个想法。后来我们试着去解决这里面涉及到的一些数学问题,在多伦多大学 Sotiris 的帮助下,我们获得了第一个实验测量结果,证明了我们的想法是可行的。这是一次非常重要的合作。


主持人:书冕,你下一步有什么打算?


辛书冕:


我非常感谢大会颁发给我这个奖项,这是对我们工作极大的肯定,也鼓励我挑战自己能力极限。我建议对计算成像感兴趣的人都能进入这个领域研究学习。这个领域融合了物理学、光学和计算机视觉,是一个充满挑战、但也非常有趣的研究方向。


主持人:说得太好了。教授,你对书冕和整个团队获奖有什么感想吗?


Ioannis:


这对我们是很大的认可。很高兴看到计算机成像作为计算机视觉领域的一小部分,现在得到了大家的认可,也希望这会鼓励更多的人在这个领域耕耘。有女生获得这个奖项也让我觉得很欣慰,希望以后有更多的女生能学习理工科。


主持人:说得太好了。我很期待你们提到的应用场景能够尽快变成现实。非常感谢你们参与我们的访谈,很荣幸邀请到你们。再次表示祝贺,这是一项非常了不起的成就。


原文链接:


https://www.robinly.info/post/cvpr-2019-best-paper-award-shumian-xin-ioannis-gkioulekas-carnegie-mellon-university


公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2019-07-13 08:003255
用户头像
Robin.ly 硅谷AI科技、创业、领导力访谈

发布了 49 篇内容, 共 18.1 次阅读, 收获喜欢 59 次。

关注

评论

发布
暂无评论
发现更多内容

不太推荐 《沟通的方法》(17/28)

赵新龙

28天写作

反射

Nydia

架构实战营 4 期第二模块作业

jialuooooo

架构实战营

TCP报文发送的那些事

程序员历小冰

网络 TCP/IP 28天写作 12月日更

如何在 CentOS 8 服务器上安装 ISP Config 3.2?

Ethereal

服务器 ISP CentOS 8

如何在 Debian 11 上使用 Nginx 安装 HTTP Git 服务器

Ethereal

nginx git HTTP Debian 11

【LeetCode】换酒问题Java题解

Albert

算法 LeetCode 12月日更

存量经营

张老蔫

吹水的6大坏习惯

搬砖的周狮傅

沟通艺术

Dubbo框架学习笔记五

风翱

dubbo 12月日更

模块二作业

whoami

「架构实战营」

抬头看天

xujiangniao

知识梳理

演绎法、归纳法、辩证法

mtfelix

28天写作

详解PON基础知识:OLT、ONU、ONT和ODN,建议收藏

Ethereal

pon 光纤 弱电工程师

分布式锁及其实现

xcbeyond

分布式锁 28天写作 12月日更

学生管理系统架构文档

drizzle

「架构实战营」

保护自己电脑绝对不做黑客肉鸡

喀拉峻

网络安全 安全

Go+ URL 解析教程(5.6)

liuzhen007

28天写作 12月日更

16.  《重学JAVA》--1.8新日期类

杨鹏Geek

Java 25 周年 28天写作 12月日更

面向WEB开发人员的Docker(七):使用 Docker 开发Node应用程序

devpoint

node.js Docker 12月日更

[Pulsar] Producer 流控

Zike Yang

Apache Pulsar 12月日更

走进Java接口测试之简单解决写接口脏数据问题

zuozewei

Java 自动化测试 测试开发 接口自动化 12月日更

电商秒杀系统

胡颖

架构实战营

HTTP超时处理

JavaEdge

12月日更

.NET 6新东西--高性能日志

喵叔

28天写作 12月日更

文本编辑器GNU Nano 6.0 发布!

Ethereal

Nano

细节的问题

将军-技术演讲力教练

47 K8S之 Ingress资源

穿过生命散发芬芳

k8s 28天写作 12月日更

性能工具之linux三剑客awk、grep、sed详解

zuozewei

Linux 性能测试 12月日更

读《思辨与立场》-05批判性思维发展的四个层级

wood

28天写作 批判性思维 思辨与立场

Turbine

李子捌

微服务 28天写作 12月日更

CVPR 2019 最佳论文得主专访:非视距形状重建的费马路径理论_AI&大模型_Robin.ly_InfoQ精选文章