写点什么

ECCV 2024|有效提高盲视频去闪烁的新方法——BlazeBVD

作者:美图影像实验室

  • 2024-07-22
    北京
  • 本文字数:2177 字

    阅读完需:约 7 分钟

大小:1.10M时长:06:26
ECCV 2024|有效提高盲视频去闪烁的新方法——BlazeBVD

近年,短视频生态的赛道迅猛崛起,围绕短视频而生的创作编辑工具在不断涌现,美图公司旗下专业手机视频编辑工具——Wink,凭借独创的视频画质修复能力独占鳌头,海内外用户量持续攀升。Wink 画质修复功能火爆的背后,是美图在视频编辑应用需求加速释放背景下,对用户视频画面模糊不清、噪点严重、画质低等视频创作痛点的洞察,与此同时,也建立在美图影像研究院(MT Lab)强有力的视频修复与视频增强技术支持下,目前已推出画质修复-高清、画质修复-超清、画质修复-人像增强、分辨率提升等功能。日前,美图影像研究院(MT Lab)联合中国科学院大学更突破性地提出了基于 STE 的盲视频去闪烁(blind video deflickering, BVD)新方法 BlazeBVD,用于处理光照闪烁退化未知的低质量视频,尽可能保持原视频内容和色彩的完整性,已被计算机视觉顶会 ECCV 2024 接收。



论文链接:https://arxiv.org/pdf/2403.06243v1

 

BlazeBVD 针对的是视频闪烁场景,视频闪烁容易对时间一致性造成影响,而时间一致性是高质量视频输出的必要条件,即使是微弱的视频闪烁也有可能严重影响观看体验。究其原因,一般是由拍摄环境不佳和拍摄设备的硬件限制所引起,而当图像处理技术应用于视频帧时,这个问题往往进一步加剧。此外,闪烁伪影和色彩失真问题在最近的视频生成任务中也经常出现,包括基于生成对抗网络(GAN)和扩散模型(DM)的任务。因此在各种视频处理场景中,探索通过 Blind Video Deflickering (BVD)来消除视频闪烁并保持视频内容的完整性至关重要。

 

BVD 任务不受视频闪烁原因和闪烁程度的影响,具有广泛的应用前景,目前对此类任务的关注,主要包括老电影修复、高速相机拍摄、色彩失真处理等与视频闪烁类型、闪烁程度无关的任务,以及仅需在单个闪烁视频上操作,而不需要视频闪烁类型、参考视频输入等额外指导信息的任务。此外,BVD 现主要集中在传统滤波、强制时序一致性和地图集等方法,所以尽管深度学习方法在 BVD 任务中取得了重大进展,但由于缺乏先验知识,在应用层面上受到较大阻碍,BVD 仍然面临诸多挑战。


BlazeBVD: 有效提高盲视频去闪烁效果

 

受经典的闪烁去除方法尺度时间均衡(scale-time equalization, STE)的启发,BlazeBVD 引入了直方图辅助解决方案。图像直方图被定义为像素值的分布,它被广泛应用于图像处理,以调整图像的亮度或对比度,给定任意视频,STE 可以通过使用高斯滤波平滑直方图,并使用直方图均衡化校正每帧中的像素值,从而提高视频的视觉稳定性。虽然 STE 只对一些轻微的闪烁有效,但它验证了:

(1)直方图比像素值紧凑得多,可以很好地描绘光亮和闪烁信息。

(2)直方图序列平滑后的视频在视觉上没有明显的闪烁。


因此,利用 STE 和直方图的提示来提高盲视频去闪烁的质量和速度是可行的。

 

BlazeBVD 通过对这些直方图进行平滑处理,生成奇异帧集合、滤波光照图和曝光掩码图,可以在光照波动和曝光过度或不足的情况下实现快速、稳定的纹理恢复。与以往的深度学习方法相比,BlazeBVD 首次细致地利用直方图来降低 BVD 任务的学习复杂度,简化了学习视频数据的复杂性和资源消耗,其核心是利用 STE 的闪烁先验,包括用于指导消除全局闪烁的滤波照明图、用于识别闪烁帧索引的奇异帧集,以及用于识别局部受过曝或过暗影响的区域的曝光图。

 

与此同时,利用闪烁先验,BlazeBVD 结合了一个全局闪烁去除模块(GFRM)和一个局部闪烁去除模块(LFRM),有效地矫正了个别相邻帧的全局照明和局部曝光纹理。此外,为了增强帧间的一致性,还集成了一个轻量级的时序网络(TCM),在不消耗大量时间的情况下提高了性能。



图 1:BlazeBVD 方法与已有方法在盲视频去闪烁任务上的结果对比

 

具体而言,BlazeBVD 包括三个阶段:

首先,引入 STE 对视频帧在光照空间下的直方图序列进行校正,提取包括奇异帧集、滤波后的光照图和曝光图在内的闪烁先验。

其次,由于滤波后的照明映射具有稳定的时间性能,它们将被用作包含 2D 网络的全局闪烁去除模块(GFRM)的提示条件,以指导视频帧的颜色校正。另一方面,局部闪烁去除模块(LFRM)基于光流信息来恢复局部曝光图标记的过曝或过暗区域。

最后,引入一个轻量级的时序网络(TCM)来处理所有帧,其中设计了一个自适应掩模加权损失来提高视频一致性。


通过对合成视频、真实视频和生成视频的综合实验,展示了 BlazeBVD 优越的定性和定量结果,实现了比最先进的模型推理速度快 10 倍的模型推理速度。 

 


图 2:BlazeBVD 的训练和推理流程

实验结果


大量的实验表明,盲视频闪烁任务的通用方法——BlazeBVD,在合成数据集和真实数据集上优于先前的工作,并且消融实验也验证了 BlazeBVD 所设计模块的有效性。

 


表 1:与基线方法的量化对比



图 3:与基线方法的可视化对比



图 4:消融实验

以影像科技助力生产力

 

该论文提出了一种用于盲视频闪烁任务的通用方法 BlazeBVD,利用 2D 网络修复受光照变化或局部曝光问题影响的低质量闪烁视频。其核心是在照明空间的 STE 滤波器内预处理闪烁先验;再利用这些先验,结合全局闪烁去除模块(GFRM)和局部闪烁去除模块(LFRM),对全局闪烁和局部曝光纹理进行校正;最后,利用轻量级的时序网(TCM)提高视频的相干性和帧间一致性,此外在模型推理方面也实现了 10 倍的加速。

 

作为中国影像与设计领域的探索者,美图不断推出便捷高效的 AI 功能,为用户带来创新服务和体验,美图影像研究院(MT Lab)作为核心研发中枢,将持续迭代升级 AI 能力,为视频创作者提供全新的视频创作方式,打开更广阔的天地。

2024-07-22 16:166767

评论

发布
暂无评论
发现更多内容

你好,工作!

小天同学

工作 心态 自我思考

将Arch Linux安装到U盘

Kurtis Moxley

Linux 安装操作系统

真香!Linux 原来是这么管理内存的

苹果看辽宁体育

Linux 操作系统

国家版权局发布《关于规范摄影作品版权秩序的通知》

CECBC

电子存证 作品版权 侵权盗版 剑网2019

NameNode和SecondaryNameNode工作机制

古月木易

NameNode econdaryNameNode

到底一台服务器能够支持多少TCP并发连接?

南方有乔木兮

如何设计一个亿级消息量的IM系统

Java Architecture Architect IM Instant Messaging

央行数字货币或将成为经济“内循环”的未来加速器

CECBC

数字经济 全球经济下行 降息 惠普金融深化

QQ音乐PB级ClickHouse实时数据平台架构演进之路

腾讯云大数据

大数据

week08 总结

Z冰红茶

第八周总结

andy

极客大学

NameNode和SecondaryNameNode工作机制

奈学教育

NameNode

一周信创舆情观察(7.20~7.26)

统小信uos

池化技术到达有多牛?看了线程和线程池的对比吓我一跳!

王磊

Java

秒杀全网!研发、运营必备实用工具网站

程序员生活志

工具类网站

什么样的信任才值得拥有?谈一谈极客邦的5K1S文档

霍太稳@极客邦科技

Django框架,Flask框架和Tornado框架各有什么优缺点

古月木易

django flask tornado

当远程工作成为未来的工作方式......

Atlassian

Atlassian Jira

LeetCode题解:142. 环形链表 II,JavaScript,快慢指针,详细注释

Lee Chen

大前端 LeetCode

架构训练营第八周作业

张锐

第八周作业

andy

极客大学

第八周作业

田振宇

如何成为一个成功的首席数据官

麒思妙想

实战:docker搭建FastDFS文件系统并集成SpringBoot

生命在于折腾

springboot

一个小实验,来

池建强

算法 薪资

原创 | 使用JPA全面实现DDD持久化【关于本书】

编程道与术

Java hibernate DDD JDBC jpa

蚂蚁上市:P7可获1200万元期权,酸酸酸酸酸...

程序员生活志

互联网热点 蚂蚁金服

乘商用之风,破后疫情之浪:丁耘分享华为如何持续护航5G新价值

脑极体

Django框架,Flask框架和Tornado框架各有什么优缺点

奈学教育

django flask tornado

顺势昌,逆势亡:人啊,得学会做信天翁,而不是鹧鸪鸟

非著名程序员

创业 程序员 管理 提升认知

Flink 1.11 SQL 使用攻略

Apache Flink

flink

ECCV 2024|有效提高盲视频去闪烁的新方法——BlazeBVD_计算机视觉_InfoQ精选文章