写点什么

ECCV 2024|有效提高盲视频去闪烁的新方法——BlazeBVD

作者:美图影像实验室

  • 2024-07-22
    北京
  • 本文字数:2177 字

    阅读完需:约 7 分钟

大小:1.10M时长:06:26
ECCV 2024|有效提高盲视频去闪烁的新方法——BlazeBVD

近年,短视频生态的赛道迅猛崛起,围绕短视频而生的创作编辑工具在不断涌现,美图公司旗下专业手机视频编辑工具——Wink,凭借独创的视频画质修复能力独占鳌头,海内外用户量持续攀升。Wink 画质修复功能火爆的背后,是美图在视频编辑应用需求加速释放背景下,对用户视频画面模糊不清、噪点严重、画质低等视频创作痛点的洞察,与此同时,也建立在美图影像研究院(MT Lab)强有力的视频修复与视频增强技术支持下,目前已推出画质修复-高清、画质修复-超清、画质修复-人像增强、分辨率提升等功能。日前,美图影像研究院(MT Lab)联合中国科学院大学更突破性地提出了基于 STE 的盲视频去闪烁(blind video deflickering, BVD)新方法 BlazeBVD,用于处理光照闪烁退化未知的低质量视频,尽可能保持原视频内容和色彩的完整性,已被计算机视觉顶会 ECCV 2024 接收。



论文链接:https://arxiv.org/pdf/2403.06243v1

 

BlazeBVD 针对的是视频闪烁场景,视频闪烁容易对时间一致性造成影响,而时间一致性是高质量视频输出的必要条件,即使是微弱的视频闪烁也有可能严重影响观看体验。究其原因,一般是由拍摄环境不佳和拍摄设备的硬件限制所引起,而当图像处理技术应用于视频帧时,这个问题往往进一步加剧。此外,闪烁伪影和色彩失真问题在最近的视频生成任务中也经常出现,包括基于生成对抗网络(GAN)和扩散模型(DM)的任务。因此在各种视频处理场景中,探索通过 Blind Video Deflickering (BVD)来消除视频闪烁并保持视频内容的完整性至关重要。

 

BVD 任务不受视频闪烁原因和闪烁程度的影响,具有广泛的应用前景,目前对此类任务的关注,主要包括老电影修复、高速相机拍摄、色彩失真处理等与视频闪烁类型、闪烁程度无关的任务,以及仅需在单个闪烁视频上操作,而不需要视频闪烁类型、参考视频输入等额外指导信息的任务。此外,BVD 现主要集中在传统滤波、强制时序一致性和地图集等方法,所以尽管深度学习方法在 BVD 任务中取得了重大进展,但由于缺乏先验知识,在应用层面上受到较大阻碍,BVD 仍然面临诸多挑战。


BlazeBVD: 有效提高盲视频去闪烁效果

 

受经典的闪烁去除方法尺度时间均衡(scale-time equalization, STE)的启发,BlazeBVD 引入了直方图辅助解决方案。图像直方图被定义为像素值的分布,它被广泛应用于图像处理,以调整图像的亮度或对比度,给定任意视频,STE 可以通过使用高斯滤波平滑直方图,并使用直方图均衡化校正每帧中的像素值,从而提高视频的视觉稳定性。虽然 STE 只对一些轻微的闪烁有效,但它验证了:

(1)直方图比像素值紧凑得多,可以很好地描绘光亮和闪烁信息。

(2)直方图序列平滑后的视频在视觉上没有明显的闪烁。


因此,利用 STE 和直方图的提示来提高盲视频去闪烁的质量和速度是可行的。

 

BlazeBVD 通过对这些直方图进行平滑处理,生成奇异帧集合、滤波光照图和曝光掩码图,可以在光照波动和曝光过度或不足的情况下实现快速、稳定的纹理恢复。与以往的深度学习方法相比,BlazeBVD 首次细致地利用直方图来降低 BVD 任务的学习复杂度,简化了学习视频数据的复杂性和资源消耗,其核心是利用 STE 的闪烁先验,包括用于指导消除全局闪烁的滤波照明图、用于识别闪烁帧索引的奇异帧集,以及用于识别局部受过曝或过暗影响的区域的曝光图。

 

与此同时,利用闪烁先验,BlazeBVD 结合了一个全局闪烁去除模块(GFRM)和一个局部闪烁去除模块(LFRM),有效地矫正了个别相邻帧的全局照明和局部曝光纹理。此外,为了增强帧间的一致性,还集成了一个轻量级的时序网络(TCM),在不消耗大量时间的情况下提高了性能。



图 1:BlazeBVD 方法与已有方法在盲视频去闪烁任务上的结果对比

 

具体而言,BlazeBVD 包括三个阶段:

首先,引入 STE 对视频帧在光照空间下的直方图序列进行校正,提取包括奇异帧集、滤波后的光照图和曝光图在内的闪烁先验。

其次,由于滤波后的照明映射具有稳定的时间性能,它们将被用作包含 2D 网络的全局闪烁去除模块(GFRM)的提示条件,以指导视频帧的颜色校正。另一方面,局部闪烁去除模块(LFRM)基于光流信息来恢复局部曝光图标记的过曝或过暗区域。

最后,引入一个轻量级的时序网络(TCM)来处理所有帧,其中设计了一个自适应掩模加权损失来提高视频一致性。


通过对合成视频、真实视频和生成视频的综合实验,展示了 BlazeBVD 优越的定性和定量结果,实现了比最先进的模型推理速度快 10 倍的模型推理速度。 

 


图 2:BlazeBVD 的训练和推理流程

实验结果


大量的实验表明,盲视频闪烁任务的通用方法——BlazeBVD,在合成数据集和真实数据集上优于先前的工作,并且消融实验也验证了 BlazeBVD 所设计模块的有效性。

 


表 1:与基线方法的量化对比



图 3:与基线方法的可视化对比



图 4:消融实验

以影像科技助力生产力

 

该论文提出了一种用于盲视频闪烁任务的通用方法 BlazeBVD,利用 2D 网络修复受光照变化或局部曝光问题影响的低质量闪烁视频。其核心是在照明空间的 STE 滤波器内预处理闪烁先验;再利用这些先验,结合全局闪烁去除模块(GFRM)和局部闪烁去除模块(LFRM),对全局闪烁和局部曝光纹理进行校正;最后,利用轻量级的时序网(TCM)提高视频的相干性和帧间一致性,此外在模型推理方面也实现了 10 倍的加速。

 

作为中国影像与设计领域的探索者,美图不断推出便捷高效的 AI 功能,为用户带来创新服务和体验,美图影像研究院(MT Lab)作为核心研发中枢,将持续迭代升级 AI 能力,为视频创作者提供全新的视频创作方式,打开更广阔的天地。

2024-07-22 16:166315

评论

发布
暂无评论
发现更多内容

啥都复用不了,还谈什么中台!

菜根老谭

中台 复用 技术管理 平台架构

大力出奇迹,揭秘昇腾CANN的AI超能力

华为云开发者联盟

AI 算法 算力 CANN

阿里巴巴Java方向面试题汇总(含答案),为什么数据库会丢失数据

Java 程序员 后端

37 手游基于 Flink CDC + Hudi 湖仓一体方案实践

Apache Flink

大数据 flink

汽车智能座舱中 显示屏市场战略趋势分析 上篇

SOA开发者

软件定义汽车

Shell:Lite OS在线调试工具知多少

华为云开发者联盟

Shell 操作系统 Lite OS 在线调试 命令函数

阿里巴巴发布“限量版”Java零基础宝典,万字Java技术类校招面试题汇总

Java 程序员 后端

“十三五”新型显示重大科技成果落地对接及产业发展研讨会召开

科技热闻

ECMAScript 2021(ES12)新特性简介

程序那些事

JavaScript ecmascript 程序那些事 ES12

论亚马逊QLDB与腾讯TDSQL架构与功能

腾讯云数据库

数据库 tdsql

为什么说腾讯云TDSQL是金融行业的“杀手锏”级应用?

腾讯云数据库

数据库 tdsql

阿里,快手,拼多多等7家大厂Java面试真题,Java开发面经分享

Java 程序员 后端

开便利店可以实现财富自由吗?

石头IT视角

OSCAR纪实:华为与开源生态伙伴协力同行,共创未来

科技热闻

腾讯云分布式数据库TDSQL再获认可

腾讯云数据库

数据库 tdsql

深入解读TDSQL-C的内核关键技术

腾讯云数据库

数据库 tdsql

亚马逊QLDB与腾讯TDSQL生产背景与模型

腾讯云数据库

数据库 tdsql

Flink 在 58 同城的应用与实践

Apache Flink

大数据 flink

阿里,快手,拼多多等7家大厂Java面试真题,Java面试题高级

Java 程序员 后端

带你学会区分Scheduled Thread Pool Executor 与Timer

华为云开发者联盟

线程 线程池 Timer 任务调度 JDK 1.5

揭秘腾讯TDSQL全时态数据库系统

腾讯云数据库

数据库 tdsql

TDSQL全时态数据库的价值和意义

腾讯云数据库

数据库 tdsql

分布迁移下的深度学习时间序列异常检测方法探究

云智慧AIOps社区

深度学习 异常检测 技术学习 智能运维 分布迁移

揭秘TDSQL-A分布式执行框架:解放OLAP关联分析查询性能瓶颈

腾讯云数据库

数据库 tdsql

TDSQL-C 数据库架构

腾讯云数据库

数据库 tdsql

Apache Hudi 在 B 站构建实时数据湖的实践

Apache Flink

大数据 flink

阿里巴巴发布“限量版”Java零基础宝典,38岁的中年失业者怎么活下去

Java 程序员 后端

阿里,快手,拼多多等7家大厂Java面试真题,Java笔试题及答案详解

Java 程序员 后端

我们应该如何过好自己这一生?

Phoenix

心理学

如何写出安全又可靠的PHP脚本

咔咔

php

干货帖 | TDSQL-A核心架构揭秘

腾讯云数据库

数据库 tdsql

ECCV 2024|有效提高盲视频去闪烁的新方法——BlazeBVD_计算机视觉_InfoQ精选文章