写点什么

基于三维卷积神经网络的全参考视频质量评估算法(三)

  • 2020-01-17
  • 本文字数:1060 字

    阅读完需:约 3 分钟

基于三维卷积神经网络的全参考视频质量评估算法(三)

结果

我们在 LIVE 和 CSIQ 两个视频质量数据集上对所提出算法的性能进行验证。LIVE 数据库包含 10 个参考视频和对应每个参考视频的 15 个失真视频。CSIQ 数据集包含 12 个源视频和相对应的 18 个失真视频。我们使用标准的 PLCC 和 SROCC 作为质量准则来比较不同算法的性能。


因为这两个数据库相对较小,我们参考另外一片深度学习文章[10]的做法,每次随机抽取 80%的参考视频和由它们所得到的失真视频作为测试集。我们重复了 20 次这样的数据集划分并且每次都从头开始训练模型。具体质量评估的散点图如图 5 所示。


图 5 质量估计结果散点图,每一个点代表一个待测视频。其中 Y 轴为估计视频质量,X 轴为主观打分结果,左图为 LIVE 上测试结果,右图为 CSIQ 上测试结果。


我们与常用的全参考质量评估算法进行了对比,比较的算法包括 PSNR,MOVIE[ 11],ST-MAD [12],VMAF 和 DeepVQA [10]。每次测试都会得到一个 PLCC 和 SROCC,下表中我们使用多次实验结果的中值来代表最终性能。


我们可以清楚的看到本文所设计的算法 C3DVQA 在两个数据库上均大幅领先 PSNR,MOVIE,ST-MAD,VMAF 等传统算法。值得一提的是 DeepVQA 也是一个基于深度学习的算法,也取得了不错的性能。我们把这些性能提提升归结为两方面的原因,1)使用 CNN 来学习质量相关特征要优于传统的特征提取算法;2)DeepVQA 和 C3DVQA 均学习视频的时空联合特征,显性的利用运动信息更能刻画视频质量。



表一 LIVE 和 CSIQ 两个数据库上不同全参考算法性能比较

总结

本文简要回顾了目前学术界和工业界视频质量评估方向的发展状况。处于复杂度考虑,工业界仍倾向于使用复杂度较低的基于图像质量评估的方案。但是这样做的缺陷就是不能不能把视频作为一个整体来学习时空特性,尽管结果差强人意,也算是性能与复杂度很好的折中。


我们提出了一种基于三维卷积神经网络的全参考算法。通过学习视频的时空联合特征,能更好的解决运动信息丢失问题。相对于传统特征提取算法,我们的算法能大幅度的提升准确度。


当然,这一切才刚刚开始,还有很多工作需要补充。我们想要详细的复杂度分析,特别是在没有 GPU 可用的场景。我们也想知道所训练的算法在其它数据库上的性能,而且不仅仅局限于 PGC 视频,也包括 UGC 视频。


好消息是我们有计划对业界开源模型训练代码,这样能方便所有人去使用自己的数据库训练测试特定视频业务场景。同时,我们也欢迎任何形式的协同开发,不管是贡献数据库,还是贡献预训练模型,甚至是抛出业务场景中所遇到的问题。


本文转载自 腾讯多媒体实验室公众号。


原文链接:https://mp.weixin.qq.com/s/Kk7J8dLMhHbhksxMumHuwA


2020-01-17 18:051277

评论

发布
暂无评论
发现更多内容

防治肥胖,AI转向

脑极体

你认识镜子里的那个自己吗?

小天同学

原则 认知 5月日更

必看:Kubernetes 开发环境对比

百度开发者中心

Kubernetes #技术课程#

微软为什么要对jdk下手?阿里对JDK的理解又是什么样的?

Java架构师迁哥

客制化:定制专属于你的产品和服务

石云升

产品 用户 职场经验 5月日更

传统BI如何转大数据数仓

数据社

大数据 BI 5月日更

姚翔:递归零知识证明,如何打造简洁的区块链?

CECBC

区块链

自主品牌实力认可!浪潮云洲亮相2021年中国品牌日

云计算

GitLab Webhooks 使用

夏兮。

gitlab jenkins CI/CD WEBHOOKS

快速搭建接口自动化测试框架

夏兮。

Java JUnit 接口测试 rest-assured

⚓【Java知识晚餐】精心准备的JVM分析工具⚓

码界西柚

Java JVM 5月日更 JVM分析工具

​ 如何保护IP并预防IP泄露

跟着华为大佬学习—Java亿级高并发,第一天

Java架构师迁哥

70%读写性能提升!基于UCloud对象存储US3的用户态文件系统设计

UCloud技术

对象存储

SaaS的前世、今生与未来 [上篇]

LigaAI

SaaS

新场景+新模式,西安雁塔区打造数字人民币示范区

CECBC

MySQL 到 ClickHouse 的高速公路

青云技术社区

MySQL 数据库 Clickhouse

吐槽对象

顿晓

对象 5月日更

这个云原生开发的痛点你遇到了吗?

阿里巴巴中间件

全新 EMQ X Cloud:升配、降费、增效,助力企业智能化升级

DT极客

iOS 开发:第三方开源库(Swift版)

迪安

移动开发 Framework iOS Developer Open Source

网络攻防学习笔记 Day11

穿过生命散发芬芳

5月日更 网络攻防

零基础学习NLP-DAY2

Qien Z.

nlp 5月日更

为什么人类学家比经济学家对比特币更感兴趣

CECBC

「技术人生」专题第1篇:什么是技术一号位?

阿里巴巴中间件

技术笔记(语音识别-语音噪声分类)

攻城先森

噪声 5月日更 技术笔记

由高频护网设备漏洞引发的供应链浅思

Thrash

安全

​ 备份测试:备份为什么如此重要

浅析以太坊网络状态平台架构及WebSocket

devpoint

区块链 以太坊 websocket

【图片旋转】十五分钟挑战鸿蒙Codelab组件

liuzhen007

鸿蒙 5月日更

Spring Cloud Alibaba 生态学习

风翱

spring cloud alibaba 5月日更

基于三维卷积神经网络的全参考视频质量评估算法(三)_文化 & 方法_腾讯多媒体实验室_InfoQ精选文章