【FCon上海】与行业领袖共话AI大模型、数字化风控等前沿技术。 了解详情
写点什么

腾讯多媒体实验室开源国内首个视频质量评估算法 DVQA

  • 2020-04-08
  • 本文字数:1232 字

    阅读完需:约 4 分钟

腾讯多媒体实验室开源国内首个视频质量评估算法DVQA

AI 大模型超全落地场景&金融应用实践,8 月 16 - 19 日 FCon x AICon 大会联诀来袭、干货翻倍!

视听时代,音视频应用越来越广泛:直播、短视频、视频节目、音视频通话……近期由于新冠疫情带来的在线协同办公、在线教育类产品的崛起,更带来了线上音视频需求的爆发,用户对音视频质量诉求也愈加强烈。


在整个视频链路中,大部分模块都可以精确度量,如采集、上传、预处理、转码、分发等。然而未知的部分却恰恰是最关键的部分,即用户的视频观看体验到底怎么样。目前行业内的视频质量评估方法分为两大类:客观质量评估与主观质量评估。前者计算视频的质量分数,又根据是否使用高清视频做参考、源视频是专业视频还是用户原创视频等进一步细分;后者主要依赖人眼观看并打分,能够直观反映观众对视频质量的感受。然而,这些方法仍存在耗时费力、成本较高、主观观感存在偏差等难题。


多媒体实验室提出的视频质量评估解决方案,首先结合业务需求,使用“在线主观质量评测平台”,来构建大规模主观质量数据库,同时使用所收集的主观数据来训练基于深度学习的客观质量评估算法,最后把训练好的质量评估算法部署到业务线中,闭环监控可能存在的质量问题。从以上三个角度出发,DVQA 能够在兼顾不同业务、场景的前提下,满足效率与精度两大需求。


DVQA 包含多个质量评估算法模型,本次开源的是针对 PGC 视频的算法 C3DVQA。本项目使用 Python 开发,深度学习模块使用 PyTorch。代码使用模块化设计,方便集成较新的深度学习技术,灵活的自定义模型,训练和测试新的数据集。


在算法设计上,C3DVQA 所使用的网络结构如下图所示。其输入为损伤视频和残差视频。网络包含两层二维卷积来逐帧提取空域特征。级联后使用四层三维卷积层来学习时空联合特征。三维卷积输出描述了视频的时空掩盖效应,再使用它来模拟人眼对视频残差的感知情况:掩盖效应弱的地方,残差更容易被感知;掩盖效应强的地方,复杂的背景更能掩盖画面失真。



网络最后是池化层和全连接层。池化层的输入为残差帧经掩盖效应处理后的结果,它代表了人眼可感知残差。全连接层学习整体感知质量和目标质量分数区间的非线性回归关系。


在评测结果上,腾讯多媒体实验室在 LIVE 和 CSIQ 两个视频质量数据集上对所提出算法的性能进行验证。并使用标准的 PLCC 和 SROCC 作为质量准则来比较不同算法的性能。将所提出的 C3DVQA 与常用的全参考质量评估算法进行对比,包括 PSNR,MOVIE,ST-MAD,VMAF 和 DeepVQA,结果如下表所示。



(LIVE 和 CSIQ 两个数据库上不同全参考算法性能比较)


目前该评估算法已在腾讯内外部多款产品中进行使用验证,如腾讯会议就借助实验室上百个符合 ITU/3GPP/AVS 等国外内标准的指标进行评判,闭环监控全网的用户体验质量,从用户真实体验出发,不断优化产品性能。


作为最早布局音视频领域的公司之一,从最早的 QQ 平台,腾讯就试图解决在当年网络条件下若干的音视频通信问题。伴随着 5G、云计算、大数据、人工智能技术的发展,腾讯多媒体实验室基于多年的技术沉淀和行业经验,逐步打磨出一条完善且高质量的音视频技术链条。


本文转载自 腾讯多媒体实验室 公众号。


原文链接: 腾讯多媒体实验室


2020-04-08 17:231976

评论

发布
暂无评论
发现更多内容

SDK 接入|游戏语音之“范围语音”接入实践

ZEGO即构

2022-12-09:上升的温度。以下的数据输出2和4,2015-01-02 的温度比前一天高(10 -> 25),2015-01-04 的温度比前一天高(20 -> 30),sql语句如何写? DR

福大大架构师每日一题

数据库 福大大

Discourse 本地开发环境时候出现代理错误

HoneyMoose

前辈给的Spring Cloud与Docker微服务实战,挽救了要被辞退的我

钟奕礼

Java 程序员 java面试 java编程

详解UDS CAN诊断:ECUReset Service(SID:0X11)

不脱发的程序猿

汽车电子 CAN ISO 14229 CAN诊断 UDS诊断

一块钱能做什么?

脑极体

移动端防抓包实践

杨充

OpenHarmony开源项目荣膺“2022东北亚优秀开源项目”

Geek_2d6073

CleanMyMac2023版本有哪些功能特色?值不值得下载

茶色酒

CleanMyMac2023

大数据HDFS凭啥能存下百亿数据?

JAVA旭阳

Java 大数据

四种主流的大数据技术

穿过生命散发芬芳

大数据技术 12月月更

浅谈网络营销从业者如何突破瓶颈期

石头IT视角

深入浅出学习透析 Nginx 服务器的基本原理和配置指南「运维操作实战篇」

洛神灬殇

nginx web服务器 运维开发 12月日更 12 月 PK 榜

政企办公「分水岭」已至,融云百幄数智化破局

融云 RongCloud

数智化 办公平台

10x 查询性能提升,全新 Unique Key 的设计与实现|1.2 新版本解读

SelectDB

数据库 大数据 新特性 Doris 优化

Zebec获BNB Chain生态大力支持,ZBC或继续登录一线CEX

股市老人

深入剖析 | 支付宝账务热点架构解决方案

九叔(高翔龙)

支付宝 账务热点 架构解决方案 热点写

CrossOver2023软件免费版永久无时间限制限制

茶色酒

CrossOver2023

OpenTelemetry系列 (一)| OpenTelemetry的前世今生

骑牛上青山

调用链 cncf OpenTelemetry 微服务调用链

2022年中国期货行业年度发展观察分析

易观分析

金融 期贷

Nacos入门指南 - Nacos是什么

华为云PaaS服务小智

微服务

赛先生的新旅行:昇腾AI带来的科学智能变革

脑极体

一文搞懂I2S通信总线

不脱发的程序猿

嵌入式 I2S 总线协议

曲面屏墨水屏显示器!墨水屏手机显示器!北京大上科技发布多款新概念产品

硬科技星球

Spring 6.0 正式发布,一文了解新特性

大白给小白讲故事

spring

简单的Apache Airflow(CVE-2022-40127)漏洞复现

网络安全学海

黑客 网络安全 信息安全 渗透测试 漏洞挖掘

CleanMyMacX软件免费版本在哪里下载?

茶色酒

CleanMyMacX

SSM框架之Mybatis整合

@下一站

实践 mybatis配置 11月日更 mybatis入门 11月月更

Verilog 表达式

芯动大师

Verilog Verilog语法 Verilog操作符

极客时间运维进阶训练营第七周作业

独钓寒江

腾讯多媒体实验室开源国内首个视频质量评估算法DVQA_开源_腾讯多媒体实验室_InfoQ精选文章