写点什么

腾讯多媒体实验室:以提升用户体验为目的,构建音视频质量评估体系

  • 2019-11-12
  • 本文字数:1943 字

    阅读完需:约 6 分钟

腾讯多媒体实验室:以提升用户体验为目的,构建音视频质量评估体系

11 月 6 日至 7 日,首届 Techo 开发者大会在北京召开,在音视频及通信分论坛上,腾讯多媒体实验室专家研究员王海强发表了题为《视频业务中的主客观质量评估》的演讲,在当前音视频发展风口下,介绍了视频质量评估的主客观方法、应用场景,并提出了建立在算法基础上的主客观视频质量评测平台及其在业务线中的应用。


Techo 开发者大会是由腾讯云发起的面向全球开发者和技术爱好者的年度盛会,作为一个专注于前沿技术研讨的非商业大会,大会致力于开发者的能力成长和实践创新,旨在通过汇聚全球顶尖行业专家和技术爱好者,搭建一个开放、中立、活跃的技术交流平台。本届 Techo 大会邀请了海内外 150 位行业专家围绕前沿技术发展进行解读,聚集了 5000 名开发者参与技术交流和探讨。



(腾讯多媒体实验室专家研究员 王海强)

质量评估应侧重“人眼感知”质量

视听时代,音视频应用越来越广泛:直播、短视频,视频节目、音视频通话……在万物诉诸音视频的互联网时代,用户对音视频质量诉求也愈加强烈。为提高音画质量,基础性工程便是建立行业评估体系,用评测标准对音视频技术和产品进行“打分”。然而,目前音视频质量评估领域仍存在门槛成本较高、主观观感存在偏差等难题。


王海强在演讲中介绍了主客观质量评估方法,普及了两者在 PGC/UGC 业务中的应用,并针对评估标准这一终极准则问题,介绍了多媒体实验室的自研算法和解决方案。


据王海强介绍,目前视频质量评估方法分为两大类:客观质量评估与主观质量评估。前者计算视频的质量分数,又根据是否使用高清视频做参考、视频质量是否与失真程度成单调关系等进一步细分;后者依赖人眼观看并打分,能够直观反映观众对视频质量的感受。


目前,视频质量评测标准并不统一,常规做法是使用开源模型 VMAF 来做 PGC 视频的质量把控,而对 UGC 视频,只能依赖于开发人员观看视频来定位、解决质量问题。王海强认为,视频质量评估的目标是“致力于评估视频的人眼感知质量”,即通过通用的、准确的、公平的测试能力与测试方法论,尽可能选择最可靠的技术方案,以客观与主观评测相结合的方式,达到最接近人眼感知的质量效果。


然而,主观测试极其耗费人力和时间,整体效率较低,把所有质量问题都诉诸于主观测试是不现实的。与其完全追求主观测试的完美性,不如以“主观质量”为目的,通过基于深度学习的客观音视频质量评估算法,进行端到端的音视频质量评估,从而逼近人眼观看的体验效果。


对此,王海强介绍了多媒体实验室的质量评估解决方案:一是结合业务需求,使用“在线主观质量评测平台”,来构建大规模主观质量数据库;二是使用所收集的主观数据来训练基于深度学习的客观质量评估算法;三是部署训练好的质量评估算法到业务线中,闭环监控可能存在的质量问题。从以上三角度出发,音视频质量评估能够在兼顾不同业务、场景的前提下,满足效率与精度两大需求。

腾讯多媒体实验室:以用户体验为最终目的

王海强所介绍的“在线主观质量评测平台”,便是腾讯多媒体实验室在音视频评估领域的落地产品——腾讯多媒体实验室视频质量评测平台。目前,这一平台不仅能够完成基于人眼的视频质量评测,模拟人耳的音频质量评测,还能够在音频的声学指标、网络指标及物理环境下对信号的主观质量进行全面详细的评估,适应了不同环境下的差异化测评场景。


同时,多媒体实验室开发了基于深度学习的全参考/无参考质量评估算法。依托主观测试平台快速构建大规模视频数据库的能力,多媒体实验室收集了数百万次的视频质量打分,训练了基于深度学习的全参考和无参考质量评估算法。两个算法在公开数据集上均取得了领先业界的性能。王海强提到多媒体实验室会在近期内把算法开源,进一步促进行业的发展。


除满足单个评估需求外,视频质量评估还将在业务线中进一步发挥作用。王海强认为,在业务线中引入视频质量评估后,将改变以往被动发现质量问题、进行人工检查的状况,变被动为主动,变人工为智能,利用 AI 进行预防性质量监控,并通过算法迭代不断实现系统优化,同时,评估系统的优化又会进一步反哺业务线的优化。


在当前音视迎来发展风口之时,腾讯多媒体实验室不仅使非专业团队能够快速、准确的完成评估需求,还通过一系列尝试,推动了音视频质量评测标准的讨论。近 50 项提案被下一代视频编码标准 VVC/H.266 采纳。此外,在虚拟现实(VR)、点云(PCC)、网络传输协议 (DASH)、多媒体系统(OMAF、CMAF、NBMP)等相关多媒体标准中也取得了突破性进展,获得多项标准核心专利,多名团队成员在多个全球标准组织担任董事、编辑、领域主席等重要席位。与此同时,多媒体实验室也大力投入国家自主标准建设,针对国家标准 AVS3 进行了相关布局,成为国际行业标准不可忽视的影响者和领导者。


未来,腾讯多媒体实验室也将投入更多技术与实践,带头制定行业规则,不断提升用户视听体验。


2019-11-12 19:591304

评论

发布
暂无评论
发现更多内容

阿里云-云开发平台入门篇——静态网站的全生命周期实战

若尘

阿里云 8月日更

带你读AI论文:SDMG-R结构化提取—无限版式小票场景应用

华为云开发者联盟

语义 多模态 推理模型 SDMG-R 检测文本

2021全球开源技术峰会|IoT 时代的开源数据基础设施

EMQ映云科技

开源 IOT Platform IoT emq 开源技术

Mysql读写锁保姆级图文教程

华为云开发者联盟

MySQL 数据 读写锁 读锁 MyLSAM

论 Erda 的安全之道

尔达Erda

云原生 安全 企业数字化转型 云平台 开发平台

只需6步,教你从零开发一个签到小程序

华为云开发者联盟

小程序 App 移动 智慧校园 FunctionGraph

赛迪发布《2020-2021年中国IT服务市场研究年度报告》,联想位居第一梯队

科技大数据

科技互联网

这本“算法宝典”讲得透彻,完全掌握后,我竟拿到字节跳动offer

公众号_愿天堂没有BUG

Java 编程 程序员 架构 面试

巨头纷纷布局分布式云,一场新的云战争即将打响

浪潮云

云计算

CC挖矿系统源码开发

获客I3O6O643Z97

挖矿 挖矿矿池系统开发案例 fil矿机

这几个棘手的面试常见问题,如何高情商的回答?

架构精进之路

面试 情商 8月日更

服务器的升级,不可避免的安全问题

九河云安全

限12小时删!白嫖对标阿里P5—P8的Java学习路线+大厂刷题秘籍

Java架构追梦

Java 阿里巴巴 架构 面试

Serverless 全能选手,再添一“金”

Serverless Devs

Serverless 互联网 云原生

Pangaea AI 智能机器人炒币系统开发

获客I3O6O643Z97

量化策略 量化跟单 量化机器人

TrafficStatsRunnable 实用封装

Changing Lin

8月日更

防止数据丢失和减轻勒索软件攻击的 5 种方法

九河云安全

Swift 实现获取、展示 Mac 的 WiFi 密码

fuyoufang

ios swift SwiftUI Mac 软件 8月日更

推动数据中心行业的“水电煤”,可视化如何用数据改变传统产业?

一只数据鲸鱼

机房 数据可视化 数字孪生 智能IDC

如何实时打通数据孤岛?Tapdata 创始人唐建法受邀于GOTC深度分享

tapdata

数据库 打通数据孤岛 数据同步 Real Time DaaS GOTC

Python代码阅读(第4篇):过滤掉列表中的唯一值

Felix

Python 编程 Code Programing 阅读代码

如何保存数据并更快地从勒索软件攻击中恢复

九河云安全

专业好用的数据恢复软件推荐

淋雨

EasyRecovery 文件恢复 硬盘数据恢复

你的工作有弹性么?

escray

学习 极客时间 朱赟的技术管理课 8月日更

【Vue2.x 源码学习】第二十七篇 - Vue 生命周期的实现

Brave

源码 vue2 8月日更

九大核心专题,630页内容,熬夜23天吃透,我收割了3个大厂offer

公众号_愿天堂没有BUG

Java 编程 程序员 架构 面试

「免费开源」基于Vue和Quasar的前端SPA项目crudapi后台管理系统实战之数据库逆向(十二)

crudapi

Vue crud crudapi quasar 数据库逆向

快来看,大数据两地三中心的容灾也可以如此省心!

华为云开发者联盟

大数据 数据湖 容灾 华为云MRS 两地三中心

2021第二届云原生编程挑战赛正式启动,抢先报名!

阿里巴巴云原生

阿里云 Serverless RocketMQ 云原生 dubbo

iOS开发-为 iOS 编写 Kotlin Parcelize 编译器插件

iOSer

ios 编译器 编译器原理 iOS 知识体系 Kotlin Parcelize

基于香港服务器的应用开发中测试数据管理的 3 个最佳实践

九河云安全

腾讯多媒体实验室:以提升用户体验为目的,构建音视频质量评估体系_服务革新_云加社区_InfoQ精选文章