最新发布《数智时代的AI人才粮仓模型解读白皮书(2024版)》,立即领取! 了解详情
写点什么

腾讯明眸·极速高清 —— 更高清更低码率的媒体处理技术方案

腾讯云音视频

  • 2022-01-12
  • 本文字数:3105 字

    阅读完需:约 10 分钟

腾讯明眸·极速高清 —— 更高清更低码率的媒体处理技术方案

腾讯视频云作为头部云厂商,服务了很多视频行业的客户,从我们服务的大量客户以及客户的诉求来看,目前视频处理行业有下面几个趋势:


  • 首先,随着带宽资费的降低以及观看设备分辨率的升高,人们对视频的清晰度有了越来越高的要求,尤其是广电行业、大屏电视等对于 4K 片源的需求。然而,从视频制作端来看,目前大部分生产的视频还是 1080P。因此,画质增强、视频超分等基于 AI 的画质提升技术受到人们更多的关注。

  • 除此之外,近年来视频行业的高速发展,尤其是直播、短视频的兴起,越来越多的互联网公司开始发展自己的视频业务。对于海量的视频观看来说,存储和带宽成为业务运营的重要成本组成部分。与此同时,视频观看的流畅度,首帧打开时间也是影响用户观看体验的重要因素之一。能够高清晰度低码率的编码视频,就成为泛互联网企业的诉求之一。

  • 从未来的发展趋势看,云宇宙 /VR 慢慢兴起,而这些无疑都需要超高清的视频传输,而高清低码、极致压缩、画质增强等相关技术,可以极大的降低传输带宽瓶颈,提升视频观看体验,也一定是未来的发展趋势之一。


也是在上述客户的诉求背景下,我们提出腾讯明眸解决方案。

腾讯明眸解决方案


腾讯明眸的基础能力主要由三部分组成,其中极速高清提供极致的压缩能力,支持感知编码、细节增强、视频去噪等能力。画质重生则专注于视频画质的提升,支持视频超分、智能插帧、色彩增强等能力。腾讯明眸除了视频处理之外,也与腾讯天籁实验室相合作,支持音频降噪、去混响、响度管理等能力。全力支持视频业务的快速发展。


腾讯明眸的整体处理 pipeline 也与普通媒体处理的流程有较大的区别,在视频解码后,我们会先进行场景分析、毛刺检测、噪声检测、交错检测等预分析流程,来分析视频源的画面质量,然后针对不同的场景和画面质量情况,使用对应的画质增强 / 修复技术。在对视频源进行修复之后,腾讯明眸会对画面进行二次分析,来辅助后续的视频编码流程,这里会分析视频的 ROI/JND 信息,内容自适应编码信息等,最后利用这些信息来进行更符合人眼主观的编码流程,在编码过程中,我们也对编码内核进行了深入的优化,在腾讯内部多个部门通力合作下,自研了 O264/V265/TXAV1/O266 等编码器,相比开源编码器极大的提升了视频压缩率。



腾讯明眸·极速高清的技术演进


首先介绍下什么是极速高清,极速高清的目的是在不降低或者提升人眼感官的前提下,尽可能的降低视频码率,节省带宽和存储。极速高清也是基于腾讯明眸的框架来实现的,包括:视频预分析、前置处理、视频自适应编码等几步,与普通转码相比,可以降低 50% 以上的带宽,也能在一定程度上提升人眼的主观感受。


在编码器内核方面,腾讯明眸·极速高清引入了很多领先的技术。2021 年的 MUS 云端编码大赛上,腾讯明眸取得了多项第一的成绩,尤其在视频编码质量评测上,相比第二名有 20% 的编码增益。除此之外,在 H.266/VVC 等下一代编码器上,我们也拥有 100 项以上的专利。



极速高清所取得的压缩效果经历了多个版本的迭代优化过程。极速高清的初始研发时,我们更专注于如何利用好当前的编码器和画质处理能力。我们发现,人眼对不同场景的感受是不同的,比如:在一些游戏中有很多的草地,这个时候通过编码参数的控制,减少纹理复杂区域的码率,虽然会在纹理区域产生振铃效应和毛刺,但是由于复杂纹理的遮挡效应,人眼并不能感知到。我们针对不同场景的视频,分析当前画面的特征,合理的利用视频编码的特性,可以在更低的码率下,同时保持人眼的感官。


随着业务的持续迭代与发展,我们发现开源的编码器虽然在业界有比较好的效果,但是很难完全满足实际业务的需求,而且开源编码器在实现上也未将标准的所有特性实现,没有发挥出标准能够达到的极限压缩。因此,极速高清的第二阶段优化我们集中在对编码器内核的算法调优。自研的 O264 编码器相较开源的 X264 可以有 20%以上的编码增益,V265 相较开源的 X265 可以有 40%的编码增益。



那这里以我们新增支持的 GPB 帧为例,我们知道 B 帧的宏块可以有两个 mv 来进行参考,提升压缩效果,但是 B 帧因为参考关系的原因,会增加编码的延迟。因此,虽然 B 帧能够提供较好的压缩率,但是低延迟直播/RTC 等场景通常还是会关闭 B 帧。那有没有办法同时利用 B 帧标准上支持的两个 mv,同时还能在这样的场景下保证低延迟?为此,我们在编码内核上支持了 GPB 帧,即:该帧虽然标准上标注为 B 帧,宏块可以有两个 mv,但是两个 mv 都只做前向参考,不会进行后向参考,因此不会引入额外的延迟,同时利用了多个 mv 的特性提升压缩率。



在对编码器内核进行深入的优化后,随着业务的发展,我们又面临了新的挑战。在一些极限压缩的场景,客户希望 720P 的带货视频,可以以 350kbps 以下的码率输出,同时保证视频整体的清晰度。这个时候,我们发现仅靠编码器的压缩很难达到理想的效果。之后我们开始思考编码器的不足之处以及如何进一步优化编码器的特性。


首先,我们处理的视频源是被压缩过的, 因此一定已经存在一些细微的毛刺毛边。而我们在二次压缩时候,编码器是无法区分这些毛刺/毛边是真实的纹理还是一些噪声数据,会对这些毛边也进行压缩,而这类毛边的压缩会消耗编码中大量的码率。


其次,编码器核心还是基于数据驱动的,并没有从人眼的角度来考虑问题,因此当码率极低的时候,编码出来的画面可能会有很多的块效应,同时一些细节地方又保留的比较好。


针对上面的两种情况,腾讯明眸·极速高清结合 AI 的能力,在编码对前视频源进行前置处理,使视频源更适配编码场景。其中,前置处理基于预训练的模型,抹平消除视频源附带的毛边细节,使整体的边缘更加平滑,也更有利于视频压缩。其次,当编码设置的码率很低时,这时模型预估压缩后的视频,会产生码率不足导致的块效应和大量噪声。我们可以使用前处理预先对一些复杂纹理进行简化,对视频进行一定程度的平滑,从人眼主观的角度来简化视频,进而使视频更容易压缩,在低码率下也能保持一个良好的效果。


使用极速高清后,带来的收益十分明显。以腾讯内部的业务为例,使用极速高清后,节省了大概 70%的存储和带宽成本,同时由于文件的减小,视频首帧的耗时也降低了 20%,整体播放的流畅度大大提升。

对于点播场景的极限压缩,1080P 的高清电影视频,极速高清 H.264 可以在 1.5M 的码率下,保持整体的主观清晰度,或者说保持 vmaf 在 95 分以上。H.265 则可以在 900kbps 达到同样的效果,AV1 甚至做到 650kbps。对于课堂教育类场景,压缩效果则更明显,课堂类场景相对静止画面较多,可以利用更多的编码工具。对于 PPT 类课堂场景,极速高清 H.264 可以在 67kbps 下,同时保持主观清晰度,H.265 可以做到 35kbps, AV1 可以做到 28kps, 此时,视频的码率大部分已经低于音频的码率,极大的减少了视频的存储和带宽。


腾讯明眸的另一特性,就是充分利用腾讯云在全世界的海量资源部署,服务全球。在各个地区都有对应的处理集群,符合区域的法律法规要求。助力国内企业更好的出海发展。



目前,腾讯明眸的接入也非常方便。其中 MPS 媒体处理服务,可以触发视频转码,在转码模板的配置上,可以选择极速高清来进行极致的视频压缩。专门针对画质提升的画质修复能力,则可以通过智能编辑产品来体验,包括:视频超分、智能插帧、色彩增强、视频加清等画质提升能力,提供更清晰的视频体验。


极速高清未来的发展方向


对于腾讯明眸来说,极速高清后续发展主要两个主轴,一方面是与 AI 能力的进一步深入结合,在前处理阶段利用 AI 进一步处理视频画质来辅助压缩,在编码器内部,利用 AI 的能力对 RDO 分析预测加速,在播放端,致力于 LCEVC 的支持,以及端测的超分和画质提升。另一方面是针对直播场景的深入优化,目前很多编码工具的复杂度较高,对于直播场景很难保证实时, 对于这些编码工具进一步优化与加速,更好的应用于直播场景。



2022-01-12 11:136583

评论

发布
暂无评论
发现更多内容

高并发线下沙龙不容错过!

Qunar技术沙龙

高并发

详解布隆过滤器的原理和实现

万俊峰Kevin

golang 微服务 微服务架构 布隆过滤器 go-zero

全网最全-混合精度训练原理

科技热闻

数据库事务与事务隔离级别

编程江湖

数据库 java编程

提高儿童被拐意识

Tiger

28天写作

关于RocketMQ事务方面Demo

百度文库新一代文档阅读器!核心技术点全解析!

百度Geek说

大前端 文档 百度文库

企业管理升级,如何加速信息化转型?

雯雯写代码

企业管理 信息化

聊聊Java底层那些事

码农参上

内容合集 签约计划第二季 技术专题合集 技术专区合集

效率高到爆炸的IT运维软件您安装了吗?

行云管家

运维 IT运维 运维i工具

鸿蒙智联设备开发,这五大法宝你应该拥有|HDC2021技术分论坛

HarmonyOS开发者

HarmonyOS

大数据开发之Kafka 存储选型

@零度

大数据 kafka

2021年财经中国年会暨第十九届中国财经风云榜

大咖说

直播 财经 财经峰会

Vue路由守卫有哪些,怎么设置,使用场景等

编程江湖

Vue 路由器

测试 —— DevOps 快速交付的最大瓶颈

SoFlu软件机器人

WebView秒开方案探索

得物技术

CSS JavaScript html webview 大前端

Linux一学就会之文件的归档和压缩tar命令

学神来啦

Linux 运维 ZIP tar命令 linux云计算

如期而至-用户购买时间预测(上)

索信达控股

模型 购买预测 购买行为 精准营销

更好用的Web端H265播放技术架构

百度开发者中心

智能视频

Flink是如何支持批流一体的

编程江湖

大数据 flink

直播预告丨“Hello Ability:从页面跳转开始”周三晚不见不散

HarmonyOS开发者

HarmonyOS

信息网络向价值网络演进过程中产品形态的思考

拍乐云Pano

前端开发JS框架之jQuery的基础知识分享

@零度

大前端 ​jQuery

ios技术分享| iOS 发布 framework 到 Cocoapods 以及常见问题

anyRTC开发者

ios 音视频 WebRTC CocoaPods Framework

一劳永逸,使用 PicGo + GitHub 搭建个人图床工具

AlwaysBeta

GitHub 工具 PicGo 图床

协程实现方式——从程序控制流转移谈起

Jowin

协程原理

【Promise 源码学习】第十四篇 - 实现工具方法 promisify

Brave

源码 Promise 12月日更

kubernetes系列随笔03:kubernetes的发展和设计思想

谦寻

Docker Kubernetes 声明式

Tapdata Cloud 版本上新!新增ClickHouse,ADB MySQL等5个数据源支持

tapdata

MySQL oracle

教你用 JavaScript 设计一个 Neumorphism 风格的数字时钟 (代码详解)

海拥(haiyong.site)

大前端 js 28天写作 签约计划第二季 12月日更

等保2.0正式发布了吗?核心思想包括什么?

行云管家

网络安全 等保 等级保护 等保2.0

腾讯明眸·极速高清 —— 更高清更低码率的媒体处理技术方案_文化 & 方法_InfoQ精选文章