大厂Data+Agent 秘籍:腾讯/阿里/字节解析如何提升数据分析智能。 了解详情
写点什么

实时通信的下一站,H.266 作为破局关键

  • 2025-03-26
    北京
  • 本文字数:2250 字

    阅读完需:约 7 分钟

大小:1.19M时长:06:55
实时通信的下一站,H.266作为破局关键

实时通信(RTC)作为支撑实时音视频交互的核心技术,近十年来已深度渗透至视频会议、直播连麦、在线教育及远程协作等多个场景。然而,随着超高清视频需求呈现爆发式增长,传统 RTC 技术面临严峻挑战。单路 4K 视频流的码率较 1080P 提升 4 倍以上,而用户对延迟的容忍度却从秒级压缩至 200ms 以内,尽管 5G 网络虽通过大带宽特性缓解了部分压力,但其部署成本与终端渗透率仍制约着其规模化发展。


在此背景下,RTC 技术必须加速升级以应对挑战,而新一代编码标准 H.266/VVC 凭借其高效的屏幕视频编码技术,正在成为 RTC 向超高清、低时延演进的破局关键。

面向未来的视频编码标准,如何定义“下一代”RTC 场景?


首先,H.266/VVC 有着更高的压缩效率、更优的编码质量,其深度适配 RTC 场景的需求。


更高的压缩效


在保证相同的视频质量下,理论上,H.266 对视频的压缩率相比于 上一代编码标准 H.265/HEVC 提高了 50%,大大降低了视频传输对网络带宽的要求,有效得缓解了网络拥堵,减少了卡顿和延迟现象,为用户提供更流畅的视频通信体验。


更优的编码质量


H.266 的帧内预测模式从 H.265 的 35 种扩充至 67 种,更多的预测方向能够精确捕捉字符笔画、图形线条的细微变化,减少像素预测误差。配合交叉分量预测(CCLM)、矩阵加权帧内预测(MIP)等前沿工具,进一步优化预测值,显著提升编码准确性,让共享内容在接收端得以清晰还原。


H.266 的帧间预测引入放射运动补偿打破传统平移模型局限,以数学矩阵精确描述物体的旋转,缩放等复杂运动轨迹,可以更精确的预测 RTC 应用里人物动作,物体移位等复杂运动。几何划分模式支持 64 种边界划分,能细致的勾勒运动物体的轮廓,匹配块间相关性,优化运动估计精度,显著提升帧间预测的准确性,提升编码质量。在高清和超高清视频的 RTC 应用中,如远程医疗诊断、高清视频会议等,高质量的视频图像有助于提高用户对信息的准确理解和交互效果。


更适合 RTC 场景的编码工具


  1. 屏幕编码工具(Screen Content Coding,SCC):随着屏幕共享、游戏直播和远程会议等新兴需求的出现,屏幕内容视频作为特殊的视频类型获得越来越多的关注。H.266 根据该类视频的内容特性,引入了诸多工具来提高压缩率,如:帧内块复制 IBC,调色板模式 PLT,变化跳过模式的残差编码,自适应色度变换(ACT)等。屏幕编码工具在主档次(Main profile)中被默认支持,确保了 RTC 应用在不同设备间进行屏幕共享和视频通信时的兼容性和一致性。

  2. 参考图像重采样(Reference Picture Resampling, RPR):在 RTC 的视频通话场景中,网络带宽往往是动态变化的。当网络带宽变窄时,可降低视频的分辨率以适应有限的带宽。传统的视频编解码器在这种情况下,服务器需要发送 “即时解码刷新”(IDR)帧来改变视频的分辨率。而 IDR 帧会占用较多的带宽资源,导致端到端的延迟和阻塞率增加。H.266 的 RPR 技术能够在解码时直接改变视频的分辨率,无需编码 IDR 帧,避免了大量 IDR 帧所带来的数据量激增,使得视频通话更加流畅,不会出现明显的卡顿,为用户提供了更优质的实时通信体验。

高压缩率“光环”之下,H.266 计算复杂度亟待解决


H.266 凭借其超高压缩效率,为高清视频的传输与存储带来了全新突破。但是,在性能提升的另一面却是复杂度的显著提升。CPU 计算复杂度及编码耗时的增加,使得 H.266 在一些 CPU 性能较差的低端机上无法满足实时编码的需求,这将导致在超高清直播过程中,会有肉眼可见的画面延迟。为保证用户的实时交互体验,火山引擎推出自研 BVC2 编码器,通过引入了一系列质量优化和编码加速算法,在加速编码器的同时兼顾了压缩效率与主观质量。


质量优化方面


自研编码器 BVC2 引入了时域自适应量化算法(Temporal Adaptive Quant,TAQ)视频不同区域的重要性不同,若将有限的带宽资源分配给重要性更高的区域,将有效提高视频的主观及客观质量。HEVC 所提出的 CUtree 工具,通过预估当前编码单元给后续帧所提供的参考信息的多少,来定义该单元的重要性。由于 CUtree 需拿到未来帧的编码信息才能指导当前编码单元的参数调整,这将带来较大的时延,在注重实时性的 RTC 场景是不适用的。因此我们所开发的编码器 BVC2 提出了 TAQ 工具,利用已编码图像帧的预测和重建等信息,来建立当前编码单元的失真传播关系(示例图如下),并以此为依据估计编码单元的重要性程度,同时调整量化参数,实现带宽资源的更高效分配。该工具在保证了低延时的条件下,有效提高了视频的压缩效率,带来了显著的画质提升。



编码加速方面


自研编码器 BVC2 加入了很多快速算法来提高编码器的运行速度,例如:通过背景检测算法,快速决策 cu 划分及预测模式;利用相邻编码单元的已知信息及当前编码单元自身的内容特征,来自适应的决策编码单元的块划分方式和预测模式;引入决策树可进一步强化上述判断的准确度,并对编码工具进行剪枝;在每个编码阶段和编码工具中都加入了多个快速算法来进行剪枝加速,同时对代码和内存进行精心设计,使用汇编进行深度优化,进一步提升编码速度;BVC2 在保证压缩效率的同时,编码时间显著降低。在最新的 JVET- AJ0256 提案中,在 RTC 场景 LDP CQP 配置下,BVC2 相比于 x265 superfast 档位在加速 1.2 倍的同时,压缩效率提升 47.05%。未来软件算法的持续优化也将进一步降低编码复杂度,提升编码效率。


PSNR BD-Rate
SSIM BD-Rate
VMAF
Speed-up
Y
U
V
YUV
Y
U
V
YUV

Class B
-43.55%
-52.99%
-54.80%
-45.67%
-48.89%
-55.27%
-57.89%
-49.92%
-37.22%
1.5
Class C
-41.24%
-52.14%
-53.23%
-43.62%
-44.93%
-55.25%
-57.57%
-46.90%
-36.30%
1.0
Class E
-52.18%
-58.30%
-60.80%
-53.91%
-54.99%
-58.43%
-61.91%
-55.78%
-50.53%
1.1
Overall
-44.94%
-54.03%
-55.78%
-47.05%
-49.10%
-56.05%
-58.79%
-50.38%
-40.24%
1.2


可以看出,在 H.266 的重塑之下,RTC 正在迎来新一轮的升级,技术进步正在为视频行业带来全新的可能性。在这场技术浪潮中,火山引擎 BVC2 自研编码器凭借其持续的技术创新,助力实时音视频交互的体验升级。


未来,H.266 将会与 RTC 进一步深度融合,为用户带来更流畅、清晰、高效的互动体验。跨越时空的高墙,点亮全球范围内的无缝连接与协作。

2025-03-26 16:534645

评论

发布
暂无评论

司库管理研修班:权威师资齐聚,共探数智转型之道

用友智能财务

AI 财经 会计

aixbt 被盗 55.5 ETH,本就孱弱的 AI 代理叙事会「雪上加霜」吗

TechubNews

以太坊 AI

AI数字人的分类及特点

北京木奇移动技术有限公司

AI智能体 软件外包公司 AI数字人

《Operating System Concepts》阅读笔记:p408-p448

codists

操作系统

智能制造:企业组织发展与IT信息技术发展的关系

积木链小链

数字化转型 信息技术 智能制造

Java 24(JDK 24)新特性详细介绍

AiDaddy

#java #java24 #jdk24 #jdk jdk24新特性

ClkLog埋点系统客户案例-电子签佼佼者「大家签」为何选择ClkLog?

ClkLog

开源 埋点 用户行为分析 自定义标签

Apache SeaTunnel脚本升级及参数调优实战

Apache SeaTunnel

一个好的产品应该具备什么要素?

执于业务

如何用Leangoo破解需求隔离与频繁变更的协作困局?

云端拾光

项目管理 效率工具 团队协作 任务管理 看板软件

“人工智能+”智赋千行百业!

天翼云开发者社区

人工智能 数字中国 DeepSeek

Fabric8 Kubernetes 教程——客户端基础

FunTester

AI数字人的开发框架

北京木奇移动技术有限公司

AI智能体 软件外包公司 AI数字人

CST软件如何理解Axial Ratio轴比

思茂信息

cst cst操作 cst电磁仿真 CST软件 CST Studio Suite

泄密与间谍:网络安全与国家安全的紧密联系

黑龙江陆陆信息测评部

网络安全 等保测评 网络安全信息安全、

如何在Java程序中使用泛型

码语者

Java泛型

10分钟部署!一文读懂NineData社区版强在哪里?

NineData

数据库、 NineData 对比工具 测评对比 NineData社区版

数字先锋 | 如何提升工业园区算力服务,天翼云息壤给出答案!

天翼云开发者社区

云计算 数字化转型 算力服务

项目管理协作工具对比:PingCode vs Leangoo

axe

项目管理工具 PingCode 办公软件 项目协作工具 leangoo

数字化转型 2.0:AI、低代码与智能分析如何重塑企业竞争力?

天津汇柏科技有限公司

AI 低代码 数字化转型

Hyperliquid巨鲸50倍做空赚510万对其会有何影响

TechubNews

比特币 以太坊 合约

数据可信安全流通实战|隐语开源社区Meetup武汉站

隐语SecretFlow

Python #大数据 AI'

通过 INFINI Console 集中管理极限网关配置

极限实验室

console Gateway

一文读懂!微店商品列表数据接口全指南

tbapi

微店API 微店商品数据采集 微店商品列表接口 关键词搜索微店商品接口

《北京日报》点赞!融云助力打造“数字丝路”新范式

融云 RongCloud

发挥技能优势,实现财务数字转型

智达方通

数字化转型 全面预算管理

AI数字人开发的技术难点

北京木奇移动技术有限公司

AI智能体 软件外包公司 AI数字人

零基础IM开发入门(五):什么是IM系统的端到端加密?

JackJiang

即时通讯 IM

【Redis技术进阶之路】「原理分析系列开篇」探索事件驱动枚型与数据特久化原理实现(数据持久化的实现RDB)

码界西柚

redis RDB 快照 redis 底层原理 数据持久化

架构师必看!现代应用架构发展趋势与数据库选型建议丨TiDB vs MySQL 专题(一)

PingCAP

分布式 TiDB #Mysql

从 0 到 1,掌握微店商品详情数据接口

tbapi

微店商品详情接口 微店API 微店商品数据采集

实时通信的下一站,H.266作为破局关键_字节跳动_火山引擎视频云_InfoQ精选文章