50万奖金+官方证书,深圳国际金融科技大赛正式启动,点击报名 了解详情
写点什么

在 AI 应用爆发前夜,H.266 成熟了

  • 2025-02-28
    北京
  • 本文字数:1605 字

    阅读完需:约 5 分钟

大小:868.26K时长:04:56
在 AI 应用爆发前夜,H.266 成熟了

2024 年,随着生成式 AI、多模态大模型、全景直播、三维重建等技术逐渐落地行业,我们从流畅、实时、高清的数字视频世界逐步进入更智能、交互性更强、沉浸感更强的的 AI 视频世界。这是一次行进中的音视频革命,我们能从诸多痕迹,验证它的进展:


  • 据 ResearchAndMarkets 预测,到 2027 年,全球视频流媒体市场规模将高达 184.3 亿美元,这一惊人的数据充分彰显了视频产业的蓬勃发展态势;

  • XR 设备出货量年增 35%,虚实融合的"空间互联网"逐步成型;

  • 2024 年央视春晚采用 XR 技术,围绕舞台效果进行了设计,并验证落地;

  • ……


以上并非终局,事实上,生成式 AI 正在进一步扩展视频流媒体领域的市场天花板。


内容生产正从 UGC/PGC 发展到 AIGC,内容的生产量将呈几何倍数的增长。有数据显示,AIGC 工具将视频创作门槛降低 90%,预计 2027 年全球短视频日产量突破 50 亿条;用户的交互空间也在从 2D、3D,VR 拓展到了虚拟世界与现实世界的无缝融合。


这一系列新需求,对视频编解码技术的要求是:在带宽不变的情况下,画质更优;同等画质下,存储和传输成本更低。


最新一代视频编码标准 H.266/VVC 正是在这种背景下,走入“舞台”中央。作为支撑庞大视频产业的核心关键要素,H.266 在流媒体生态中起着举足轻重的作用。


H.266 的重点应用场景可分为三个部分:点播、直播、RTC。虽然 H.266 硬解码器的支持正在逐步增加,但目前市场上硬解支持 H.266 的设备相对较少,尤其是一些移动终端。因此,优化 H.266 的软件解码器就显得尤为重要。


其中,点播编解码更注重压缩效率与画质平衡,H.266 的核心优势在于压缩效率提升约 50%(理论值)。通过四叉树加多类型树(QT+MTT)分块法和色度分量双树编码,H.266 能更精细地划分编码单元,减少冗余数据。例如,在 4K/8K 视频中,128×128 的编码树单元(CTU)相比 H.265 的 64×64 单元,显著提升大分辨率视频的编码效率。


在动态范围与色彩支持方面,H.266 的 Main10 Profile 原生支持 10bit 色深和 HDR,解决了点播内容在宽色域和高动态范围下的色彩断层问题。


直播则更看重实时性与复杂度平衡,因而对编码速度要求苛刻,H.266 的编码复杂度较 H.265 增加约 10 倍,可通过硬件加速(如 GPU 或专用芯片)实现高效实时编码,这点与当下新型算力中心的构建思路相通,适合复用冗余的、低功耗的 GPU 算力。


RTC (实时通信)更关注低延迟与交互优化,要求端到端延迟低于 100ms。H.266 通过多种技术手段提升运动矢量预测(HMVP)和编码(SMVD) 效率,提升编码效率,降低重传率。


针对视频会议中的 PPT 共享、白板协作等场景,H.266 引入帧内块复制(Intra Block Copy)技术,直接复用屏幕内容中的重复块(如文字、图表),压缩效率提升 40%(理论值)。


此外,H.266 的环绕运动补偿(Wrap Around Motion Compensation),也可以优化 360 度视频的边界连续性。


这些特性使得 H.266 已经成为视频企业必选的技术栈、必做的标准升级。有数据显示,2026 年支持 H.266 硬解设备将超 20 亿台,推动 8K/VR 内容普及。唯一的问题在于,直接使用开源软件做简单定制,还是基于付费版商业软件来构建业务。


我们必须考虑到,对比十年前,视频编解码领域的实力派玩家,数量增加了,其中最重磅的,非字节跳动及火山引擎莫属。


字节及火山在视频业务上有积累独到的 Know-How ,且在技术上的嗅觉足够敏锐,这赋予了字节及火山自研的 H.266 系列产品夸张的性能表现。比如,从官方数据口径来看,火山引擎 H.266 解码器的计算复杂度几乎只有 VTM-23.5 的四分之一到七分之一,是 FFmpeg 7.1 的三分之一。


本专题将首先回顾 H.266/VVC 的技术沿革,而更多、更详细的性能指标对比和技术解读,将在接下来的章节中逐步展开。专题末尾,我们会单独提及火山引擎对点播、直播、RTC 场景下编码器及解码器的优化工作。


我认为这个技术专题,对于即将基于  H.266 标准构建视频流业务的团队,有着极强的借鉴意义,也几乎是一名技术决策者,在完成技术选型前,所必须参考的资料。

2025-02-28 19:0711724

评论

发布
暂无评论

揭开“视频超分”黑科技的神秘面纱

拍乐云Pano

音视频 RTC 视频算法 视频超分

2021云栖大会 | 传统行业如何上链?旺链科技与你面对面畅聊!

旺链科技

区块链 云栖大会

Python代码阅读(第40篇):通过两个列表生成字典

Felix

Python 编程 Code Programing 阅读代码

新思科技网络安全研究中心发现Nagios XI存在漏洞

InfoQ_434670063458

虚拟币钱包软件系统开发(搭建)

Sentinel-Go 源码系列(一)|开篇

捉虫大师

sentinel Go 语言

一场穿越千年的智能矿山“梦游记”

白洞计划

优化技术专题-性能优化系列-针对Java对象压缩及序列化技术的探索之路

码界西柚

序列化协议 序列化机制 10月月更

字节跳动技术官珍藏版:MySQL王者进阶手册!面面俱到,太全面了

Java MySQL 数据库 面试 后端

数字资产钱包系统开发源码搭建

高效动画实现原理-Jetpack Compose 初探索

vivo互联网技术

动画 Google 框架 移动开发 Andriod

常州一家等保测评公司在哪里?联系电话多少?

行云管家

网络安全 堡垒机 等级保护 等保测评 过等保

保姆级带你深入阅读NAS-BERT

华为云开发者联盟

推理 预训练模型 BERT NAS论文 NAS搜索

021云原生之Kubernetes 部署

穿过生命散发芬芳

云原生 10月月更

官方线索|CCF CED中国工程师文化日

轻口味

1024我在现场

【服务器】服务器租用后如何高效管理,不出纰漏?

行云管家

服务器 IT运维 运维管理 服务器租用

C2C交易软件系统开发(源码)

运营型CRM系统(运营型客户关系管理)只是针对于运营的吗?

低代码小观

企业 企业管理 CRM 管理系统 运营型CRM

Android技术分享| 超简单,给 Android WebRTC增加美颜滤镜功能

anyRTC开发者

android 音视频 WebRTC 移动开发 美颜滤镜

16个实用JavaScript代码片段:DOM、Cookie、数组、对象

devpoint

JavaScript DOM Cookie Object 10月月更

如何支撑企业快速构建数字孪生体

华为云开发者联盟

数据分析 IoT 工业物联网 数字孪生 华为云IoT数据分析

想要面试大数据工作的50道必看题

华为云开发者联盟

大数据 hadoop hdfs 数据分析 关系型数据库

华为云GaussDB深耕数字化下半场,持续打造数据库根技术

华为云数据库小助手

GaussDB 大会 GaussDB(for openGauss) 华为云数据库

现成C2C场外交易源码系统开发

数字钱包软件系统开发介绍(源码)

【高热FAQ】关于智慧康养物联网加速器 ,你想知道的都在这

华为云开发者联盟

物联网 硬件开发 智慧康养 华为云物联网平台 SaaS应用

AI 在视频领域运用—弹幕穿人

百度Geek说

AI 后端 弹幕 视频

mysql binlog日志信息查看

梁小航航

MySQL Binlog

实用 | 利用 aardio 配合 Python 快速开发桌面应用

星安果

Python 软件 工具 aardio 桌面开发

RPAaaS是什么?为何能够推进RPA人人可用?

王吉伟频道

云计算 RPA SaaS 机器人流程自动化 RPAaaS

自媒体团队会面临哪些瓶颈和困境

石头IT视角

在 AI 应用爆发前夜,H.266 成熟了_字节跳动_王一鹏_InfoQ精选文章