大厂Data+Agent 秘籍:腾讯/阿里/字节解析如何提升数据分析智能。 了解详情
写点什么

在 AI 应用爆发前夜,H.266 成熟了

  • 2025-02-28
    北京
  • 本文字数:1605 字

    阅读完需:约 5 分钟

大小:868.26K时长:04:56
在 AI 应用爆发前夜,H.266 成熟了

2024 年,随着生成式 AI、多模态大模型、全景直播、三维重建等技术逐渐落地行业,我们从流畅、实时、高清的数字视频世界逐步进入更智能、交互性更强、沉浸感更强的的 AI 视频世界。这是一次行进中的音视频革命,我们能从诸多痕迹,验证它的进展:


  • 据 ResearchAndMarkets 预测,到 2027 年,全球视频流媒体市场规模将高达 184.3 亿美元,这一惊人的数据充分彰显了视频产业的蓬勃发展态势;

  • XR 设备出货量年增 35%,虚实融合的"空间互联网"逐步成型;

  • 2024 年央视春晚采用 XR 技术,围绕舞台效果进行了设计,并验证落地;

  • ……


以上并非终局,事实上,生成式 AI 正在进一步扩展视频流媒体领域的市场天花板。


内容生产正从 UGC/PGC 发展到 AIGC,内容的生产量将呈几何倍数的增长。有数据显示,AIGC 工具将视频创作门槛降低 90%,预计 2027 年全球短视频日产量突破 50 亿条;用户的交互空间也在从 2D、3D,VR 拓展到了虚拟世界与现实世界的无缝融合。


这一系列新需求,对视频编解码技术的要求是:在带宽不变的情况下,画质更优;同等画质下,存储和传输成本更低。


最新一代视频编码标准 H.266/VVC 正是在这种背景下,走入“舞台”中央。作为支撑庞大视频产业的核心关键要素,H.266 在流媒体生态中起着举足轻重的作用。


H.266 的重点应用场景可分为三个部分:点播、直播、RTC。虽然 H.266 硬解码器的支持正在逐步增加,但目前市场上硬解支持 H.266 的设备相对较少,尤其是一些移动终端。因此,优化 H.266 的软件解码器就显得尤为重要。


其中,点播编解码更注重压缩效率与画质平衡,H.266 的核心优势在于压缩效率提升约 50%(理论值)。通过四叉树加多类型树(QT+MTT)分块法和色度分量双树编码,H.266 能更精细地划分编码单元,减少冗余数据。例如,在 4K/8K 视频中,128×128 的编码树单元(CTU)相比 H.265 的 64×64 单元,显著提升大分辨率视频的编码效率。


在动态范围与色彩支持方面,H.266 的 Main10 Profile 原生支持 10bit 色深和 HDR,解决了点播内容在宽色域和高动态范围下的色彩断层问题。


直播则更看重实时性与复杂度平衡,因而对编码速度要求苛刻,H.266 的编码复杂度较 H.265 增加约 10 倍,可通过硬件加速(如 GPU 或专用芯片)实现高效实时编码,这点与当下新型算力中心的构建思路相通,适合复用冗余的、低功耗的 GPU 算力。


RTC (实时通信)更关注低延迟与交互优化,要求端到端延迟低于 100ms。H.266 通过多种技术手段提升运动矢量预测(HMVP)和编码(SMVD) 效率,提升编码效率,降低重传率。


针对视频会议中的 PPT 共享、白板协作等场景,H.266 引入帧内块复制(Intra Block Copy)技术,直接复用屏幕内容中的重复块(如文字、图表),压缩效率提升 40%(理论值)。


此外,H.266 的环绕运动补偿(Wrap Around Motion Compensation),也可以优化 360 度视频的边界连续性。


这些特性使得 H.266 已经成为视频企业必选的技术栈、必做的标准升级。有数据显示,2026 年支持 H.266 硬解设备将超 20 亿台,推动 8K/VR 内容普及。唯一的问题在于,直接使用开源软件做简单定制,还是基于付费版商业软件来构建业务。


我们必须考虑到,对比十年前,视频编解码领域的实力派玩家,数量增加了,其中最重磅的,非字节跳动及火山引擎莫属。


字节及火山在视频业务上有积累独到的 Know-How ,且在技术上的嗅觉足够敏锐,这赋予了字节及火山自研的 H.266 系列产品夸张的性能表现。比如,从官方数据口径来看,火山引擎 H.266 解码器的计算复杂度几乎只有 VTM-23.5 的四分之一到七分之一,是 FFmpeg 7.1 的三分之一。


本专题将首先回顾 H.266/VVC 的技术沿革,而更多、更详细的性能指标对比和技术解读,将在接下来的章节中逐步展开。专题末尾,我们会单独提及火山引擎对点播、直播、RTC 场景下编码器及解码器的优化工作。


我认为这个技术专题,对于即将基于  H.266 标准构建视频流业务的团队,有着极强的借鉴意义,也几乎是一名技术决策者,在完成技术选型前,所必须参考的资料。

2025-02-28 19:0711464

评论

发布
暂无评论
发现更多内容

最新版本 Stable Diffusion 开源 AI 绘画工具之使用篇

江户川码农

人工智能 图文生成 AI绘画 Stable Diffusion

喜讯!天翼云荣获国际AI顶会ABAW季军

天翼云开发者社区

安全可信| 天翼云算力调度平台通过信通院首批可信算力云服务评估!

天翼云开发者社区

网上说低代码的一大堆,JNPF凭什么可以火?

引迈信息

前端 敏捷开发 低代码 快速开发 JNPF

算云融合促发展,天翼云以领先云网算力助推数字中国建设!

天翼云开发者社区

智改数转:这个制造业的必答题该如何作答?

加入高科技仿生人

低代码 数字化 制造业 智能化 智改数转

从“卖船”到提供建造“航母” 的基础设施,用友BIP有底气

用友BIP

数据库原理及MySQL应用 | 程序流程控制

TiAmo

数据库 sql

软件测试/测试开发丨通用 api 封装实战,带你深入理解 PO

测试人

软件测试 自动化测试 测试开发

大咖说丨云计算:数字世界的“中枢神经”

天翼云开发者社区

国营单位工作4年转行网络安全,成功上岸安全开发!

网络安全学海

黑客 网络安全 信息安全 渗透测试 WEB安全

GaussDB(DWS)云原生数仓技术解析

华为云开发者联盟

数据库 后端 华为云 华为云开发者联盟 企业号 4 月 PK 榜

基于SpringBoot实现单元测试的多种情境/方法(二)

天翼云开发者社区

保证高效写入查询的情况下,如何实现 CPU 资源和磁盘 IO 的最低开销?

TDengine

大数据 tdengine 数据处理 时序数据库 资源消耗

分布式政企应用如何快速实现云原生的微服务架构改造

华为云开源

微服务 云原生

明道云技术路径选择及与LCDP的比较

明道云

打破软件开发“不可能三角” 只需一个低代码方案

力软低代码开发平台

5月上海线下 · CSPO认证周末班【提前报名特惠】“价值交付课程”CST导师亲授

ShineScrum

重磅消息 | 2023年腾讯云从业者课程全面升级

科技热闻

软件测试/测试开发丨Chrome 浏览器+Postman还能这样做接口测试 ?

测试人

软件测试 Postman 自动化测试 接口测试 测试开发

FastAPI 快速开发 Web API 项目: 定义路径参数和查询参数

宇宙之一粟

Python FastApi

社区分享 | Orillusion 引擎入门系列 —— 如何创建一个简单的 3D 示例

Orillusion

WebGL 元宇宙 web3d #WebGPU #开源

软件测试/测试开发丨如何高效使用 Requests 做接口自动化测试

测试人

软件测试 自动化测试 接口测试 测试开发 requests

不动产行业国产化加速,明源云上榜《中国信创500强》

科技热闻

5月在线 · A-CSM认证周末班【提前报名特惠】“敏捷教练必修课程”CST导师亲授

ShineScrum

Springfox与SpringDoc——swagger如何选择(SpringDoc入门)

天翼云开发者社区

5月上海线下 · CSM认证周末班【提前报名特惠】“全球金牌课程”CST导师亲授

ShineScrum

如何通过Java代码将添加页码到PDF文档?

在下毛毛雨

Java PDF 添加页码

再获权威认可!MIAOYUN入选中国信通院2022年度《云原生产品目录》

MIAOYUN

云计算 容器 云原生 容器云 容器云平台

在 AI 应用爆发前夜,H.266 成熟了_字节跳动_王一鹏_InfoQ精选文章