写点什么

在 AI 应用爆发前夜,H.266 成熟了

  • 2025-02-28
    北京
  • 本文字数:1605 字

    阅读完需:约 5 分钟

大小:868.26K时长:04:56
在 AI 应用爆发前夜,H.266 成熟了

2024 年,随着生成式 AI、多模态大模型、全景直播、三维重建等技术逐渐落地行业,我们从流畅、实时、高清的数字视频世界逐步进入更智能、交互性更强、沉浸感更强的的 AI 视频世界。这是一次行进中的音视频革命,我们能从诸多痕迹,验证它的进展:


  • 据 ResearchAndMarkets 预测,到 2027 年,全球视频流媒体市场规模将高达 184.3 亿美元,这一惊人的数据充分彰显了视频产业的蓬勃发展态势;

  • XR 设备出货量年增 35%,虚实融合的"空间互联网"逐步成型;

  • 2024 年央视春晚采用 XR 技术,围绕舞台效果进行了设计,并验证落地;

  • ……


以上并非终局,事实上,生成式 AI 正在进一步扩展视频流媒体领域的市场天花板。


内容生产正从 UGC/PGC 发展到 AIGC,内容的生产量将呈几何倍数的增长。有数据显示,AIGC 工具将视频创作门槛降低 90%,预计 2027 年全球短视频日产量突破 50 亿条;用户的交互空间也在从 2D、3D,VR 拓展到了虚拟世界与现实世界的无缝融合。


这一系列新需求,对视频编解码技术的要求是:在带宽不变的情况下,画质更优;同等画质下,存储和传输成本更低。


最新一代视频编码标准 H.266/VVC 正是在这种背景下,走入“舞台”中央。作为支撑庞大视频产业的核心关键要素,H.266 在流媒体生态中起着举足轻重的作用。


H.266 的重点应用场景可分为三个部分:点播、直播、RTC。虽然 H.266 硬解码器的支持正在逐步增加,但目前市场上硬解支持 H.266 的设备相对较少,尤其是一些移动终端。因此,优化 H.266 的软件解码器就显得尤为重要。


其中,点播编解码更注重压缩效率与画质平衡,H.266 的核心优势在于压缩效率提升约 50%(理论值)。通过四叉树加多类型树(QT+MTT)分块法和色度分量双树编码,H.266 能更精细地划分编码单元,减少冗余数据。例如,在 4K/8K 视频中,128×128 的编码树单元(CTU)相比 H.265 的 64×64 单元,显著提升大分辨率视频的编码效率。


在动态范围与色彩支持方面,H.266 的 Main10 Profile 原生支持 10bit 色深和 HDR,解决了点播内容在宽色域和高动态范围下的色彩断层问题。


直播则更看重实时性与复杂度平衡,因而对编码速度要求苛刻,H.266 的编码复杂度较 H.265 增加约 10 倍,可通过硬件加速(如 GPU 或专用芯片)实现高效实时编码,这点与当下新型算力中心的构建思路相通,适合复用冗余的、低功耗的 GPU 算力。


RTC (实时通信)更关注低延迟与交互优化,要求端到端延迟低于 100ms。H.266 通过多种技术手段提升运动矢量预测(HMVP)和编码(SMVD) 效率,提升编码效率,降低重传率。


针对视频会议中的 PPT 共享、白板协作等场景,H.266 引入帧内块复制(Intra Block Copy)技术,直接复用屏幕内容中的重复块(如文字、图表),压缩效率提升 40%(理论值)。


此外,H.266 的环绕运动补偿(Wrap Around Motion Compensation),也可以优化 360 度视频的边界连续性。


这些特性使得 H.266 已经成为视频企业必选的技术栈、必做的标准升级。有数据显示,2026 年支持 H.266 硬解设备将超 20 亿台,推动 8K/VR 内容普及。唯一的问题在于,直接使用开源软件做简单定制,还是基于付费版商业软件来构建业务。


我们必须考虑到,对比十年前,视频编解码领域的实力派玩家,数量增加了,其中最重磅的,非字节跳动及火山引擎莫属。


字节及火山在视频业务上有积累独到的 Know-How ,且在技术上的嗅觉足够敏锐,这赋予了字节及火山自研的 H.266 系列产品夸张的性能表现。比如,从官方数据口径来看,火山引擎 H.266 解码器的计算复杂度几乎只有 VTM-23.5 的四分之一到七分之一,是 FFmpeg 7.1 的三分之一。


本专题将首先回顾 H.266/VVC 的技术沿革,而更多、更详细的性能指标对比和技术解读,将在接下来的章节中逐步展开。专题末尾,我们会单独提及火山引擎对点播、直播、RTC 场景下编码器及解码器的优化工作。


我认为这个技术专题,对于即将基于  H.266 标准构建视频流业务的团队,有着极强的借鉴意义,也几乎是一名技术决策者,在完成技术选型前,所必须参考的资料。

2025-02-28 19:0711564

评论

发布
暂无评论

《零基础学 Java》 FAQ 之 7-Java 中的内存是怎么分配的

臧萌

Java JVM

《后浪》产品经理篇(恶搞版)

静陌

产品经理 后浪

Redis稳定性实践

心平气和

redis 缓存 稳定性

更聪明地学习,而不是苦读——《如何高效学习》

mzlogin

学习

谈谈控制感(5):怎么破控制感损失的局

史方远

职场 心理 成长

Xtrabackup的安装使用

一个有志气的DB

MySQL 工具 数据的分片和备份

游戏夜读 | Scikit-learn迎来0.21之前

game1night

尽管HTTP/3已经来了,HTTP/2也得了解啊

清远

网络协议 HTTP

如何在一台计算机上安装多个 JDK 版本

mghio

Java jdk 版本管理工具

面试官:小伙子,听说你看过ThreadLocal源码?(万字图文深度解析ThreadLocal)

一枝花算不算浪漫

源码 并发编程 ThreadLocal

一文带你看清HTTP所有概念

苹果看辽宁体育

HTTP

MySQL常用权限说明

一个有志气的DB

MySQL 用户研究

Harbor 2.0的飞跃: OCI 兼容的工件仓库

亨利笔记

Kubernetes 容器 k8s Harbor 镜像

OpenResty部署配置和日志切割

wong

nginx centos openresty

对于程序员,那些既陌生又熟悉的计算机硬件

架构师修行之路

微软 编程 程序员 cpu 架构师

sync.Map源码分析

陈思敏捷

源码 源码分析 Go 语言

Mac 使用笔记

FeiLong

Java新技术:封闭类

X.F

Java 架构 编程语言

Python 核心技术与进阶 list & tuple

Bonaparte

松哥手把手教你定制 Spring Security 中的表单登录

江南一点雨

Java spring Spring Boot spring security

Rust 与区块链四月月刊

Aimee 阿敏

区块链 rust 加密货币 crypto

Android | Tangram动态页面之路(二)介绍

哈利迪

android

松哥手把手带你入门 Spring Security,别再问密码怎么解密了

江南一点雨

Java spring Spring Boot spring security

聊聊我对技术一些性质的认识

Tanzv

技术 思考 新人

如果你觉得学习 Git 很枯燥,那是因为你还没玩过这款游戏!

GitHubDaily

git GitHub 编程 程序员 开发者工具

设计模式之观察者模式

设计模式

回“疫”录(18):536公里的路

小天同学

疫情 回忆录 现实纪录 纪实 返程

严选合伙人(二)

Neco.W

创业 重新理解创业 合伙人

业余前端的日常

顿晓

学习 大前端 日常 专家 知识体系

让你高效工作与学习的免费工具(1)

石云升

高效工作 效率工具 工具

从一次排查ES线上问题得出的总结——熔断机制

罗琦

elasticsearch 源码分析 circuit break 熔断

在 AI 应用爆发前夜,H.266 成熟了_字节跳动_王一鹏_InfoQ精选文章