写点什么

在 AI 应用爆发前夜,H.266 成熟了

  • 2025-02-28
    北京
  • 本文字数:1605 字

    阅读完需:约 5 分钟

大小:868.26K时长:04:56
在 AI 应用爆发前夜,H.266 成熟了

2024 年,随着生成式 AI、多模态大模型、全景直播、三维重建等技术逐渐落地行业,我们从流畅、实时、高清的数字视频世界逐步进入更智能、交互性更强、沉浸感更强的的 AI 视频世界。这是一次行进中的音视频革命,我们能从诸多痕迹,验证它的进展:


  • 据 ResearchAndMarkets 预测,到 2027 年,全球视频流媒体市场规模将高达 184.3 亿美元,这一惊人的数据充分彰显了视频产业的蓬勃发展态势;

  • XR 设备出货量年增 35%,虚实融合的"空间互联网"逐步成型;

  • 2024 年央视春晚采用 XR 技术,围绕舞台效果进行了设计,并验证落地;

  • ……


以上并非终局,事实上,生成式 AI 正在进一步扩展视频流媒体领域的市场天花板。


内容生产正从 UGC/PGC 发展到 AIGC,内容的生产量将呈几何倍数的增长。有数据显示,AIGC 工具将视频创作门槛降低 90%,预计 2027 年全球短视频日产量突破 50 亿条;用户的交互空间也在从 2D、3D,VR 拓展到了虚拟世界与现实世界的无缝融合。


这一系列新需求,对视频编解码技术的要求是:在带宽不变的情况下,画质更优;同等画质下,存储和传输成本更低。


最新一代视频编码标准 H.266/VVC 正是在这种背景下,走入“舞台”中央。作为支撑庞大视频产业的核心关键要素,H.266 在流媒体生态中起着举足轻重的作用。


H.266 的重点应用场景可分为三个部分:点播、直播、RTC。虽然 H.266 硬解码器的支持正在逐步增加,但目前市场上硬解支持 H.266 的设备相对较少,尤其是一些移动终端。因此,优化 H.266 的软件解码器就显得尤为重要。


其中,点播编解码更注重压缩效率与画质平衡,H.266 的核心优势在于压缩效率提升约 50%(理论值)。通过四叉树加多类型树(QT+MTT)分块法和色度分量双树编码,H.266 能更精细地划分编码单元,减少冗余数据。例如,在 4K/8K 视频中,128×128 的编码树单元(CTU)相比 H.265 的 64×64 单元,显著提升大分辨率视频的编码效率。


在动态范围与色彩支持方面,H.266 的 Main10 Profile 原生支持 10bit 色深和 HDR,解决了点播内容在宽色域和高动态范围下的色彩断层问题。


直播则更看重实时性与复杂度平衡,因而对编码速度要求苛刻,H.266 的编码复杂度较 H.265 增加约 10 倍,可通过硬件加速(如 GPU 或专用芯片)实现高效实时编码,这点与当下新型算力中心的构建思路相通,适合复用冗余的、低功耗的 GPU 算力。


RTC (实时通信)更关注低延迟与交互优化,要求端到端延迟低于 100ms。H.266 通过多种技术手段提升运动矢量预测(HMVP)和编码(SMVD) 效率,提升编码效率,降低重传率。


针对视频会议中的 PPT 共享、白板协作等场景,H.266 引入帧内块复制(Intra Block Copy)技术,直接复用屏幕内容中的重复块(如文字、图表),压缩效率提升 40%(理论值)。


此外,H.266 的环绕运动补偿(Wrap Around Motion Compensation),也可以优化 360 度视频的边界连续性。


这些特性使得 H.266 已经成为视频企业必选的技术栈、必做的标准升级。有数据显示,2026 年支持 H.266 硬解设备将超 20 亿台,推动 8K/VR 内容普及。唯一的问题在于,直接使用开源软件做简单定制,还是基于付费版商业软件来构建业务。


我们必须考虑到,对比十年前,视频编解码领域的实力派玩家,数量增加了,其中最重磅的,非字节跳动及火山引擎莫属。


字节及火山在视频业务上有积累独到的 Know-How ,且在技术上的嗅觉足够敏锐,这赋予了字节及火山自研的 H.266 系列产品夸张的性能表现。比如,从官方数据口径来看,火山引擎 H.266 解码器的计算复杂度几乎只有 VTM-23.5 的四分之一到七分之一,是 FFmpeg 7.1 的三分之一。


本专题将首先回顾 H.266/VVC 的技术沿革,而更多、更详细的性能指标对比和技术解读,将在接下来的章节中逐步展开。专题末尾,我们会单独提及火山引擎对点播、直播、RTC 场景下编码器及解码器的优化工作。


我认为这个技术专题,对于即将基于  H.266 标准构建视频流业务的团队,有着极强的借鉴意义,也几乎是一名技术决策者,在完成技术选型前,所必须参考的资料。

2025-02-28 19:0711838

评论

发布
暂无评论
发现更多内容

模块三作业

周文

「架构实战营」

14 K8S之对外访问容器服务

穿过生命散发芬芳

k8s 11月日更

架构实战营 - 模块八作业

en

#架构实战营

无处不在的 Kubernetes,难用的问题解决了吗?

阿里巴巴云原生

阿里云 Kubernetes 容器 云原生 难题攻克

Android C++系列:JNI中的线程操作

轻口味

c++ android jni 11月日更

设计消息队列存储消息数据的 MySQL 表格

缘分呐

自动化前端页面性能测试介绍

刘冉

大前端 软件测试 性能测试 软件自动化测试

对于排序号中参数值的校验

卢卡多多

参数校验 11月日更

架构实战营 - 模块八作业

Alex.Wu

Golang Gin 框架入门介绍(一)

liuzhen007

11月日更

模块三作业:学生管理系统架构设计文档

赵先生

架构实战营

.NET6新东西--CallerArgumentExpression

喵叔

11月日更

架构营模块三作业

GTiger

架构实战营

【Promise 源码学习】第七篇 - 实现 Promise 返回值 x 的处理

Brave

源码 Promise 11月日更

低碳企业和个人如何参与碳交易市场?

石云升

碳中和 11月日更 碳交易

模块三课后作业 - 详细架构设计文档 - 外包学生管理系统

渐行渐远

架构实战营

模块三作业

忘记喝水的猫

架构训练营

再见了,纸币!数字人民币,席卷而来

CECBC

Go语言,定时器的使用

微客鸟窝

Go 语言 11月日更

进击的Java(六)

ES_her0

11月日更

在线英文名随机生成器

入门小站

工具

《PyTorch深度学习实战》复习之环境搭建

IT蜗壳-Tango

11月日更

和12岁小同志搞创客开发:手撕代码,做一款声控灯

不脱发的程序猿

少儿编程 DIY 传感器 创客开发 Arduino

PS 基础操作 - 文件格式和存储

hepingfly【gzh:和平本记】

ps教程 ps学习笔记

PS 基础操作 - 缩放、抓手、移动工具

hepingfly【gzh:和平本记】

ps教程 ps学习笔记

聚焦云原生,阿里云与 CNCF 共话「云未来,新可能」

阿里巴巴云原生

阿里云 云原生 活动 KubeCON

linux之ClamAV杀毒软件安装配置

入门小站

Linux

模块三作业

lxz

微服务中台技术之延迟中心实践

小江

Java redis kafka 延时队列

【LeetCode】键值映射Java题解

Albert

算法 LeetCode 11月日更

基于Serverless的测试服务化-理论篇

刘冉

软件测试 自动化测试 测试服务化

在 AI 应用爆发前夜,H.266 成熟了_字节跳动_王一鹏_InfoQ精选文章