写点什么

编码技术新突破:字节跳动 AVG 让视频缩小 13%

字节跳动

  • 2023-03-04
    北京
  • 本文字数:1196 字

    阅读完需:约 4 分钟

编码技术新突破:字节跳动AVG让视频缩小13%

据联合视频专家组 JVET 官网显示,字节跳动 AVG (先进视频团队)在 2021 年 2 月发起了一项视频压缩的技术提案,该提案能够在优化压缩质量的同时,节约至少 13% 的存储和带宽。例如,一段 180 分钟 H.266/VVC 标准的高清视频( 1080P 分辨率),大约需要 3GB 的数据体积,应用新技术后只需要 2.6GB 。这是业界公开的单个智能编码工具的最佳性能增益。


字节跳动 AVG 在美国加州建立研发团队,成员有来自高通、微软、英特尔等巨头的资深研究员,也有出身海内外顶级院校的新生代。在此前 JVET 制定新一代国际视频编解码标准 H.266/VVC 的过程中,字节跳动 AVG 累计提交 260+ 项技术提案,其中 130+ 项被采纳,被采纳提案数和采纳率均排在世界前列,是 H.266/VVC 核心算法的主要贡献者之一。


视频是由一张张图片连接起来的动态图像序列,视频编解码则是视频应用的底层核心技术,作用是对图像进行压缩和数字编码,以尽可能小的带宽传送高质量的视频数据。 H.266/VVC 能够在不影响画质的情况下,把视频码率降低到前一代标准 H.265/HEVC 的一半。本来只够放标清视频的网速,也能流畅播放高清视频。


此次字节跳动 AVG 提出的新算法,旨在通过深度学习技术构建减少视频压缩失真的滤波器( DAM ),主干是基于残差单元堆叠的深度卷积网络,辅以自适应模型选择以最大程度适应特性复杂的自然视频。所谓残差单元是指通过引入跳层连接,允许网络把注意力放在变化的残差上,这与视频图像帧之间的残差有异曲同工之妙,比如武林高手决斗,“剑光一闪”,每一帧图像绝大部分内容是相同的,闪动的剑光形成残差,这也是视频编码压缩的重点关注对象。


实验结果显示,相比 H.266/VVC 最新标准,字节跳动的 DAM 解决方案能够为视频编码性能带来显著提升,亮度信号 Y 可实现 10.28% 的性能增益,两个色度信号 U 和 V ,性能增益也分别达到 28.22% 和 27.97% ,在视频质量有所优化的同时,至少还可缩小 13% 的数据体积。


图:测试用例来自国际标准组织的测试视频


据悉,字节跳动 AVG 已自主研发了 BVC2.0 编码器,首次参加国际权威的 MSU 2020 视频编码器大赛,就在四项评价指标上包揽第一。 AVG 的各项研究成果,也将通过 BVC 编码器的升级换代投入应用,包括抖音、西瓜视频、今日头条等 App 的视频类内容处理,以及云计算、云游戏等基础架构领域,从而为用户带来更高清画质、更流畅播放的视频体验。


AVG 除了深度参与国际视频标准制定外,也为国产新一代视频压缩标准 AVS3 做出重要贡献,包括块划分、运动矢量编码及预测、色-亮度帧内预测等多项原创性技术被 AVS3 视频标准所采纳。字节跳动因此获得 2019 年度 AVS 产业技术创新之提案奖,是迄今唯一获奖的互联网企业。


字节跳动 AVG 的张莉博士介绍说,视频压缩标准作为服务商必须遵循的规范,不仅蕴含着难以估量的商业价值,也会为用户带来实实在在的便利。通过标准制定与产品研发,字节跳动会持续创新并输出技术能力,与行业一起为用户提供更优质的视频服务。

2023-03-04 18:518360
用户头像
鲁冬雪 GMI Cloud China Marketing Manager

发布了 364 篇内容, 共 288.8 次阅读, 收获喜欢 299 次。

关注

评论

发布
暂无评论
发现更多内容

基于OpenCV+QT开发超实用的视频编辑器

轻口味

OpenCV 音视频 引航计划 9月日更

Spark 系列教程(1)Word Count

Se7en

Go 中五个常见错误

baiyutang

golang 9月日更

Chrome浏览器控制台支持中文

FunTester

chrome 浏览器 控制台 FunTester 中文

网络攻防学习笔记 Day147

穿过生命散发芬芳

风险评估

linux之mktemp命令

入门小站

Linux

我写了一个脚本,可在“任意”服务器上执行命令!

冰河

Java 后台开发 运维 研发效能 系统架构

一文教你如何落地spring cloud alibaba企业级架构

小鲍侃java

后端 引航计划

华为云开天aPaaS 上线,服务千万开发者,使能行业场景化创新

华为云开发者联盟

华为云 企业应用 开天aPaaS aPaaS 华为云生态

25. 自动驾驶:AI最大的应用场景

Databri_AI

人工智能

在线Emoji符号大全

入门小站

工具

Prometheus 2.27.0 新特性

耳东@Erdong

release Prometheus 9月日更

Python代码阅读(第28篇):计算列表中位数

Felix

Python 编程 Code Programing 阅读代码

缓存的弊端,你了解吗

卢卡多多

缓存 9月日更

从敏捷开发到全自动开发,加速实现企业数字化转型

飞算JavaAI开发助手

学习心得 - 架构训练营 - 第四课

Fm

ECS 选款利器!PTS助您快速上云!

阿里巴巴云原生

活动 ECS TPS

Flutter 对状态管理的认知与思考

小呆呆666

flutter ios android 大前端 dart

Intel要跟华硕等OEM品牌推出DG2显卡?官方:消息不属实

科技新消息

送你一个Python 数据排序的好方法

华为云开发者联盟

Python 数据分析 数据排序

如何实现一款毫秒级实时数据分析引擎

Shopee技术团队

大数据 数据分析 后端 HBase

Morphling:云原生部署 AI , 如何把降本做到极致?

阿里巴巴云原生

阿里云 AI 云原生 Morphling

Intel高管披露Arc显卡合作厂商?官方否认

科技新消息

书单 | 带你轻松度假的10本好书!

博文视点Broadview

考试系统高并发试卷存储设计方案

Imaginary

【墨天轮专访第五期】偶数科技常雷:创新改变世界,深耕云数据仓库

墨天轮

数据库 国产数据库

前端性能优化实战(二)

Augus

JavaScript 9月日更

架构实战营 - 模块四作业

Alex.Wu

Linux用户/用户组编辑

在即

9月日更

Java变异出现错误:No enclosing instance of type XXX is accessible

华为云开发者联盟

Java

你知道怎么离线安装全局 node 模块吗?

编程三昧

大前端 npm Node 离线包 9月日更

编码技术新突破:字节跳动AVG让视频缩小13%_语言 & 开发_InfoQ精选文章