AICon 深圳站聚焦 Agent 技术、应用与生态,大咖分享实战干货 了解详情
写点什么

火山引擎蝉联全国人工智能大赛 — AI+ 增强视频质量评价冠军

  • 2025-05-14
    北京
  • 本文字数:2023 字

    阅读完需:约 7 分钟

大小:1017.08K时长:05:47
火山引擎蝉联全国人工智能大赛 — AI+增强视频质量评价冠军

近期,第 5 届全国人工智能大赛 NAIC(National Artificial Intelligence Challenge)圆满落幕。火山引擎多媒体实验室团队同学组成“SharpMind”小组,提出的“High-resolution video quality assessment based on degraded multi-task learning”算法荣获 AI+增强视频质量评价赛道冠军,算法性能以显著优势排名第一,成功蝉联冠军!



本次夺冠的“AI+增强视频质量评价赛道”吸引了 1400+支队伍参加,涵盖了头部企业、知名院校和科研机构。多媒体实验室的夺冠方案“通过引入退化任务,有效强化了模型对增强损伤类型和程度的判别能力,并对高分辨率输入针对性优化输入模式和模型结构,以极低的计算代价实现了对增强 PGC 视频质量的有效评估,成功蝉联赛道冠军”。

具体比赛细节和排名可以参考比赛官网:https://app-kyxt.pcl.ac.cn/competitions/detail/src6vogj


赛事介绍

全国人工智能大赛(NAIC)自 2019 年创办以来,已成为全球 AI 领域最具影响力的顶级赛事之一。大赛聚焦前沿科研与产业难题,汇聚全球顶尖创新力量,竞争异常激烈——四届赛事累计吸引来自 20 多个国家的 2 万余支高水平团队同台竞技,其中包括来自顶尖高校、科研机构和科技巨头的精英团队。赛事构建了五大百万级高质量数据集,成为推动 AI 技术突破的重要标杆。


2025 年第五届大赛进一步升级,设立“AI+增强视频质量评价”“AI+图像编码”“AI+数智创新”三大前沿赛道,挑战全球选手在算法创新、技术落地等维度的极限。历届赛事不仅催生多项突破性研究成果,更成为全球 AI 人才展示实力、争夺技术制高点的关键舞台。

研究背景

增强视频是指将低质量的老旧视频增强到更高分辨率、更高亮度动态范围、更广色度范围、更高帧率以及更高比特数后的视频。增强生成后的视频在图像清晰度、彩色自然度、亮度对比度、流畅度等维度有显著提升,可以为用户提供更加真实生动的视觉享受和更好的用户体验。


目前视频增强算法还不够成熟,增强生成后的视频与超高清视频的质量要求还有一定的距离,不能满足视听领域高清产业的需求。视频增强修复领域急需要能对增强修复后的视频质量进行智能、准确、有效的评价方法。但是现有的图像质量评价算法都是基于降质视频图像研发的,例如压缩图像等,直接用于增强和修复视频其评测结果与主观感知质量存在差异较大,这也在一定程度上阻碍了增强视频生成算法质量的进一步提升和应用发展。

方案概述

针对增强超高清视频独特的失真特性,提出“High-resolution video quality assessment based on degraded multi-task learning”算法。整体方案包含“退化样本构建策略、基于帧裁块和片段的网络输入模式、多层级特征融合”3 个核心技术点,方案框图如下所示:

1.退化样本构建策略

在对原超高清视频进行一系列增强算法后会引入许多不同程度和类型的失真,为了模拟这个过程并强化模型辨认不同增强失真的能力,本文提出一种基于退化的多任务学习训练策略,其过程如图所示,首先通过分析选取了三种类型的增强失真,包括交错失真(Interlace),超分失真(Resize),Jpge 压缩失真(Jpge compression)。在训练过程中,对原视频帧施加某一种类型的随机失真,并对其进行不同程度的处理。通过“原始输入的分数预测任务(Smooth L1 Loss)、退化前后的画质优劣关系判别任务(Margin Rank Loss)”,实现多任务联合优化。

2.基于帧裁块和片段的网络输入模式

为了避免调整分辨率(Resize)导致局部失真细节的损失并保留一定程度的语义信息,首先在原图上截取与原分辨率相同长宽比的块输入网络。其次,进一步考虑更大尺度下的语义信息,将原视频帧通过切块和组合拼接为片段输入另一个网络。

3.多层级特征融合模块

借鉴学术界多个 SOTA 方案的特征融合思路,设计了多层级特征融合模块,将 模型中特征提取器输出的四阶段特征进行全局平均池化后拼接融合,最终得到的拼接特征输入质量回归模块生成预测分数。该融合模式有效聚合了多尺度信息,使模型预测性能获得大幅提升。

总结

团队创新性地提出了“High-resolution video quality assessment based on degraded multi-task learning”方案,在 NAIC 2025 AI+增强视频质量评价赛道以显著优势夺冠。该夺冠方案“通过引入退化任务,有效强化了模型对增强损伤类型和程度的判别能力,并对高分辨率输入针对性优化输入模式和模型结构,以极低的计算代价实现了对增强 PGC 视频质量的有效评估,成功蝉联赛道冠军”。

团队介绍

火山引擎多媒体实验室是字节跳动旗下的研究团队,致力于探索多媒体领域的前沿技术,参与国际标准化工作,其众多创新算法及软硬件解决方案已经广泛应用在抖音、西瓜视频等产品的多媒体业务,并向火山引擎的企业级客户提供技术服务。实验室成立以来,多篇论文入选国际顶会和旗舰期刊,并获得数项国际级技术赛事冠军、行业创新奖及最佳论文奖。


火山引擎是字节跳动旗下的云服务平台,将字节跳动快速发展过程中积累的增长方法、技术能力和工具开放给外部企业,提供云基础、视频与内容分发、大数据技术、人工智能、开发与运维等服务,帮助企业在数字化升级中实现持续增长


2025-05-14 16:353907
用户头像

发布了 31 篇内容, 共 30.9 次阅读, 收获喜欢 21 次。

关注

评论

发布
暂无评论

基于区块链的去中心化身份技术有哪些应用前景?

CECBC

十二张图带你了解 Redis 的数据结构和对象系统

程序员历小冰

redis 数据结构 28天写作 12月日更

vue3.2组件库-element plus 自动按需引入

Mr.Cactus

typescript Vue3 Element Plus Vite2

在Vue-cli中使用mock.js

CRMEB

怎样的活动才算是成功?(20/28)

赵新龙

28天写作

如何正确的重写hashcode()

李子捌

Java 28天写作 12月日更

王者荣耀异地多活架构设计

Beyond Ryan

JavaScript面试系列:JavaScript设计模式之桥接模式和懒加载

汪子熙

JavaScript 设计模式 桥接模式 28天写作 12月日更

vivo:不做开发者的过客,变成IoT的归人

脑极体

花一点时间优化一次年迈的后台系统的检索体验

为自己带盐

28天写作 12月日更 ​jQuery

优酷播放黑科技 | 基于WebRTC实现的直播“云多视角“技术解析

阿里巴巴终端技术

WebRTC 移动开发 直播技术 客户端

NFT改变潮流,也在解放人类创造力的约束

CECBC

如何提高用户留存?

石云升

AARRR 产品思维 28天写作 产品增长 12月日更

🏆【CI/CD技术专题】「Docker实战系列」(1)本地进行生成镜像以及标签Tag推送到DockerHub

码界西柚

Docker 容器镜像 12月日更 Dockerhub

网络安全教程:13 信息收集

喀拉峻

黑客 网络安全 安全 信息安全

PassJava 开源(一) :初始化项目和添加微服务

悟空聊架构

SpringCloud 28天写作 passjava 悟空聊架构 12月日更

如何看待制造企业的数字化转型,有哪些成功案例可以分享?

优秀

低代码 数字化转型 制造业

GrowingIO Reactor速成指南

GrowingIO技术专栏

响应式编程 reactor

Dubbo框架学习笔记七

风翱

dubbo 12月日更

电竞进入5G时代!腾讯云联合腾讯游戏CROS首秀5G电竞专网

科技热闻

跟着源码学IM(九):基于Netty实现一套分布式IM系统

JackJiang

Netty websocket 即时通讯 IM

不要被数据蒙蔽你的眼睛

Geek_utwige

数据分析 统计学 辛普森悖论

开发者供不应求,传统企业如何拥抱 DevOps ?

飞算JavaAI开发助手

如何推动区块链与物联网深度融合,赋能数字化转型?

CECBC

动手做个 AI 机器人,帮我回消息!

程序员鱼皮

JavaScript AI 前端 nlp Node

Python 的切片为什么不会索引越界?

Python猫

Python

聊聊你每天是如何修bug的

卢卡多多

bug修复 28天写作 12月日更

☕【Java深层系列】「技术盲区」让我们一起完全吃透针对于时间和日期相关的API指南

码界西柚

Java 工具 日期处理 12月日更

复盘健康

将军-技术演讲力教练

CSS之变量

Augus

CSS 12月日更

Gitee 如何自动部署 Pages?还是用 GitHub Actions!

冴羽

GitHub 前端 GitHub Pages gitee vuepress

火山引擎蝉联全国人工智能大赛 — AI+增强视频质量评价冠军_云原生_火山引擎_InfoQ精选文章