写点什么

火山引擎蝉联全国人工智能大赛 — AI+ 增强视频质量评价冠军

  • 2025-05-14
    北京
  • 本文字数:2023 字

    阅读完需:约 7 分钟

大小:1017.08K时长:05:47
火山引擎蝉联全国人工智能大赛 — AI+增强视频质量评价冠军

近期,第 5 届全国人工智能大赛 NAIC(National Artificial Intelligence Challenge)圆满落幕。火山引擎多媒体实验室团队同学组成“SharpMind”小组,提出的“High-resolution video quality assessment based on degraded multi-task learning”算法荣获 AI+增强视频质量评价赛道冠军,算法性能以显著优势排名第一,成功蝉联冠军!



本次夺冠的“AI+增强视频质量评价赛道”吸引了 1400+支队伍参加,涵盖了头部企业、知名院校和科研机构。多媒体实验室的夺冠方案“通过引入退化任务,有效强化了模型对增强损伤类型和程度的判别能力,并对高分辨率输入针对性优化输入模式和模型结构,以极低的计算代价实现了对增强 PGC 视频质量的有效评估,成功蝉联赛道冠军”。

具体比赛细节和排名可以参考比赛官网:https://app-kyxt.pcl.ac.cn/competitions/detail/src6vogj


赛事介绍

全国人工智能大赛(NAIC)自 2019 年创办以来,已成为全球 AI 领域最具影响力的顶级赛事之一。大赛聚焦前沿科研与产业难题,汇聚全球顶尖创新力量,竞争异常激烈——四届赛事累计吸引来自 20 多个国家的 2 万余支高水平团队同台竞技,其中包括来自顶尖高校、科研机构和科技巨头的精英团队。赛事构建了五大百万级高质量数据集,成为推动 AI 技术突破的重要标杆。


2025 年第五届大赛进一步升级,设立“AI+增强视频质量评价”“AI+图像编码”“AI+数智创新”三大前沿赛道,挑战全球选手在算法创新、技术落地等维度的极限。历届赛事不仅催生多项突破性研究成果,更成为全球 AI 人才展示实力、争夺技术制高点的关键舞台。

研究背景

增强视频是指将低质量的老旧视频增强到更高分辨率、更高亮度动态范围、更广色度范围、更高帧率以及更高比特数后的视频。增强生成后的视频在图像清晰度、彩色自然度、亮度对比度、流畅度等维度有显著提升,可以为用户提供更加真实生动的视觉享受和更好的用户体验。


目前视频增强算法还不够成熟,增强生成后的视频与超高清视频的质量要求还有一定的距离,不能满足视听领域高清产业的需求。视频增强修复领域急需要能对增强修复后的视频质量进行智能、准确、有效的评价方法。但是现有的图像质量评价算法都是基于降质视频图像研发的,例如压缩图像等,直接用于增强和修复视频其评测结果与主观感知质量存在差异较大,这也在一定程度上阻碍了增强视频生成算法质量的进一步提升和应用发展。

方案概述

针对增强超高清视频独特的失真特性,提出“High-resolution video quality assessment based on degraded multi-task learning”算法。整体方案包含“退化样本构建策略、基于帧裁块和片段的网络输入模式、多层级特征融合”3 个核心技术点,方案框图如下所示:

1.退化样本构建策略

在对原超高清视频进行一系列增强算法后会引入许多不同程度和类型的失真,为了模拟这个过程并强化模型辨认不同增强失真的能力,本文提出一种基于退化的多任务学习训练策略,其过程如图所示,首先通过分析选取了三种类型的增强失真,包括交错失真(Interlace),超分失真(Resize),Jpge 压缩失真(Jpge compression)。在训练过程中,对原视频帧施加某一种类型的随机失真,并对其进行不同程度的处理。通过“原始输入的分数预测任务(Smooth L1 Loss)、退化前后的画质优劣关系判别任务(Margin Rank Loss)”,实现多任务联合优化。

2.基于帧裁块和片段的网络输入模式

为了避免调整分辨率(Resize)导致局部失真细节的损失并保留一定程度的语义信息,首先在原图上截取与原分辨率相同长宽比的块输入网络。其次,进一步考虑更大尺度下的语义信息,将原视频帧通过切块和组合拼接为片段输入另一个网络。

3.多层级特征融合模块

借鉴学术界多个 SOTA 方案的特征融合思路,设计了多层级特征融合模块,将 模型中特征提取器输出的四阶段特征进行全局平均池化后拼接融合,最终得到的拼接特征输入质量回归模块生成预测分数。该融合模式有效聚合了多尺度信息,使模型预测性能获得大幅提升。

总结

团队创新性地提出了“High-resolution video quality assessment based on degraded multi-task learning”方案,在 NAIC 2025 AI+增强视频质量评价赛道以显著优势夺冠。该夺冠方案“通过引入退化任务,有效强化了模型对增强损伤类型和程度的判别能力,并对高分辨率输入针对性优化输入模式和模型结构,以极低的计算代价实现了对增强 PGC 视频质量的有效评估,成功蝉联赛道冠军”。

团队介绍

火山引擎多媒体实验室是字节跳动旗下的研究团队,致力于探索多媒体领域的前沿技术,参与国际标准化工作,其众多创新算法及软硬件解决方案已经广泛应用在抖音、西瓜视频等产品的多媒体业务,并向火山引擎的企业级客户提供技术服务。实验室成立以来,多篇论文入选国际顶会和旗舰期刊,并获得数项国际级技术赛事冠军、行业创新奖及最佳论文奖。


火山引擎是字节跳动旗下的云服务平台,将字节跳动快速发展过程中积累的增长方法、技术能力和工具开放给外部企业,提供云基础、视频与内容分发、大数据技术、人工智能、开发与运维等服务,帮助企业在数字化升级中实现持续增长


2025-05-14 16:353744
用户头像

发布了 31 篇内容, 共 30.5 次阅读, 收获喜欢 21 次。

关注

评论

发布
暂无评论

报名直达丨HarmonyOS开发者创新大赛线下城市交流会来了,约吗?

HarmonyOS开发者

HarmonyOS 交流 创新大赛

APP热更新技术最优解,不只是支持热更新...

Speedoooo

小程序 APP开发 容器安全 热更新 小程序容器

生态扩大进行中!Apache APISIX 集成 Splunk HTTP Event Collector

API7.ai 技术团队

API网关 Apache APISIX

新插件上线,public API 处理能力更进一步

API7.ai 技术团队

HTTP APISIX APISIX 网关

手把手教学电瓶车进电梯检测、多类别车辆追踪、异常行为检测产业级应用

百度开发者中心

万字通俗讲解何为复杂度

华为云开发者联盟

数据结构 时间复杂度 复杂度 空间复杂度 复杂度分许

Apache APISIX 新技能,代理 gRPC-Web 请求

API7.ai 技术团队

gRPC HTTP 网关 APISIX

为什么国企要加快推进数字化转型?

用友BIP

数字化转型 用友 用友iuap 用友YonBIP 国企

COPT4.0新增凸QP、QCP和QCQP求解能力

杉数科技

求解器 优化求解器 凸QP 凸QCP

极速生成缩略图,Serverless 支撑赛事转播锁定冬奥亮点

Serverless Devs

企业级 APIs 安全实践指南 (建议初中级工程师收藏)

领创集团Advance Intelligence Group

API

SQL注入-“错误”的语句为什么会得到“正确”的结果?

BUG侦探

MySQL 网络安全 SQL注入

常青藤开源科技加入,龙蜥社区再迎 HPC 和开源领域新伙伴

OpenAnolis小助手

Linux 开源 高性能计算

StarRocks 元数据管理及 FE 高可用机制

邸星星

BerkeleyDB-JE bdbje StarRocks元数据管理

你知道钓鱼网站的形成步骤吗?一次网络钓鱼演练带你了解(增强安全意识)

H

网络安全 钓鱼网站

Nacos 在 Apache APISIX API 网关中的服务发现实践

API7.ai 技术团队

nacos 注册中心 服务发现 API网关 APISIX

JWT Token在线编码生成

入门小站

工具

阿里云资深专家李国强:云原生的一些趋势和新方向

Serverless Devs

异步请求积压可视化|如何 1 分钟内快速定位函数计算积压问题

Serverless Devs

计算IIS

杉数科技

求解器 优化求解器 计算IIS 混合整数规划 杉数科技

学生外包管理系统架构设计文档

孙强

#架构实战营

第十五节:SpringBoot使用JPA访问数据库

入门小站

spring-boot

如何在设计时保证RPA机器人的稳定运行?

金小K

2022写作计划2月文章排行榜

TGO鲲鹏会

TGO鲲鹏会 写作计划

使用goofys挂载S3 bucket为文件系统

阿呆

文件系统 goofys aws s3

斯图飞腾Stratifyd入选「2022爱分析·营销科技厂商全景报告」

极客天地

Apache APISIX 集成 Open Policy Agent

API7.ai 技术团队

开源 后端 API网关 OPA Apache APISIX

浅析企业云服务之SaaS、PaaS、IaaS对比分析

郑州埃文科技

IaaS PaaS SaaS

【场景化集成方案】如何让企业快速集成钉钉各种能力

钉钉开发者

钉钉能力中心 钉钉官网 场景化能力包 场景化解决方案 应用集成方案

Window下Redis的安装和部署详细教程

明金同学

redis

如何使用 Apache APISIX CSRF 安全插件拦截跨站点伪造攻击

API7.ai 技术团队

CSRF API网关 Apache APISIX

火山引擎蝉联全国人工智能大赛 — AI+增强视频质量评价冠军_云原生_火山引擎_InfoQ精选文章