写点什么

一种基于视频帧差异视频卡顿检测方案

  • 2021-03-02
  • 本文字数:1331 字

    阅读完需:约 4 分钟

一种基于视频帧差异视频卡顿检测方案

奇技 · 指南

在视频质量检测中,检测视频是否卡顿也属于视频质量检测的标准之一,在构建视频检测平台中,这一步至关重要。


本文要说明的是把视频转换为帧序列,根据计算帧之间的差值,寻找帧序列中是否有断层,来判断当前视频是否存在卡顿的现象。


结果为一个数据, 0 代表无卡顿现象, 1 代表存在卡顿现象

技术与架构

用户上传视频文件后,使用 ffmpeg 转换为图片序列,抽取图片信息,计算所有序列帧的图片运动像素,计算所有序列图片的平均运动水平,动态计算动态因子,输出判断结果, 0 表示当前不存在卡顿点, 1 表示当前存在卡顿点。



整体方案主要分为六个部分

1. 图片处理

2. 图像相邻帧像素计算

3. 计算所有图片运动量,组合为运动集合

4. 消除视频图片场景剪辑比例,计算平均运动量

5. 计算动态因子

6. 返回结果

技术优势

  • 不需要准备大量的数据集来训练模型,只针对当前要处理的视频进行计算;

  • 不会因为大量的动态场景和静态场景影响卡顿检测的结果;

  • 精准高效,计算量相对较低

技术实现

图片处理

这里采用灰度图片来作为视频卡顿检测的输入序列图片数据,重新设置当前图片的大小为 360*640,当前区域为我们后面计算的兴趣区域.设定兴趣区域,可以有效的避免一些像素点计算的噪声影响。

图像相邻帧计算

A.遍历当前图像集,使用 t+1(下一时刻帧) 的像素减去 t(当前时刻帧)的像素值,计算出两帧之间的差异信息。

B.设定阈值,这里的阈值是一个常量值 = 30,当两帧之间的差异值> 30 的时候,就任务图片存在运动像素,否则,没有存在运动,值为 0,此步骤消除了低运动噪声,或感知能力下的运动像素。

计算所有图片的运动量

将步骤 2 中的值进行平方,将幅度转换为能量,并计算每个视频帧的平均值.该平均值就是当前帧的能量值,所有帧的动量值记为 TI2。

消除视频图片场景切换比例,计算平均运动水量

A.在计算平均值之前要消除场景剪辑比例,这里使用的常量值为 0.02,就是说我们有 100 个帧要消除 2 个场景的剪辑。


B.对 TI2 从小到大排序,在这个序列中,根据 B 中的比例值,消除最高和最低的两个噪声值,循环遍历 TI2,计算 t 时刻帧之前所有帧的平均值,并把这个平均值进行累加.当场景切换的时候,TI2 序列的低点和高点均被消除,平均 TI2 值(TI2_AVG)不会收到影响。

计算动态因子

在近乎静态的场景和动态的场景中,由于像素的变动很小,或者像素变动很大,卡顿的帧/丢失帧会存在少量/大量的运动信息,在确定运动水平的时候需要涉及主观直觉的要素,所以需要利用动态阈值来确定卡顿的视频帧。


在视频中,存在的动态场景较多,该阈值增加,静态场景,阈值减少。


Dfact = a + b * log(TI2_AVG)  a ,b, c 都为常量,分别为 2.5, 1.25, 0.1,c 为限制 Dfact 较小的一个值。

当 Dfact < c = Dfact else 等于 c, Dfact 取值范围是[0, 0.1]之前的一个值。

帧的丢弃和运动量是线性依赖于平均运动能量的对数。

返回结果

循环遍历视频帧,获取每一帧的 TI2 值,如果当前的 TI2 值<= Dfact * Mdrop,认为当前的帧是卡顿的,也就是值为 1,如果当前的 TI2 值> Dfact * Mdrop, 任务当前帧不存在卡顿,把视频所有的帧按找时间顺序排序后,就是我们当前视频卡顿检测的列表值。


Dfact 为上述计算的动态因子,Mdrop 为固定运动能量阈值来确定帧的卡顿.Mdrop 为常量值 0.015。

效果展示


选择 9 张连续的视频帧图片



返回检测结果

本文转载自:360 技术(ID:qihoo_tech)

原文链接:一种基于视频帧差异视频卡顿检测方案

2021-03-02 13:003439

评论

发布
暂无评论
发现更多内容

AI客服越智能,客户越崩溃?看天润融通怎么说

天润融通

AI Compass前沿速览:Cursor 2.0、Firefly Image5、Agent HQ 、LongCat-Video、Kimi-k2 Thinking

汀丶人工智能

《Learn Python Programming(4th)》读后感

codists

Python

职场中的顶级能力—服务意识

老李说技术

职场 职场发展

过程控制 硬件维护经验总结(8)

万里无云万里天

工业 工厂运维 过程控制

Advantech iView SQL注入漏洞分析:认证绕过与数据泄露

qife122

网络安全 SQL注入

在CEIC 2025:生态之力,推动全球消费电子产业的风向之变

脑极体

AI

储能项目如何落地?— 西格电力从规划到运营的全流程实战指南

西格电力

高性能存储 新能源 智慧储能电站 储能 新能源产业

听歌母带音质,追剧AI搜片,鸿蒙双11为你的娱乐生活升个级

最新动态

盘点企业级远程控制方案,哪一款最安全?

科技经济

2026 年RPA全面进化,选型就看这一篇!

Techinsight

10 月热搜精选

KaiwuDB

数据库 KaiwuDB 分布式多模数据库 KWDB开源数据库

qData 数据中台开源版 v1.0.7 发布:新增 SQL Server 支持,快速部署支持达梦与 MySQL 主库切换!

千桐科技

大数据 开源 数据中台 数据治理 qData

AI智能体与多模态算法系统:您的“全能数字员工”已上线

上海拔俗

AI辅助规划编制与智能管理系统:为您的业务装上“导航”与“自动驾驶”

上海拔俗

AWS CloudFront 可观测最佳实践

观测云

aws cloudfront

Java程序员该如何快速上手LLM应用开发呢?

六边形架构

LLM应用开发 Java应用开发 Java大模型

天润融通AI Agent实战营北京站圆满收官,引爆企业AI生产力!

天润融通

AI替代人工:车企如何用天润融通ZENAVA重塑试驾邀约流程

天润融通

把周报写成业务资产:一条指令如何连接数据、流程和管理共识

HuiZhuDev

团队管理 数据驱动 AI应用 国产大模型 工作流自动化

如何提高 SaaS 产品的成功率?

hepingfly【gzh:和平本记】

云效「AI 智能评审」,先锋体验官招募活动正式启动,赢取极客专属好礼!

阿里巴巴云原生

阿里云 云效

绕过Cloudflare防护实现密码重置投毒攻击的账户接管漏洞分析

qife122

网络安全 Cloudflare

AI智能体-路由模式

Hernon AI

#LangChain AI 智能体 AI开发框架 AI设计方法论 AI开发方法论

谷云科技深度参与编制《多源异构数据融合技术规范》团体标准,共创数据融合技术标准

谷云科技RestCloud

技术标准 数据安全 数据融合 ETL 多源异构

过程控制 通讯维护经验总结(5)

万里无云万里天

工业 工厂运维 过程控制

StarRocks 4.0:FlatJSON,让 JSON 查询像列存一样高效

StarRocks

json sql 数据查询 StarRocks 4.0 FlatJSON

等级保护建设方案,等保解决方案

金陵老街

等级保护

西格电力企业级储能技术线路图制定方法与实践指南

西格电力

高性能存储 智慧储能电站 储能 新能源产业 可再生能源发电

Data engineering at Meta

数新网络官方账号

meta

Vibe Coding - 免费使用gpt-5、grok-code-fast-1进行氛围编程

小工匠

vibe coding Claude Code

一种基于视频帧差异视频卡顿检测方案_架构_360技术_InfoQ精选文章