内容介绍

每一个视频,不论长短,在拍摄时都是有故事线和逻辑结构的,以往的视频分析主要集中于视频分类打标,而对于视频的细粒度结构分析涉及较少。如果我们在视频搜索中查询“某某角色战胜另外一位角色的打斗片段”,仅有基于关键词的匹配是远远不够的。电视剧或者电影在拍摄时都是从小片段拍出来的,如何像导演一样来解构视频是视频理解中一个非常挑战性的问题,它不仅涉及到基于计算视觉、ASR、OCR、NLP 等一系列多模态分析技术,还涉及到视频内容制作的原理和方法,如何能够对视频做完整的逆向工程不仅对于多模态搜索推荐,而且对于视频智能创作、后期都有很大的助力。这里我将给大家介绍优酷在结构化视频理解方面做的一些尝试工作,从应用到系统、算法设计给出我们的经验尝试。

评论

发布
暂无评论