写点什么

美图海量短视频内容分析与检索(二)

  • 2019-11-30
  • 本文字数:977 字

    阅读完需:约 3 分钟

美图海量短视频内容分析与检索(二)

如何有效定义标签体系

我们有一个热门视频池,运营和产品会手动为一些视频打上标签。你可能会说,我们可以拿这部分标签做模型训练。如果我们将业务标签应用于算法会存在哪些问题呢?


一是业务的标签比较抽象,比如可能会制定像搞笑和幽默这样的一些标签。但一个视频是否算搞笑、幽默,无法仅从视觉或声音、语音等一些信息进行准确判定。


举个例子,一个 3 岁的小孩在哭,父母上传的可能会是一个搞笑的视频,如果是 20 多岁或者 50 多岁的人在哭,那就是一个悲伤的视频。


二是训练数据不均衡,上图是我们拿到的一部分业务标签对应的数据量,因为业务人员在定标签的时候不会考虑每个类别是什么样的,所以就会出现训练数据不均衡的问题,这个也会影响算法模型的训练。


另一个问题是类别区分度低。以上图为例,手指舞和自拍,从视觉角度来看没有任何区别,如果训练中强行将其分成两类,也会在训练过程中影响网络模型的学习,会引起一些噪声。


还有一个问题是标签的维度比较单一。通常一个视频,最多给四到五个维度的标签,再多的话,想全面衡量这个视频会变得非常复杂。


我们的解决方法是,以业务标签作为指引,拿我们的视频数据和文本数据(伴随视频的标题、评论相关信息)去提取视频特征、音频特征进行聚类,然后对聚类进行抽象定义,得出相应的视觉标签元素。这个标签元素就是我们用来训练的标签。最后训练标签输出的结果会反过来映射到业务标签,用这种方法定义的标签是多层级多维度的。


如下图所示,视频中是一个女生,视频中的姿态显示为全身,动作是在摇摆,检测到的音乐风格为摇滚,那么可以判断这个视频是一个美女在自拍,而且在跳舞,属于才艺展示,于是生成的标签就是“美女自拍”、“舞蹈”、“才艺”。这就完成一个算法标签到业务标签的映射。

如何提高线上算法模型的迭代更新效率

这里有三个核心问题:快速的数据标注、有效稳定的模型评估机制、算法运行的性能要有保障。


为了进行快速标注,我们也用了一个自动的算法标注,这个算法在无监督和半监督的深度学习的论文中被提到过。我们会预先拿一个通用的数据训练模型,对业务数据进行少量的标注,基于少量的标注数据再训练一个分类器。这个分类器会给其它未标注的进行标注。伴随标签输出会有一些置信度,会把高置信度的数据再拿去进行训练,低置信度的会继续下一次的迭代更新,这个过程会重复多次。这个过程也会根据任务的难度,加入人工的核验和标注。


2019-11-30 22:53936

评论

发布
暂无评论
发现更多内容

即时通讯和即时通信,即时通讯和实时通信

BeeWorks

telegraf 常用命令总结

不在线第一只蜗牛

服务器 命令

华为大咖说 | 揭秘巴黎奥运会门票定价:为什么最低门票定24欧?

人工智能 华为云

简单好用的京东商品详情API使用入门指南

技术冰糖葫芦

API 安全 API 文档 API 测试 API 优先 pinduoduo API

玩转漫画、小说等跨模态AI创作,百度文库联合玄机科技举办国内首个AI漫画大赛

极客天地

面试官:你的项目有哪些难点?

王磊

Java 面试

大模型检索X一键成片,巴黎奥运的AI新演绎

阿里云CloudImagine

云计算 AI技术 大模型 视频云 奥运会

解锁AI安全新高度,安全极客全新升级

云起无垠

解析 LSP 经济循环系统,如何推动生态形成价值增长?

股市老人

观测云:企业监控的定制化与精细化管理专家

可观测技术

集成与 API 支持:开放架构的灵活性

可观测技术

掌握良好的API设计原则:是什么、为什么和怎么办

幂简集成

API API 设计

可信数据库发展大会回顾 | 天谋科技乔嘉林:Apache TsFile & IoTDB 联合赋能智慧能源

Apache IoTDB

远程访问Voice Engine AI工具:无需公网IP,轻松实现高效创作

贝锐

AI 花生壳 贝锐

万字干货:从消息流平台Serverless之路,看Serverless标准演进

华为云开发者联盟

Serverless lvm 信息流 企业号 8 月 PK 榜

LSP 协议:模块化 PoS 的全新叙事方案

股市老人

【Hive】 HiveServer2 内存溢出总结

扬_帆_起_航

Hive SQL 内存泄漏 HiveServer2 hive metastore

信创企业级即时通讯发展趋势,私有化安全沟通

BeeWorks

单集群 100 节点!资源占用远小于 Grafana Mimir——GreptimeDB 海量数据写入性能报告

Greptime 格睿科技

数据库 性能测试 数据存储 Mimir 基准测试

ByteHouse高性能向量检索实践——“以图搜图”

字节跳动数据平台

数据库 大数据 云原生 Clickhouse 数仓

IoTDB 集群性能优化:内存配置详解

Apache IoTDB

发布更便宜的GPT-4o mini,OpenAI也打起了价格战

蓉蓉

openai GPT-4o mini

观测云:零售行业数据分析的利器

可观测技术

全网热议!GitHub发布的最简单的黑客入门教程,你值得拥有!

我再BUG界嘎嘎乱杀

黑客 网络安全 安全 信息安全 网安

美图海量短视频内容分析与检索(二)_文化 & 方法_声网_InfoQ精选文章