NVIDIA 初创加速计划,免费加速您的创业启动 了解详情
写点什么

让机器读懂视频:亿级淘宝视频背后的多模态 AI 算法揭秘(一)

  • 2020-01-09
  • 本文字数:1163 字

    阅读完需:约 4 分钟

让机器读懂视频:亿级淘宝视频背后的多模态AI算法揭秘(一)


本文内容大纲:

1、多模态在视频分类算法中的应用探索

2、视频分类算法中的层次化分类器的设计

3、总结和展望

背景

随着 4G 的普及和 5G 的推出,内容消费的诉求越来越受到人们的重视。2019 年互联网趋势报告指出在移动互联网行业整体增速放缓的大背景下,短视频行业异军突起,成为“行业黑洞”抢夺用户时间,尽管移动互联网人口红利见顶,新的增长点难以寻觅,但中国短视频人均使用时长及头部短视频平台日均活跃用户均持续增常(如图 1 所示)。



图一


在淘宝,短视频业务一直以来都是非常重要的业务,是淘宝 app 从单一的商品导购 app 走向商品导购+内容消费的多元化 app 的关键所在。相较于单一的商品导购,商品导购+内容消费的模式有效增加用户粘性,提高用户的停留时长,最终获得 GMV 的持续增长。不仅如此,2019 年视频营销发展趋势白皮书指出目前视频内容的转发量已达到图文的 12 倍,视频营销已经成为品牌最爱的营销方式,使用视频营销比不使用视频营销收入增长速度快 49%,且从搜索获得的网站流量多 41%。现如今淘宝每年新增内容数达数十亿,其中视频数占比持续提升,预计到 2022 年视频的占比会超过 50%。如何对规模如此庞大的视频进行内容化理解,高效赋能视频运营和个性化分发变得极为关键。

视频类目体系

视频内容化理解的首要问题是构建一个完备的、层次化的类目体系,相比于传统的淘宝商品类目体系,视频类目体系需要解决两大问题。


  • 一是提高运营的精细化能力,提供内容的盘货和定向生产、以及快速搭建会场的能力;

  • 二是针对新生产的视频提供冷启动能力,提升分发的效率。


虽然淘宝的商品类目体系可以部分代替视频类目体系的功能,但会导致短视频业务的用户心智和商品导购业务同质化,因此构建一套属于短视频业务自己的视频类目体系已经迫在眉睫。有了构建完成的视频类目体系,另外一个更重要的问题是产出高效的视频分类算法,用于对海量的视频进行标签生成。为了获得好的点击效果,视频生产者往往会采用吸引眼球的封面图或者标题,但是和视频本身的内容关联性很弱。此外,淘宝的视频天然和商品有强关联性,如何利用好商品的信息也非常关键。


不同于抖音美拍等其他视频的内容体系从新闻、科技、金融等领域做分类划分,淘宝的视频类目体系从商品导购、产品功能展示、商品知识获取等角度出发,由行业经验丰富的运营进行设计,包含了 30+一级类目和 150+二级类目,其中一级类目是对视频的领域的划分,例如服饰/家居日用/美食/萌宠等,二级类目是在一级类目的基础之上对视频的子领域的划分,例如一级类目服饰下的熟女穿搭/少女穿搭/儿童服饰/中老年穿搭等,图 2 是视频类目体系的几个案例。在这个体系之上多媒体算法团队投入近半年的时间提出了基于模态注意力机制的多模态分层视频分类算法。



图二


本文转载自淘系技术公众号。


原文链接:https://mp.weixin.qq.com/s/kT01tMRPUCx307m0cF5x0w


2020-01-09 18:13692

评论

发布
暂无评论
发现更多内容

ElasticSearch降本增效常见的方法 | 京东云技术团队

京东科技开发者

KaiwuDB × 风电企业 | 高性能、低成本、释放数据价值

KaiwuDB

数据库 解决方案

Parallels Desktop 17 安装Windows 11 教程 附激活工具

Rose

测试工程师必知的10大测试法则

禅道项目管理

测试 自动化测试

良心推荐!几款收藏的神级IDEA插件分享

Java随想录

Java IDEA

用二维码介绍产品详情,扫码查看图文并茂的宣传册

草料二维码

【年后跳槽必看篇-非广告】老生常态之Spring AOP/IOC 实现原理

派大星

Java 面试 跳槽

使用Local Persistent Volume 部署有状态工作负载

华为云开发者联盟

Kubernetes 开发 华为云 华为云开发者联盟

让 K8s 更简单!8款你不得不知的 AI 工具-Part 1

SEAL安全

开源 AI Kubernetes

从前端角度浅谈性能 | 京东物流技术团队

京东科技开发者

解决苹果无线鼠标、键盘或触控板无法被 Mac 识别的方法

Rose

软件开发

Geek_8da502

Prometheus配置Basic Auth进行安全防护,实现登录控制

华为云开发者联盟

开发 华为云 华为云开发者联盟

Acrobat Pro DC 2023如何插入附件?Acrobat Pro DC添加附件方法

Rose

JavaScript面向对象之实践项目

伤感汤姆布利柏

奇遇未来新动态!AIGC产品经理教学终于来了!

Geek_2d6073

ByConity 社区回顾|ByConity 和开发者们一起展望未来,携手共进!

字节跳动数据平台

开源数据库 ByConity

京东ES支持ZSTD压缩算法上线了:高性能,低成本 | 京东云技术团队

京东科技开发者

APP加固原理与作用

AI遇上传统文化,文心一言上央视带来跨时空访古体验

飞桨PaddlePaddle

人工智能 深度学习

软件测试/测试开发/全日制/测试管理丨Appium Inspector

测试人

软件测试

“无法打开应用,因为Apple无法检查其是否包含恶意软件“解决方法

Rose

数字人的未来发展?

青否数字人

数字人

我想做一款软件产品,应该怎么做?

天津汇柏科技有限公司

创新创业 产品原型设计软件

替代关系型数据库 MAX 聚合函数的思路

alexgaoyh

MySQL 替代 聚合函数 最新数据 自关联

第三方 Cookie 被禁用?企业该如何实现用户精准运营和管理

Authing

Cookie Authing 用户运营

随想2024.01.15

hackstoic

生活感悟

使用数字人系统源码进行实时互动直播!

青否数字人

数字人

苹果电脑Mac教程:如何开启任何来源选项

Rose

什么是互动式数字人?

青否数字人

数字人

面试官:如何保证本地缓存的一致性?

王磊

Java 面试

让机器读懂视频:亿级淘宝视频背后的多模态AI算法揭秘(一)_语言 & 开发_淘系技术_InfoQ精选文章