写点什么

让机器读懂视频:亿级淘宝视频背后的多模态 AI 算法揭秘(一)

  • 2020-01-09
  • 本文字数:1163 字

    阅读完需:约 4 分钟

让机器读懂视频:亿级淘宝视频背后的多模态AI算法揭秘(一)


本文内容大纲:

1、多模态在视频分类算法中的应用探索

2、视频分类算法中的层次化分类器的设计

3、总结和展望

背景

随着 4G 的普及和 5G 的推出,内容消费的诉求越来越受到人们的重视。2019 年互联网趋势报告指出在移动互联网行业整体增速放缓的大背景下,短视频行业异军突起,成为“行业黑洞”抢夺用户时间,尽管移动互联网人口红利见顶,新的增长点难以寻觅,但中国短视频人均使用时长及头部短视频平台日均活跃用户均持续增常(如图 1 所示)。



图一


在淘宝,短视频业务一直以来都是非常重要的业务,是淘宝 app 从单一的商品导购 app 走向商品导购+内容消费的多元化 app 的关键所在。相较于单一的商品导购,商品导购+内容消费的模式有效增加用户粘性,提高用户的停留时长,最终获得 GMV 的持续增长。不仅如此,2019 年视频营销发展趋势白皮书指出目前视频内容的转发量已达到图文的 12 倍,视频营销已经成为品牌最爱的营销方式,使用视频营销比不使用视频营销收入增长速度快 49%,且从搜索获得的网站流量多 41%。现如今淘宝每年新增内容数达数十亿,其中视频数占比持续提升,预计到 2022 年视频的占比会超过 50%。如何对规模如此庞大的视频进行内容化理解,高效赋能视频运营和个性化分发变得极为关键。

视频类目体系

视频内容化理解的首要问题是构建一个完备的、层次化的类目体系,相比于传统的淘宝商品类目体系,视频类目体系需要解决两大问题。


  • 一是提高运营的精细化能力,提供内容的盘货和定向生产、以及快速搭建会场的能力;

  • 二是针对新生产的视频提供冷启动能力,提升分发的效率。


虽然淘宝的商品类目体系可以部分代替视频类目体系的功能,但会导致短视频业务的用户心智和商品导购业务同质化,因此构建一套属于短视频业务自己的视频类目体系已经迫在眉睫。有了构建完成的视频类目体系,另外一个更重要的问题是产出高效的视频分类算法,用于对海量的视频进行标签生成。为了获得好的点击效果,视频生产者往往会采用吸引眼球的封面图或者标题,但是和视频本身的内容关联性很弱。此外,淘宝的视频天然和商品有强关联性,如何利用好商品的信息也非常关键。


不同于抖音美拍等其他视频的内容体系从新闻、科技、金融等领域做分类划分,淘宝的视频类目体系从商品导购、产品功能展示、商品知识获取等角度出发,由行业经验丰富的运营进行设计,包含了 30+一级类目和 150+二级类目,其中一级类目是对视频的领域的划分,例如服饰/家居日用/美食/萌宠等,二级类目是在一级类目的基础之上对视频的子领域的划分,例如一级类目服饰下的熟女穿搭/少女穿搭/儿童服饰/中老年穿搭等,图 2 是视频类目体系的几个案例。在这个体系之上多媒体算法团队投入近半年的时间提出了基于模态注意力机制的多模态分层视频分类算法。



图二


本文转载自淘系技术公众号。


原文链接:https://mp.weixin.qq.com/s/kT01tMRPUCx307m0cF5x0w


2020-01-09 18:13682

评论

发布
暂无评论
发现更多内容

荣耀Magic6系列旗舰新品及MagicOS 8.0发布会

荣耀开发者服务平台

安全 UX 交互 人机协作 loT

市场上常见的5种LED异形屏

Dylan

设计 场景 LED LED显示屏

cannot load "mso.dll" vs2008 web开发问题

GoodTime

web开发 VS2008

主编夜话,2023 技术圈儿大事件盘点丨 RTE 开发者日报 Vol.115

声网

推特(Twitter)蓝V,怎么升级蓝V

跨境

twitter VISA

联邦云高效的云计算解决方案

如水

联邦云 多云多活

Eudic欧路词典 for mac(英语学习工具) v4.5.6完美激活版

mac

苹果mac Windows软件 英语学习软件 欧路词典 Eudic

AIBP,我的下一个职业规划

法老猫

AIGC LLMs AIBP

什么是意向锁?它和意向书有什么区别?

王磊

Java 面试

MATLAB R2023b for mac(数值计算和科学编程软件)v23.2.0.2409890永久激活版

mac

苹果mac Windows软件 MATLAB R2023b 科学计算软件

联邦云,一站式多云多活平台!

如水

联邦云 多云多活

喜讯!MIAOYUN正式获封“专精特新”中小企业称号!

MIAOYUN

四川省创新型中小企业 专精特新 MIAOYUN 专精特新中小企业 成都高新梯度培育企业

菜单栏应用管理软件:Bartender 4 mac破解版

影影绰绰一往直前

软件测试/测试开发丨Python面向对象 学习笔记

测试人

Python 软件测试 测试开发

购买体育赛事直播系统源码:如何找到靠谱一手源码,避免二道贩子源码

软件开发-梦幻运营部

怎么在GridView中限制显示字数

GoodTime

C# asp.net GridView

干货满满!学习有限元分析软件Abaqus的几个必备理论

思茂信息

abaqus abaqus软件 abaqus有限元仿真 有限元分析

元数据中心的数据有哪些分类?

如水

元数据

pdf增强插件:Enfocus PitStop Pro 2021激活版

影影绰绰一往直前

码住!8个小众宝藏的开发者学习类网站

伤感汤姆布利柏

学习 效率 低代码 低代码开发工具

爬虫业务中,为什么使用高匿代理ip仍然会被识别出来呢?

巨量HTTP

数据采集 代理IP http代理

PTS 3.0:可观测加持的下一代性能测试服务

阿里巴巴云原生

阿里云 云原生 性能压测

Databend 部署与运维概要:本地部署 Meta 服务并利用 Kubernetes 管理 Query 服务

Databend

E往无前|腾讯云大数据ES索引原理剖析及写入性能优化最佳实践

腾讯云大数据

ES

python3中,//、/ 的区别

GoodTime

Python 水仙花数 // /

支付宝 v3 验签如何实现

盐焗代码虾

Java 支付宝 验签

QCN9274, QCN9024-QCA9880 three different chips - how are they connected?

wifi6-yiyi

QCN9024 qcn9274

【论文解读】模型即服务-介绍MaaS中所涉及的关键技术

合合技术团队

人工智能 大数据 合合信息 论文解读

BDTC2023:CloudberryDB开源创新与实践

酷克数据HashData

什么是仿真软件?推荐几个简单易上手的几款CAE软件!

智造软件

CAE 仿真软件 仿真技术 CAE软件

云原生应用开发模式的一个构想

Jade@pluto-lang

Serverless Faas 云原生(Cloud Native) aws lambda Pluto

让机器读懂视频:亿级淘宝视频背后的多模态AI算法揭秘(一)_语言 & 开发_淘系技术_InfoQ精选文章