NVIDIA 初创加速计划,免费加速您的创业启动 了解详情
写点什么

算法如何促成亿级别扶持曝光视频?爱奇艺 Budget Pacing 智能扶植系统实践

  • 2021-06-15
  • 本文字数:2846 字

    阅读完需:约 9 分钟

算法如何促成亿级别扶持曝光视频?爱奇艺Budget Pacing智能扶植系统实践

视频的保量和扶植对于视频平台而言是一种重要的分发策略。不同于普通的推荐算法,出于商业、画风等角度的考量,视频扶植往往要保证指定的视频物料有一定的曝光量,并尽可能地降低对推荐系统效果的负面影响。在本文中,我们主要介绍爱奇艺自研的基于改进的 Budget Pacing 算法的智能扶植系统是如何在保证对用户消费指标影响可控的前提下,达到最大量级和最高效的扶持效果。

背景

对于爱奇艺等在线视频服务平台来说,除了普通的推荐算法之外,出于各种考量,往往要求对于指定的新热视频增加曝光。


在具体的应用场景下,爱奇艺和随刻短视频流中,超级粉丝、电商视频以及各类剧集综艺的运营物料视频等等,均需要使用扶植保量保证播放量的最大化。


图一 feed 流中的扶植保量视频


feed 流的曝光资源是有限的,内容间存在竞争,对扶植视频增加曝光必然会挤压推荐算法产出视频的曝光资源,对推荐系统产生负面影响。


另一方面扶植视频间也有差异,有的视频保量额度消耗过快,甚至在最初的几分钟内就完成保量目标,早早退出竞争,无法触达更匹配的用户,降低消费指标;而另一些视频又得不到有效分发。这就是典型的扶植保量问题。


因此我们设计了生态智能扶植系统,直接进行视频级别的扶植保量,针对不同视频的保量目标和真实的消费情况进行定制化的扶植,且所有保量视频共同竞争恒定的展示资源,降低对消费的影响。另外采用类似计算广告领域的 Budget Pacing 机制,将保量展示目标按照实际流量曲线分配在保量周期内,且根据具体消费情况动态调整保量程度,使视频在保量周期内均匀分发,完成保量目标。


另外生态智能扶植系统使用提升视频在精排中的位置的方式为视频提权,保证其扶植保量效果的确定性。


图 2:生态智能扶植系统流程结构图

问题分析

我们认为,视频的扶植保量和计算广告领域的预算控制问题有相似的地方:预算控制的核心问题是如何平稳地消费掉广告主的预算,并帮助广告主优化转化效果。而视频的扶植保量的核心问题是如何平稳的消耗掉视频的目标曝光量,并保证将对整体的消费影响尽可能降低。所以视频的扶植保量要完成以下两个目标:


(1)匀速分发

通过视频目标曝光量、当前曝光量和曝光曲线来控制视频的投放速度;


(2)提升视频消费指标

保证扶植视频对整体消费影响尽可能低。


计算广告的预算控制方案目前分为两大类:Probabilistic throttling 和 Bid modification,Probabilistic throttling 通过一个概率控制广告参与竞价的频率从而达到控制预算消费速度的目的,而 Bid modification 则通过修改竞价的方式来控制预算消费速度。

图 4(a):Probabilistic throttling

图 4(b):Bid modification


对于视频扶植保量场景而言,视频的目标曝光量即为“预算”,因此每次曝光的“竞价”是恒定的数值,即为曝光次数,不能通过 Bid modification 来修改“竞价”,因此我们采用 Probabilistic throttling 作为基础框架设计智能扶植系统。

框架设计

扶植保量系统首先要保证扶植保量视频的分发趋势和大盘整体曝光趋势保持一致。我们以 5 分钟为单位,将一天拆分为 288 个时间片,根据历史数据统计出一天内大盘整体曝光趋势。


图 4(a):时间片-流量曲线


图片 4(b):时间片-流量累计曲线


值得注意的是,在原始的计算广告的 Probabilistic throttling 方案中,广告物料享有单独的展示资源,因此广告物料之间只需通过概率进行竞争,胜者则可以占有专门为广告预留的展示位。


但在视频扶植保量的场景中,不仅有扶植保量视频之间竞争保量机会,扶植保量视频也会和普通视频竞争,因此除了要使用概率之外,我们又引入了精排位置提权机制,对于需要扶植保量的视频,根据目标曝光量,直接提升视频在精排中的排序位置,使得扶植保量视频在与普通视频的竞争中更占优势,从而达到扩大曝光的目的。


因此我们需要根据历史数据统计出精排中排序位置和曝光量的关系曲线。这里需要注意的是,由于不同时间片的曝光效能不同(如晚高峰的曝光效能大于凌晨),所以每一个时间片都有一个独立的位置-曝光曲线。


图 5:位置-曝光曲线


则有具体算法如下:


对任意扶植保量视频  ,记其全天预期保量曝光为  ,将一天拆分为时间片集合  ,对于时间片  ,  表示截止时间片  结束时的累积预期曝光,则根据图四(b)中描述的累计曝光曲线,可将  拆分为各个时间片的累计曝光集合  ,其中  。同时对于时间片  ,亦有  表示截止时间片  结束时的累积真实曝光


对下一个即将来到的时间片  ,该时间片内的预期曝光  ,根据图五可得满足  曝光要求的最大的位置。同样的,我们也可求得上一个刚结束的时间片  ,该时间片内的真实曝光  ,根据图五亦可得对应  曝光的最大的位置,设为对于时间片  ,扶植保量视频达到其预期曝光所需要的达到的精排位置的均值,而对于时间片  ,扶植保量视频实际达到的精排位置的均值,因此在时间片,我们需要 在每一次精排结果中提升的位置。


其中,保证 σ 表示对超量分发的视频不进行降权。


此外,由于图五中精排位置与曝光量的对应关系是离散的,  所对应的曝光量(设为  )一般情况下会大于  的要求,因此为了防止扶植保量的超发,约定扶植保量视频  在时间片  参与竞争的概率为:

 

最后推荐引擎便可在任意时间片  对任意视频  ,根据 σ 和  进行精排位置调整,从而达到扶植保量的效果。

线上效果

日均扶持量:生态智能扶植系统单日扶持曝光达到亿级别。


曝光完成率:旧版保量曝光完成率(实际曝光/曝光目标>80%)低于 5%,生态智能扶植系统保量完成度大幅提升,随刻端达到 65-70%,基线端达到 50-60%,保量完成率提升 20 倍左右。


对系统影响:实现扶持保量视频分发智能控速,将对系统的人均播放时长影响从 3.5%降低到 2.5%,人均展示视频数的影响从 2%降低到 0.15%。


运营业务成果:助力《奇葩说》等项目以及百科、开箱等垂类优质内容分发。保证了对优质视频和优质创作者的曝光,对提高优质作者的平台粘性有重大意义。

总结与展望

以上是我们近期在生态扶植保量领域的一些工作,实践证明基于 Budget Pacing 的生态智能扶植系统确实能够对视频的扶植保量任务产生很大的助益。后续我们还会从以下几个角度进行优化:


(1)秩序优化扶植系统和相关扶植召回,保证扶植完成度的基础上进一步降低对整体消费的影响;

(2)当前的扶植系统类似于计算广告的竞价消费方式,无法保证视频的目标曝光量一定完成,考虑增加担保式保量投放机制,保证视频曝光的数量。


参考文献:

1. Agarwal D, Ghosh S, Wei K, et al. Budget pacing for targeted online advertisements at linkedin[C]//Proceedings of the 20th ACM SIGKDD international conference on Knowledge discovery and data mining. 2014: 1613-1619.

2.Xu J, Lee K, Li W, et al. Smart pacing for effective online ad campaign optimization[C]//Proceedings of the 21th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. 2015: 2217-2226.


本文转载自:爱奇艺技术产品团队(ID:iQIYI-TP)

原文链接:算法如何促成亿级别扶持曝光视频?爱奇艺Budget Pacing智能扶植系统实践

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2021-06-15 13:001677

评论

发布
暂无评论
发现更多内容

想要了解华为IPD,先要了解需求如何管理!华为云CodeArts Req:支撑需求全生命周期管理,助力产研团队高效协作

轶天下事

TimechoDB v1.3.1 发布 | 新增多种内置函数、脚本工具等功能,集群可观测性持续提升

Apache IoTDB

责任链模式与spring容器的搭配应用

快乐非自愿限量之名

区块链 spring 容器 责任链

电竞赛事开发融合体育直播平台:促进产业协同发展的新引擎

软件开发-梦幻运营部

NOW 闹个元宵?与亚信安慧AntDB一起猜灯谜,抽奖品

亚信AntDB数据库

数据库 AntDB AntDB数据库

记录 re:Invent 大会,使用 PartyRock 编写我们第一个 AI 应用以及心得

亚马逊云科技 (Amazon Web Services)

人工智能 API re:Invent 生成式人工智能

华为云自主创新再迎成果:软件工具链为数字政府夯实研发新基建

轶天下事

2024 年的第一次见面!这场开源数据技术沙龙不容错过

Apache IoTDB

数据价值在线化丨TiDB 在企查查数据中台的应用及 v7.1 版本升级体验

PingCAP

MySQL 数据库 开源 分布式 TiDB

ERC404 + meme 文化叙事,Dancing Beans 会达到怎样的高度?

股市老人

已解决org.springframework.web.HttpSessionRequiredException异常的正确解决方法,亲测有效!!!

小明Java问道之路

风靡万千软件开发者:揭秘华为研发代码大模型是如何实现的?

平平无奇爱好科技

知识图谱与大模型结合方法概述

轶天下事

数智赋能,变革加速:人工智能技术与低代码开发利器

EquatorCoco

人工智能 AI 软件开发 低代码

性价比拉满!英特尔锐炫新驱动,提升可达418%!

E科讯

中小企业“数实融合”的新趋势与新特点——探索数字化转型的秘诀

快乐非自愿限量之名

低代码 企业转型 数字转型

Runaway Queries 管理:提升 TiDB 稳定性的智能引擎

PingCAP

MySQL 数据库 TiDB

TiDB 社区智慧合集丨TiDB 相关 SQL 脚本大全

PingCAP

MySQL 数据库 TiDB

安擎科技携手华为云区块链共同打造安全天空

轶天下事

六大新兴技术助力未来工作效率提升

不在线第一只蜗牛

区块链 人工智能 云计算 物联网

蓝戟英特尔锐炫A770驱动对比测评,游戏性能迎来全面提升!

E科讯

猜字谜|构建生成式 AI 应用实践(一)

亚马逊云科技 (Amazon Web Services)

【CodeArts开发者实践】CodeArts开发者八件套——开发者的进阶宝典!

轶天下事

代码检查入门

轶天下事

华为云CodeArts Snap荣获信通院优秀大模型案例及两项荣誉证书

平平无奇爱好科技

算法如何促成亿级别扶持曝光视频?爱奇艺Budget Pacing智能扶植系统实践_AI&大模型_爱奇艺技术产品团队_InfoQ精选文章