【ArchSummit架构师峰会】探讨数据与人工智能相互驱动的关系>>> 了解详情
写点什么

比图文推荐更难,考拉 FM 如何实现车载音频个性化产品?

  • 2019-04-10
  • 本文字数:4698 字

    阅读完需:约 15 分钟

比图文推荐更难,考拉FM如何实现车载音频个性化产品?

推荐系统发展了二十年,极大的提升了主流应用的效率,亚马逊通过推荐系统销售收入提升 35%,Youtube 主页上 60%的浏览来自推荐服务…到现在,各主流应用基本都用到了推荐系统。我们知道,在个性化推荐中,与用户的交互非常重要。比如在淘宝购物中浏览和购买的物品,以及点击的“喜欢”和“不喜欢”,都会成为提升推荐精准度的关键。但是在车载环境中,为了安全起见,主动用户行为很少,这种推荐系统产品构建好的关键是什么?一直深耕车载音频领域的考拉 FM 是一个典型案例。


2013 年 6 月正式上线的考拉 FM(去年升级改名为听伴)是一家音频内容分发平台,拥有大量的音频内容资源,每日服务全国数百万的车载收听用户。最开始他们通过手机与车机互联的方式,向车主提供车载特色精品内容。但由于交互路径过长,通过手车互联来映射内容的方式,用户活跃率并不理想。随后听伴改变了策略,通过前装的方式与车厂合作,将音频应用预装到车机里,同时提供内容推荐算法应用,为听众提供想听的内容。


听伴的推荐从场景化与智能电台流两方面着手。比如长时间开车是一件枯燥的事,遇到堵车容易产生焦躁情绪,这时候就需要播放一些娱乐放松性的内容。场景化是基于车载特点,打造专属内容库,结合车主的时间+地点+人物的个性需求,分场景打造内容。听伴副总裁李建刚表示:“我们有一百多个场景,在不同的场景下推荐规则不一样。不同的天气、地点、路况,推荐内容都不一样。举个例子,车主在四环上开车,路况很拥挤,听伴会自动推荐一些堵车时车主爱听的内容。另外,早晚高峰的场景差异是很明确的。做到这一点非常难,比图文要难,这也是听伴非常核心的技术。


在手机上用户可以通过点播专辑收听,换节目的成本比较低,随时可点击切换到下一个。在车上并不方便“点播”,用户在不同专辑之间切换的操作很麻烦。这时候就需要流式收听。流式收听类似于 Feed 流,基于这一点听伴做了独有的智能电台。手机上大家都是点播,在找特定节目,电台流不会受欢迎。但对于车载,电台流这个形式却是最合适的。智能电台以车主画像为基础,结合场景化,用个性化推荐进行主动推送,用语音进行交互。


李建刚曾介绍,听伴在北美设有专门的实验室研究个性化推荐,他们的音频个性化推荐大体流程分四步:


  1. 用户标签:由程序初步给节目打上标签,编辑团队再次人工复检标签的质量,维度的完整性等。

  2. 用户画像:通过汽车厂商初步共享的用户画像信息(脱敏后,不涉及隐私),比如性别、年龄、城市等标签帮推荐引擎冷启动。

  3. 用户行为:用户红心/完整收听了某一档节目/语音主动搜索/主动点播被视为正向反馈;用户经常跳过某一档节目被视为负向反馈。

  4. 特征维度机器精排:通过机器学习验证所有特征维度的有效性,在粗排候选集的基础上通过特征维度的打分对候选结果进行精排。输出精排结果即为实时推荐的节目单。


最初在车载端使用的是手机端一样的一套推荐模型。但车载场景特殊,后来发现推荐的结果非常收敛,覆盖率和多样性都出现了问题。经过分析,发现是因为交互少导致的。对于如何趟过这个坑,李建刚说:“针对这种情况,我们就摒弃了手机端的那套基于用户主动行为的推荐模型,而重新去思考、开发针对车载端这种用户少交互,更多伴随式收听的推荐模型。在这个过程中,大数据对我们构建推荐模型起了及其重要的作用。基于考拉十多年车载音频娱乐服务的数据,我们针对数百万车载用户行为做了挖掘与学习,产生了非常有价值的结果”。针对交互的问题,未来听伴会加入语音交互。他表示“一个推荐系统中,算法、交互、数据都是极其重要都因素,但最关键的还是需要对使用场景的深入理解”。


InfoQ:个性化推荐产品在听伴的定位是什么样的?重要性程度如何?听伴有哪些利用推荐系统技术的频道?


李建刚:在车上,用户的交互成本非常高,主动交互的频次很低,要让用户有优质的收听体验,个性化推荐就非常重要,所以基于车载场景的音频个性化推荐是我们非常重要的产品。


和手机上的展示类推荐相比,音频的推荐会更复杂。


手机端的推荐模型,我们主要基于用户反馈,为用户发现和展示内容;但在车载端,我们必须根据车载伴随收听的特性,进行音频流式推荐,这种推荐用户不会主动点击,推荐出来的内容,直接给用户收听。因为没有用户主动点击的行为,要有好的体验,对推荐的要求非常高。


我们的推荐产品,主打两款智能网联车载音频新品 K-radio 和品牌电台。K-radio 以场景化+智能电台流技术给用户提供简单、便捷的车载音频娱乐服务,拥有车载直播互动、AI 电台流,多源内容融合、娱乐语义满足、帐号云端互通五大核心能力。它的特点一是可以私有化部署,用户数据部署在车企自有服务器,隔离起来以保护用户隐私;二是支持 SDK+APP+车载桌面多种合作模式,同时可以很方便地集成;三是一站式音频娱乐信息服务解决方案,可以将音乐、电台整合到一起收听。


InfoQ:一些人也用过手机上的 FM,那么车载端 FM 和手机 FM 相比有哪些差异?


李建刚:我们同时有做车载和手机端,手机跟车载差异很大,场景、使用方式、服务形态都不一样。手机是个相对专注的场景,主动点播行为会更多。在车上点播收听偏少,更多是伴随式被动收听。手机上进行推荐的核心逻辑是挖掘用户行为,召回用户会喜欢的内容。基于所有用户对推荐结果的点击行为,进行排序优化。车载上进行推荐的核心逻辑是通过建立车载娱乐知识图谱,召回特征相关的内容,基于用户自身主动行为,优化推荐结果顺序


手机/PC推荐车载推荐
用户意图从海量数据中,帮助用户决策,找到想要的信息在有限的路途时间里,推荐优质内容
行为特点注意力集中,隐式/显式主动行为丰富注意力在驾驶上,主要行为是伴随式被动收听;用户行为很少
时间随时随地通常驾车时间不会太长
形式基本以点播为主流式,持续收听
内容广度长尾内容头部精品内容
维度用户和行为用户、行为、车和场景
模型特点个性召回,共性排序共性召回,个性排序
核心逻辑挖掘用户行为,召回用户会喜欢的内容。基于所有用户对推荐结果的点击行为,进行排序优化通过建立车载娱乐知识图谱,召回特征相关的内容。基于用户自身主动行为,优化推荐结果顺序。


InfoQ:推荐的内容如新闻类、情感类和音乐类,针对不同的内容,技术上最大的区别在哪里?


李建刚:


新闻类:时效性很强,选择基于分类、主题、关键词等维度表示一篇新闻;通过自然语言处理,提取新闻要素,结合知识图谱消岐,另外新闻的消费时间属性很强,不同的时间段对新闻类型的需求也是不同的,比如早间希望听资讯内容,晚上喜欢听娱乐内容等。


情感类:深挖用户画像,尤其是社会方面的特征(婚姻、家庭、社交)。


音乐类:挖掘用户开车出行时的场景、车速、位置甚至天气等,结合音乐内容的场景化表示,推荐出此时此刻最符合车载下的音乐内容。


InfoQ:一个典型的音频推荐系统架构是怎么样的?您是否能给出图片来解释?


李建刚:



我们的推荐架构从底层到上层,分为数据平台、数据挖掘和推荐投放。


数据平台提供用户行为数据的存储、分布式/流式计算的能力。


数据挖掘是利用数据平台的大数据,结合机器学习和自然语言处理等技术,构建用户画像、训练模型等中间数据,并提取领域知识。通过 nosql、搜索引擎、key-value 缓存等中间件提供给推荐投放系统。


推荐投放,是基于 Actor 模型的的并发框架 akka,利用数据挖掘层的训练模型和知识图谱,提供高可用、可扩展、低延迟的结果内容投放能力。


InfoQ:音频推荐系统,一些先驱是如何做的,考拉 FM 做过哪些独特尝试?


李建刚:音频领域做得比较多的,是针对歌曲的推荐。目前流行两类模式:第一类模式是专家对歌曲进行多维度标记,然后基于这些标记做相似度计算并进行推荐,譬如 pandora 就采用了这种模式。第二类模式是基于协同过滤算法进行推荐,譬如网易云音乐就采用了这种模式。


但音频内容,和歌曲还是有较大差异的,譬如用户很少重复收听同一段内容,但会反复听同一首歌。所以对音频内容的推荐,和歌曲推荐就会不一样。而且在车载端,用户的行为相对较少。因此为了更精准地满足用户的需求,一方面,我们独创了共性召回、个性排序的推荐模型。另一方面,我们把用户场景纳入了推荐模型里,让场景成为推荐维度里的重要因素。


InfoQ:音频推荐系统中,跟踪用户的偏好主要是通过隐式的方式进行获取。而听伴有细分到上百个不同场景,那么如何确定不同情景,根据哪些因素判定情境,并进行个性化推送并满足听众的不同需求的?


李建刚:场景推荐,是听伴针对车载行为独家推出的内容推荐产品。车载行为和手机端行为并不一样,用户需要专注于开车,行为被车载场景所限制,对屏幕和内容的控制力都大为降低。我们针对这种情况,从推荐逻辑及内容层面,都做了针对性的优化。


针对场景的推荐,主要从用户属性、车辆属性,车主当前所处的开车场景等多个维度,去做内容的推荐。为了能完整的用户画像、场景等,我们除了利用用户的收听数据之外,我们还需要和车的信息深入的结合,从各个维度信息挖掘用户当前的状态和驾车场景,全面了解用户画像和当下需求。为了精准推荐内容,我们会根据几十个不同维度的特征进行判定,比如时间、天气、路况、车速、目的地、车主心情、乘客情况等。比如,我们可以结合位置信息和区域天气,推荐不同天气场景的电台内容;还可通过 LBS 信息及衍生出的车速、轨迹信息来判断用户的行驶状态,是城区还是高速公路,是通畅行驶还是拥堵状态,以此推荐适合不同心情的音频内容。


InfoQ:接上,针对不同场景,听伴如何将音频内容进行分类、相关性判定、标定、评分、排序的?


李建刚:不是所有音频内容,都适合在车载场景进行收听。譬如恐怖惊悚类,就不适合夜晚开车的情景去收听。有些长篇内容,也不适合短途开车行为收听。但在长途驾驶时,类似人物传记等的长篇,就会有用户去收听。因此我们会从声音及内容两个维度,做细致的梳理,包括声音及情绪、内容类型、上下文关系等特征。


InfoQ:(车载)用户行为分析主要是哪几方面。依行为分析作出什么 action?


李建刚:我们主要分析用户的内容选择、内容订阅、内容切换、收听时长、完播率、语音搜索等行为。所有的行为都会作为用户画像特征的计算依据,经过离线或实时计算,从而优化用户画像。


InfoQ:听伴如何度量推荐结果?通过哪些度量方法?


李建刚:推荐流量下,可以通过如下指标评估:完播率,点击率,播放时长,收听留存,日总负反馈次数等.


InfoQ:构建一个优秀的音频推荐系统产品,您觉得最关键的成功因素是什么?


李建刚:对于一个成功的推荐系统来说,算法、内容和产品策略,三者缺一不可。但是最关键的还是需要对使用场景的深入理解,如果不深入理解用户的场景,一定不能满足好用户的需求,对我们来说,车载场景和手机场景就有非常大的区别,完全照搬手机推荐的场景肯定不行,所以我们针对车载场景的独特特性,设计了一套适合车载的推荐系统,已经在用户那里得到了很好的反馈。同时,一个推进系统一定需要持续迭代。基于数据的反馈,不断优化内容、产品策略及算法,就可以让推荐产品持续的进步。


InfoQ:未来计划里,您们最想攻克的推荐系统问题是什么?


李建刚:在车载端的用户行为,与手机端/pc 端完全不一样,因此不能用手机端或 pc 端的推荐模型来做。针对车载端,我们思考了很多策略,构建了很多的模型,但针对车载行为的场景化推荐及有多个乘客时的推荐,是我们最希望取得成功的领域。尤其是开车行为,与很多因素相关,譬如车况、天气、速度、目的地等,而不仅仅是用户兴趣或意图相关联。如何把各个因素融合进推荐模型里,去优化推荐结果,是我们重点关注的。


本文系 “推荐系统”专题系列文章之一:


进击的下一代推荐系统:多目标学习如何让知乎用户互动率提升 100%?


阿里妈妈新突破:深度树匹配如何扛住千万级推荐系统压力


公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2019-04-10 15:092967
用户头像
Tina InfoQ高级编辑

发布了 1248 篇内容, 共 832.6 次阅读, 收获喜欢 3530 次。

关注

评论

发布
暂无评论
发现更多内容

蓝易云:Linux系统如何查看服务器带宽及网络使用情况?

百度搜索:蓝易云

云计算 Linux 运维 云服务器

DAPP系统开发模式(源码对接)

V\TG【ch3nguang】

文心一言 VS 讯飞星火 VS chatgpt (94)-- 算法导论9.2 3题

福大大架构师每日一题

福大大架构师每日一题

C++中的 throw详解

二哈侠

我在超化研究上的日志采集架构设计

软件工程师-罗小东

2023-09-16:用go语言,给你一个整数 n 和一个在范围 [0, n - 1] 以内的整数 p , 它们表示一个长度为 n 且下标从 0 开始的数组 arr , 数组中除了下标为 p 处是 1

福大大架构师每日一题

福大大架构师每日一题

Python 基本操作

小万哥

Python 程序员 软件 后端 开发

蓝易云:Centos7系统wget 的安装与使用详细教程。

百度搜索:蓝易云

Linux centos 运维 云服务器, wget

DAPP区块链挖矿模式系统开发

l8l259l3365

C++的异常类型与多级catch匹配

二哈侠

分区副本重分配源码原理分析(附配套教学视频)

石臻臻的杂货铺

kafka

Photoshop 2021 for mac(PS2021破解版) 22.4.2中英双语版

mac

PhotoShop 苹果mac Windows软件下载 图像编辑软件 PS2021

秒合约交易系统_虚拟数字币合约交易系统开发

V\TG【ch3nguang】

IntelliJ IDEA 2023 for Mac(Java开发工具) v2023.2.2永久激活版

mac

java开发工具 IntelliJ IDEA 2023 苹果mac Windows软件

ARTS打卡第5周

苏籍

Programming abstractions in C阅读笔记:p161-p165

codists

适合自身业务的HTTP代理有哪些因素决定?

巨量HTTP

代理IP http代理

Xmind for Mac(思维导图软件) 23.08中文激活版

mac

windows XMind 思维导图软件 苹果mac

金九银十!GitHub星标137k霸榜,国外友人直呼太卷了!

程序员万金游

Java 面试 #java #程序员 #Java面试题 #Mysql

敏捷时代的架构

俞凡

架构 敏捷

架构实战营-模块二作业

王朝阳

#架构训练营

PDF Merge PDF Splitter for Mac(PDF合并和拆分软件) v6.3.9永久激活版

mac

苹果mac Windows软件 PDF Merge PDF Splitter 拆分PDF文件工具

ARTS 打卡第 5 周

AI帅辉

ARTS 打卡计划 学习分享

使用VirtualBox新建虚拟机CentOS

衣谷

centos virtualbox

DoorDash基于eBPF的监控实践

俞凡

云原生 ebpf 大厂实践 DoorDash

如何过好一生?全情投入地生活

少油少糖八分饱

生活 情绪控制 享受状态 冥想 热爱

HTTP静态、动态住宅ip代理和数据中心代理是什么?有什么区别?

巨量HTTP

代理IP http代理

比图文推荐更难,考拉FM如何实现车载音频个性化产品?_行业深度_Tina_InfoQ精选文章