QCon 全球软件开发大会(北京站)门票 9 折倒计时 4 天,点击立减 ¥880 了解详情
写点什么

打造工业级推荐系统(五):推荐系统冷启动全解析

2019 年 6 月 20 日

打造工业级推荐系统(五):推荐系统冷启动全解析

作者在《推荐系统介绍》这篇文章中提到,冷启动是推荐系统的重要挑战之一。


那么,什么是冷启动?如何设计一个好的冷启动方案?可能很多读者还不是特别了解,本文将试图给大家讲清楚这些问题。


具体而言,本文将主要从以下 7 个方面进行展开:


  • 什么是冷启动?

  • 解决冷启动面临的挑战

  • 解决冷启动为何如此重要?

  • 解决冷启动的方法和策略

  • 不同推荐产品形态冷启动的解决方案

  • 设计冷启动时,需要注意的问题

  • 冷启动未来发展趋势


希望通过本文,你能对推荐系统的冷启动有个全面的认识,并结合自己公司的实际业务,将冷启动策略更好的落地到真实推荐场景中,让推荐的体验更好,对业务产生价值。


什么是冷启动?

推荐系统的主要目标是将大量的标的物推荐给可能喜欢的海量用户, 这里涉及到标的物和用户两类对象。


任何互联网推荐产品, 标的物和用户都是不断增长变化的,所以一定会频繁面对新标的物和新用户, 推荐系统冷启动问题指的就是对于新注册的用户或者新入库的标的物, 该怎么给新用户推荐标的物让用户满意,怎么将新标的物分发出去,推荐给喜欢它的用户。


另外,如果是新开发的产品,初期用户很少,用户行为也不多,常用的协同过滤、深度学习等依赖大量用户行为的算法不能很好的训练出精准的推荐模型, 怎么让推荐系统很好的运转起来,让推荐变得越来越准确,这个问题就是系统冷启动。


总之,推荐系统冷启动主要分为标的物冷启动、用户冷启动、系统冷启动三大类。


现在我们大概知道了什么是冷启动,看起来很好理解,但却不是这么容易搞定。下面我们就讲讲冷启动的难点。


解决冷启动面临的挑战

冷启动问题是推荐系统必须要面对的问题,也是一个很棘手的问题,要想很好的解决冷启动,需要发挥推荐算法工程师的聪明才智。


本节我们来说说冷启动到底会面临哪些挑战,只有知道冷启动的难点,才能更好的思考出解决冷启动的好方法。具体来说,解决冷启动问题会面临如下挑战:


  1. 我们一般对新用户知之甚少, 所以基本不知道用户的真实兴趣,从而很难为用户推荐他喜欢的标的物;


我们对新用户知之甚少的主要原因有:


(1) 很多 APP 也不强求用户注册时填写包含个人身份属性及兴趣偏好的信息,其实也不应该让新用户填写太多的信息,否则用户就嫌麻烦不用你的产品了。由于没有这些信息,我们没法得到用户的画像。


(2) 新用户由于是新注册的,在产品上的访问行为没有或者很少,不足以用复杂的算法来训练推荐模型;


  1. 对于新的标的物,我们也不知道什么用户会喜欢它。


只能根据用户历史行为了解用户的真实喜好,如果新的标的物与库中存在的标的物可以建立相似性联系的话, 我们可以基于这个相似性将标的物推荐给喜欢与它相似标的物的用户。


但是,很多时候标的物的信息不完善、包含的信息不好处理、数据杂乱,或者是新标的物产生的速度太快(如新闻类,一般通过爬虫可以短时间爬取大量的新闻),短时间类来不及处理或者处理成本太高,或者是完全新的品类或者领域,无法很好的建立与库中已有标的物的联系,所有这些情况都会增加将标的物分发给喜欢该标的物的用户的难度。


  1. 对于新开发的产品,由于是从零开始发展用户,冷启动问题就更加凸显,这时每个用户都是冷启动用户,面临的挑战更大。


既然冷启动问题这么难解决, 那么我们是不是可以不用管这些新用户和新的标的物呢?只将精力放到老用户身上呢?


读者肯定知道这是不可以的,否则我就不会写这篇文章了,那冷启动的重要性体现在哪些方面呢?


解决冷启动为何如此重要?

用户不确定性需求是客观存在的,在当今信息爆炸的时代,用户的不确定性需求更加明显,而推荐作为一种解决用户不确定性需求的有效手段在互联网产品中会越来越重要, 特别是随着短视频、新闻等应用的崛起,推荐的重要性被更多人认可。


很多产品将推荐业务放到最核心的位置(如首页),或者是整个产品的核心,比如今日头条等各类信息流产品及很多电商类产品。因此,新用户必须要面对冷启动这个问题。


从上面的介绍中可以知道,新用户、新标的物是持续产生的,对互联网产品来说是常态,是无法避免的,所以冷启动问题会伴随整个产品的生命周期。


特别是当你投入很大的资源推广你的产品时, 短期会吸引大量的用户来注册你的产品(比如今年百度的春晚红包),这时,用户冷启动问题将会更加严峻,解决冷启动问题也会更加迫切。


既然很多产品将推荐放到这么好的位置, 而推荐作为一种有效提升用户体验的工具,在新用户留存中一定要起到非常关键的作用,如果推荐系统不能很好的为新用户推荐好的内容,新用户可能会流失。所以如果不解决冷启动问题,你的新用户一直会得不到好的推荐体验,极有可能会流失掉。


新用户的留存对一个公司来说非常关键, 服务不好新用户,并让用户留下来,你的用户增长将会停滞不前。对于互联网公司来说, 用户是公司赖以生存的基础,是利润的核心来源。


可以毫不夸张地说,如果不能很好的留住新用户,让总用户健康的增长,整个公司将无法运转下去。


因为互联网经济是建立在规模用户基础上的,只有用户足够多,你的产品才会有变现的价值(不管是会员、广告、游戏、增值服务,你的总营收基本线性依赖于用户数, 拿会员来举例说明,会员总收益=日活跃用户数付费率客单价)。


同时,只有你的产品有很好的用户增长曲线, 投资人才会相信未来用户大规模增长的可能, 才能看得到产品未来的变现价值,才会愿意在前期投资你的产品。


那既然冷启动问题对新用户的留存及体验这么重要,怎么在推荐业务中很好的解决这个问题呢?


这就是本文最重要的话题了。


解决冷启动的方法和策略

前面讲过冷启动包含用户冷启动、标的物冷启动和系统冷启动。在本节我们会给出一些解决冷启动的思路和策略, 方便大家结合自己公司的业务场景和已有的数据资源选择合适的冷启动方案。


在讲具体策略之前,我们先概述一下解决冷启动的一般思路,这些思路是帮助我们设计冷启动方案的指导原则。


具体思路有如下 7 个(括号里面代表适用于哪类冷启动):


  • 提供非个性化的推荐(用户冷启动)

  • 利用用户注册时提供的信息(用户冷启动、系统冷启动)

  • 基于内容做推荐(用户冷启动、系统冷启动)

  • 利用标的物的 metadata 信息做推荐(标的物冷启动)

  • 采用快速试探策略(用户冷启动、标的物冷启动)

  • 采用兴趣迁移策略(用户冷启动、系统冷启动)

  • 采用基于关系传递的策略(标的物冷启动)


上面这些策略是整体的思路,下面分别针对用户冷启动、标的物冷启动、系统冷启动这三类冷启动给出具体可行的解决方案。


同时, 在本节最后我会基于自己的思考从新的视角来看冷启动,提供不一样的解决方案。


用户冷启动

基于上面 7 大思路,针对新注册用户或者只有很少用户行为的用户,可行的解决冷启动的策略有:


1. 提供非个性化的推荐


(1) 利用先验数据做推荐


可以利用新热标的物作为推荐。


人都是有喜新厌旧倾向的,推荐新的东西肯定能抓住用户的眼球(比如视频行业推荐新上映的大片)。


推荐热门标的物, 由于这些标的物是热点,同时人是有从众效应的,大家都在看的,新用户喜欢的可能性比较大(比如视频行业推荐最近播放量 TopN 的热门节目), 基于二八定律,20%的头部内容占到 80%的流量,所以基于热门推荐往往效果还不错。热门推荐也一般用来作为新推荐算法的 AB 测试的基准对照组。


还可以推荐常用的标的物及生活必需品。如在电商行业推荐生活必需品, 这些物品是大家使用频次很高的,生活中必不可少的东西(比如纸巾等), 将这些物品推荐给新用户,用户购买的可能性会更大。


对于特殊行业,可以根据该行业的经验给出相应的推荐策略。如婚恋网站,给新注册的男生推荐美女,新注册的女生推荐帅哥,效果肯定不会差。


(2)给用户提供多样化的选择


这里举个视频行业的例子,方便大家更好的理解,可以先将视频按照标签分几大类(如恐怖、爱情、搞笑、战争、科幻等),每大类选择一个推荐给新用户,这样总有一个是用户喜欢的。


如果是新闻类的产品(如今日头条),可以采用 TF-IDF 算法将文本转化为向量,再对文本做聚类,每一类代表一个不同的新闻类型,可以采用上面视频类似的推荐策略每类推荐一个。


如果是图像或者视频(如快手),可以利用图像相关技术将图片或者视频转化为特征向量,基于该向量聚类,再采用每类推荐一个的策略。可以用 openCV 及深度学习技术从视频图像中提取特征, 图像视频分析对技术要求更高,也需要大量计算。


这种方法要保证有比较好的效果,需要类有一定的区分度。也可能碰到给用户的类是用户不喜欢的。最好是从一些热门的类(可能需要编辑做一下筛选)中挑选一些推荐给用户。太冷门的类用户不喜欢的概率较大。


2.利用新用户在注册时提供的信息


(1) 利用人口统计学数据


很多产品在新用户注册时是需要用户填写一些信息的, 这些用户注册时填的信息就可以作为为用户提供推荐的指导。典型的比如相亲网站,需要填写自己的相关信息,填的信息越完善代表越真诚,这些完善的信息就是产品为你推荐相亲对象的素材。


基于用户的信息(如年龄,性别,地域、学历、职业等)来做推荐,这要求平台事先要知道用户的部分信息,这在某些行业是比较困难的,比如 OTT 端的视频推荐,因为用户主要通过遥控器操作,不方便输入信息。


并且还要有一定的规则来将用户画像(你填的信息提取的标签就是你的画像)与待推荐的物品关联起来,根据用户的画像标签关联相关的物品,从而为用户做推荐。


最近由于安全问题越来越严峻(今年 315 晚会报道了大量利用大数据来做黑产的公司),用户也越来越不愿意填写自己的信息了,所以获取用户的画像是比较困难的。


(2) 利用社交关系


有些 APP, 用户在注册时要求导入社交关系等,这时可以将你的好友喜欢的标的物推荐给 你。利用社交信息来做冷启动,特别是在有社交属性的产品中,这是很常见的一种方法。


社交推荐最大的好处是用户基本不会反感推荐的标的物(可以适当加一些推荐解释, 比如你的朋友 XXX 也喜欢),所谓人以类聚,你的好友喜欢的东西你也可能会喜欢。


(3) 利用用户填写的兴趣点


还有一些 APP,强制需要用户在注册时提供你的兴趣点,有了这些兴趣点就可以为你推荐你喜欢的内容了。


通过该方法可以很精准的识别用户的兴趣,对用户兴趣把握相对准确。这是一个较好的冷启动方案,但是要注意不能让用户填写太多内容,用户操作也要非常简单,用户的耐心是有限的,占用用户太多时间,操作太复杂,用户可能就不用你的产品了。


3.基于内容做推荐


当用户只有很少的行为记录时,这时很多算法(比如协同过滤)还无法给用户做很精准的推荐。


这时可以采用基于内容的推荐算法,基于内容的推荐算法只要用户有少量行为就可以给用户推荐。


比如你看一部电影,至少就知道你对这个题材的电影有兴趣,那么就推荐类似题材的电影。


不像基于模型的算法那样,需要有足够多的行为数据才能训练出精度够用的模型。


4. 采用快速试探策略


这类策略一般可用于新闻短视频类应用中, 先随机或者按照非个性化推荐的策略给用户推荐,基于用户的点击反馈快速发现用户的兴趣点,从而在短时间内挖掘出用户的兴趣。


由于新闻或者短视频时长短,只占用用户碎片化时间,用户发现兴趣也不会太长。


现在的新闻应用(如今日头条),你可以采用下拉,快速选择自己感兴趣的东西,抖音快手也一样,可以很快的切换视频。


5. 采用兴趣迁移策略


当一个公司有一个成熟的 APP 时,准备拓展新的业务,开发新的 APP,这时可以将用户在老 APP 上的特征迁移到新 APP 中, 从而做出推荐。


比如今日头条做抖音时,对抖音是新用户,但是如果这个用户刚好是头条的用户(抖音前期是通过头条来导流的,所以抖音很大一部分用户其实就是从头条来的),那么我们是知道这个用户的兴趣点的, 从而在抖音上就很容易为他做推荐了。


兴趣迁移策略借鉴了迁移学习的思路,在基于主产品拓展新产品形态的情况下,特别适合新产品做冷启动。


物品冷启动

针对新上线的标的物,基于上述 7 大冷启动解决思路,可行的解决标的物冷启动的方案与策略有:


1.利用标的物的 metadata 信息做推荐


1)利用标的物跟用户行为的相似性


可以通过提取新入库的标的物的特征(如标签、采用 TF-IDF 算法提取的文本特征、基于深度学习提取的图像特征等),通过计算标的物特征跟用户行为特征(用户行为特征通过他看过的标的物特征的叠加,如加权平均等)的相似性,从而将标的物推荐给与它最相似的用户。


(2) 利用标的物跟标的物的相似性


可以基于标的物的属性信息来做推荐,一般新上线的标的物或多或少都是有一些属性的。


根据这些属性找到与该标的物最相似(利用余弦相似度等相似算法)的标的物,这些相似的标的物被哪些用户“消费”过,可以将该标的物推荐给这些消费过的用户。


2. 采用快速试探策略


另外一种思路是借用强化学习中的 exploration-exploitation 思想,将新标的物曝光给随机一批用户,观察用户对标的物的反馈,找到对该标的物有正向反馈(观看,购买,收藏,分享等)的用户, 后续将该标的物推荐给有正向反馈的用户或者与该用户相似的用户。


该方法特别适合像淘宝这种提供平台的电商公司以及像今日头条、快手、阅文等 UGC 平台公司。


他们需要维护第三方生态的繁荣,所以需要将第三方新生产的标的物尽可能的推荐出去,让第三方有利可图。同时通过该方式也可以快速知道哪些新的标的物是大受用户欢迎的,找到这些标的物,也可以提升自己平台的营收。


3.采用基于关系传递的策略


当产品在拓展标的物品类的过程中,比如视频类应用,前期只做长视频,后来拓展到短视频,那么对某些没有短视频观看行为的用户,怎么给他做短视频推荐呢?


可行的方式是借用数学中关系的传递性思路,利用长视频观看历史,计算出用户的相似度。对新入库的短视频,可以先计算与该短视频相似的长视频,我们可以将该短视频推荐给喜欢与它相似的长视频的用户。


该相似关系的传递性可描述为:短视频与长视频有相似关系,长视频与喜欢它的用户有相似关系,最终得到短视频与用户有相似关系。


系统冷启动

针对刚开发的产品,没有多少用户,这时每个用户都是冷启动用户,怎么让推荐系统尽快运转起来,是摆在推荐开发人员面前的首要问题。


这里新系统比成熟的系统少的是海量的用户, 无法借助其它老用户的行为来为新用户的推荐提供指导.


但是除了这一块外,其它策略可以采用跟用户冷启动一样的策略,包括利用用户注册时提供的信息、基于用户少量内容做推荐以及采用兴趣迁移策略,这里不再赘述。


新的视角看冷启动

1. 在产品初期,个性化推荐一定是必要的吗?


其实,我个人觉得在新产品阶段,最重要的是做好用户体验,提供给用户最核心的最小化可行特性,只要这些核心功能是用户想要的,操作体验不太差,用户还是愿意留在你的平台上的。同时,需要做好搜索和导航,方便用户更好的找到自己想要的内容。


前期个性化推荐没有那么重要, 因为个性化推荐本来就是需要有大量用户行为时效果才会更好的,但是可以做一个基于内容的标的物关联推荐,方便用户从内容可以关联到相似内容。


如果推荐能力不是你的产品的核心竞争力的话,前期也没有足够多的人力来开发,在产品初期可以不做个性化推荐。如果你的产品以推荐为核心竞争力(如今日头条),最好在一开始就构建推荐系统,让用户有一个很强烈的品牌感知。


2.跳出推荐的视角看用户冷启动


对新用户来说,最重要的是高效方便地在你的平台上找到自己喜欢的标的物。


用户的需求主要有两类,一类是明确性需求,自己知道自己要啥,我们只要方便的让用户找到自己想要的标的物就可以了,解决这个问题可以通过搜索或者导航来实现。


另一类是不明确的需求,在没有用户信息之前,我们确实不知道用户的喜好,但是我们可以给很多差异性较大的标的物并分门别类让用户自己快速选择,不行就换一批,这样用户就可以快速找到一个自己喜欢的标的物。


基于上述思路,我觉得我们可以给新用户设计一个特殊的“新用户登录页面”,对于老用户进入你的 APP 或者网站,首页就是原来常规的首页,而新用户在第一次进入时登录的是“新用户登录页面”, 当新用户在“新用户登录页面”有行为(播放、购买、点赞等)时,再次登录时就会进入常规首页。


我们拿视频 APP 举例来说,我们可以设计如下的“新用户登录页面”(见下面图 1)。


我们将该页面分为 4 大模块:热门模块、搜索模块、筛选模块、主题模块。


用户在视频类 APP 最重要的诉求是尽快找到自己喜欢的内容。对于尽快,用户希望一进来的界面就可以找到自己想要的,尽量不要让我“走很多路”,我们直接用一个“新用户登录页面”来满足这个诉求。


用户对喜欢的内容的诉求的最主要四种情况是:


(1)需求很明确。比如我就是想看”狂暴巨兽”;


(2)需求很明确。想看最近正在热播的内容;


(3)需求有一定范围,但是不明确。比如我想找恐怖电影看;


(4)需求完全不明确,如果给我的内容我喜欢就会看。


对于上述(1),搜索可以满足用户需求;对于(2),热播榜可以满足用户诉求;对于(3),筛选可以满足用户需求;对于(4),给出各种风格各异的内容,让用户快速选择自己喜欢的类型。


基于以上对用户诉求的分析,设计这个“新用户登录页面”,就可以解决新用户下面 4 大类需求(解决用户找到喜欢内容的痛点):


(1) 最近热播的内容;


(2)用户搜索自己想要看的内容;


(3) 用户筛选自己喜欢的某类型的内容;


(4) 浏览找到最近想看的内容;



图 1:为新用户设计的“新用户登录页面”


上面,已经比较完整地给出了解决各类冷启动的技术方案。


但是,我们主要是从用户和标的物的角度来阐述的, 而在实际业务中, 推荐系统是以各种产品形态出现的,如相似推荐、猜你喜欢、主题推荐等等。


我们下面结合冷启动解决方案, 对各种常用推荐产品形态来简单介绍一下,怎么实现冷启动。


不同推荐产品形态冷启动的解决方案

作者在《推荐系统的工程实现》这篇文章中讲到,推荐系统主要有 5 种范式,分别是:完全个性化范式、群组个性化范式、非个性化范式、标的物关联标的物范式、笛卡尔积范式。


不熟悉的读者,可以再看一下该文第五节推荐系统范式。现在,我们分别从这 5 种范式来说明怎么做冷启动。


1.完全个性化范式


该范式可以采用基于用户的冷启动的所有方法来做冷启动,这里不再赘述。


2.群组个性化范式


对于群组个性化范式,用户是分为兴趣相似的组的。


新用户由于没有相关行为,可以单独将所有新用户放到一个新用户组,可以采用用户冷启动中的“提供非个性化的推荐“的策略来做冷启动。


3.非个性化范式


每个用户推荐的内容都是一样的,这种推荐本来就是各种排行榜, 采用新热推荐的策略,所以不存在冷启动的问题。


4.标的物关联标的物范式


这种范式一般是相似视频、喜欢该物品的人还喜欢等推荐形态。


可以采用标的物冷启动中的“利用标的物的 metadata 信息做推荐”和用户冷启动中的“提供非个性化的推荐”策略。


具体来说就是对新标的物,既可以利用标的物的 metadata 计算与之相似的标的物,利用相似的标的物作为关联推荐,也可以关联到新热标的物或者常用标的物。


5. 笛卡尔积范式


这种推荐范式,每个用户关联到的每个标的物的推荐都是不一样的(如个性化相似影片, A 用户和 B 用户看到的 V 节目的相似影片不一样)。


这时,可以采用关联到新热标的物或者常用标的物作为冷启动推荐。


在真实产品和业务场景中,推荐方式可以有很多变种,读者需要结合公司业务和产品策略来灵活选择采用的冷启动方案, 同时在具体设计冷启动方案时需要注意很多问题。


设计冷启动时,需要注意的问题

上面讲了很多冷启动的实现方案, 不同的产品需要结合自身产品特征和拥有的资源来选择采用什么方式做冷启动。


在这里我讲一下冷启动落地过程中需要注意的事情, 让大家更好的将冷启动应用于真实的业务场景中。


1.逐步迭代让冷启动效果更好


冷启动有很多方法,我们需要通过 AB 测试选择一种效果更好的方法,并不断优化,让冷启动的效果达到最佳状态。


2. 量化冷启动用户的比例及转化效果


如 1 中所讲, 需要将用户的行为日志埋点, 日志中需要包含用户 userId,采用的算法标识、用户具体行为(点击、播放、购买、点赞)等,这样就可以通过分析日志知道:


每天的 DAU 中,有多少用户采用了冷启动策略;


各种冷启动策略及非冷启动策略的比例;


冷启动策略的转化效果,及与其他非冷启动策略的转化效果的对比。


只有知道了具体数据情况,才能够知道从哪些维度去优化。


3. 采用级联推荐策略


一般来说协同过滤的效果比基于内容推荐好,而基于内容推荐会比冷启动推荐好,我们在给用户做推荐时可以采用级联策略。


比如如果协同过滤有推荐结果就采用协同过滤的结果,没有的话(可能是新注册不久的用户)就采用基于内容的推荐,如果用户没有看任何内容这时可以采用冷启动推荐(如热门推荐等)。


这样做效果肯定会更好,因为总是优先使用最好的算法,但是实现起来可能会复杂一些,为了给用户提供最好的推荐体验,这也是值得的。


在我们公司的相似视频推荐中就是采用的这种方法,如果某个视频有基于 item2vector 的算法计算出的相关视频就采用该算法的结果,如果没有就采用基于标签的相似推荐,如果该视频是新视频,标签不完善,就采用基于热门的冷启动推荐策略。


采用级联策略的目的主要是优先利用所有已知的最好信息,尽量减少采用非个性化冷启动推荐的比例,最大程度提升用户的使用体验。


4. 需要维护提供标的物的第三方利益


对于依赖第三方提供标的物的平台,如电商、新闻、短视频、小说阅读等,需要维护标的物提供方生态的繁荣,怎么保证新的标的物提供方可以挣到钱,提供优质标的物的提供方挣更多的钱,也是很重要的问题。


这就涉及到新标的物的冷启动问题。


需要确保更好地将优质的标的物尽量推荐给更多的用户,质地差的标的物少推荐,这就涉及到很多业务策略和评估指标了。


在最后,我基于自己的思考和经验,讲讲冷启动未来的发展趋势。在未来,随着技术的发展,肯定有很多新的解决冷启动的策略和方法。


冷启动未来发展趋势

冷启动与推荐系统密切相关, 随着推荐系统在互联网产品中的重要性日益增大,解决冷启动问题也越来越重要和迫切。


随着互联网的深入发展及创业的精细化,未来为用户提供服务的产品会越来越多,区分度越来越模糊,这就像一个生态系统,随着物种越来越多,就会有更多的物种的生存空间出现重叠。


所以,竞争也会越来越激烈。同时,用户也会越来越没有耐心(信息量太大、碎片化时间更严重),你的产品稍微有点让用户不满,用户可能就会选择其他的替代品。随着技术的发展及新的交互模式的出现,也会出现越来越多的冷启动的方案。


下面基于自己的理解,以及对未来发展趋势的预测, 对冷启动的未来发展说下自己的想法, 给大家提供一些不同角度思考问题的视角。


1.解决冷启动越来越迫切


前面说过,创业朝精细化发展后,产品竞争激烈,功能重叠会更多,有更多的替代品,用户的耐心会下降。


要想更好的让新用户留下来,需要优化推荐的冷启动方法,让新用户更加满意。


2.可以更加实时的了解用户的兴趣


随着 5G 技术的发展,网络速度会更快,几秒钟就可以下载一部高清电影,无损视频通话变得可行。


同时随着硬件的升级和边缘计算的发展,在终端部署复杂的深度学习模型变得可行,我们可以直接在终端中做复杂的计算处理,快速获取用户的特征。


就像凯文凯利的畅销书《必然》中所说的,社会生活及信息获取会更加流式化,对于获取和提取用户特征也是一样,未来会更加快速(比如你说一句话,你手机上的深度学习模型就可以马上识别出你的年龄、性别、情绪等),从而更好更快地解决冷启动问题。


3.新的解决冷启动的方案


随着语音及图像技术的发展、边缘计算算力的强大、数据安全法制建设的完善,说不定未来的 APP 可以通过视频或者语音来注册了(在一定的安全隐私法规的框架之下)。


你开启 APP 摄像头就自动识别你或者你说一句话,APP 马上就可以识别出你的年龄、性别、心情、着装、体型、精神状态等特质。


这样立马就为你构建了一套专属的用户画像,基于该用户画像,系统马上就可以为你推荐跟你的画像匹配的标的物了。


4.资源共享的协同效应


随着云计算和 AI 技术的发展, 未来的创业公司会直接采购云端的大数据与机器学习 SAAS 服务,而不是直接从零开始搭建自己的数据与 AI 平台。


而现在很多 APP 都是采用手机、微信、QQ、支付宝等账号登陆,云端是可以知道用户在各个平台上的信息的,。


未来这些信息通过加密后说不定可以共享,不具备直接竞争关系的公司更有可能达成同盟。


利用共同的用户行为信息来协同优化用户体验, 这个 APP 的新用户, 可能就是另外一个 APP 的老用户,可以从另外一个 APP 知道他的信息, 这些信息可以帮助第一个 APP 来更好的做冷启动。


写在最后


到目前为止,所有关于冷启动的介绍就告一段落了。


上面很多冷启动方法作者团队曾在自己公司的产品中实践过,也有很多是基于作者的经验提出来的,并未得到实践。


由于作者一直是做视频行业的推荐,其他行业的推荐没有涉及到,但是我在写冷启动的解决方案时, 希望做到通用,试图覆盖所有的行业,所以不当之处在所难免,欢迎批评指正!


相关文章


打造工业级推荐系统(一):推荐算法工程师的成长之道


打造工业级推荐系统(二):无处不在的推荐系统


打造工业级推荐系统(三):推荐系统的工程实现与架构优化


打造工业级推荐系统(四):推荐系统怎么更好的帮助公司挣钱?


作者介绍:gongyouliu,有近 10 年大数据与 ai 相关项目经验,有 9 年推荐系统研究及实践经验,目前负责电视猫大数据与人工智能团队。喜欢读书,暴走,写作。业余维护“大数据与人工智能”公众号,ID:ai-big-data,持续输出推荐系统相关文章。个人微信:liuq4360


原文链接https://mp.weixin.qq.com/s/82REVmDV5cfeQP766qOZmw


2019 年 6 月 20 日 18:559033

评论

发布
暂无评论
发现更多内容

观点 | 破解云管理平台在数据中心管理体系中定位模糊的困局

BoCloud博云

云计算 PaaS 服务目录 多云管理平台 数据中心管理

涨薪50%,从小厂逆袭快手 - 附面经

haxianhe

面试

神操:凭借“阿里Java脑图”,成功斩获腾讯、蚂蚁、B站、字节、滴滴等5个Offer

Java架构师迁哥

你知道 HTTP 是如何使用 TCP 连接的吗?今天我就来告诉你

程序员改bug

Java 架构 HTTP

我看JAVA 之 枚举类型

awen

Java 源码 jdk 枚举

2021突击金三银四必备:BAT1000Java面试真题合集!

比伯

Java 编程 架构 面试 计算机

GitHub上连夜被下架!阿里巴巴2021版JDK源码笔记(2月第三版)

Java架构追梦

Java 阿里巴巴 jdk源码 金三银四 跳槽面试

2021年第一次凡尔赛!2个月肝完阿里技术官“亲码”Java核心思维脑图+核心知识整理,成功入职大厂

Java王路飞

Java 程序员 面试 项目经验 大厂Offer

金融数字化转型浪潮呼啸而来 大数据区块链落地场景全面开花

CECBC区块链专委会

金融

一波N折,3面+HR面成功入职蚂蚁金服实现“财务自由”,自曝狂刷N遍的面试题!

Java成神之路

Java 程序员 架构 面试 编程语言

刷了一个月leetcode算法,成功收下阿里巴巴、网易等大厂的offer

程序员改bug

架构 算法

程序员成长第十四篇:做好时间管理(二)

石云升

时间管理 程序员成长 28天写作 2月春节不断更

公链,区块链的未来和归宿

CECBC区块链专委会

区块链

面试不知道如何做准备? 来看看这一套BATJ最爱问的面试题精选吧

Java成神之路

Java 程序员 架构 面试 编程语言

Linux入门篇 —— Linux 用户与组管理详解(system-config-users && 命令行)

若尘

Linux 命令行 用户

探索图神经网络的网络架构和训练方法

华为云开发者社区

神经网络 AI 图神经网络 网络架构 GNNs

多年阅读《经济学人》是一种什么体验?

wbliu85

第十二周 学习总结

简简单单

双指针高频面试题:「三数之和」的姐妹篇 ...

宫水三叶的刷题日记

LeetCode 数据结构与算法 面试数据结构与算法

日记 2021年2月27日(周六)

Changing Lin

2月春节不断更

我看JAVA 之 Annotation

awen

Java 源码 jdk 注解 annotation

备战明年金三银四,阿里P8大佬总结的这份Java面试文档,你可一定要好好看看

Java成神之路

Java 程序员 架构 面试 编程语言

《经济学人》2021年2月27日刊精彩文章导读及资源下载

wbliu85

第十二周 作业

简简单单

牛批!Github一夜爆火,阿里JDK源码小册2021全新开源!

程序员小毕

Java 源码 jdk 面试 并发

基于matlab的控制系统与仿真6-PID控制模型

AXYZdong

matlab 2月春节不断更

深入解读华为云细粒度文本情感分析及其应用

华为云开发者社区

AI 华为云 情感分析 语言语义 文本情感分析

Enterprise Tech30(2021)

行人23

Tech ET30

推荐程序员平时使用最多的绘图软件!!!

秦怀杂货店

软件 流程图 绘图

紧急寻人,还缺75万!区块链产业为何“一才难求”?

CECBC区块链专委会

区块链人才

七年阿里升级路,熬到P7,想给正在成长的Java程序员一点建议

Java成神之路

Java 程序员 架构 面试 编程语言

边缘计算隔离技术的挑战与实践

边缘计算隔离技术的挑战与实践

打造工业级推荐系统(五):推荐系统冷启动全解析-InfoQ