多维度分析：推荐效果明显的产品属性-InfoQ

「如何实现流动式软件发布」线上课堂开课啦，快来报名参与课堂抽奖吧~ 了解详情 



 写点什么

导读

1. 双刃剑

互联网从 web1.0 到 web3.0，正慢慢推动着人类社会的发展，颠覆着原有产业形态，信息量也急剧膨胀，我们正处于一个高速发展的信息时代。

人们获取信息的方式被拓宽，特别是近 5 年移动互联网的推波助澜，整个互联网虚拟社会很快便从信息匮乏信息匮乏发展到了信息爆炸。一方面，人们享受着互联网信息发展带来的智能与便捷，如信息无线化，看书读报查资料全部可以在互联网上完成；如交易形态发生变化，从线下交易正逐步被线上交易侵蚀；如出行发生变化，从招手叫车变成了手机叫车等待；但另一方面，由于利益的存在，互联网上也充斥着各种无用信息与资源，如诈骗广告、低智、无知言论，流氓软件横行，散发出浓浓的恶臭，且这些垃圾占据了很高的比例，将某些有价值的信息埋没其中。web4.0 时代，各大公司正开始逐渐从企业内部去改变这种形态，因为这样才能最大程度促进企业自身的发展。

2. 马太效应与长尾理论

互联网时代下的信息及内容分发机制存在严重的马太效应，有者愈有，强者愈强；热门商品越热门，新商品很难发现。2/8 现象再次出现，20%的内容收到了 74%的用户交互，而这背后的原因不是用户不喜欢或者不感兴趣，而是用户可能根本没有看到，长尾内容非常多，但利用率却不高。

3. 大数据下的信息经济与体验经济

解决信息过载，知识匮乏，时间有限的利器就是大数据技术。体验经济狂扫全球的根本原因，就是因为互联网红利的消失，企业盘外资源增速有限，大家都开始精耕细作盘内资源，最大竞争力正由精细化运营构建。

信息经济时代正慢慢渗透进物质经济，并为体验经济做了非常好的铺垫；而这两个时代的主基调一定是建立在大数据的基础之上的，特别是互联网产业的崛起与发展，伴生着海量数据，催生了大数据+机器学习模式。企业数据的收集与积累，底层硬件与软件的支持，数据的互通与融合，产生了 1+1>2 的强网络效应。大数据的边际成本开始趋于零，数据成为 DT 时代最好的生产资料。

4. 信息化-数据化-智能化

体验经济正推动着数据化/智能化的发展。面对海量信息，该如何选择呢？选择爆炸？选择恐惧？选择焦虑？信息需要过滤，如何从海量数据中快速挖掘用户感兴趣的产品，并将无用无趣无聊的三无信息剔除的诉求，推动了个性化内容分发技术 ( 搜索与推荐 ) 的发展。而个性化内容分发的信息筛选与呈现工作主要通过四步来完成：

① 收集用户或群体的行为数据或搜索数据；

② 寻找合适的机器学习算法构建用户的兴趣模型；

③ 通过构建的用户兴趣模型预测未来用户的感兴趣的产品和内容；

④ 过滤低质商品和内容并呈现给用户。

这是一个庞大的系统工程，整个过程需要根据业务经验，依托产品形态，利用算法从数据中挖掘各种信息，最终帮助用户感知，而不强迫 TA 思考。这里涉及了一个重要概念机器学习，我们这里简短阐述，机器学习的三大核心点：

① 基于过去的事实和数据，用来发现趋势和模式；

② 机器学习模型提供了对于结果的洞察力，机器学习帮助揭示未来的一个结果的概率而不仅仅是过去发生的事情；

③ 历史的数据和统计建模被用于概率进行预测；

传统数据分析旨在回答关于过去的事实，机器学习的目的是回答关于未来事件的可能性的问题！

5. 线上流量红利逐渐见顶

前几年企业中存在的普遍问题，小公司本身收集的数据少；大公司拥有更加丰富的数据，但是杂乱无章，无从下手。现在这个阶段，大部分公司数据虽全，但存在于孤岛，信息散落各处 ( pos，crm，erp，供应链，oa )，如何基于现有商业进行快速数据挖掘，主动出击对商业快速反应。

流量红利见顶的情况下，谁能用好数据，谁能更好地精细化地满足用户需求，谁就能在激烈竞争中胜出。推荐正是这个流程中主动迎合用户，快速抓住用户需求点的有效手段。

数据层面

1. 稀疏性：稳定的流量与稳定的交互比例 ( pv/uv )

稳定的流量与稳定的交互比例保证了数据的稠密性，单用户和单商品有足够的数据可以完成机器学习，并且保证一定的置信度。当有新用户 (新商品) 加入系统时，由于系统中缺乏用户 (商品) 历史反馈信息，所以完全无法推断用户的偏好，也就无法做出预测。稀疏性主要指用户反馈数据的量级与本身条目量级的对比，如果这两个量级差异过大，则会导致模型容易受到随机因子影响。

2. 时效性：能够获得快速反馈

首先你的产品必然需要具备快速获取用户反馈的能力，推荐产品必然需要随着用户走，如果用户反馈有较大的 delay，必然带来体验和效果上的大打折扣。而对于反馈的获取，主要是在数据收集及处理上，并且最终作为燃料送入算法，产出用户所需的推荐。用户行为数据越快被反馈的产品推荐效果更明显：因为用户的兴趣是变化的，通过机器学习来推敲用户的兴趣所需的物料就是数据，如果你能够快速地反馈用户行为数据，那算法模型就能够实时地捕捉用户变化着的兴趣，当然效果就自然而然明显。

3. 多样性与稀疏性：条目增长相对稳定、条目的类别多样

多样的类别可以从不同的角度满足用户，商品量越大，类目越多，推荐的价值就越大。条目增长稳定主要指产品所持有的可推荐物料，因为对于推荐而言，条目作为信息载体，如果增长不稳定，最根本的物料缺乏，可能导致新颖性降低。如果本身条目池长期数量有限的话，那很难带来良好的推荐体验，因为本身推荐也是信息爆炸下的产物。如果产品本身条目增长不稳定，那么大量新条目的涌入会使冷启动非常明显，而条目增长过缓会导致多样性问题，推荐无法很好地从有限的池子中挑选适合用户的条目，因为往往时效性在推荐系统中有较明显的影响，历史物料无法长期提供高价值。

4. 数据收集情况

关键数据缺失，数据收集不规范等无法给给出准确及时的数据，也会大大影响推荐系统的效果。

产品层面

1. 推荐是锦上添花

围绕产品的核心目标进行的推荐才是有价值的，产品是推荐的载体，用现在的话说就是帮产品搞事情。

推荐“搞事情”的目的有 2 点：

① 让产品活的更久：活的久是要延长产品的生命周期，延长用户的生命的周期，更受用户喜欢。

② 让产品活的更好：活的更好就是通过广告、用户主动付费等方式获得收入，带来商业价值。

本质上产品需要将整个用户行为路径进行优化，比如电商产品，在推荐的场景需要考虑展现形态，包括图片和文字简介，购物链路上的商品详情页的描述信息丰富和核心程度，整体布局等等。去伪存精，通过信息表达需要考虑：

① 基础信息区：回答商品是什么，吸引决策；

② 优惠：有没有优惠，刺激决策；

③ 服务区：有没有保障，加固决策；

④ 参数规格区：有哪些可选，完成决策；

⑤ 评价区：大家怎么说，辅助决策；

⑥ 后续推荐卡片：再逛逛别的，流量再分发。

2. 推荐是帮助用户感知，而不是强迫 TA 思考

在推荐产品的整个构建过程中，永远需要记住的是你需要帮助用户感知，而不是将过多的主观想法强加于他，不是替他思考。推荐通过收集用户数据，并对用户意图及行为路径建模，从而建立整体用户认知，将条目作为认知的载体呈现给用户，让用户进行体验交互，并进一步收集用户反馈，并假设用户有正向反馈的商品是用户表现出价值认可的。在此基础上，我们可以让用户持续留存，并且建立一定的情感链接。

3. 全局 & 系统工程

推荐是一个系统工程，从业务经验出发，围绕数据、产品形态、算法进行协同优化才能带来更大的收益。用户体验的满意程度贯穿于整个产品使用过程中，如果想要有好的推荐结果，必然需要全局去思考并优化。

① 推荐时机：由于兴趣发现和收敛速度的原因，对于智能程度的感知也随时间会产生较大的变化，合适的时机能够带来更大的收益。

② 推荐质量：对于不同的产品，内容时效性和列表新颖性有不一样的要求，对于不同领域的产品，质量也有不一样的定义。

③ 多样性：对于推荐而言，既要满足用户行为中的正负反馈，又要给予用户更加多样的列表。

④ 产品定位：不同位置的推荐产品定位不同，跳出局部最优思想，做全局最优化，永远是场景间协同，根据行为路径的差异，行为深度的差异来做差异化的场景设置。比如：

单品页：购买意图；
过渡页：提高客单价；
购物车页：购物决策；
无结果页：减少跳出率；
订单完成页：交叉销售；
关注推荐：提高转化；
我的 xx 推荐：提高忠诚度。

用户维度

推荐系统为用户服务，产品所面向的不同类型用户很大程度会影响推荐系统的效果。如新老用户占比，即营销引流与用户留存的情况所影响的占比，新用户在冷启动上会需要花费更多的时间，因为新用户通常是那些没有行为或者行为过少的用户，本质还是数据稀疏问题带来的困难，初期可以用冷启动的一些方法来进行推荐，最终最有效的方式是将新用户留下来，将新用户培养成老用户；不同性别用户的占比，这个主要体现在用户的行为性别，因为不同性别的人在使用产品过程中的差异非常大，对体验好坏的体感也有较大差异。

架构维度

架构设计对问题排查监控的影响。老司机们都知道，只能跑不能修的车是肯定不能上路的。同理，推荐系统的整体架构设计要对问题的排查比较友好，能够在出现问题或者需要验证猜想的时候能够快速在系统中进行定位，而不是现加 debug 信息现上线，导致问题排查过程被拖长。优秀的工程师会在系统设计的时候就给自己留好后路，而不是在出了问题时才临时抱佛脚。

架构设计对迭代速度的影响。除了响应速度这种较为表面的影响以外，整个架构的设计能否支持快速的策略迭代对效果的隐形影响也是极大的。如果整体架构比较臃肿，模块分离不清晰，基础逻辑缺乏适当抽象同一，会导致数据和策略的迭代无法快速进行，每迭代一次都要走很复杂的流程，而且还不能保证正确性。这样的问题会拖累系统的发展速度，最终影响效果。

完美的推荐

1. 技术本质 & 根源：f ( 场+人+货 ) = rate

从前几章的介绍，我们可以了解到，本质上我们需要通过业务构建一个用户对商品的评价模型 (函数)，不同的人在不同的场景下，对不同的物料有不同的偏好及需求度，如果我们精确地构建了对这种需求的定量衡量，则我们只需要将那些用户需求度高的物料展示给用户就能带来巨大的用户体验提升和收益。在这一过程中，其实用户行为存在感性与理性交织的情况，经济学中，人的消费行为是感性消费和理性消费的统一。所谓感性消费，是指消费者在选择具体的消费品时，所依据的常常是感性原则。而理性消费，是指消费者通过消费，让资源得到最优配置。推荐系统需要通过建模来尽量度量感性与理性的消费，消费包括了时间和金钱等。

2. 多学科交叉

想要做好推荐系统，必然需要利用多个学科的知识，包括了市场营销学、网络经济学、计算机、数学、统计学等。涉及 2c 的产品必然是复杂并且非常态的，复杂系统的建模需要拆解，从多个维度去解构，解构过程就需要我从学科专业维度去分析用户的种种行为，并落地迭代。细节决定成败，除了上面提到的因素，还有很多细节会影响推荐系统的最终效果，要有一定的全局观，能够从全局的角度找到当前对效果影响最大的是什么，进而进行针对性优化。对于那些暂时不能改变的因素，也要做到心里有数，在适当的时机进行干预。

作者介绍：

姚凯飞，Club Factory 推荐算法负责人。硕士毕业于上海交通大学，前阿里推荐算法工程师，多年电商及视频推荐经验，目前在出海电商 Club Factory 负责推荐算法工作。

本文来自 DataFun 社区

原文链接：

https://mp.weixin.qq.com/s/BzijAppjwEaG3xQ0DmkgDQ

发布

暂无评论

创作场景

多维度分析：推荐效果明显的产品属性

导读

1. 双刃剑

2. 马太效应与长尾理论

3. 大数据下的信息经济与体验经济

4. 信息化-数据化-智能化

5. 线上流量红利逐渐见顶

数据层面

1. 稀疏性：稳定的流量与稳定的交互比例 ( pv/uv )

2. 时效性：能够获得快速反馈

3. 多样性与稀疏性：条目增长相对稳定、条目的类别多样

4. 数据收集情况

产品层面

1. 推荐是锦上添花

2. 推荐是帮助用户感知，而不是强迫 TA 思考

3. 全局 & 系统工程

用户维度

架构维度

完美的推荐

1. 技术本质 & 根源：f ( 场+人+货 ) = rate

2. 多学科交叉

评论

更多内容推荐

推荐阅读

电子书

大厂实战PPT下载