写点什么

推荐系统在房产领域的实践

  • 2018-12-17
  • 本文字数:1738 字

    阅读完需:约 6 分钟

推荐系统在房产领域的实践
00:00 / 00:00
    1.0x
    • 3.0x
    • 2.5x
    • 2.0x
    • 1.5x
    • 1.25x
    • 1.0x
    • 0.75x
    • 0.5x
    网页全屏
    全屏
    00:00

    采访嘉宾简介

    许燕松,就职于贝壳找房,担任贝壳找房智能推荐平台负责人一职。硕士毕业于美国匹兹堡大学信息科学专业。先后就职于当当网,聚美优品负责个性化推荐系统的研发工作,有多年的推荐系统的实践经验。主要研究推荐系统领域的系统架构设计与策略算法的应用。在贝壳找房主导了智能推荐平台的架构升级与算法迭代工作。通过架构的升级大幅提升了推荐架构的灵活性与迭代效率。通过算法的多次迭代不断提升推荐的效果。


    InfoQ:请您先介绍一下您的工作经历,以及您在贝壳找房所在的团队负责的工作。


    许燕松:我一直从事推荐研发相关工作,已经有很多年了,在我最开始的时候是先在当当,当时是第一次接触推荐相关的工作内容。那会儿我主要负责当当的个性化 PUSH 还有母婴品类相关的推荐,尤其是在做母婴品类推荐的时候我还自研了一套母婴相关的单独的一个推荐策略。后来就加入到聚美优品,负责整个聚美的推荐算法和用户画像相关的工作。在聚美的这段经历让我得到了更全方面的发展,让我知道如何去 hold 住一个完整的推荐系统。


    后来现在我又来到贝壳找房,在贝壳的这段经历让我知道如何把一个推荐系统做得更好,如何把一个相对封闭的推荐系统转变成一个智能推荐平台。这就是我主要的一些工作经历。


    InfoQ:贝壳找房推荐平台都使用了哪些推荐算法和策略以提高性能?


    许燕松:很多种策略,包括协同过滤的策略,基于用户画像的推荐策略,一些基于业务规则的推荐策略。这些策略本身都有各自的优缺点,我们并不是每一个场景只用一种,我们会混合着来用,这样不同策略之间就会形成互补,达到最优的一个效果。


    InfoQ:贝壳找房的智能推荐系统架构和算法经过哪些重大变化和迭代?做出改变的原因是什么?


    许燕松:可以说我们整个智能推荐平台是跟着贝壳找房一起发展壮大的,它主要经历了三个阶段:第一个是初创阶段,第二个阶段是快速发展阶段,第三个阶段是平台化的阶段。


    每个阶段面临着不同的问题:比如说在初创阶段,这时候我们用户需要提升找房的效率,我们所收录的这些房源需要得到更好的曝光,并且这个阶段我们的数据是非常不完备的。所以在这个阶段我们主要是想快速实现推荐系统从 0 到 1,从无到有的这么一个快速实现。所以在那个阶段没有用太复杂的推荐策略。


    在快速发展阶段,随着我们的数据积累,我们加入了各种各样的个性化策略,比如我提到的基于协同过滤的推荐策略、基于用户画像的推荐策略。有了这些策略之后,我们整个推荐相当于更上了一层楼。


    此外我们在平台化的阶段,我们去做了整个智能推荐平台的大升级。通过这次升级之后,可以说我们整个智能推荐平台在这个阶段就真的成为一个平台了,我们支持了快速的业务接入,以前一个业务的接入可能需要五个工作日,现在一个工作日就可以搞定了。而且在策略方面,我们加入了实时化的推荐策略,还加入了很多更为精准的推荐策略,比如说我们有 LR 模型做了一个精准排序。这就是整个贝壳的发展历程。


    InfoQ:在不同的阶段利用了不同的策略。


    许燕松:对,主要是针对当时面临的背景和不同的问题,有针对性地去解决。


    InfoQ:您觉得智能推荐平台在未来还可以做哪些优化?


    许燕松:因为我们叫智能推荐平台,所以第一点就是让智能推荐平台更加智能。目前我们做策略的优化都是人去做 AB 试验,通过 AB 试验的结果来不断地调整我们的策略。我们希望以后不通过人去做 AB 试验,通过线上的数据实时地反馈,让机器自己去学习如何去调优,这样才能真正说我们是一个智能的推荐平台。


    还有就是我们想在架构上加入更复杂模型的预测,比如说 WDL 模型。WDL 也可以在我们的算法上有很大的要求,所以我们在算法上也要做一个深耕。这就是我们未来在这块想要做的事情。


    InfoQ:最后一个问题是关于产品落地,贝壳找房除了智能推荐平台之外,还有没有一些其他的策略产品落地?


    许燕松:我所在的部门叫数据智能部,我们部门除了智能推荐平台还有很多其他的产品。比如说为了评估一个房源的真实价值,我们提供了一个智能估价系统,它是用来给房源进行估价的。


    为了更好地提升用户体验,我们还建立了智能的客服系统,智能客服系统你去问答的时候,它可以智能地给你回答,提升了用户的问答效率。


    我们还有智能图片的处理平台,主要是帮助我们解决各种各样图片相关的需求。这里面我只列举了一些比较主要的,其实还有很多其他的产品落地。


    2018-12-17 00:002261
    用户头像

    发布了 1488 篇内容, 共 661.0 次阅读, 收获喜欢 2499 次。

    关注

    评论 3 条评论

    发布
    用户头像
    贝壳不是把链家绿色的颜色背景换成了蓝色,哪儿来那么多的策略
    2019-06-01 23:34
    回复
    用户头像
    贝壳不是直接用的链家系统呀,哪有那么多策略
    2019-06-01 23:32
    回复
    没有更多了
    发现更多内容

    Seata 与三大平台携手编程之夏,百万奖金等你来拿

    阿里巴巴云原生

    阿里云 开源 云原生 seata

    利用Docker极速下载OpenJDK11源码

    程序员欣宸

    Docker Openjdk 6月月更

    架构实战营模块5作业

    挖了蘑菇哩斯

    架构实战营

    传统微服务框架如何无缝过渡到服务网格 ASM

    阿里巴巴云原生

    阿里云 微服务 云原生 Service Mesh 服务网格 服务网格

    小心transmittable-thread-local的这个坑

    看山

    Java’

    阅读Skeleton.css源码,改善睡眠质量(尽管它只有419行代码)

    德育处主任

    CSS 源码 前端 6月月更 skeleton.css

    Flutter 中的 ValueNotifier 和 ValueListenableBuilder

    坚果

    flutter dart 6月月更

    在Hadoop环境里面统计西游记文章的词组(hdfs实验)

    王小王-123

    mapreduce hadoop统计词频 hadoop项目 文本统计分析

    [译]在软件开发行业工作 6 年后,那些年我曾改过的观念

    宇宙之一粟

    感悟 6月月更

    淘宝数据可视化大屏案例(Hadoop实验)

    王小王-123

    海量数据 大数据分析 淘宝项目 hadoop实验 hive项目

    我的远程办公深度体验 | 社区征文

    6个核桃

    初夏征文

    @Scheduled注解的坑,我替你踩了

    慕枫技术笔记

    后端 6月月更

    Dart 开发技巧

    Geek_0a3437

    flutter android dart 6月月更

    ABAP-时间函数

    桥下本有油菜花

    abap

    声网自研传输层协议 AUT 的落地实践丨Dev for Dev 专栏

    声网

    Dev for Dev 网络传输

    淘宝大数据分析案例(百万数据集Hadoop项目)

    王小王-123

    大数据分析 淘宝大数据 淘宝业务数据 淘宝项目可视化

    基于学生选课数据库分析(Hadoop实验)

    王小王-123

    hadoop 大数据分析 学生选课项目 数据库项目

    基于Hadoop豆瓣电影数据分析(代码+原理)

    王小王-123

    大数据 数据分析 基于Hadoop豆瓣电影

    我们如何拿到自己满意的薪资呢?这些套路还是需要掌握的

    看山

    闲聊

    【值得收藏】HTML5使用多种方法实现移动页面自适应手机屏幕的方法总结

    迷彩

    前端 自适应 HTML5, CSS3 6月月更

    K8S V1.23 安装--Kubeadm+contained+公网 IP 多节点部署

    云原生 k8s Kubernetes 集群

    今晚19:00知识赋能第2期直播丨OpenHarmony智能家居项目之控制面板界面设计

    OpenHarmony开发者

    Open Harmony

    Jetpack之Room的使用,结合Flow

    yechaoa

    android flow JetPack 6月月更 Room

    初识Hadoop之概念认知篇

    王小王-123

    hadoop hadoop概念

    云技能提升好伙伴,亚马逊云师兄今天正式营业

    亚马逊云科技 (Amazon Web Services)

    亚马逊云

    直播带货源码开发中,如何降低直播中的延迟?

    开源直播系统源码

    软件开发 直播系统 直播源码

    Serverless 在阿里云函数计算中的实践

    阿里巴巴云原生

    阿里云 Serverless 云原生 函数计算

    架构实战营模块 5 作业

    Roy

    架构实战营

    “微博评论”的高性能高可用计算架构

    Pengfei

    Flutter的特别之处在哪里

    Geek_99967b

    小程序 Flutter 小菜

    穿越过后,她说多元宇宙真的存在

    白洞计划

    推荐系统在房产领域的实践_大数据_InfoQ 中文站_InfoQ精选文章