阿里云飞天发布时刻,领先大模型限免,超7000万 tokens免费体验 了解详情
写点什么

Real Data 地产大数据上线,惠新宸谈链家大数据建设思路

  • 2017-12-25
  • 本文字数:2018 字

    阅读完需:约 7 分钟

12 月 21 日,链家举办了 2018 年年度思享会。以“数据赋能,品质居住”为主题,会上链家研究院发布了地产大数据产品 Real Data。我们在会场采访了链家集团技术副总裁,同时也是此次 Real Data 研发团队的负责人惠新宸(鸟哥),他为我们介绍了 Real Data 背后的核心技术和研发团队,以及数据赋能行业的一些思考。

Real Data 是一个针对 B 端用户所开发的房地产领域一站式研究和数据服务平台。从项目团队上来看,鸟哥介绍,链家目前有 1000 多研发成员,大部分都来自于 BAT 等一线互联网公司,加上链家研究院专业的市场、行业分析师团队,他们中的一部分为 Real Data 提供了强大的专业支持。

链家集团技术副总裁 鸟哥惠新宸

Real Data 囊括城市基础数据库、市场数据库、用户行为数据库及集中式公寓字典四大数据库,支持多维交叉分析,形成用户画像,帮助开发商等使用客户定位潜客来源、预估客户交易行为以及挖掘客户需求偏好,预估用户中意房屋的类型等。

通常来说,房产大数据有两大核心指标:

  • 数据颗粒度。颗粒度越细,大数据的价值越高
  • 数据更新能力。数据更新能力越强,数据就会越真实越贴近市场。

Real Data 正是在这样的要求下诞生的,它具有数据精细、真实,并且实时更新的特点。

首先是它的数据颗粒度,官方介绍,Real Data 采用商圈层级数据统计方式,依据地理维度进行聚合,形成聚合后的区域热点,按照成交量、人流量及热度的不同,进行商圈层级的划分,相较于行政区域划分统计,数据颗粒度更细。未来 Real Data 还将细化到小区级别的数据统计,对小区楼栋,业态、户型、总价和面积段提供数据交叉分析。

据了解,Real Data 收集的用户信息基本涵盖全面的人口属性数据,包括地域、年龄、性别、学历、职业、工作年限、收入、家庭结构等;购房行为属性数据,包括总价、面积、户型、贷款等;用户交易相关金融数据,贷款比例、利率、周期、杠杆使用等情况;住房需求,是否是刚需首套、刚需改善、中级改善、高端改善和顶级改善等,也即用户目前正处于哪一个需求阶段;以及链家首创的换房迁徙动态信息。以这些数据为基础,链家构建了 Real Data 潜客分析功能。而说到个人信息安全性问题,鸟哥说所有收集的用户信息都在注册链家网时用户须知上会进行提示,至于额外信息,除非用户自愿,否则不会进行收集。他同时还说明了这些数据的来源:通过链家 PC 和移动端所产生的定位、搜索、点击数据,以及与线下经纪人互动过程中产生的用户录入信息、带看、成交等数据。“数据安全是互联网数据公司的生命线。涉及到个体用户的隐私,我们有多重的保护,对所有的数据调用都是在脱敏的基础上,设置有限的调用权限。”鸟哥强调。

数据的真实性方面,首先,从渠道信息采集上看,线上链家网、链家 APP 已累计 3000 万注册用户量,日活跃用户达 300W,线下遍布全国 8000 家门店,15 万经纪人可实时采集成交数据。另一方面,链家的楼盘字典数据库囊括了全国 36 个重点核心城市 8000 万房源数据,容量达到了 1200T,收录了包括房源房间门牌号、标准户型图、属性信息、配套设施信息、历史业务数据等多维度信息,它保障了房源的真实性。此外,链家采用数据筛选机制——元数据平台、自动清洗机制——剔除虚假信息,使用这些数据管理体系,以技术的形式保障数据真实可信。

“我们建设系统的思路是以数据为导向,围绕人、房、客三方建设系统,通过用户的数据以及在整个过程中实时产生的交互行为,来推动整个系统的建设。基于这一点,用户上一秒的交互,就会成为下一秒的推荐特征,这也保证了 Real Data 产品实时画像能力的实现。”鸟哥介绍这是 Real Data 数据能实时更新的原因。因为目前大部分交易类的数据,包括签前、签中和签后的数据,都是通过系统得来的,这些从业务中产生的数据,本身具有实时性,而链家已经建立起了一个比较完善的系统,可以将数据向上汇集,这就保障了 Real Data 数据的实时性。同时,线上用户数据采集不断完善,这也使得链家的用户数据库趋于丰富,用户画像趋于精细化。

Real Data 的这些特点,使其为政府、房企、金融机构等房产全产业链参与者提供精准数据服务和决策依据成为可能,鸟哥以金融领域为例举了一个简单的例子,他认为 Real Data 在金融领域有很大的应用空间,市场、区域商圈和用户信息数据能为泛金融领域的投资行为、贷款、房屋抵押估值、金融获客、营销策略和服务模式等提供参考价值。“Real Data 的数据基础主要来源于链家的真实交易数据,是最接近市场的数据,离交易越近的数据,对用户的参考价值很大。”同时,Real Data 对用户进行全方位的标签系统管理,用户金融标签,将对交易用户的收入支付能力、贷款数据和杠杆使用情况等进行细致的描绘,这些数据可以帮助金融用户更深刻地洞察用户。

最后鸟哥表示,未来,Real Data 还将对已有的各项数据进行完善、扩充资产管理相关功能。此外,针对目前火热的租赁领域需求将推出一系列数据产品服务,用于辅助分散型、集中型租赁品牌的选址、定价与运营的策略制定,进一步扩大产品的应用空间。

2017-12-25 18:003568

评论

发布
暂无评论
发现更多内容

架构师训练营第 1 期 - 大作业 2

Anyou Liu

架构师训练营第 1 期

架构师训练营第 12 周学习总结

菜青虫

聊聊并发,进程通信方式,go协程简单应用场景

AI乔治

Java 架构

Springboot 开发环境搭建和项目启动

武哥聊编程

Java springboot SpringBoot 2 28天写作

python 基本数据类型-1

赵开忠

Python 28天写作

【薪火计划】09 - 员工激励理论

码字与律动

管理 28天写作

IDEA@Data注释使用

AI乔治

Java 架构 注解

生产环境全链路压测建设历程 25:FAQ 7、8 正常业务保护和外调接口的处理

数列科技杨德华

28天写作

优化无止境,爱奇艺中后台 Web 应用性能优化实践

爱奇艺技术产品团队

大前端

价值创造

JiangX

创业 投资 认知 28天写作 价值

演讲还是辩论

将军-技术演讲力教练

28天写作

大数据知识专栏1-Hadoop环境安装

小马哥

大数据 hadoop 28天写作

海明威《老人与海》

抗哥

28天写作

28 天带你玩转 Kubernetes-- 第二天(K8s 介绍)

Java全栈封神

Kubernetes k8s k8s入门 28天写作 k8s历史

架构师训练营第 12 周课后练习

菜青虫

justauth-spring-boot-starter V1.3.5 发布成功

RD

OAuth 2.0 justauth 第三方登录

想不想get和湖南卫视一样的现代直播?

亚马逊云科技 (Amazon Web Services)

同理心

lidaobing

28天写作 了不起的盖茨比

领域驱动设计在爱奇艺打赏业务的实践

爱奇艺技术产品团队

架构 DDD

关于私域流量与社群的思考

.

28天写作

新官上任,如何开始你的管理工作(上)

一笑

管理 28天写作

中国金融科技权威盛会点赞了这个来自 AWS 的金融行业解决方案

亚马逊云科技 (Amazon Web Services)

云计算 AWS

前端性能优化之指标

知识乞丐

大前端 28天写作

SpringBoot 系列 2——SpringBoot原理分析

程序员的时光

程序员 springboot 七日更 28天写作

车轱辘话来回说怎么治

Justin

团队协作 沟通 28天写作

如果梦境取决于一串代码「幻想短篇 2/28」

道伟

28天写作

28 天带你玩转 Kubernetes-- 第二天(K8s介绍)

Java全栈封神

Kubernetes k8s k8s入门 28天写作 k8s历史

28天瞎写的第二百一三天:背代码的故事

树上

代码 28天写作

MySQL在按照某个字段分组、排序加序号

AI乔治

Java MySQL 架构

AWS x 红帽 | 以客户需求为驱动,加速开放混合云落地

亚马逊云科技 (Amazon Web Services)

云计算 红帽 AWS

详细教程丨如何利用Rancher和Kong实现服务网格?

Rancher

微服务 k8s

Real Data地产大数据上线,惠新宸谈链家大数据建设思路_DevOps & 平台工程_雨多田光_InfoQ精选文章