写点什么

Real Data 地产大数据上线,惠新宸谈链家大数据建设思路

  • 2017-12-25
  • 本文字数:2018 字

    阅读完需:约 7 分钟

12 月 21 日,链家举办了 2018 年年度思享会。以“数据赋能,品质居住”为主题,会上链家研究院发布了地产大数据产品 Real Data。我们在会场采访了链家集团技术副总裁,同时也是此次 Real Data 研发团队的负责人惠新宸(鸟哥),他为我们介绍了 Real Data 背后的核心技术和研发团队,以及数据赋能行业的一些思考。

Real Data 是一个针对 B 端用户所开发的房地产领域一站式研究和数据服务平台。从项目团队上来看,鸟哥介绍,链家目前有 1000 多研发成员,大部分都来自于 BAT 等一线互联网公司,加上链家研究院专业的市场、行业分析师团队,他们中的一部分为 Real Data 提供了强大的专业支持。

链家集团技术副总裁 鸟哥惠新宸

Real Data 囊括城市基础数据库、市场数据库、用户行为数据库及集中式公寓字典四大数据库,支持多维交叉分析,形成用户画像,帮助开发商等使用客户定位潜客来源、预估客户交易行为以及挖掘客户需求偏好,预估用户中意房屋的类型等。

通常来说,房产大数据有两大核心指标:

  • 数据颗粒度。颗粒度越细,大数据的价值越高
  • 数据更新能力。数据更新能力越强,数据就会越真实越贴近市场。

Real Data 正是在这样的要求下诞生的,它具有数据精细、真实,并且实时更新的特点。

首先是它的数据颗粒度,官方介绍,Real Data 采用商圈层级数据统计方式,依据地理维度进行聚合,形成聚合后的区域热点,按照成交量、人流量及热度的不同,进行商圈层级的划分,相较于行政区域划分统计,数据颗粒度更细。未来 Real Data 还将细化到小区级别的数据统计,对小区楼栋,业态、户型、总价和面积段提供数据交叉分析。

据了解,Real Data 收集的用户信息基本涵盖全面的人口属性数据,包括地域、年龄、性别、学历、职业、工作年限、收入、家庭结构等;购房行为属性数据,包括总价、面积、户型、贷款等;用户交易相关金融数据,贷款比例、利率、周期、杠杆使用等情况;住房需求,是否是刚需首套、刚需改善、中级改善、高端改善和顶级改善等,也即用户目前正处于哪一个需求阶段;以及链家首创的换房迁徙动态信息。以这些数据为基础,链家构建了 Real Data 潜客分析功能。而说到个人信息安全性问题,鸟哥说所有收集的用户信息都在注册链家网时用户须知上会进行提示,至于额外信息,除非用户自愿,否则不会进行收集。他同时还说明了这些数据的来源:通过链家 PC 和移动端所产生的定位、搜索、点击数据,以及与线下经纪人互动过程中产生的用户录入信息、带看、成交等数据。“数据安全是互联网数据公司的生命线。涉及到个体用户的隐私,我们有多重的保护,对所有的数据调用都是在脱敏的基础上,设置有限的调用权限。”鸟哥强调。

数据的真实性方面,首先,从渠道信息采集上看,线上链家网、链家 APP 已累计 3000 万注册用户量,日活跃用户达 300W,线下遍布全国 8000 家门店,15 万经纪人可实时采集成交数据。另一方面,链家的楼盘字典数据库囊括了全国 36 个重点核心城市 8000 万房源数据,容量达到了 1200T,收录了包括房源房间门牌号、标准户型图、属性信息、配套设施信息、历史业务数据等多维度信息,它保障了房源的真实性。此外,链家采用数据筛选机制——元数据平台、自动清洗机制——剔除虚假信息,使用这些数据管理体系,以技术的形式保障数据真实可信。

“我们建设系统的思路是以数据为导向,围绕人、房、客三方建设系统,通过用户的数据以及在整个过程中实时产生的交互行为,来推动整个系统的建设。基于这一点,用户上一秒的交互,就会成为下一秒的推荐特征,这也保证了 Real Data 产品实时画像能力的实现。”鸟哥介绍这是 Real Data 数据能实时更新的原因。因为目前大部分交易类的数据,包括签前、签中和签后的数据,都是通过系统得来的,这些从业务中产生的数据,本身具有实时性,而链家已经建立起了一个比较完善的系统,可以将数据向上汇集,这就保障了 Real Data 数据的实时性。同时,线上用户数据采集不断完善,这也使得链家的用户数据库趋于丰富,用户画像趋于精细化。

Real Data 的这些特点,使其为政府、房企、金融机构等房产全产业链参与者提供精准数据服务和决策依据成为可能,鸟哥以金融领域为例举了一个简单的例子,他认为 Real Data 在金融领域有很大的应用空间,市场、区域商圈和用户信息数据能为泛金融领域的投资行为、贷款、房屋抵押估值、金融获客、营销策略和服务模式等提供参考价值。“Real Data 的数据基础主要来源于链家的真实交易数据,是最接近市场的数据,离交易越近的数据,对用户的参考价值很大。”同时,Real Data 对用户进行全方位的标签系统管理,用户金融标签,将对交易用户的收入支付能力、贷款数据和杠杆使用情况等进行细致的描绘,这些数据可以帮助金融用户更深刻地洞察用户。

最后鸟哥表示,未来,Real Data 还将对已有的各项数据进行完善、扩充资产管理相关功能。此外,针对目前火热的租赁领域需求将推出一系列数据产品服务,用于辅助分散型、集中型租赁品牌的选址、定价与运营的策略制定,进一步扩大产品的应用空间。

2017-12-25 18:003547

评论

发布
暂无评论
发现更多内容

如何使用浏览器自动化框架Playwright开发“万媒易发”实现多平台自动发布文章?

爱写字的阿城

自动化 playwright JavaScrip 浏览器操作

双11里最“火爆”轻量应用服务器,华为云耀云服务器L实例打通数字化新动能

轶天下事

软件测试/测试开发丨软件测试中的人工智能

测试人

人工智能 软件测试

人工成本高企?华为云耀云服务器L实例打通企业网站开发最后堵着

YG科技

杭州悦数出席 2023 云栖大会计算巢专场,分享云上最佳实践

悦数图数据库

数据库 图数据库 悦数 杭州悦数

友商“喜提”热搜还遭“补刀”,论专业还得是华为云这款轻量应用服务器

轶天下事

极致安全可靠才是王道!华为云这款轻量应用服务器值得相信

轶天下事

拒绝成为红利本身!华为云这款轻量应用服务器助力企业吃透红利

平平无奇爱好科技

彻底远离职场“噩梦”!华为云这款轻量应用服务器保住IT打工人饭碗

平平无奇爱好科技

如何在部署中实施实时监控

互联网工科生

部署

更强更超值!华为云耀云服务器L实例全新规格诚意来袭

轶天下事

再次遥遥领先!华为云耀云服务器L实例性能暴涨

轶天下事

HarmonyOS NEXT如何解决不同多媒体技术开发难题

极客天地

如何利用罗拉ROLA-IP代理IP提高运营效率和安全性

Geek_bf375d

六个提升网站开发效率秘诀,最后一个华为云产品绝对值得收藏

平平无奇爱好科技

搭建小程序服务器怎么选?闭着选华为云耀云服务器L实例准没错

平平无奇爱好科技

悦数图数据库 v3.6.0 发布:支持 Zone 管理,提升业务安全性和连续性

悦数图数据库

图数据库 悦数 杭州悦数

Codigger,您团队协作的得力助手

知者如C

助企业经营花少钱办大事,华为云这款轻量应用服务器开大招了

轶天下事

公司网站建设缺资金缺人手,华为云耀云服务器L实例解困分忧

平平无奇爱好科技

Vinted、PoshMark、Carousell这些海外二手跨境电商平台如何运营?

Geek_ccdd7f

一个工具让你明白“万丈高楼平地起”,拒绝重复造轮子!

伤感汤姆布利柏

编程 程序员 前端 低代码

网站建设超预算?华为云这款轻量应用服务器事半功倍

轶天下事

软件测试/测试开发丨软件测试中为什么需要人工智能

测试人

人工智能 软件测试

从小白到大神丨快收藏华为云这款小程序开发进阶秘籍!

平平无奇爱好科技

引爆双11消费新热潮!华为云高性能轻量应用服务器“C位”耀眼

平平无奇爱好科技

和鲸携手暨大经管,为复合型、应用型数据人才培养工作提供最佳实践

ModelWhale

人工智能 数据分析 经管 交叉学科 暨南大学

又一个涵盖前后端+DevOps+OpenAI大模型的高并发项目启动了

冰河

程序员 架构师 即时通讯 项目实战 分布式IM

Real Data地产大数据上线,惠新宸谈链家大数据建设思路_DevOps & 平台工程_雨多田光_InfoQ精选文章