写点什么

京东 618 实时数据大屏核心技术解密

  • 2021-06-30
  • 本文字数:898 字

    阅读完需:约 3 分钟

京东618实时数据大屏核心技术解密

一、背景

刚过去的 618,京东销量 GMV 超 3000 亿。


(1)从用户在京东 app、小程序、网页端下单、支付,到最终大屏上 GMV 和订单量实时累加,这中间究竟发生了什么呢?

(2)如何才能做到,用户下单,大屏上能够实时统计呢?

(3)从用户下单,到最终支付完成,后来又取消了这笔订单,大屏上 GMV 和订单量的总值如何做到既要保证极高的时效性,又要保证较高的准确性呢?



二、系统整体架构

(1)业务流程梳理:

用户在京东上购物,可能会经过以下几种流程,用户下单、支付订单、取消订单、订单拆单(由于商品在不同的仓库等原因)


(2)大屏整体系统架构

从线上 mysql binlog、日志、MQ 消息接入(线上数据),存储在 JDQ、JMQ 当中(数据存储层),通过实时计算组件 Flink、Storm 等进行实时计算,关联维表数据以及调用线上接口服务 JSF 进行维度信息关联(实时计算层),最后将计算指标存储在 redis、mysql 中,或者将明细数据写入 OLAP 当中(数据指标层)。最后对外提供服务或者应用,包括:大屏、看板、销量榜单排行等等。

系统整体架构图参照下图:


(3)实际线上业务遇到的问题

a、数据倾斜、redis 数据热点?

redis 探针解决数据热点问题,对热点 key 进行 hash

b、如果做到精确一次?

采用幂等来进行保证一次的。

c、Flink 背压、Flink 调优

增加并发度、优化程序代码、调整 slot、避免频繁调线上 JSF 服务增加缓存

d、数据延迟(订单取消比订单下单先到达)

将所有消息进行存储 JDHBase,进行关联,构造宽表,下游业务进行判断

e、高可用保障

主备集群,异地容灾

f、数据质量、数据准确性保障

数据质量告警配置、离线实时数据校验

g、大促压测

h、监控、告警

任务失败监控、消息挤压的监控

m、高时效性

Flink 低延迟计算引擎

(4)数据大屏可视化

目前现有的数据可视化大屏解决方案有:阿里云(DataV)、网易有数(EasyScreen)、腾讯云(腾讯云图)、百度 Sugar、京东城市莫奈可视化平台


三、总结

本文讲述了京东 618 实时数据大屏,从用户下单到最终大屏指标计算,呈现给用户。对当中整个流程进行了详细的阐述,以及在开发过程中遇到的问题也进行详细的描述。希望能给搭建大屏的读者提供一个思路。


作者简介

诸葛子房,曾供职于京东,现就职于 BAT,在大数据领域有多年实践经验,欢迎加微信:zhugezifang001 交流

2021-06-30 17:075547

评论 2 条评论

发布
暂无评论
发现更多内容

开源免费!敲敲云APaaS零代码平台,做轻流/明道本地化的平替产品

JEECG低代码

零代码 无代码平台 流程引擎 敲敲云 表单引擎

配电 低压电工经验总结(11)

万里无云万里天

工业 工厂运维

设备点检 设备维护经验总结(2)

万里无云万里天

工业 设备维护 工厂运维 设备点检

法国农业部如何利用Elastic技术监控商业捕鱼业

qife122

数据分析 Elastic技术

Databend 向量索引:加速 AI 应用的数据引擎

Databend

别再靠加人提效了!天润融通AI训练师正在重构客户服务模式

天润融通

从零开始学MCP(1)| MCP 协议核心原理解析

测吧(北京)科技有限公司

人工智能 MCP

华为元服务“服务商”生态加速计划正式启动,共拓服务分发新蓝海

新消费日报

Dify入门篇(4)| 初识 Dify 控制台:工作区与应用管理逻辑

测吧(北京)科技有限公司

深度学习为何有效及其局限性解析

qife122

机器学习 深度学习

如何轻松编写Rootkit:Linux内核系统调用拦截技术解析

qife122

Linux内核 漏洞挖掘

计算机视觉构建地球数字孪生体

qife122

计算机视觉 卫星遥感

全球客服行业集体紧张,GPT-5带来的3个颠覆你不可不知

天润融通

体验为王时代,天润融通助力台铃以服务撬动品牌长期价值

天润融通

工业管理 项目管理经验总结(1)

万里无云万里天

项目管理 工厂运维

设备点检 设备维护经验总结(1)

万里无云万里天

项目管理 工业 工厂运维

公链开发竞争白热化:如何设计下一代高性能、可扩展的区块链基础设施?

区块链软件开发推广运营

交易所开发 dapp开发 链游开发 公链开发 公链开发代币开发

用“数”创新,聚“数”赋能!中石大携手和鲸主办 2025 年青岛市公共数据创新应用大赛圆满落幕!

ModelWhale

中国石油大学 和鲸 公共数据创新应用大赛

直播预告 | 破解能源转型痛点!全链路可观测如何助力能源业高质量发展?

博睿数据

基于OpenHarmony的Nexus_Geometry_Nano_Board亮灯实验

华为云开发者联盟

龙蜥邀您参加 AICon 全球人工智能开发与应用大会,探索 AI 应用边界

OpenAnolis小助手

AI 操作系统 龙蜥社区

夜莺监控的几种架构模式详解

巴辉特

Prometheus 夜莺监控 Victoriametrics

数智先锋 | 告别运维黑盒!豪鹏科技×Bonree ONE构建全栈智能可观测体系

博睿数据

微软SharePoint五重漏洞剖析:ToolShell攻击链技术内幕

qife122

漏洞分析 零日漏洞 反序列化漏洞

基于扩散先验的自适应多模态蛋白质即插即用框架

qife122

机器学习 扩散模型

Dify入门篇(4)| 初识 Dify 控制台:工作区与应用管理逻辑

测吧(北京)科技有限公司

人工智能

Databend 向量索引:加速 AI 应用的数据引擎

Databend

征程 6 | 自定义查表算子实现量化部署

地平线开发者

自动驾驶 算法工具链 地平线征程6

PPT文件怎么添加视频?3个PPT高级技巧盘点!

职场工具箱

效率工具 PPT 办公软件 AI生成PPT

深度学习如何优化某中心包装减废方案

qife122

自然语言处理 深度学习

在AI技术快速落地的时代,挖掘数据库连接工具的真实需求——某知名MySQL协议框架需求洞察

qife122

需求分析 AI辅助开发

京东618实时数据大屏核心技术解密_服务革新_诸葛子房_InfoQ精选文章