写点什么

高可用分布式流数据存储设计

2019 年 8 月 06 日

高可用分布式流数据存储设计

QCon北京2019大会上,李玥讲师做了《高可用分布式流数据存储设计》主题演讲,主要内容如下。


演讲简介


每天,超过千亿交易相关的数据在京东数千个系统中高速流转。实现数据流在超大规模集群系统之间高性能流转同时,确保数据的高可靠、高可用、一致性对京东的消息中间件系统是一项艰巨的技术挑战。


高性能、高可用、高可靠的流数据存储提供数据持久化能力,是未来分布式计算不可或缺的基础设施之一。其不仅用于构建分布式消息中间件,在诸多计算场景中均有广泛的应用:


  1. 结合流计算框架构建下一代存储计算分离的可靠流计算应用;

  2. 大数据系统中构建可靠的 Connector,用于连接数据源和大数据应用以及大数据应用之间的数据互联;

  3. 用于海量日志和监控数据的存储;

  4. 通过 Binlog 复制实现各类数据库和存储类系统的高可用架构。


本次演讲的主要介绍了京东高可用分布式流数据存储系统的架构,内容涵盖:


  1. 流数据存储集群的高可用架构设计;

  2. 数据强一致性保证:改进于 Raft 的流数据选举和复制机制;

  3. 理解数据流的特性和针对性性能优化手段。


听众收益


  1. 如何利用流数据存储构建高可靠分布式应用;

  2. 基于 Raft 设计去中心化、强一致分布式系统的要点;

  3. 使用 CAS 原语替代锁实现单节点百万级 TPS 的设计思路;

  4. 高性能流数据存储设计中的 IO 优化思路和最佳实践。


讲师介绍


李玥


京东集团 中台技术架构部资深架构师


李玥,京东集团中台技术架构部资深架构师。负责主导设计新一代京东消息中间件系统,专注于流数据的一致性分发和可靠存储,分布式实时计算、高可用分布式系统架构等技术领域。从事互联网研发、架构 10 余年,曾在浪潮集团、当当网等公司任职架构师相关工作。2017 年加入京东,期间提升京东商城相关系统的性能和吞吐量数倍。目前致力于推进京东基础架构技术的创新、对外赋能与开源。












完整演讲 PPT 下载链接


https://qcon.infoq.cn/2019/beijing/schedule


2019 年 8 月 06 日 08:005471

评论

发布
暂无评论
  • 膜拜!京东 T9 大牛沉淀三年终于整理出了这份架构核心修炼之道

    本书的主书名叫作“架构修炼之道",当提到“道”的时候,我们通常会想起孔子、孟子,或者想起国外一些“大神”写的技术书籍,因此使用该书名可谓十分大胆。但实际想来,“实践是检验真理的唯一标准”,本书中的“道",就是被检验过的真理、道理,是最普通、最

    2020 年 9 月 2 日

  • 浅谈 Kafka Streams 在实时跟踪和监控系统中的应用

    演讲嘉宾粟海,PaloAlto Networks 高级研发经理内容介绍结合在Palo Alto Networks Wildfire云服务系统开发和运维中的一些痛点,来讲述如何运用流技术来设计和打造一个实时跟踪和监控系统。如何进行技术选型,如何使用流技术(Kafka Streams)来计算和统计基于业务逻辑的系统运行状况,使用Elasticsearch来存储数据和查询历史数据,并通过定制化界面以及通用图形报表系统Grafana来展示实时统计数据和个体处理单元的跟踪结果。 讨论将来如何通过机器学习技术结合实时跟踪和监控系统来使整个运维系统智能化,减轻运维压力,快速定位和隔离故障节点,保证整体系统的高可用性。

    2018 年 11 月 9 日

  • week06 学习总结

    本周主要学习了nosql/分布式一致两部分内容。

    2020 年 7 月 15 日

  • 电商 IM 消息系统架构演进

    基于反应式架构理念,构建高并发、高可靠、容错性等特点支撑亿级用户百亿消息分发规模的消息产品,奠定了电商消息业务自运营阵地。讲师简介现任阿里巴巴高级技术专家,长期从事移动BOSS系统、移动PCRF策略与计费规则系统和大型互联网产品架构研发工作,先后在亚信科技、甲骨文、阿里巴巴等企业就职,2014年加入淘宝,主导电商内容平台、电商IM消息系统架构设计和系统落地,在后端架构设计、性能优化、稳定性保障方面有非常好的积累和口碑,在业务系统可靠性保障方面有丰富的实战经验。 获得第四届中间件性能挑战赛冠军,以及基于Facebook-GraphQL规范产出淘宝的数据聚合产品TQL。

    2020 年 1 月 3 日

  • LeetCode 题解:94. 二叉树的中序遍历,递归,JavaScript,详细注释

    原题链接:https://leetcode-cn.com/problems/binary-tree-inorder-traversal/

    2020 年 9 月 20 日

  • 架构师训练营 -- 第七周作业

    性能压测的时候,随着并发压力的增加,系统响应时间和吞吐量如何变化,为什么?

    2020 年 7 月 22 日

  • 网络模型及性能优化

    网络模型及性能优化

    2020 年 11 月 15 日

  • Week05 总结

    总结

    2020 年 9 月 24 日

  • 架构 week2 学习总结

    本周主要讲设计模式

    2020 年 6 月 17 日

  • 架构师训练营第 1 期 week7 总结

    1、性能测试:性能测试是性能优化结果的检查和度量标准,不同视角下,衡量标准不一样,主观视角:用户感受到的性能,客观视角:性能指标衡量的性能。

    2020 年 11 月 8 日

  • LeetCode 题解:206. 反转链表,双指针,JavaScript,详细注释

    原题链接:https://leetcode-cn.com/problems/reverse-linked-list/

    2020 年 9 月 15 日

  • 构建灵活可靠的消费金融大规模分布式系统

    演讲嘉宾李远鑫,中邮消费金融有限公司 IT运营部 总经理助理 & 架构师内容介绍消费金融是近年来新兴的热门行业,市场广阔、需求量大、行业竞 争激烈。为了突破传统金融行业限制,建立一套灵活、高效、可靠的消费金融 系统,支持互联网环境下高并发访问、可靠资金交易、交互式场景化的需求,我们从基于集中式商业中间件搭建的传统信贷系统,演进为基于微服务、分布式、灵活快速迭代的互联网消费金融系统。本次演讲重点从服务化和容器化演进的角度来阐述中邮消费金融系统的演进过程,包括服务化演进、分布式技术平台的搭建、微服务集成及容器化演进。内容大纲 消费金融行业和业务模式简介; 从集中式商业中间件的架构到微服务架构的演进: 应用架构演进:烟囱式架构演进为“大中台、小前端”的共享服务架构; 搭建分布式技术平台中关键的技术,包括服务调用框架,消息中间件,分布式事务处理等; 微服务集成和容器化演进:微服务在线化,以及事件驱动的协同的集成方式,基于容器技术的微服务编排和部署,业务数据稽核确保金融交易账务准确性。 未来的发展方向:去中心化、基于区块链的消费金融信用认证体系。

    2019 年 1 月 2 日

  • CAP 定理的理解

    CAP 定理(CAP theorem)又被称作布鲁尔定理(Brewer's theorem),是加州大学伯克利分校的计算机科学家埃里克·布鲁尔(Eric Brewer)在 2000 年的 ACM PODC 上提出的一个猜想。2002 年,麻省理工学院的赛斯·吉尔伯特(Seth Gilbert)和南希·林奇(Nancy

    2020 年 7 月 16 日

  • 分布式数据存储系统之三要素:顾客、导购与货架

    顾客、导购和货架组成了分布式存储系统的三要素,分别对应着分布式领域中的数据生产者/消费者、数据索引和数据存储。

    2019 年 11 月 20 日

  • OOA-OOD:面向对象分析 / 设计练习

    面向对象分析/设计练习--week2

    2020 年 9 月 27 日

  • 云南区块链电子发票全面推广啦!

    区块链电子发票通过将发票相关信息上链,对发票从开具到报销的过程实现全流程管理,每一张发票都可以做到可查,可验,可信,可追溯。

    2020 年 12 月 16 日

  • 分布式计算模式之 Stream:一门背锅的艺术

    我与你介绍了流计算的工作原理,并分析了Storm的核心组件,以加深你对流计算的理解。

    2019 年 10 月 28 日

  • 架构师训练营第二周总结

    学了软设的大则手结软设计式系学了何行向象程

    2020 年 6 月 17 日

  • 如何实现中台服务化编排?

    2019年初到现在,我们经常听到的一个词就是“中台”,中台之中有两个关键特性就是能力复用和灵活多变,灵活多变之中包括了服务编排和插件扩展点,那服务编排又是什么呢?有哪些开源的框架可供选择呢?能否基于这些开源框架做二次封装呢?讲师介绍程超,北京多来点有限公司高级架构师,阿里云MVP、CSDN博主专家。有14年Java研发经验,8年技术管理和架构经验,熟悉支付和电商领域,擅长微服务生态建设和运维监控,对Dubbo、Spring Cloud和gRPC等微服务框架有深入研究,并应用于项目中,帮助过多家公司进行过微服务建设和改造。目前在致力于公司业务中台建设。合著作品《深入分布式缓存》和《高可用可伸缩微服务架构》。

    2020 年 1 月 7 日

  • week04 总结

    构人多,术先没然系wk团规不,网规大技没多fany全用众,ii影力超数似其公。司存“架构”是为达业目,构的用是要达成这目,着语,术没要架面都工,至H也好。

    2020 年 6 月 30 日

发现更多内容

第八周作业

赵龙

设计过度有时比设计不足更可怕

菜根老谭

架构思维 过度设计 演化思维 设计不足

架构师训练营第8周

大丁💸💵💴💶🚀🐟

shell实现SSH自动登陆

阿呦,简笔话_Golden

Week 08 命题作业

Jeremy

扎克伯格:从程序员到福布斯全球首富,他经历了什么?

北柯

你好,工作!

小天同学

工作 心态 自我思考

保障服务稳定之服务限流

X先生

架构设计 服务设计 后端开发 限流算法

架构师训练营第八章总结

itrickzhang

敏捷开发:影响地图工作坊的反思

华为云开发者社区

敏捷开发 业务线 需求管理 需求 华为云

面试官问:如何设计一个安全的对外接口?

Java小咖秀

Java 面试 经验

NameNode和SecondaryNameNode工作机制

古月木易

NameNode econdaryNameNode

第八周总结

andy

极客大学

域名凭什么能卖出亿元高价?

北柯

创业 互联网 域名解析

产品、方案、生态三力齐发 英特尔驱动智能边缘价值迸发

飞天鱼2017

天天用SpringBoot,它的自动装配你能说出来吗?

java金融

Java spring springboot 自动装配 EnableAutoConfiguration

面经手册 · 开篇《面试官都问我啥》

小傅哥

面试题 Java 面试 面试经验 面试官

一周信创舆情观察(7.20~7.26)

统小信uos

架构训练营第八周作业

张锐

架构师训练营 - 第八周 - 学习总结

stardust20

英特尔®边缘软件中心重磅发布 一站式资源供给为应用开发创新赋能

飞天鱼2017

世界上最狠的语言

十三

Java开发Spark ELT实践(一)

团子粑粑

大数据 Apache Spark

Week 08 学习总结

Jeremy

NameNode和SecondaryNameNode工作机制

奈学教育

NameNode

第八周作业

andy

极客大学

第八周学习总结

赵龙

架构师训练营 -- 第八周作业

stardust20

行为型模式:迭代器模式解析

七哥爱编程

Java 编程 程序员 设计模式 迭代器模式

架构师训练营第八章作业

itrickzhang

JVM详解之:汇编角度理解本地变量的生命周期

程序那些事

Java JVM 汇编 生命周期

NLP领域的2020年大事记及2021展望

NLP领域的2020年大事记及2021展望

高可用分布式流数据存储设计-InfoQ