搭建大规模高性能的时间序列大数据平台

阅读数:63 2019 年 9 月 14 日 16:52

搭建大规模高性能的时间序列大数据平台

ArchSummit 深圳 2018 大会上,孟晓桥讲师做了《搭建大规模高性能的时间序列大数据平台》主题演讲,主要内容如下。

演讲简介

基于时间序列的大数据平台是现代智能监控系统的核心。当系统的规模达到一定量级时,构建基于时间序列的大数据平台需要解决四个挑战:高数据吞吐量,数据查询的高度实时性,成本控制和用户对系统的滥用导致的对系统稳定性的挑战。在演讲中,我将分享 Pinterest 监控组应对这四个挑战的经验。

演讲提纲

  • 介绍基于时间序列的大数据平台的应用

  • 时间序列的大数据平台的基本架构

  • 四个挑战以及应对方法:

    a. 高数据吞吐量 - 预处理,压缩,过滤

    b. 数据查询的高度实时性 - 数据降维,缓冲,全内存数据库

    c. 成本控制 - 基于数据使用记录的智能数据差异化处理

    d. 用户对系统的滥用导致对系统稳定性的挑战 - 对数据写和读的实时建模和监控

  • 总结

听众受益

  • 从事监控的参会者能了解时间序列数据平台的系统框架和可能遇到的实际问题;
  • 分享的四个挑战和应对方法也适用于很多大规模实时的数据平台,希望对从事大数据的参会者也有所启发。

讲师介绍

孟晓桥

Pinterest 监控组经理

现任美国 Pinterest 公司监控组经理。自 2006 年于美国加州大学洛杉矶分校计算机系获得博士学位后,先后在 NEC 北美研究所和 IBM 沃特森研究院任资深研究员。孟晓桥在云计算和计算机网络领域深耕 15 年,发表了 50 余篇学术论文和 10 余项美国专利。近三年以来,带领 Pinterest 公司监控组开发和运维着多套监控系统,保障了公司云计算平台的稳定和高性能。

搭建大规模高性能的时间序列大数据平台

搭建大规模高性能的时间序列大数据平台

搭建大规模高性能的时间序列大数据平台

搭建大规模高性能的时间序列大数据平台

搭建大规模高性能的时间序列大数据平台

搭建大规模高性能的时间序列大数据平台

搭建大规模高性能的时间序列大数据平台

搭建大规模高性能的时间序列大数据平台

搭建大规模高性能的时间序列大数据平台

搭建大规模高性能的时间序列大数据平台

完整演讲 PPT 下载链接

https://archsummit.infoq.cn/2018/shenzhen/schedule

评论

发布