支撑百亿请求的微博广告运维技术实践

阅读数:65 2019 年 9 月 24 日 15:07

支撑百亿请求的微博广告运维技术实践

CNUTCon 上海 2018 大会上,朱伟讲师做了《支撑百亿请求的微博广告运维技术实践》主题演讲,主要内容如下。

演讲简介

随着微博广告业务的迅速发展,相关的监控报警、自动化运维等基数设施也越来越重要。无论是代码的快速迭代,还是故障的迅速定位,我们都需要通过运维体系的建设去不断提高我们的效率,去优化我们的系统,而带给我们的就是系统可用性的提高以及服务质量的保证,从而避免广告收入的损失。

本次分享将为大家带来微博广告 SRE 体系的建设之路,以及在微博广告复杂的业务场景下,我们在监控报警、自动化、服务治理等方面遇到的困难以及解决方案。

主要内容:

  1. 运维在广告体系中的价值
    • 运维体系发展阶段
    • SRE 在微博广告中的价值
  2. 海量指标监控平台 Oops 实践
    • 自动化采集
    • 配置化清洗
    • 实时指标仓库
    • 指标可视化
  3. 复杂业务场景下的 SRE 建设之路
    • 服务治理
    • 有效的报警
    • 全链路 Trace 系统
    • 自动化运维平台 Kunkka 揭秘

听众收益

  1. 如何在我们的业务中体现 SRE 的价值;
  2. 复杂业务场景下如何提高系统可用性,减少收入损失;
  3. 海量监控指标下,如何基于开源组件快速构建一个监控平台。

讲师介绍

朱伟

新浪微博广告 SRE 团队技术负责人,高级产品运维工程师

16 年加入微博,主要负责微博广告监控报警、运维自动化、服务治理等工作。

支撑百亿请求的微博广告运维技术实践

支撑百亿请求的微博广告运维技术实践

支撑百亿请求的微博广告运维技术实践

支撑百亿请求的微博广告运维技术实践

支撑百亿请求的微博广告运维技术实践

支撑百亿请求的微博广告运维技术实践

支撑百亿请求的微博广告运维技术实践

支撑百亿请求的微博广告运维技术实践

支撑百亿请求的微博广告运维技术实践

支撑百亿请求的微博广告运维技术实践

完整演讲 PPT 下载链接

https://cnutcon.infoq.cn/2018/shanghai/#schedule

评论

发布