
在QCon北京2018大会上,Julius Volz 讲师做了《Prometheus 监控系统最佳实践与常见陷阱(英文演讲)》主题演讲,主要内容如下。
演讲简介:
Prometheus 是一款开源的监控报警系统和时间序列数据库。越来越多的公司选择该系统进行运维监控。
本次演讲将从埋点、报警和查询几个方面入手,分享 Prometheus 的最佳实践和常见陷阱。
讲师介绍:
Julius Volz
Prometheus 监控系统创始人之一
Julius 是 Prometheus 的创始人之一,参与开发了很多核心组件。
Prometheus 是一款开源的监控系统和时序数据库。
Julius 在 SoundCloud 领导团队成功部署了 Prometheus。在此之前,曾在 Google 担任网站可靠性工程师(Site Reliability Engineer,SRE)。
 
  
  
  
  
  
  
  
  
  
 完整演讲 PPT 下载链接:
https://qcon.infoq.cn/2018/beijing/schedule
更多内容推荐
- 1. 监控系统的意义与 Prometheus 概述- 2023-09-27 
- 监控治理有效性评价体系- 当一个中大型互联网公司,每天由监控系统发出大量报警,而故障却始终无法及时发现的时候,如何能够快速找到问题的根源,如何改进,以及如何度量改进的效果,这一系列的问题就会摆在大家面前,本文基于作者在多家公司的监控治理经验,从评价体系角度出发,整理 - 2022-02-08 
- 12. 架构治理分析—熔断降级监控- 2023-09-30 
- #滴滴夜莺# Nightingale & Prometheus- 对于公司的运维&监控体系来说,通常都是用Prometheus全家桶,然后公司内部开发自己的告警体系。 - 2021-03-01 
- Prometheus Exporter (二十三)Slurm Exporter- 本文已经收录在 Prometheus 合集 Prometheus 都可以采集那些指标?-- 常用 Exporter 合集 中。 - 2021-12-11 
- 7. 案例分享:通过 Ingress 和 Service 完成一个网络拓扑- 2023-09-26 
- 09 Prometheus 之可靠性及可扩展性- 2022-01-09 
- 13. 心理健康为何成为招聘中的重要指标?- 2023-10-17 
- 3. 指标查询与告警- 2023-09-27 
- 07 Prometheus 之服务发现- 2022-01-07 
- prometheus 介绍与安装- Prometheus 是由 SoundCloud 开源监控告警解决方案,从 2012 年开始编写代码,再到 2015 年 github 上开源以来,已经吸引了 31.5k+ 关注,以及很多大公司的使用;2016 年 Prometheus 成为继 k8s 后,第二名 CNCF(Cloud Native Computing Foundation - 2021-08-08 
- AlertManager 告警发送频率探究- 说到云原生监控,就不得不提 Prometheus和它的搭档 AlertManager。 本文尝试说清楚以下几个问题。 - alert和alert notification各自长什么样子 - alert如何触发以及Prometheus发送alert的频率是什么 - AlertManager发送notification的频率是什么 - 2021-08-10 
- Prometeus 2.31.0 新特性- Prometheus 2.31.0 现在(2021.11.02)已经发布,在上个月的 2.30.0 之后又进行了很多的修复和改进。 - 2021-11-15 
- 基于 Prometheus 的高可用 Redis 多实例监控实践- 因为原生的Prometheus上几乎都是单点的部署,不足以保证数据的可靠性,为此我们通过开发服务注册的方式来实现Prometheus的高可用性。 
- Prometheus 发布 LTS 长期支持版本啦- 最近翻看 Prometheus 的发布记录,发现在 2022.07.14 发布了新的版本 v2.37.0 ,这个版本的新特性更新和 BUG 修复我们下篇文章再讲,这个版本和其他版本有一个最大的不同,那就是这个版本是 Prometheus 的第一个 LTS 版本。 - 2022-07-19 
- 监控之美——监控系统选型分析及误区探讨- 本文摘自于朱政科撰写的《Prometheus 云原生监控:运维与开发实战》,重点介绍了在监控系统选型中应该考虑的问题。 - 2020-12-01 
- Prometeus 2.32.0 新特性- Prometheus 2.32.0 现在(2021.12.09)已经发布,在上个月的 2.31.0 之后又进行了很多的修复和改进。 - 2021-12-22 
- Prometheus Exporter (十六)Microsoft SQL Server Exporter- 本文已经收录在 Prometheus 合集 Prometheus 都可以采集那些指标?-- 常用 Exporter 合集 中。 - 2021-12-04 
- 21. 基于公司目标和指标的分解- 2023-10-17 
- 【21-6】PushGateway 快速上手- Prometheus 的 Pushgateway 允许临时和批处理作业向Prometheus公开它们的度量。由于这些类型的作业可能存在的时间不够长,因此它们可以将它们的指标推到Pushgateway。然后Pushgateway将这些度量标准暴露给普罗米修斯。 - 2021-06-13 
推荐阅读
- 第 30 讲 详解恒大足球队奖金制度 考核指标很重要- 2023-10-17 
- 03. 制定销售手册第一步:公司介绍。为何公司有实力,销量却上不去?- 2023-10-17 
- 46. 制作与竞争对手各项指标对比图- 2023-10-17 
- prometheus 架构介绍及部署使用- 2023-04-02 
- Grafana 9 在警报和用户体验方面带来巨大改进
- 【云原生•监控】基于 Prometheus 的云原生集群监控 (理论 + 实践)-01- 2023-12-12 
- 软件测试 | 普罗米修斯 - HTTP API 调用 PromQL- 2023-03-01 
电子书

大厂实战PPT下载
换一换 
郭耀星(雪尧) | 阿里巴巴 技术专家
张颖峰 | 英飞流(上海)信息科技有限公司 联合创始人
谭奎 | 腾讯 云架构平台部/高级研发工程师






 
    
评论