【AICon】探索八个行业创新案例,教你在教育、金融、医疗、法律等领域实践大模型技术! >>> 了解详情
写点什么

公有云运维福利 | 开源监控小工具:Open-Falcon 插件 cloud-mon

  • 2019-04-03
  • 本文字数:1081 字

    阅读完需:约 4 分钟

公有云运维福利 | 开源监控小工具:Open-Falcon插件cloud-mon

背景

当你成为公有云的一名管理员,权限和安全之间的权衡便成为了始终萦绕在我们身边的一个话题。每天在我们专心解决问题,或者 code 的时候,一会儿有人来找你:能不能帮我们看看××× 机器所在的 NAT 网关带宽多大呀?目前使用量是什么情况呀?一会儿有人问:我们在做业务升级,帮我们关注下 LB 的流量情况呀?我们现在 S3 的增长趋势是什么样子的呀?


方案调研

崩溃一秒钟,这种没有“含金量”的事情,怎么能浪费我们的时间呢?毕竟程序员的使命是要拯救地球的,再不济也得做一个优秀的产品。可是,问题来了。机器的监控好做,可以装 Agent、Zabbix、Open-Falcon 等。这些东西怎么监控呢?而且公有云有很多:什么 AWS、Azure 、阿里云、金山云等,自己重新开发一个监控系统么?


额,这个工作量有点大。干活当然得选最简单,高效,又合理的方案啦,哈哈。


小米内部都是用 Open-Falcon 做监控。Open-Falcon 的 GitHub 地址:


https://github.com/open-falcon



Open-Falcon 是基于 Go 开发的一款快速上手、高可用的监控系统,支持自定义 Dashboard 报警,可以用来监控机器各方面指标,还可以自定义插件,上报数据,获取自己想要的信息。


Open-Falcon 是小米早期的开源工具,星星多,社区活跃,还支持插件。恩,显示、存储、画图表、保持数据有序,都交给 TA 了。方案已定,写个 Open-Falcon 插件。

架构设计

说了这么久,先上架构图:



需要支持的云


(1)AWS


(2)阿里云


(3)金山云


监控的资源范围


(1)ELB


(2)EIP


(3)NAT 网关


(4)专线


每个资源都取哪些监控指标呢?当然全部取啦!控制台有啥就取啥。


具体指标信息和含义请自行参照官网:


金山云:https://docs.ksyun.com/documents/42


阿里云:https://help.aliyun.com/product/28572.html?spm=a2c4g.750001.list.212.49707b13EZbdDR


AWS:https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CW_Support_For_AWS.html


代码思路


  • 通过读取配置文件,获取资源类型、监控指标、地区信息和账号信息;

  • 获取相应资源的所有列表;

  • 获取列表的相关监控信息;

  • 生成 Open-Falcon 识别的格式数据,推送到 Open-Falcon。

使用指北

该工具已经作为 Open-Falcon 的插件开源,开源地址:


https://github.com/open-falcon/cloud-mon


具体实现代码以及参考文档可以去 github 查看。


首先把代码 clone 下来,按照你们的实际情况配置文件,就可以使用啦。


配置文件实例:



cloud 下面是一个 list,可以写的很长很长,想配什么配什么。下面是各项参数说明:



至此,小工具分享完啦,希望帮助大家提高效率。


本文转载自公众号“小米运维” (ID: MI-SRE):https://mp.weixin.qq.com/s/IN6MjUesBkuk90tLfpadpA


2019-04-03 16:383124

评论

发布
暂无评论
发现更多内容

智能合约DAPP项目系统开发技术逻辑(dEOM)

I8O28578624

流程的作用是服务于业务,所有不能被用来帮业务部门好好打粮食的流程,都不是好流程!

CTO技术共享

30+亮眼指标,看看2022年嘉为蓝鲸的逆势创新之路!

嘉为蓝鲸

自动化运维 嘉为蓝鲸 2022大事件

CleanMyMac4.12.3中文版如何汉化免费?

茶色酒

CleanMyMac4.12.3

Java踩坑之三目运算符类型转换

lambochen

C++缺省参数:学习成为一名优秀的舔狗

子夜的星

c++ 缺省参数 编程语言、 基础语法

高效学 C++|继承与组合

TiAmo

c++ 编程语言 继承

Redis缓存的主要异常及解决方案

京东科技开发者

数据库 缓存 缓存击穿 Redis 数据结构 企业号 1 月 PK 榜

浅谈区块链项目开发技术(Solidity成熟语言)

I8O28578624

DAPP/去中心化系统开发流程解析方案(成熟理念)分析结果

I8O28578624

MySQL 主从备份实践

lambochen

NFT元宇宙链游游戏项目系统开发技术解析(Demo)

I8O28578624

栉风沐雨 韧性前行 | 2022年九科大事件

九科Ninetech

RPA 超自动化 流程挖掘

流程的价值一,固化业务的最佳实践!

CTO技术共享

深入理解跨域和最佳实践分享

Crazy Urus

面试 前端 HTTP 跨域

人人都在聊的云原生数据库Serverless到底是什么?

华为云开发者联盟

数据库 Serverless 云原生 华为云 GaussDB

嘉为蓝鲸IT服务管理解决方案入选2022广东省政务服务创新解决方案

嘉为蓝鲸

自动化运维 嘉为蓝鲸 IT服务管理中心

CleanMyMac4.12.4最新版本有哪些新功能?

茶色酒

CleanMyMac CleanMyMac X2023

Pipy 0.90.0 发布

Flomesh

多线程并发 Pipy 流量管理

小令动态丨令牌云获中国金融科技·最佳新锐企业奖

令牌云数字身份

创新大赛 金融科技创新

佛萨奇2.0系统开发解析逻辑教程方案(成熟技术)

I8O28578624

启科 QuTrunk+Runtime+QuSaaS+亚马逊云科技量子计算编程实战

亚马逊云科技 (Amazon Web Services)

Python 量子计算 Amazon EC2 Hero 专栏 Amazon Braket

Studio One6永久免费版本下载安装包

茶色酒

Studio One6

【译】5 Different Ways to Create Objects in Java

lambochen

软件测试/测试开发 | 接口自动化测试中,文件上传该如何测试?

测试人

软件测试 自动化测试 接口测试 测试开发 文件上传

谈谈enabled_shared_from_this

SkyFire

c++ 智能指针

什么是NFT链游项目游戏系统开发技术(Demo)采用Solidity 智能合约系统开发方案

I8O28578624

比Postman更懂中国程序员,Apipost真香!

不想敲代码

接口测试 API 研发管理工具

如何让Java编译器帮你写代码

京东科技开发者

后端 编译器 java; 编译器原理 企业号 1 月 PK 榜

编译期多态

SkyFire

c++ 多态

在可观测性的启蒙与初试探--快速实现根因分析/业务大盘

Yestodorrow

架构 监控 可观测性

公有云运维福利 | 开源监控小工具:Open-Falcon插件cloud-mon_软件工程_小米运维_InfoQ精选文章