写点什么

Collectd 的 Amazon CloudWatch 插件

  • 2019-11-12
  • 本文字数:3554 字

    阅读完需:约 12 分钟

Collectd的Amazon CloudWatch插件

原文:https://aws.amazon.com/blogs/aws/new-cloudwatch-plugin-for-collectd/


作者:Jeff Barr




我在 2011 年已介绍过 Cloud Watch 的特性,“您可以在 Cloud Watch 中查看图表、设置告警、并根据这些指标启动自动化操作,所使用的这些 AWS 资源指标会被存储于 Cloud Watch 中 。”您目前已有能力在Amazon Cloud Watch中存储一段时间范围内的业务、应用及系统的指标数据(参阅“Amazon Cloud Watch定制新指标”了解更多信息)。


今天我们将简化系统统计信息的采集过程,使用一个新的 CloudWatch plug for colletd将采集数据发送至 CloudWatch 中 。并通过collectd 多种类型信息的统计采集能力与 cloudwatch 存储、展示、警报和告警的功能的整合,您可以更好地获取 EC2 实例、本地硬件以及运行于其上应用程序的运行状态及其性能信息。该插件已经作为一个开源项目发布,我们期待您的反馈。


Collectd 守护进程采用 C 语言编写,具有高性能和可移植性。它支持上百个插件 ,允许您收集有关ApacheNginx Web 服务器性能统计数据、memory usage uptime等信息。

安装与配置

为了演示这些功能,我在 EC2 实例上安装并配置了 Collectd 服务及新 Cloudwatch 插件。


首先我创建了一条 IAM 策略,它具备将指标数据写入 CloudWatch 的权限:



然后我创建了一个 IAM 角色,允许 EC2(运行 collectd 程序的实例)使用上述所建的策略:



如果我计划使用 Collectd 插件从本地服务器或运行中的 EC2 实例收集统计信息,那请跳过这些步骤,采用创建一个具有适当权限的 IAM 用户作为替代方法。在我完成上述工作后,会将该用户的证书放在本地服务器或 EC2 实例中。


在策略和角色配置完毕后,选择该角色来启动一个 EC2 实例



登录并安装 Collectd :


Bash


$ sudo yum -y install collectd
复制代码


然后获取插件和安装脚本,设置脚本为可执行,并运行该脚本:


Bash


$ chmod a+x setup.py
$ sudo ./setup.py
复制代码


回答一些交互问题确认安装过程无误,在完成配置之后就可启动 Collectd :


Bash


Installing dependencies ... OK
Installing python dependencies ... OK
Copying plugin tar file ... OK
Extracting plugin ... OK
Moving to collectd plugins directory ... OK
Copying CloudWatch plugin include file ... OK
Choose AWS region for published metrics:
1. Automatic [us-east-1]
2. Custom
Enter choice [1]: 1
Choose hostname for published metrics:
1. EC2 instance id [i-057d2ed2260c3e251]
2. Custom
Enter choice [1]: 1
Choose authentication method:
1. IAM Role [Collectd_PutMetricData]
2. IAM User
Enter choice [1]: 1
Choose how to install CloudWatch plugin in collectd:
1. Do not modify existing collectd configuration
2. Add plugin to the existing configuration
Enter choice [2]: 2
Plugin configuration written successfully.
Stopping collectd process ... NOT OK
Starting collectd process ... OK
$
复制代码


在 Collectd 运行并且插件安装配置完成后,下一步是确定感兴趣的统计信息,并配置插件将它们发布至 CloudWatch 中(每个指标的采集成本也是一个需考虑因素)。


文件/opt/collectd-plugins/cloudwatch/config/blocked_metrics 包含已收集但尚未发布到 CloudWatch 的指标列表:


Bash


$ cat /opt/collectd-plugins/cloudwatch/config/blocked_metrics
# This file is automatically generated - do not modify this file.
# Use this file to find metrics to be added to the whitelist file instead.
cpu-0-cpu-user
cpu-0-cpu-nice
cpu-0-cpu-system
cpu-0-cpu-idle
cpu-0-cpu-wait
cpu-0-cpu-interrupt
cpu-0-cpu-softirq
cpu-0-cpu-steal
interface-lo-if_octets-
interface-lo-if_packets-
interface-lo-if_errors-
interface-eth0-if_octets-
interface-eth0-if_packets-
interface-eth0-if_errors-
memory--memory-used
load--load-
memory--memory-buffered
memory--memory-cached
复制代码


如您对内存消耗关注,可添加了一行到


/opt/collectd-plugins/cloudwatch/config/whitelist.conf


Bash


memory--memory-.*
复制代码


Collectd 配置文件(/etc/collectd.conf)中包含 Collectd 附加设置及插件设置。不需要做任何修改。


重新启动 Collectd,以便所做的调整生效:


Bash


$ sudo service collectd restart
复制代码


为了模拟内存消耗,可执行了一些消耗内存的程序,然后打开 CloudWatch Console 来查找并显示自定义指标:



该截图包括了对 CloudWatch 控制台即将推出增强功能的预览;如果看起来不一致也不必担心(请关注获取更多信息)。


如果监控一个生产实例,您还可以安装更多 Collectd 插件。以下是 Amazon Linux AMI 可用插件列表:


Bash


$ sudo yum list | grep collectdcollectd.x86_64                        5.4.1-1.11.amzn1               @amzn-main
collectd-amqp.x86_64 5.4.1-1.11.amzn1 amzn-main
collectd-apache.x86_64 5.4.1-1.11.amzn1 amzn-main
collectd-bind.x86_64 5.4.1-1.11.amzn1 amzn-main
collectd-curl.x86_64 5.4.1-1.11.amzn1 amzn-main
collectd-curl_xml.x86_64 5.4.1-1.11.amzn1 amzn-main
collectd-dbi.x86_64 5.4.1-1.11.amzn1 amzn-main
collectd-dns.x86_64 5.4.1-1.11.amzn1 amzn-main
collectd-email.x86_64 5.4.1-1.11.amzn1 amzn-main
collectd-generic-jmx.x86_64 5.4.1-1.11.amzn1 amzn-main
collectd-gmond.x86_64 5.4.1-1.11.amzn1 amzn-main
collectd-ipmi.x86_64 5.4.1-1.11.amzn1 amzn-main
collectd-iptables.x86_64 5.4.1-1.11.amzn1 amzn-main
collectd-ipvs.x86_64 5.4.1-1.11.amzn1 amzn-main
collectd-java.x86_64 5.4.1-1.11.amzn1 amzn-main
collectd-lvm.x86_64 5.4.1-1.11.amzn1 amzn-main
collectd-memcachec.x86_64 5.4.1-1.11.amzn1 amzn-main
collectd-mysql.x86_64 5.4.1-1.11.amzn1 amzn-main
collectd-netlink.x86_64 5.4.1-1.11.amzn1 amzn-main
collectd-nginx.x86_64 5.4.1-1.11.amzn1 amzn-main
collectd-notify_email.x86_64 5.4.1-1.11.amzn1 amzn-main
collectd-postgresql.x86_64 5.4.1-1.11.amzn1 amzn-main
collectd-rrdcached.x86_64 5.4.1-1.11.amzn1 amzn-main
collectd-rrdtool.x86_64 5.4.1-1.11.amzn1 amzn-main
collectd-snmp.x86_64 5.4.1-1.11.amzn1 amzn-main
collectd-varnish.x86_64 5.4.1-1.11.amzn1 amzn-main
collectd-web.x86_64 5.4.1-1.11.amzn1 amzn-main
复制代码

需了解事项

如果您使用的是 5.5 或更新版本的 Collectd ,则会在默认情况下发布四个指标:


  • df-root-percent_bytes-used – disk utilization

  • memory–percent-used – memory utilization

  • swap–percent-used – swap utilization

  • cpu–percent-active – cpu utilization


如果您不希望发布它们,您可以从 whitelist.conf 文件中删除这些指标。


在 Amazon Linux AMI,Ubuntu,RHEL 和 CentOS 的软件仓库中,目前提供了较旧版本的 Collectd; 如果从源代码或自定义 repo 进行构建安装,请注意默认行为的变化。

更多

除了本次所展示的内容外, 您可以安装更多的插件,然后配置 whitelist.conf 来向 CloudWatch 发布更多的指标。同时您可以创建CloudWatch警报 ,自定义仪表盘等。


要开始使用,请访问AWS Lab on GitHub,并下载collectd plugin for CloudWatch


译者介绍



倪晓峻,AWS 专业服务顾问,负责基于 AWS 云计算项目的咨询和设计,具有超过十五年以上企业客户服务经验,致力于 AWS 服务在国内和全球的项目实施。在企业级解决方案,混合云架构,运营集成等领域有着广泛的设计与实践经验。在加入 AWS 之前曾任职 VMware;HPE 专业服务顾问,从事云计算/虚拟化架构设计及运维咨询工作,两次获得省部级科技进步奖励,参与 OGC ITIL V3 中文版的审定工作 。


本文转载自 AWS 技术博客。


原文链接:


https://amazonaws-china.com/cn/blogs/china/new-cloudwatch-plugin-for-collectd/


2019-11-12 08:00794

评论

发布
暂无评论
发现更多内容

数字化转型有可能让所有人满意吗?

优秀

数字化转型

EMI 滤波电路是由哪些元件组成的,一文看懂!

元器件秋姐

元器件采购 元器件电商 EMI滤波电路 滤波电路 元器件知识

构建高质量的持续交付体系

老张

软件工程 持续交付

浅谈MVC、MVP、MVVM框架模式

闫同学

mvc MVP MVVM 11月月更 框架模式

Java Web(九)会话跟踪技术

浅辄

javaWeb session Cookie 11月月更

从HelloWorld看Java与Kotlin

子不语Any

kotlin Andriod 11月月更

深入浅出学习透析Nginx服务器的基本原理和配置指南「初级实践篇 」

码界西柚

nginx 正向代理与反向代理 11月日更 nginx 开源版 开发指南

Thymeleaf入门教程

Studying_swz

前端 thymeleaf 11月月更

谈谈我对服务网格的理解

阿里巴巴云原生

阿里云 云原生 服务网格

工信部电子五所李冬:在龙蜥社区的一站式自动化测试平台的探索和实践|2022云栖龙蜥实录

OpenAnolis小助手

开源 操作系统 自动化测试 龙蜥社区 2022云栖大会

精益创业者的用户体验设计

产品海豚湾

产品经理 产品设计 精益思想 用户体验 11月月更

分布式事务详解、理论分析、及强一致性(2PC、3PC)剖析

C++后台开发

数据库 分布式 后端开发 Linux服务器开发 C++开发

秒云加入OpenCloudOS操作系统开源社区,携手打造更智能、更可控、更可信的云原生环境

MIAOYUN

开源社区 opencloudOS

阿里云弹性计算总经理张献涛:智能化、高效能、新交互将重塑互联网

云布道师

弹性计算 云栖大会

数据预处理和特征工程-特征选择-Embedded嵌入法

烧灯续昼2002

Python 机器学习 算法 sklearn 11月月更

【愚公系列】2022年11月 微信小程序-app.json配置属性之Worker

愚公搬代码

11月月更

基础逻辑门

芯动大师

Verilog 11月月更 Xilinx

从0开始,让你的Spring Boot项目跑在Linux服务器

闫同学

spring Linux 服务器 11月月更

【Go电商实战04】为什么GoFrame不支持migrate功能?我还特意去问了框架作者

王中阳Go

golang 高效工作 学习方法 程序员 11月月更

浅析云原生

鲸品堂

mysql的高可用方案以及优缺点

想要飞的猪

AI音乐创作,让每一个人都成为音乐家

HarmonyOS SDK

音频 HMS Core

JVM Sandbox入门教程与原理浅谈

Zhendong

Java JVM

甩掉容量规划炸弹:用 AHPA 实现 Kubernetes 智能弹性伸缩

阿里巴巴云原生

阿里云 Kubernetes 云原生 AHPA

泛型由入门到精通(2)

好程序员IT教育

Java 泛型

4K60帧!RayLink远程控制软件如何帮助设计师远程办公?

RayLink远程工具

远程控制软件 远程办公软件 远控软件 远程桌面连接 RayLink

九科信息受邀参加中国总会计师协会财务数智化转型研讨会

九科Ninetech

湖仓一体架构下的数据研发及管理

数造万象

MySQL事务的隔离级别以及脏读、幻读和不可重复读

闫同学

MySQL 事务 11月月更

Kotlin变量声明和类型推断

子不语Any

kotlin Andriod 11月月更

泛型由入门到精通(3)

好程序员IT教育

Java 泛型

Collectd的Amazon CloudWatch插件_其他_亚马逊云科技 (Amazon Web Services)_InfoQ精选文章