写点什么

全新 – Amazon CloudWatch 高精度自定义指标和警报

  • 2019-11-12
  • 本文字数:1689 字

    阅读完需:约 6 分钟

全新 – Amazon CloudWatch 高精度自定义指标和警报

Amazon CloudWatch 自 2009 年年初以来一直是 AWS 的重要组成部分。CloudWatch 与 Auto ScalingElastic Load Balancing 三个产品包组合在一起发布,它已发展成为功能极强、面向 AWS 云中运行的 AWS 资源和应用程序的监控服务。CloudWatch 自定义指标 (早在 2011 年发布) 可用在 CloudWatch 中存储业务和应用程序指标、以图形方式查看这些指标,并基于 CloudWatch 警报启动操作。不用说,这些年来,我们的 CloudWatch 增强了很多的功能!最近的一些增强功能包括延长指标保留期 (以及一项用户界面更新)、控制面板控制面板 API/CloudFormation 支持以及控制面板上的警报


一开始,指标是按照五分钟的时间间隔存储的;后来,在 2010 年,应客户请求缩短到一分钟 (也称为详细监控)。这是一个广受欢迎的改变,但现在我们可以做得更好。我们的客户在流式传输视频、开展限时抢购、每天上百次部署代码,并随着情况的变化非常快速地扩展和缩减应用程序。对于所有这些情况,一分钟为时间间隔还是太长了。这样有可能错过重要的瞬间高峰;分散 (然而事实上相关) 的事件难以跨越时间进行关联,并且在发生故障时的 MTTR (平均修复时间) 过高。


全新的高精度指标


今天,我们将增加对高精度自定义指标的支持,我们还计划以后逐渐增加对 AWS 服务的支持。现在您的应用程序可以以 1 秒的精度将指标发布到 CloudWatch。在发布指标数秒后您就可以在屏幕上滚动查看这些指标,您还可以设置高精度 CloudWatch 警报,可以精细到每 10 秒评估一次。


想象一下可用内存较少时发出警报。这通常是一种瞬时的情况,如果取样不够频繁,将很难捕获到。使用高精度指标,您可以在数秒内查看、检测 (通过警报) 到这种情况并相应地执行操作。



在此例中,右侧的警报不会触发,您也不会知道出现了问题。


发布高精度指标


您可以用两种不同的方式发布高精度指标:


  • API[](http://docs.aws.amazon.com/AmazonCloudWatch/latest/APIReference/API_PutMetricData.html "未定义") 函数现在接受可选 StorageResolution 参数。将此参数设置为 1 可发布高精度指标;省略它 (或设置为 60) 可按照标准的 1 分钟精度发布指标。

  • collectd 插件 – collectd 的 CloudWatch 插件已更新,现在支持高精度指标的收集和发布。您需要在该插件的配置文件中设置 enable_high_definition_metrics 参数。


CloudWatch 指标随时间累积;随着指标存在时间变长,精度将大大降低。下面是时间设置:


  • 1 秒指标可用 3 小时。

  • 60 秒指标可用 15 天。

  • 5 分钟指标可用 63 天。

  • 1 小时指标可用 455 天 (15 个月)。


当您调用 [](http://docs.aws.amazon.com/AmazonCloudWatch/latest/APIReference/API_GetMetricStatistics.html "未定义") 时,可以指定 1、5、10、30 或 60 秒的任意倍数作为高精度指标。您可以指定 60 秒的任意倍数作为标准指标。


快速演示


我选用我最近的 EC2 实例,它安装了最新版本的 collectd 和 Python 插件:


Bash


$ sudo yum install collectd collectd-python
复制代码


然后我下载该插件的设置脚本,让它变成可执行文件,然后运行:


Bash


$ wget https://raw.githubusercontent.com/awslabs/collectd-cloudwatch/master/src/setup.py$ chmod a+x setup.py$ sudo ./setup.py
复制代码


我已创建一个合适的 IAM 角色,并将它添加到我的实例中;在设置过程中自动检测到了它。有人要求我启用高精度指标:



collectd 在数秒内开始运行并发布指标。我打开 CloudWatch 控制台查看:



然后我放大,详细查看指标:



我还以 10 秒的时间间隔创建一个警报来检查 memory.percent.used 指标。这样我可以更方便地检测短时间内使用很多内存的情况:



现在提供


现在,高精度自定义指标和警报在所有公共 AWS 区域都可用,并且很快还会支持 AWS GovCloud (US)


目前您每个月可以免费存储 10 个指标;有关更多信息,请参阅 CloudWatch 定价页面。高精度指标的定价与标准精度指标相同,如果需要使用更多指标,用量套餐可以为您节省费用 (对于每个指标)。高精度警报价格为每月每个警报 0.30 美元。


本文转载自 AWS 技术博客。


原文链接:


https://amazonaws-china.com/cn/blogs/china/new-high-resolution-custom-metrics-and-alarms-for-amazon-cloudwatch/


2019-11-12 08:001116

评论

发布
暂无评论
发现更多内容

Cocktail for Mac(系统清理)(15以上系统适用)v18.1 注册激活版

Rose

苹果电脑免费好用的鼠标增强工具:Mos for Mac

Rose

macOS Big Sur 11(苹果电脑mac11系统安装包)v11.7.10正式版

Rose

人工智能 | 基于ChatGPT开发人工智能服务平台

测试人

人工智能 软件测试

淘宝商品详情数据api接口深度探索:解锁商品信息的全面视角

代码忍者

API 接口 pinduoduo API

淘宝API接口:关键词搜索商品列表数据接口

tbapi

淘宝API接口 淘宝商品列表数据接口

服装企业必备增长利器:高效商品管理系统

第七在线

开源即时通讯IM框架MobileIMSDK的H5端技术概览

JackJiang

即时通讯;IM;网络编程

一文轻松掌握Kotlin接口与类

Silently9527

Java kotlin

VMware ESXi 8.0U3b 发布下载,新增功能概览

sysin

vSphere vmware esxi

超实用的办公模板合集(office模板、商业模板、思维导图模板)

Rose

【堡垒机小知识】堡垒机常见运维方式你知道几种呢?

行云管家

网络安全 堡垒机 运维审计

随州等保测评机构在哪里?电话多少?

行云管家

等保 堡垒机 等保测评 随州

数据飞轮:企业数字化转型的下一站风口

不叫猫先生

数据中台 数据仓库 数据 数据飞轮

技术解读 MySQL InnoDB 大对象存储格式

华为云开发者联盟

从YouTube到B站,Downie 4一网打尽,视频下载无界限!

Rose

万兆时代 TCP/IP如何赋能以太网飞跃

郑州埃文科技

TCP/IP 以太网

百度Android IM SDK组件能力建设及应用

百度Geek说

聊天 IM sdk 安卓 即时通讯IM

鸿蒙跨端实践-布局方案介绍

京东科技开发者

京东广告投放平台整洁架构演进之路

京东科技开发者

安装AutoCAD最新版,提示安装错误112解决方法

Rose

从数据中台到数据飞轮:企业数字化战略的新范式

不叫猫先生

数据中台 数据仓库 数据 数据飞轮

聚道云软件连接器9月新增应用合集(1)

聚道云软件连接器

功能更新

集成Sermant,ServiceStage带你实现应用上下线平滑过渡

华为云开发者联盟

#人工智能

Emby for Mac:一款强大的多媒体影音库管理工具

Rose

全新 – Amazon CloudWatch 高精度自定义指标和警报_语言 & 开发_亚马逊云科技 (Amazon Web Services)_InfoQ精选文章