红帽白皮书新鲜出炉!点击获取,让你的云战略更胜一筹! 了解详情
写点什么

全新 – Amazon CloudWatch 高精度自定义指标和警报

  • 2019-11-12
  • 本文字数:1689 字

    阅读完需:约 6 分钟

全新 – Amazon CloudWatch 高精度自定义指标和警报

Amazon CloudWatch 自 2009 年年初以来一直是 AWS 的重要组成部分。CloudWatch 与 Auto ScalingElastic Load Balancing 三个产品包组合在一起发布,它已发展成为功能极强、面向 AWS 云中运行的 AWS 资源和应用程序的监控服务。CloudWatch 自定义指标 (早在 2011 年发布) 可用在 CloudWatch 中存储业务和应用程序指标、以图形方式查看这些指标,并基于 CloudWatch 警报启动操作。不用说,这些年来,我们的 CloudWatch 增强了很多的功能!最近的一些增强功能包括延长指标保留期 (以及一项用户界面更新)、控制面板控制面板 API/CloudFormation 支持以及控制面板上的警报


一开始,指标是按照五分钟的时间间隔存储的;后来,在 2010 年,应客户请求缩短到一分钟 (也称为详细监控)。这是一个广受欢迎的改变,但现在我们可以做得更好。我们的客户在流式传输视频、开展限时抢购、每天上百次部署代码,并随着情况的变化非常快速地扩展和缩减应用程序。对于所有这些情况,一分钟为时间间隔还是太长了。这样有可能错过重要的瞬间高峰;分散 (然而事实上相关) 的事件难以跨越时间进行关联,并且在发生故障时的 MTTR (平均修复时间) 过高。


全新的高精度指标


今天,我们将增加对高精度自定义指标的支持,我们还计划以后逐渐增加对 AWS 服务的支持。现在您的应用程序可以以 1 秒的精度将指标发布到 CloudWatch。在发布指标数秒后您就可以在屏幕上滚动查看这些指标,您还可以设置高精度 CloudWatch 警报,可以精细到每 10 秒评估一次。


想象一下可用内存较少时发出警报。这通常是一种瞬时的情况,如果取样不够频繁,将很难捕获到。使用高精度指标,您可以在数秒内查看、检测 (通过警报) 到这种情况并相应地执行操作。



在此例中,右侧的警报不会触发,您也不会知道出现了问题。


发布高精度指标


您可以用两种不同的方式发布高精度指标:


  • API[](http://docs.aws.amazon.com/AmazonCloudWatch/latest/APIReference/API_PutMetricData.html "未定义") 函数现在接受可选 StorageResolution 参数。将此参数设置为 1 可发布高精度指标;省略它 (或设置为 60) 可按照标准的 1 分钟精度发布指标。

  • collectd 插件 – collectd 的 CloudWatch 插件已更新,现在支持高精度指标的收集和发布。您需要在该插件的配置文件中设置 enable_high_definition_metrics 参数。


CloudWatch 指标随时间累积;随着指标存在时间变长,精度将大大降低。下面是时间设置:


  • 1 秒指标可用 3 小时。

  • 60 秒指标可用 15 天。

  • 5 分钟指标可用 63 天。

  • 1 小时指标可用 455 天 (15 个月)。


当您调用 [](http://docs.aws.amazon.com/AmazonCloudWatch/latest/APIReference/API_GetMetricStatistics.html "未定义") 时,可以指定 1、5、10、30 或 60 秒的任意倍数作为高精度指标。您可以指定 60 秒的任意倍数作为标准指标。


快速演示


我选用我最近的 EC2 实例,它安装了最新版本的 collectd 和 Python 插件:


Bash


$ sudo yum install collectd collectd-python
复制代码


然后我下载该插件的设置脚本,让它变成可执行文件,然后运行:


Bash


$ wget https://raw.githubusercontent.com/awslabs/collectd-cloudwatch/master/src/setup.py$ chmod a+x setup.py$ sudo ./setup.py
复制代码


我已创建一个合适的 IAM 角色,并将它添加到我的实例中;在设置过程中自动检测到了它。有人要求我启用高精度指标:



collectd 在数秒内开始运行并发布指标。我打开 CloudWatch 控制台查看:



然后我放大,详细查看指标:



我还以 10 秒的时间间隔创建一个警报来检查 memory.percent.used 指标。这样我可以更方便地检测短时间内使用很多内存的情况:



现在提供


现在,高精度自定义指标和警报在所有公共 AWS 区域都可用,并且很快还会支持 AWS GovCloud (US)


目前您每个月可以免费存储 10 个指标;有关更多信息,请参阅 CloudWatch 定价页面。高精度指标的定价与标准精度指标相同,如果需要使用更多指标,用量套餐可以为您节省费用 (对于每个指标)。高精度警报价格为每月每个警报 0.30 美元。


本文转载自 AWS 技术博客。


原文链接:


https://amazonaws-china.com/cn/blogs/china/new-high-resolution-custom-metrics-and-alarms-for-amazon-cloudwatch/


2019-11-12 08:00766

评论

发布
暂无评论
发现更多内容

2024中国(深圳)国际VR/AR虚拟现实展览会

吹吹晚风

如何仅用几分钟就能破解8个字符长的密码?

高端章鱼哥

黑客 密码安全 破译密码

因为私域流量运营,App重新受重视?

FinFish

小程序生态 私域运营 小程序容器 私域流量运营 流量运营

洛阳等级保护测评机构有哪些?在哪里?咨询电话多少?

行云管家

等保 等级保护 等保测评 洛阳

2023城博会|上海国际智慧工地展览会

AIOTE智博会

城博会 上海城博会

GeaFlow图计算快速上手之K-hop算法

TuGraphAnalytics

大数据 流计算 图计算 图论

Programming abstractions in C阅读笔记p111-p113: boilerplate

codists

规划性和可扩展性,助力企业全面预算管理的推进

智达方通

全面预算管理系统 智达方通EPM系统 财务规划与分析 多维模型

【资料包】HDC.Together 2023精选Codelabs指南现已上线(内有活动)

HarmonyOS开发者

HarmonyOS

到底该不该使用Python?

这我可不懂

Python Go 数据库

基于eBPF技术构建一种应用层网络管控解决方案

统信软件

ARTS薪火重启之第一周

渣渣辉

算法 职业规划 心得分享

突破大模型 | Alluxio助力AI大模型训练-成功案例(一)

Alluxio

机器学习 gpu 模型训练 大模型 AIGC

面试涨薪神奇操作,直接多给3k的JVM垃圾优化笔记

小小怪下士

Java 程序员 JVM 调优

本地工具是什么意思?本地工具与远程工具一样吗?

行云管家

IT运维 远程工具 本地工具

2024杭州国际工业装配及传输技术展览会

吹吹晚风

达芬奇DaVinci Resolve Studio 18 for mac(视频调色软件) v18.5.1正式激活版

mac

苹果mac Windows软件 DaVinci Resolve Studio 专业视频剪辑软件

文档比对技术难点与使用场景

合合技术团队

人工智能 算法 文字识别 文档对比

19. 第三方库的管理和虚拟环境

茶桁

Python pip conda

断点续传的未来发展趋势与前景展望

镭速

断点续传 文件传输软件

2024杭州国际伺服系统与控制技术展览会

吹吹晚风

揭穿DevOps的5个谣言!

互联网工科生

DevOps 运维 自动化运维

上央视啦!扫描全能王科技助力社会跑步进入无纸化办公时代

合合技术团队

人工智能 环保 无纸化办公

企业文件外发系统必备八大要素

镭速

文件外发系统

aspera替代方案:探索这些安全且可靠的文件传输工具

镭速

aspera替代方案 文件传输工具

IIOT WiFi solution/IPQ9574 VS IPQ8074 support MU-MIMO-Beamforming-Advanced Wireless Technology

wifi6-yiyi

wifi6 WiFi7

语音聊天源码平台开发小知识

山东布谷网络科技

2024杭州国际连接器及线束设备展览会

吹吹晚风

2024杭州国际3D打印技术展览会

吹吹晚风

腾讯云ES:一键配置,LDAP身份验证服务来了!

腾讯云大数据

ES

生成式AI崛起,元宇宙发展遭遇挑战

百度开发者中心

元宇宙 文心一言

全新 – Amazon CloudWatch 高精度自定义指标和警报_语言 & 开发_亚马逊云科技 (Amazon Web Services)_InfoQ精选文章