写点什么

全新 – Amazon CloudWatch 高精度自定义指标和警报

  • 2019-11-12
  • 本文字数:1689 字

    阅读完需:约 6 分钟

全新 – Amazon CloudWatch 高精度自定义指标和警报

Amazon CloudWatch 自 2009 年年初以来一直是 AWS 的重要组成部分。CloudWatch 与 Auto ScalingElastic Load Balancing 三个产品包组合在一起发布,它已发展成为功能极强、面向 AWS 云中运行的 AWS 资源和应用程序的监控服务。CloudWatch 自定义指标 (早在 2011 年发布) 可用在 CloudWatch 中存储业务和应用程序指标、以图形方式查看这些指标,并基于 CloudWatch 警报启动操作。不用说,这些年来,我们的 CloudWatch 增强了很多的功能!最近的一些增强功能包括延长指标保留期 (以及一项用户界面更新)、控制面板控制面板 API/CloudFormation 支持以及控制面板上的警报


一开始,指标是按照五分钟的时间间隔存储的;后来,在 2010 年,应客户请求缩短到一分钟 (也称为详细监控)。这是一个广受欢迎的改变,但现在我们可以做得更好。我们的客户在流式传输视频、开展限时抢购、每天上百次部署代码,并随着情况的变化非常快速地扩展和缩减应用程序。对于所有这些情况,一分钟为时间间隔还是太长了。这样有可能错过重要的瞬间高峰;分散 (然而事实上相关) 的事件难以跨越时间进行关联,并且在发生故障时的 MTTR (平均修复时间) 过高。


全新的高精度指标


今天,我们将增加对高精度自定义指标的支持,我们还计划以后逐渐增加对 AWS 服务的支持。现在您的应用程序可以以 1 秒的精度将指标发布到 CloudWatch。在发布指标数秒后您就可以在屏幕上滚动查看这些指标,您还可以设置高精度 CloudWatch 警报,可以精细到每 10 秒评估一次。


想象一下可用内存较少时发出警报。这通常是一种瞬时的情况,如果取样不够频繁,将很难捕获到。使用高精度指标,您可以在数秒内查看、检测 (通过警报) 到这种情况并相应地执行操作。



在此例中,右侧的警报不会触发,您也不会知道出现了问题。


发布高精度指标


您可以用两种不同的方式发布高精度指标:


  • API[](http://docs.aws.amazon.com/AmazonCloudWatch/latest/APIReference/API_PutMetricData.html "未定义") 函数现在接受可选 StorageResolution 参数。将此参数设置为 1 可发布高精度指标;省略它 (或设置为 60) 可按照标准的 1 分钟精度发布指标。

  • collectd 插件 – collectd 的 CloudWatch 插件已更新,现在支持高精度指标的收集和发布。您需要在该插件的配置文件中设置 enable_high_definition_metrics 参数。


CloudWatch 指标随时间累积;随着指标存在时间变长,精度将大大降低。下面是时间设置:


  • 1 秒指标可用 3 小时。

  • 60 秒指标可用 15 天。

  • 5 分钟指标可用 63 天。

  • 1 小时指标可用 455 天 (15 个月)。


当您调用 [](http://docs.aws.amazon.com/AmazonCloudWatch/latest/APIReference/API_GetMetricStatistics.html "未定义") 时,可以指定 1、5、10、30 或 60 秒的任意倍数作为高精度指标。您可以指定 60 秒的任意倍数作为标准指标。


快速演示


我选用我最近的 EC2 实例,它安装了最新版本的 collectd 和 Python 插件:


Bash


$ sudo yum install collectd collectd-python
复制代码


然后我下载该插件的设置脚本,让它变成可执行文件,然后运行:


Bash


$ wget https://raw.githubusercontent.com/awslabs/collectd-cloudwatch/master/src/setup.py$ chmod a+x setup.py$ sudo ./setup.py
复制代码


我已创建一个合适的 IAM 角色,并将它添加到我的实例中;在设置过程中自动检测到了它。有人要求我启用高精度指标:



collectd 在数秒内开始运行并发布指标。我打开 CloudWatch 控制台查看:



然后我放大,详细查看指标:



我还以 10 秒的时间间隔创建一个警报来检查 memory.percent.used 指标。这样我可以更方便地检测短时间内使用很多内存的情况:



现在提供


现在,高精度自定义指标和警报在所有公共 AWS 区域都可用,并且很快还会支持 AWS GovCloud (US)


目前您每个月可以免费存储 10 个指标;有关更多信息,请参阅 CloudWatch 定价页面。高精度指标的定价与标准精度指标相同,如果需要使用更多指标,用量套餐可以为您节省费用 (对于每个指标)。高精度警报价格为每月每个警报 0.30 美元。


本文转载自 AWS 技术博客。


原文链接:


https://amazonaws-china.com/cn/blogs/china/new-high-resolution-custom-metrics-and-alarms-for-amazon-cloudwatch/


2019-11-12 08:001158

评论

发布
暂无评论
发现更多内容

『Plotly实战指南』--在金融数据可视化中的应用(上)

量贩潮汐·WholesaleTide

Python

商超拣货业务流程与常见模式

PeterOne

人工智能 AI 运筹规划

工业计算机:工业领域的智慧大脑

极客天地

网络问题导致金仓数据库备机无法加入集群的排查与解决​

金仓技术

KingBase 金仓数据库

云上玩转Qwen3系列之二:PAI-LangStudio搭建联网搜索和RAG增强问答应用

阿里云大数据AI技术

人工智能 rag PAI Qwen3 LangStudio

从彼得·蒂尔四象限看 Crypto「情绪变迁」:从密码朋克转向「标准化追求者」

TechubNews

MCP 规范新版本特性全景解析与落地实践

阿里巴巴云原生

阿里云 云原生 通义灵码

Nacos源码—Nacos集群高可用分析(二)

不在线第一只蜗牛

天润融通开启AI Agent新时代,引领客户服务智能化升级

天润融通

0 代码,一键部署 Qwen3

阿里巴巴云原生

阿里云 Serverless 云原生 函数计算

类似亲家相亲,亲人朋友帮忙找对象的交友/app/小程序平台开发搭建

网站,小程序,APP开发定制

远程访问代理+内网穿透:火山引擎边缘网关助力自部署模型公网调用与全链路管控

火山引擎边缘云

网关 火山引擎 大模型 私有化部署 LLM

发件箱模式实战

俞凡

最佳实践 设计模式

【IoTDB 线上小课 15】树表双模型,到底该怎么选?

Apache IoTDB

5月13日观测云发布会:这一次,我们不只是发布产品

观测云

产品发布会

太阳能薄膜频谱吸收率_CST软件仿真案例

思茂信息

cst CST软件 CST Studio Suite

【签约快讯|天润融通签约极核电动】

天润融通

Flutter小程序与跨端组装技术:高效App开发的新范式

xuyinyin

天润融通AI Agent实战营成功举办,助力企业革新客户服务模式

天润融通

在京东做AI的95后:我们这样搞定技术难题

京东零售技术

【解决方案】DistilQwen2.5-DS3-0324蒸馏小模型在PAI-ModelGallery的训练、评测、压缩及部署实践

阿里云大数据AI技术

人工智能 大模型 模型部署 PAI DistilQwen2.5

解决金仓数据库启动报错“内存不足”的问题

金仓技术

KingbaseES 金仓数据库

当 CEO 患上了 AI 焦虑症(之四):NoETL,万数皆可问!

Aloudata

数据分析 数据开发 指标平台 ChatBI 智能问数

从架构设计到核心组件深度解析SpringCloudAlibaba一站式解决方案

程序员高级码农

架构师 SpringCloud Alibaba spring-cloud

Voila:开源端到端全双工语音模型,延迟 195 毫秒;Gemini 2.5 Pro 预览版发布,视频理解能力提升丨日报

声网

天润融通助力工业巨头,从人工派单到智能调度的售后提效之路

天润融通

e签宝智能合同Agent于数字中国重磅发布!

科技汇

AI与情感计算:如何让机器更好地理解人类情感与情绪?

天津汇柏科技有限公司

人工智能 AI

AI 编程实战:如何用 AI+DevBox 三周开发出 WAF 防火墙(保姆级教程)

硅基新手村

ide AI vscode cursor

高性能发件箱模式(每天处理20亿条消息)

俞凡

最佳实践 设计模式

全新 – Amazon CloudWatch 高精度自定义指标和警报_语言 & 开发_亚马逊云科技 (Amazon Web Services)_InfoQ精选文章