Google 将要集成云日志与云监控服务

  • Kent Weare
  • 史臣敏

2015 年 11 月 12 日

话题:Google架构

近日,谷歌宣布将要在它的云服务平台上增加新的功能,这将实现云日志服务和云监控服务的有效整合。谷歌提供这些新功能的目的是使用户在监控自己程序运行状态的同时,能够在云日志记录和云监控服务间快速切换。

目前谷歌云日志服务和云监控服务都被开发者广泛使用着。云日志服务的作用是记录其云平台中所发生的事件。云监控服务则帮助开发人员或管理员监控其程序服务的运行状况,并在阈值超出极值的时候,发出警告。这些工具目前的缺陷就是它们是彼此独立运行的。产品经理 Deepak Tiwari 已经认识到这些问题,并试图着手改善用户体验。他说,“当特定的事件发生时,或参数超过某一特定的值时,亦或计数器超过某阈值时,我们希望得到及时的提醒。然而,现有监控工具并不允许使用者方便地将日志连接到监视控制台。随着这项新功能的推出,谷歌云监控增加了现有即时指标从日志中导入相关内容的功能。”

新整合的功能目前正在测试阶段,但在发布时将提供以下功能:

  • 基于日志的度量可以让开发人员通过过滤器表达式创建一个检索,例如当 HTTP 状态编码为 500 时输出全部日志条目。有了这个检索功能,日志条目就可以被添加到云监控仪表板中。开发者还能设置阈值来关闭这些的报警功能,使得更重要的指标能更醒目。

在最近公开的日志中,谷歌提供了这些功能运作的细节。下图详细的展示了日志检索功能转化为监控仪表板的过程。

图片来源:http://googlecloudplatform.blogspot.com/2015/10/create-metrics-alerts-and-dashboards-based-on-your-Google-Cloud-logs.html

  • 高级日志过滤器支持更复杂的基于布尔表达式过滤,支持时间范围设定、采样率设定、过滤元数据或用户自定义字段功能。
  • 从图表钻取到日志能帮助用户从监测仪表盘钻取到特定的日志来解决问题。这样,开发人员可能正在监控其服务运行状态。当他们发现一个反常现象时,如系统资源高峰期,他们就可以钻取到那段时间的日志中展开进一步诊断。

谷歌增加这些新特性的目标之一就是减少用户在日志和监控工具之间切换的时间。这是一个用户在使用上不够便捷的地方,但新功能的早期使用者已经从中获得了便利。正如 Q42 的工程师 Arjen van der Ende 所描述的那种:“我们拥有大量有价值的日志数据,但却缺乏从大量数据中搜集有效数据的能力。我们尝试了一些开源的解决方案,但是有效地管理这些产生的日志却是一项艰巨的工作。现在,我们可以向运行着的系统中增加新的度量来帮助我们诊断问题并监控新的情况。”

查看英文原文:Google to Provide Integration between Cloud Logs and Cloud Monitoring Services


感谢张龙对本文的审校。

给 InfoQ 中文站投稿或者参与内容翻译工作,请邮件至editors@cn.infoq.com。也欢迎大家通过新浪微博(@InfoQ@丁晓昀),微信(微信号:InfoQChina)关注我们,并与我们的编辑和其他读者朋友交流(欢迎加入 InfoQ 读者交流群)。

Google架构