写点什么

不止于监控,夜莺 V6 全新升级为开源观测平台

夜莺项目管理委员会

  • 2023-03-21
    北京
  • 本文字数:2316 字

    阅读完需:约 8 分钟

不止于监控,夜莺V6全新升级为开源观测平台

不止于监控,夜莺 V6 来了!今天我们郑重发布夜莺 6.0 beta 版本,全面支持 Metrics、Logging、Tracing,向着构建开源、开放、完整的可观测性解决方案迈进。您可以借助夜莺 V6,接入和管理 Prometheus、ElasticSearch、Jaeger 多种数据源,实现数据的统一可视化、告警和分析。

可以在页面管理数据源了



无需修改配置文件里的 Clusters 配置了,直接在页面就可以管理了。除了兼容 Prometheus 查询协议的数据源,也支持 Jaeger 和 ElasticSearch 作为数据源接入。

可以接入 ElasticSearch 数据源了

类似 Grafana 的配置体验,可以接入已有的 ElasticSearch 数据源,自然的,就可以在夜莺里查看 ElasticSearch 的数据了,监控大盘的图表数据也可以从 ElasticSearch 获取。



可以接入 Jaeger 数据源查看链路数据了

Jaeger 在 CNCF 蓝图中,是链路追踪的佼佼者,所以我们首先支持了 Jaeger,目前做到的效果是可以在夜莺里查看 Trace 甘特图和拓扑依赖。




现在这个版本,可以把 metrics、logging、tracing 的数据都做到可视化了,只是数据串联方面还差一些,后续版本继续迭代优化,万里长征先走了一步。

架构做了简化


Nightingale 5.x 的版本,至少需要 n9e-webapi 和 n9e-server 两个模块,6.x 开始默认只需要一个模块了,就叫 n9e。我们先来回顾一下 5.x 的架构:



假设两个集群,Region01 是中心机房,部署了一整套夜莺,Region02 和 Region01 的网络链路不好,所以 Region02 单独搞了一套 TSDB,n9e-server 跟随 TSDB,所以 Region02 也部署了一套 n9e-server。图上其实少画了 Redis,n9e-webapi 和 n9e-server 都依赖 Redis,可以全局用一个 Redis,也可以每套 n9e-server 部署自己的 Redis。



6.x 版本把 webapi、pushgateway、alerting 模块合并成一个 n9e 模块了,这个模块可以对接多个数据源,n9e 模块也可以部署多个实例组成集群,架构上变简单了。


当然,如果某个机房和中心机房之间网络链路不好,想在这个边远的机房下沉部署一套时序库+告警引擎,也是 OK 的。除了 n9e 模块,我们也单独提供了 n9e-pushgw(数据转发网关) 和 n9e-alert(告警引擎),这俩模块是可选的,平时都用不到,只是应对边远机房网络链路不好的情况。

可维护性提升


除了架构方面做了简化,降低了维护复杂度,很多配置也挪到页面上管理了。比如单点登录相关的配置、告警发送模板相关的配置:


角色管理也挪到页面上了,不用像 5.x 的版本那样,只能通过修改数据库创建新的角色了。

增加了内置监控大盘


5.x 的版本其实就有内置监控大盘,但是必须把内置监控大盘导入到自己的业务组使用。6.x 开始,提供了内置大盘的浏览页面,可以不用导入自己的业务组直接使用。


欢迎夜莺社区的小伙伴一起共建共创,把内置监控大盘搞的多多的,为社区建设添砖加瓦,功在当代利在千秋!

增加了内置告警规则


同理,也内置了各类组件的告警规则,极大的增加了便利性。当然了,我们也非全能,期待社区小伙伴一起共建共创,把内置告警规则也搞的多多的,如果不知道如何贡献,可以联系我们。

继续优化了告警规则



附加标签支持变量了,于是,我们可以对告警的 vector 的标签做一些二次处理。



对于机器失联告警、机器时间偏移做了更好的实现。废弃了原本的 target_up 指标的生成逻辑,在告警规则里直接内置支持了机器失联告警和时间偏移告警,甚至,额外增加了机器失联比例告警。



阈值告警也做了优化,一个告警策略里可以配置多个规则,指定不同的级别,而且支持级别抑制,高级别的告警抑制低级别的告警。



顺便介绍一下告警规则的多时间段配置,其实 5.15 版本就支持了,但是很多人不知道,借此机会也一并说一下。这个功能是社区提出的,对于一些特定的场景非常有用。

继续优化了屏蔽规则



增加了大家心心念念的周期性屏蔽,惊不惊喜意不意外?看图就知道这个是啥意思了,我就不详细解释了。有没有感觉开源夜莺的一些功能已经比很多商业软件做的都好了。

继续优化了订阅规则



订阅规则引入了“订阅事件持续时长超过(秒)”的配置,这个功能很酷,一定程度上可以实现告警升级的功能,不过相比完备的告警升级,还是差点意思,没有认领、排班之类的功能,如果想建立统一的告警事件中心,接收各类监控系统的告警事件,统一做告警降噪、认领、升级、排班、协同等功能,请使用 FlashDuty,FlashDuty 是 SaaS 版本的 OnCall 中心,有免费套餐可用。

另外,订阅规则可以重新定义回调地址,可以对一些特定的告警事件做自动化处理,比如把特定的告警事件发给 FlashDuty。

夜莺开源社区发展和治理

夜莺监控,于 2022 年 5 月 11 日,正式托管于中国计算机学会开源发展委员会(CCF ODC),为 CCF ODC 成立后接受捐赠的第一个开源项目。在计算机学会的支持和带动下,在快猫星云和众多公司的持续投入下,和数千名社区用户的积极参与,截止当前,夜莺开源项目在 Github 上获得了 6K star,1K fork,近 100 位 Contributor,夜莺开源社区展现出了蓬勃的生机。


夜莺 V6,是夜莺监控往全栈可观测性解决方案迈进的关键一步,是夜莺项目管理委员会和夜莺开源社区共同努力的成果。


夜莺的开源仓库在 github.com/ccfos/nightingale 欢迎小伙伴们 star 收藏。前端代码和 V5 版本拆开了,放到了 github.com/n9e/fe 前端相关问题可以到这个 repo 提 issue。


夜莺开源项目大事记

  1. 2020 年 3 月,夜莺监控由滴滴技术正式在 Github 开源,凭借其优秀的产品设计、灵活性架构和明确清晰的定位,夜莺监控快速发展为国内最活跃的企业级云原生监控方案。

  2. 2022 年 5 月 11 日,夜莺监控正式捐赠予中国计算机学会开源发展委员会 CCF ODC,为 CCF ODC 成立后接受捐赠的第一个开源项目。

  3. 2022 年 8 月 1 日,发布夜莺监控开源社区治理架构,并公示相关的任命和社区荣誉。

  4. 2023 年 3 月 9 日,夜莺 V6 全新发布,夜莺监控升级为开源观测平台。

2023-03-21 18:196646

评论 1 条评论

发布
用户头像
对比grafana有什么优势?
2023-03-22 12:15 · 广东
回复
没有更多了
发现更多内容

售票系统(源码+文档+讲解+演示)

深圳亥时科技

优化成本与效率:低代码平台构建企业级应用的技术探析

JeeLowCode低代码平台

低代码 低代码平台 低代码凭条 低代码, 低代码选择

Java 单例模式与线程安全

知识浅谈

Java 单例模式

【连载 24】性能测试实践——超时结账第四回合

FunTester

Apple Safari 18.3.1 发布 - macOS 专属浏览器 (独立安装包下载)

sysin

safari

弹性扩展何以助力 Polkadot 2.0 触达无缝互操作的理想愿景?

One Block Community

技术 开发者 polkadot

WebGL开发VR软件框架

北京木奇移动技术有限公司

VR开发 软件外包公司 webgl开发

Apache NetBeans 25 (macOS, Linux, Windows) - Java 等多语言开源跨平台 IDE

sysin

NetBeans

京东商品视频API接口全攻略

tbapi

京东API 京东商品视频API 京东商品视频数据采集

从零复现,全面开源:360 Light-R1-14B/7B带来端侧AI平权时刻

脑极体

AI

1688商品列表API 接口全攻略

tbapi

1688商品列表接口 1688API 1688商品列表数据采集

从 Web2 到 Web3,她做对了什么使其成为行业资深大牛?

One Block Community

开发 web3

智慧园区,智慧工地,智慧物业等建设方案(PPT))

金陵老街

智慧园区

数据可信、隐私可控:CESS 如何打造波卡生态数据新基建?

One Block Community

区块链 开发 web3

自动化测试的 8 个最佳实践

FunTester

“全球金牌敏捷课程” · 4月19-20日CSM认证课程 · Jim老师引导讨论AI & Agility话题

ShineScrum

敏捷 项目开发 CSM认证 CSM认证培训

《Operating System Concepts》阅读笔记:p331-p353

codists

操作系统

1688商品详情API接口全攻略

tbapi

1688API 1688商品详情API 1688商品详情数据采集

业务幂等性设计的六种方案

Java随想录

Java MySQL 幂等

DeepSeek赋能SRE:新时代下SRE人员的技能革新

雅菲奥朗

SRE SRE培训 DeepSeek

淘宝商品数据API接口实战指南|手把手教你获取商品详情和全店数据(避坑版)

代码忍者

淘宝API接口

使用 INFINI Gateway 保护 Elasticsearch 集群之修改查询不合理参数(一)

极限实验室

elasticsearch Gateway

HarmonyOS ArkTS声明式UI开发实战教程

李游Leo

HarmonyOS

Deepseek进入业务深水区,为什么需要昇腾大EP?

脑极体

AI

Polkadot 迈向 Web3 云:超越以太坊原生 Rollup 方案的创新之路

One Block Community

开发者 Rollup web3

Coremail全面对接DeepSeek,开启办公效率新革命

科技热闻

Microsoft Office LTSC 2024 for Mac (Microsoft 365) 16.95 - 文档、电子表格、演示文稿和电子邮件

sysin

Office

CrossOver 25.0 for macOS & Linux - 领先的 Wine 解决方案

sysin

crossover

【Redis技术进阶之路】「底层源码解析」揭秘高效存储模型与数据结构底层实现(跳跃表 - 上)

码界西柚

redis 跳表 跳跃表 redis 底层原理 数据库 nosql

4大观点直面呈现|直播回顾-DeepSeek时代的AI算力管理

雅菲奥朗

AI AI算力 DeepSeek

不止于监控,夜莺V6全新升级为开源观测平台_开源_InfoQ精选文章