写点什么

不止于监控,夜莺 V6 全新升级为开源观测平台

夜莺项目管理委员会

  • 2023-03-21
    北京
  • 本文字数:2316 字

    阅读完需:约 8 分钟

不止于监控,夜莺V6全新升级为开源观测平台

不止于监控,夜莺 V6 来了!今天我们郑重发布夜莺 6.0 beta 版本,全面支持 Metrics、Logging、Tracing,向着构建开源、开放、完整的可观测性解决方案迈进。您可以借助夜莺 V6,接入和管理 Prometheus、ElasticSearch、Jaeger 多种数据源,实现数据的统一可视化、告警和分析。

可以在页面管理数据源了



无需修改配置文件里的 Clusters 配置了,直接在页面就可以管理了。除了兼容 Prometheus 查询协议的数据源,也支持 Jaeger 和 ElasticSearch 作为数据源接入。

可以接入 ElasticSearch 数据源了

类似 Grafana 的配置体验,可以接入已有的 ElasticSearch 数据源,自然的,就可以在夜莺里查看 ElasticSearch 的数据了,监控大盘的图表数据也可以从 ElasticSearch 获取。



可以接入 Jaeger 数据源查看链路数据了

Jaeger 在 CNCF 蓝图中,是链路追踪的佼佼者,所以我们首先支持了 Jaeger,目前做到的效果是可以在夜莺里查看 Trace 甘特图和拓扑依赖。




现在这个版本,可以把 metrics、logging、tracing 的数据都做到可视化了,只是数据串联方面还差一些,后续版本继续迭代优化,万里长征先走了一步。

架构做了简化


Nightingale 5.x 的版本,至少需要 n9e-webapi 和 n9e-server 两个模块,6.x 开始默认只需要一个模块了,就叫 n9e。我们先来回顾一下 5.x 的架构:



假设两个集群,Region01 是中心机房,部署了一整套夜莺,Region02 和 Region01 的网络链路不好,所以 Region02 单独搞了一套 TSDB,n9e-server 跟随 TSDB,所以 Region02 也部署了一套 n9e-server。图上其实少画了 Redis,n9e-webapi 和 n9e-server 都依赖 Redis,可以全局用一个 Redis,也可以每套 n9e-server 部署自己的 Redis。



6.x 版本把 webapi、pushgateway、alerting 模块合并成一个 n9e 模块了,这个模块可以对接多个数据源,n9e 模块也可以部署多个实例组成集群,架构上变简单了。


当然,如果某个机房和中心机房之间网络链路不好,想在这个边远的机房下沉部署一套时序库+告警引擎,也是 OK 的。除了 n9e 模块,我们也单独提供了 n9e-pushgw(数据转发网关) 和 n9e-alert(告警引擎),这俩模块是可选的,平时都用不到,只是应对边远机房网络链路不好的情况。

可维护性提升


除了架构方面做了简化,降低了维护复杂度,很多配置也挪到页面上管理了。比如单点登录相关的配置、告警发送模板相关的配置:


角色管理也挪到页面上了,不用像 5.x 的版本那样,只能通过修改数据库创建新的角色了。

增加了内置监控大盘


5.x 的版本其实就有内置监控大盘,但是必须把内置监控大盘导入到自己的业务组使用。6.x 开始,提供了内置大盘的浏览页面,可以不用导入自己的业务组直接使用。


欢迎夜莺社区的小伙伴一起共建共创,把内置监控大盘搞的多多的,为社区建设添砖加瓦,功在当代利在千秋!

增加了内置告警规则


同理,也内置了各类组件的告警规则,极大的增加了便利性。当然了,我们也非全能,期待社区小伙伴一起共建共创,把内置告警规则也搞的多多的,如果不知道如何贡献,可以联系我们。

继续优化了告警规则



附加标签支持变量了,于是,我们可以对告警的 vector 的标签做一些二次处理。



对于机器失联告警、机器时间偏移做了更好的实现。废弃了原本的 target_up 指标的生成逻辑,在告警规则里直接内置支持了机器失联告警和时间偏移告警,甚至,额外增加了机器失联比例告警。



阈值告警也做了优化,一个告警策略里可以配置多个规则,指定不同的级别,而且支持级别抑制,高级别的告警抑制低级别的告警。



顺便介绍一下告警规则的多时间段配置,其实 5.15 版本就支持了,但是很多人不知道,借此机会也一并说一下。这个功能是社区提出的,对于一些特定的场景非常有用。

继续优化了屏蔽规则



增加了大家心心念念的周期性屏蔽,惊不惊喜意不意外?看图就知道这个是啥意思了,我就不详细解释了。有没有感觉开源夜莺的一些功能已经比很多商业软件做的都好了。

继续优化了订阅规则



订阅规则引入了“订阅事件持续时长超过(秒)”的配置,这个功能很酷,一定程度上可以实现告警升级的功能,不过相比完备的告警升级,还是差点意思,没有认领、排班之类的功能,如果想建立统一的告警事件中心,接收各类监控系统的告警事件,统一做告警降噪、认领、升级、排班、协同等功能,请使用 FlashDuty,FlashDuty 是 SaaS 版本的 OnCall 中心,有免费套餐可用。

另外,订阅规则可以重新定义回调地址,可以对一些特定的告警事件做自动化处理,比如把特定的告警事件发给 FlashDuty。

夜莺开源社区发展和治理

夜莺监控,于 2022 年 5 月 11 日,正式托管于中国计算机学会开源发展委员会(CCF ODC),为 CCF ODC 成立后接受捐赠的第一个开源项目。在计算机学会的支持和带动下,在快猫星云和众多公司的持续投入下,和数千名社区用户的积极参与,截止当前,夜莺开源项目在 Github 上获得了 6K star,1K fork,近 100 位 Contributor,夜莺开源社区展现出了蓬勃的生机。


夜莺 V6,是夜莺监控往全栈可观测性解决方案迈进的关键一步,是夜莺项目管理委员会和夜莺开源社区共同努力的成果。


夜莺的开源仓库在 github.com/ccfos/nightingale 欢迎小伙伴们 star 收藏。前端代码和 V5 版本拆开了,放到了 github.com/n9e/fe 前端相关问题可以到这个 repo 提 issue。


夜莺开源项目大事记

  1. 2020 年 3 月,夜莺监控由滴滴技术正式在 Github 开源,凭借其优秀的产品设计、灵活性架构和明确清晰的定位,夜莺监控快速发展为国内最活跃的企业级云原生监控方案。

  2. 2022 年 5 月 11 日,夜莺监控正式捐赠予中国计算机学会开源发展委员会 CCF ODC,为 CCF ODC 成立后接受捐赠的第一个开源项目。

  3. 2022 年 8 月 1 日,发布夜莺监控开源社区治理架构,并公示相关的任命和社区荣誉。

  4. 2023 年 3 月 9 日,夜莺 V6 全新发布,夜莺监控升级为开源观测平台。

2023-03-21 18:197147

评论 1 条评论

发布
用户头像
对比grafana有什么优势?
2023-03-22 12:15 · 广东
回复
没有更多了
发现更多内容

AI诊后患者管理系统:让康复过程“有监测、有提醒、有陪伴”

上海拔俗

实验室RFID智能化解决方案

斯科信息

RFID智能危化品柜 CK-DP14 CK-GWHA

模糊照片如何快速变清晰?3个AI图片放大工具盘点

职场工具箱

人工智能 图片无损放大 AIGC 在线设计 AI工具

KWDB 3.0.0 正式发布!年度重磅升级,重塑 AIoT 产业智能数据基座

KaiwuDB

数据库 KaiwuDB 分布式多模数据库 KWDB开源数据库

AI变革,企业如何应用AI大模型重塑思考维度?

禅道项目管理

人工智能 AI AI编程 智能 BI 企业AI应用

经济越差,越是好产品脱颖而出的时候

Feedalyze

产品经理 用户 产品迭代 用户反馈 商业需求

大数据-156 Apache Druid+Kafka 实时分析实战:JSON 拉平摄取与 SQL 指标全流程

武子康

Java 大数据 分布式 Druid Apache Druid

人工智能皮肤科慢病管理系统

上海拔俗

AI 智能问答系统:用技术让知识服务“问得准、答得快、学得懂”

上海拔俗

直播预告|开启“智能升级”协作之旅,枫清科技让AI更“懂”行业

Fabarta

12月3日《如何运用 Scrum 打造一个高绩效的团队》

ShineScrum

Scrum 团队 团队成长 团队效率

EverShop IDOR漏洞分析:未经授权的订单信息访问

qife122

网络安全 IDOR

【FAQ】HarmonyOS SDK 闭源开放能力 — Notification Kit

HarmonyOS SDK

HarmonyOS NEXT HarmonyOS SDK应用服务

流程挖掘与AI双剑合璧:凡得科技董事长海广跃解密下一代智能流程管理新范式

凡得流程PROCESS X

流程 流程挖掘 流程智能 分析流程

用Comate的zulu 快速开发 “标书速读”网站

严学峰

AI编程 comate 文心快码Zulu

文件完整性监控工具

运维有小邓

日志管理 日志审计 日志管理系统 文件完整性 日志收集

广汽昊铂首获时速120公里的L3高速测试牌照

科技经济

AI 社区综合治理系统:让社区管理从“人盯人”变成“智能协同“

上海拔俗

人工智能赋能药监系统:用智能技术筑牢药品安全“防火墙”

上海拔俗

ERP实施,从哪几个方面入手能保证成功落地?

优秀

ERP ERP实施

AI 慢病高危管理系统:让风险“早发现、可干预、能下降”

上海拔俗

使用AI简化身份安全查询的技术实践

qife122

自然语言处理 身份安全

基于 Hologres 构建智能驾驶图像高性能分析系统

阿里云大数据AI技术

sql 阿里云 数据分析 hologres 多模态分析

AI 智能分析平台系统:用数据智能让决策“看得清、判得准、行得稳”

上海拔俗

集成专栏——MQ 消息集成的可靠性保障

inBuilder低代码平台

事件总线 ERP系统 MQ消息 消息异步传递

「 活动 」阿里云 ESA 有奖征文|六大选题 + 多档奖励,所有人均可参加

阿里云CloudImagine

云计算 阿里云 边缘计算 征文投稿 ESA

AI运营分析平台:让业务数据“自己说话”、让运营决策更聪明

上海拔俗

AI 大语言模型知识图谱:让模型“更懂知识、更聪明、更可信”

上海拔俗

流程大咖说 | 流程建模在相邻建模学科背景下的未来

凡得流程PROCESS X

流程智能 #流程挖掘 流程可视化

昇腾384超节点深圳首秀!光明实验室携手华为开启国产AI生态“新丝绸之路”

极客天地

ToDesk:办公高效协作,游戏畅爽操控,远程新境界

小喵子

远程办公 远程 远程游戏

不止于监控,夜莺V6全新升级为开源观测平台_开源_InfoQ精选文章