写点什么

Grafana Labs 发布 Mimir 3.0,推出全新架构以提升性能

作者:Claudio Masolo

  • 2025-11-27
    北京
  • 本文字数:1562 字

    阅读完需:约 5 分钟

大小:775.34K时长:04:24
Grafana Labs 发布 Mimir 3.0,推出全新架构以提升性能

Grafana Labs 发布了 Grafana Mimir 3.0,可以说是这款开源、可横向扩展的时序数据库的重要升级。本次版本采用全新的架构,将读写操作彻底分离,大幅提升了在大规模指标场景下的性能、可靠性和成本效率。

 

Grafana Mimir 自 2022 年推出以来,已成为普罗米修斯(Prometheus)和 OpenTelemetry 生态中领先的指标后端之一,目前在 GitHub 上拥有超过 4700 颗星,并由约 30 名维护者积极贡献。该项目的核心目标是打造一款高度可扩展、高效的开源时序数据库,能够支撑 10 亿条以上的活跃序列。

 

3.0 版本的核心亮点是全新的解耦架构,解决了早期版本中的关键瓶颈。在过去的 Mimir 版本中,ingester 组件同时负责写入和读取,这意味着在查询负载很重时,会挤占写入性能。新版架构引入 Apache Kafka 作为读写路径之间的异步缓冲层,使摄取和查询能够独立扩展,并消除了此前影响系统稳定性的互相依赖关系。

 


Mimir 3.0 架构

 

这次的架构升级引入了 “ingest storage(ingest 存储)”,这是 Grafana Labs 设计的关键组件,用来避免查询量的突然上升拖慢数据写入,反之亦然。内部测试显示,系统可靠性有了显著提升,尤其是在组件开始出现故障的早期阶段,读取路径因 ingester 随机故障而导致宕机的风险大幅下降。

 

架构调整的同时,Mimir 3.0 还将 Mimir Query Engine(MQE)设为默认查询引擎。MQE 首次在 Mimir 2.17 中推出,其处理方式不同于传统的普罗米修斯 PromQL 引擎。普罗米修斯的查询引擎会批量加载样本数据,导致内存使用不可预测;而 MQE 采用流式执行方式,在查询过程的每个步骤只加载当前需要的样本。Grafana Labs 表示,这种方式能够将峰值内存消耗降低多达 92%,让查询速度更快,也让系统在高负载下保持更稳定,同时依然保持 100% 的 PromQL 兼容性。

 

性能提升不仅体现在查询执行上。Grafana Labs 的测试结果显示,在他们的大规模集群中,资源使用量减少了最多 15%,同时性能和可靠性反而更好。这些收益来自解耦架构与流式查询引擎的组合效果。

 

Mimir 3.0 的设计反映了团队在大规模运行 Mimir 时的经验,其中包括像 CERN 这类大规模用户的反馈。他们将重点放在三个核心方向上:

  • 通过分离职责提升可靠性

  • 通过流式查询提升性能

  • 通过更高效的资源使用降低成本

 

由于架构变更幅度很大,Grafana Labs 建议组织谨慎规划升级流程。升级需要在现有集群旁部署一个新的 Mimir 集群,然后调整写入客户端,让数据同时写入多个端点,最后再将读取客户端切换到新集群。在此期间,组织需要同时调整两个集群的 Helm 或 Jsonnet 配置。

 

目前,Mimir 3.0 的新能力已经在 Grafana Cloud Metrics(基于 Mimir 的托管指标服务)上线。对于自建部署的用户,项目文档提供了升级指南和发布说明,帮助团队顺利迁移到新架构。

 

这次发布体现了过去三年的打磨成果,也继续推动项目在指标存储与查询方面的发展方向。Mimir 3.0 的解耦架构与升级后的查询引擎,为组织在扩展可观测性系统时提供了更高的效率,同时降低了复杂度和资源成本。

 

对于寻找 Mimir 替代方案的组织而言,也有不少成熟的时序数据库可选。普罗米修斯是一款非常流行的开源工具,具备强大的 PromQL 查询语言,并与 Kubernetes 深度集成,不过其设计主要面向单节点场景。InfluxDB 则擅长应对高写入和高查询负载,拥有 InfluxQL 和 Flux 查询语言,适合 IoT 与实时分析场景。TimescaleDB 是 PostgreSQL 的扩展,适合熟悉 SQL 的团队,可复用现有工具,同时获得时序优化能力。云原生场景下,亚马逊 Timestream谷歌云 Monitoring 提供托管服务,可减少运维成本。Thanos 则通过加入长期存储和全局查询能力,扩展了普罗米修斯,并解决了部分 Mimir 同样关注的可扩展性问题。不同方案在可扩展性、查询性能、运维复杂度以及生态兼容性方面各有取舍。


原文链接:

https://www.infoq.com/news/2025/11/grafana-mimir-3/

2025-11-27 09:452628

评论

发布
暂无评论

Pytest 框架与常用操作

测吧(北京)科技有限公司

测试

软件测试丨Pytest 参数化与调度执行

测试人

软件测试

Web兼容性测试思路详解

测吧(北京)科技有限公司

测试

南京大学苏州校区学生代表团到访合合信息,开启“沉浸式”人工智能企业行

合合技术团队

人工智能 科技 校企合作 南京大学

VTS:基于Apache SeaTunnel的开源向量数据迁移工具

白鲸开源

GitHub 数据集成 Apache SeaTunnel 开源、 VTS

AIC和ScaleFlux(锐钲)发布基于NVIDIA BlueField-3 DPU的新型存储阵列

ScaleFlux

如何使用PHP开发1688商品详情API接口

科普小能手

数据采集 1688 API 接口 1688代采 1688 API

用豆包MarsCode ,陪你云赏月

TRAE.ai

Pytest 参数化与基本装饰器用法

测吧(北京)科技有限公司

测试

Rust 错误处理在 GreptimeDB 的实践

Greptime 格睿科技

rust 错误 错误处理

Web兼容性测试思路详解

测吧(北京)科技有限公司

测试

从孤岛到协同,集成式财务规划的未来

智达方通

数据孤岛 业财融合 集成式财务协作 财务协作

2024华为云开源开发者论坛完整议程揭晓,云原生专场邀您共探前沿技术!

华为云原生团队

云计算 容器 云原生 Volcano kubeedge

技术实践 | AI 安全:通过大模型解决高危WEB应用识别问题

百度安全

SecureCRT & SecureFX 9.6 发布,新增功能概览

sysin

securecrt SecureFX

Supersonic 推出混合休闲游戏开发大赛 为开发者提供丰厚资金支持与专家指导

极客天地

并行区块链全解:执行原理、代表项目及技术发展周期

区块链软件开发推广运营

交易所开发 dapp开发 链游开发 公链开发 钱包开发

Pytest框架:提升软件测试的利器

测试人

软件测试

Pytest 编写自动化测试用例规则

测吧(北京)科技有限公司

测试

Pytest 结合数据驱动的用法详解

测吧(北京)科技有限公司

测试

比特币临近10万美元回调:后市走势与关键因素解读

区块链软件开发推广运营

交易所开发 dapp开发 链游开发 公链开发 代币开发

Python多任务编程在软件测试中的应用

测试人

软件测试

NineData ChatDBA发布重大更新,准确率飙升

NineData

数据库 大模型 ChatGPT NineData ChatDBA

DolphinScheduler JavaTask动态传参秘籍:轻松实现任务间数据流动

白鲸开源

开源 干货 Apache DolphinScheduler 参数传递

为什么不建议中小企业自己研发管理系统?

积木链小链

企业管理 数字化 ERP 中小企业

Grafana Labs 发布 Mimir 3.0,推出全新架构以提升性能_架构_InfoQ精选文章