写点什么

Apache Pinot 1.0 发布,提供实时的分布式 OLAP 数据存储

  • 2024-01-06
    北京
  • 本文字数:941 字

    阅读完需:约 3 分钟

Apache Pinot 1.0发布,提供实时的分布式OLAP数据存储

Apache Pinot 是一个使用 Java 编写的开源列式分布式数据存储系统。Pinot 通过在线分析处理 (OLAP) 来响应低延迟的多维分析 (MDA) 查询。


Pinot 最初在 2013 年作为 LinkedIn 的内部项目,用于支持分析解决方案,随后于 2015 年 6 月基于 Apache 2.0 许可开源。该项目于 2019 年 6 月成为 Apache 软件基金会的一部分。


在 1.0 版本发布之前的一年中,社区解决了 300 多个问题,包括引入新特性、提高性能和 bug 修复。目前该项目在 GitHub 上有 130 多万行代码,由 300 多名贡献者进行维护。


Apache Pinot 最适合用于分析不可变的实时摄入数据,尤其是在查询具有多个维度和度量的时间序列数据时。该项目使用 Apache Helix 作为集群管理嵌入式代理,使用 Apache Zookeeper 进行集群状态和健康的协调和维护。


Pinot 提供快速查询,能够在几十毫秒的 P90 延迟内过滤和聚合 PB 级的数据。数据可以使用流式解决方案(如 Apache Kafka、Apache Pulsar 和 AWS Kinesis)实时摄入,也可以使用 Apache Hadoop、Apache Spark 和 AWS S3 进行批量摄入。Pinot 具备了水平伸缩性和容错性。可使用 Pinot 查询语言 (PQL)、SQL 或 Trino 和 Presto SQL 查询引擎查询数据。PQL 支持类似于 SQL 的功能:选择、聚合、分组、排序和过滤。


该版本的关键特性之一是多阶段查询引擎的功能完整性。默认查询执行引擎从未针对复杂查询(如分布式连接和窗口操作)进行过优化。多阶段查询引擎支持多阶段运算符,如实时分布式连接和窗口操作,并配备了新的最小化了数据重洗的查询计划优化器。Apache Pinot 的文档解释了如何启用多阶段查询引擎。


入门指南描述了如何在本地、Docker、Kubernetes 或 Azure、GCP 、 AWS 公共云上运行 Pinot。下面的命令用于使用预加载的棒球数据集来运行 Pinot:


docker run \      -p 9000:9000 \      apachepinot/pinot:0.12.0 QuickStart \      -type batch
复制代码


快速入门示例提供了不同的示例和所有可用的启动命令。


更多详细信息可在发布说明和 Apache Pinot 1.0 的公告中找到。StarTree 开发者关系副总裁 Tim Berglund 在 YouTube 上介绍了 Apache Pinot 1.0 并解释了 Apache Pinot 的一般性情况。Apache Pinot Meetup Group 定期组织会议,开发者可在 Slack 上提问。


原文链接

https://www.infoq.com/news/2023/12/apache-pinot/


2024-01-06 08:0011698

评论 3 条评论

发布
用户头像
1
2024-01-08 17:02 · 江苏
回复
2
2024-01-08 17:06 · 江苏
回复
3
2024-01-08 17:06 · 江苏
回复
没有更多了
发现更多内容

悟空活动中台-打造 Nodejs 版本的MyBatis

vivo互联网技术

Java 大前端 mybatis nodejs

2020 阿里云原生实战峰会即将开幕 云原生落地的正确姿势

阿里巴巴云原生

阿里巴巴 阿里云 开发者 云原生 实战

(G20200388020528)第一周练习

走走,停停……

ZEGO即构科技荣获36氪【WISE2020中国新经济之王最具影响力企业】

ZEGO即构

Swift性能优化分析

ios swift

Kubernetes 1.20发布,Release Logo变成一只猫

晓川

《算法问题整理》​.pdf

田维常

浅谈ToB市场精细化运营

Linkflow

营销数字化 客户数据平台 CDP 精细化运营

Redis 如何实现点赞、取消点赞

Bruce Duan

Redis实现点赞

即构科技肖传发:即刻构建在线教育的音视频互动场景

ZEGO即构

DB-Engines 12月数据库排名: PostgreSQL拿下同期涨幅榜冠军,有望获得「2020年度数据库」荣誉?

华章IT

数据库 postgresql

话题讨论 | 图解一致性哈希算法全小区局域网最通俗易懂

程序员柠檬

数据结构与算法系列之散列表(一)(GO)

书旅

数据结构 算法 Go 语言

架构师训练营第一期 - 第十一周课后作业

卖猪肉的大叔

极客大学架构师训练营

从容应对11.11大促 京东智联云云硬盘做对了哪些事?

京东科技开发者

云计算 高可用 云硬盘

大厂也在用的 6种 数据脱敏方案,严防泄露数据的 “内鬼”

程序员小富

Java 数据脱敏;

药品安全追溯系统开发区块链技术

13828808769

安全 区块链+

mybatis快速入门,so easy啦

田维常

mybatis

当我们谈前端性能的时候,我们谈的是什么

vivo互联网技术

性能优化 大前端 页面

为什么建议使用你 LocalDateTime ,而不是 Date?

Bruce Duan

LocalDateTime Date

TronChain波场链系统软件开发|TronChain波场链APP开发

系统开发

公安舆情分析重点人员管控系统搭建解决方案

t13823115967

智慧公安 舆情分析

5种分布式事务方案与阿里的 Seata 中间件

Bruce Duan

分布式事务 seata

《迅雷链精品课》第十一课:区块链常用共识算法介绍

迅雷链

区块链

大厂iOS面试题全面讲解(上)

ios 面试

G20200388020528第二周作业

走走,停停……

AR智能眼镜会成未来趋势

anyRTC开发者

人工智能 音视频 WebRTC RTC

《前端算法系列》数组去重

徐小夕

Java 面试 算法 大前端

通过docker获取系统运行情况的实用命令

晓川

一个依赖搞定 Spring Boot 反爬虫,防止接口盗刷!

Bruce Duan

反爬虫组件 kk-anti-reptile

区块链应用落地,区块链电子票据应用平台搭建

t13823115967

区块链+ 区块链应用 区块链落地开发

Apache Pinot 1.0发布,提供实时的分布式OLAP数据存储_实时计算_Johan Janssen_InfoQ精选文章