在 2025 收官前,看清 Data + AI 的真实走向,点击查看 BUILD 大会精华版 了解详情
写点什么

Apache Pinot 1.0 发布,提供实时的分布式 OLAP 数据存储

  • 2024-01-06
    北京
  • 本文字数:941 字

    阅读完需:约 3 分钟

Apache Pinot 1.0发布,提供实时的分布式OLAP数据存储

Apache Pinot 是一个使用 Java 编写的开源列式分布式数据存储系统。Pinot 通过在线分析处理 (OLAP) 来响应低延迟的多维分析 (MDA) 查询。


Pinot 最初在 2013 年作为 LinkedIn 的内部项目,用于支持分析解决方案,随后于 2015 年 6 月基于 Apache 2.0 许可开源。该项目于 2019 年 6 月成为 Apache 软件基金会的一部分。


在 1.0 版本发布之前的一年中,社区解决了 300 多个问题,包括引入新特性、提高性能和 bug 修复。目前该项目在 GitHub 上有 130 多万行代码,由 300 多名贡献者进行维护。


Apache Pinot 最适合用于分析不可变的实时摄入数据,尤其是在查询具有多个维度和度量的时间序列数据时。该项目使用 Apache Helix 作为集群管理嵌入式代理,使用 Apache Zookeeper 进行集群状态和健康的协调和维护。


Pinot 提供快速查询,能够在几十毫秒的 P90 延迟内过滤和聚合 PB 级的数据。数据可以使用流式解决方案(如 Apache Kafka、Apache Pulsar 和 AWS Kinesis)实时摄入,也可以使用 Apache Hadoop、Apache Spark 和 AWS S3 进行批量摄入。Pinot 具备了水平伸缩性和容错性。可使用 Pinot 查询语言 (PQL)、SQL 或 Trino 和 Presto SQL 查询引擎查询数据。PQL 支持类似于 SQL 的功能:选择、聚合、分组、排序和过滤。


该版本的关键特性之一是多阶段查询引擎的功能完整性。默认查询执行引擎从未针对复杂查询(如分布式连接和窗口操作)进行过优化。多阶段查询引擎支持多阶段运算符,如实时分布式连接和窗口操作,并配备了新的最小化了数据重洗的查询计划优化器。Apache Pinot 的文档解释了如何启用多阶段查询引擎。


入门指南描述了如何在本地、Docker、Kubernetes 或 Azure、GCP 、 AWS 公共云上运行 Pinot。下面的命令用于使用预加载的棒球数据集来运行 Pinot:


docker run \      -p 9000:9000 \      apachepinot/pinot:0.12.0 QuickStart \      -type batch
复制代码


快速入门示例提供了不同的示例和所有可用的启动命令。


更多详细信息可在发布说明和 Apache Pinot 1.0 的公告中找到。StarTree 开发者关系副总裁 Tim Berglund 在 YouTube 上介绍了 Apache Pinot 1.0 并解释了 Apache Pinot 的一般性情况。Apache Pinot Meetup Group 定期组织会议,开发者可在 Slack 上提问。


原文链接

https://www.infoq.com/news/2023/12/apache-pinot/


2024-01-06 08:0011739

评论 3 条评论

发布
用户头像
1
2024-01-08 17:02 · 江苏
回复
2
2024-01-08 17:06 · 江苏
回复
3
2024-01-08 17:06 · 江苏
回复
没有更多了
发现更多内容

【web 开发基础】PHP8中数组的序列化和反序列化(54)

迷彩

数组 对象 序列化 反序列化 PHP基础

阿根廷夺冠梅西加冕,球场外视频平台角逐世界杯

易观分析

视频 足球 卡塔尔世界杯

BI-数据可视化 | 年度干货合集

搞大屏的小北

数据可视化工具 BI 分析工具 BI分析 市场分析

【冲破信息孤岛】华为云大数据BI,助力金融行业进行数字化转型

秃头也爱科技

打碎软件应用,在产业互联场景中串联—钉钉7.0关注企业间高效协同

B Impact

华为云对象存储OBS,助力企业降本增效

清欢科技

助力企业降本增效:华为云ECS,助力企业数字化转型需求

IT科技苏辞

【web 开发基础】如何调换数组中的键和值(53)

迷彩

数组合并 数组操作 PHP基础 数组整理

【web 开发基础】PHP中的类和对象(55)

迷彩

面向对象 封装、继承、多态 类与对象 PHP基础

2022年度总结:虽迷茫,仍前行

年度总结

华为云OBS对象存储:企业“上云”的好帮手

清欢科技

HTTP的四种认证方式

穿过生命散发芬芳

HTTP 12月月更

提升企业决策能力,华为云用大数据BI助力企业腾飞

秃头也爱科技

解决“双十一”电商行业数据存储难题,华为云OBS值得期待

清欢科技

支持故障自动秒级检测,华为云VPN更省心!

IT科技苏辞

共创、共享、共赢云生态,华为云ECS助力企业轻松上云

IT科技苏辞

华为云ECS弹性服务器,加快企业数字化转型的进程!

IT科技苏辞

华为云对象存储,助力企业驶入“数据快车道”

清欢科技

实力是最好的武器!华为云ECS助力企业更好发展

IT科技苏辞

我凭借这份pdf,最终拿到了阿里,腾讯,京东等八家大厂offer

钟奕礼

程序员 Java 面试 Java、 java 编程

RayLink测评 | 完全免费,功能超越同类付费远程控制软件!!

RayLink远程工具

远程控制软件 远程办公软件 远控软件

数字经济时代,为什么华为云ECS能获得更多用户的青睐?

IT科技苏辞

大数据一站式服务,华为云大数据BI驱动企业业务线增长

秃头也爱科技

跨浏览器测试策略

FunTester

2022年中国数字文化娱乐产业综合分析

易观分析

产业 文娱

如何准备Java技术岗春招面试:史上最全Java核心知识点笔记奉上

钟奕礼

程序员 Java 面试 Java、 java 编程

推动企业稳定发现,华为云大数据助力能源企业纾困

秃头也爱科技

2022-12-30:某天小美进入了一个迷宫探险,根据地图所示,这个迷宫里有无数个房间 序号分别为1、2、3、...入口房间的序号为1 任意序号为正整数x的房间,都与序号 2*x 和 2*x + 1

福大大架构师每日一题

算法 rust 福大大

Android程序签名打包

芯动大师

Android Studio 打包签名 签名的含义

PostgreSQL 技术内幕(四)执行引擎之Portal

酷克数据HashData

postgresql

华为云对象储存OBS,为企业提供优秀且安全的数据储存环境

清欢科技

Apache Pinot 1.0发布,提供实时的分布式OLAP数据存储_实时计算_Johan Janssen_InfoQ精选文章