

 写点什么

列式存储

收录了列式存储频道下的 50 篇内容

为什么 OLAP 需要列式存储

ClickHouse 是最近比较热门的用于在线分析处理的（OLAP）1数据存储，与我们常见的 MySQL、PostgreSQL 等传统的关系型数据库相比，ClickHouse、Hive 和 HBase 等用于在线分析处理（OLAP）场景的数据存储往往都会使用列式存储。

作者 : 面向信仰编程

2021-03-21

深入分析 Parquet 列式存储格式

Parquet是面向分析型业务的列式存储格式，由Twitter和Cloudera合作开发，2015年5月从Apache的孵化器里毕业成为Apache顶级项目，最新的版本是1.8.0。

作者 : 梁堰波

2015-08-07

71476

把 Nginx 日志压到只剩 1/170：ClickHouse 列式存储是怎么做到的？

在可观测性系统中，日志与追踪和指标一起构成三大支柱。

作者 : ClickHouse

2025-11-03

火山引擎 ByteHouse：分析型数据库如何设计列式存储

更多技术交流、求职机会，欢迎关注字节跳动数据平台微信公众号，回复【1】进入官方交流群

数据库

字节跳动数据平台

2024-01-30

什么是列数据库？全面解析列式存储的核心优势与应用场景

列式数据库正是为解决这一痛点而生，通过创新的存储结构和处理机制，为大数据分析场景带来了革命性的性能提升。

数据分析

列式存储

StarRocks

查询性能

列数据库

镜舟科技

2025-06-27

Google Spanner 再出新招：单库同时处理事务和分析，效果如何？

Google 为 Spanner 推出列式引擎，实现单库同时处理 OLTP 与 OLAP，性能最高提升 200 倍。

作者 : Steef-Jan Wiggers 译者: 田橙

2025-09-06

列存数据库，不只是列式存储

本文将从大数据存储格式的变迁；存取方式中 Early Materialization 和 Late Materialization 的权衡取舍；执行框架向优化 CPU 的方向迈进；关系算子结合存储进行优化等几个方面出发，对列存数据库进行详细讲解。

Kyligence

2021-12-08

数据库内核杂谈（三十）- 大数据时代的存储格式 -Parquet

欢迎阅读新一期的数据库内核杂谈。在内核杂谈的第二期（存储演化论）里，我们介绍过数据库如何存储数据文件。

作者 : 顾仲贤策划: 王一鹏

2023-04-12

Lucene 中的 Stored Fields 存储优化

Qunar 酒店的搜索和 suggest 是基于 Lucene 构建的，本文将介绍 Lucene 提供的相关机制，以及我们怎么利用这种机制去实现我们想要的功能。

作者 : Qunar技术沙龙

2021-01-09

实时分析都靠它→揭秘 YashanDB 列式存储引擎的技术实现

YashanDB列式存储引擎，又称为LSC（Large-scale Storage Columnar Table)。其通过自研的CBO优化器、向量化执行、原生列存格式等技术，达到业界领先的查询分析能力。

列式存储

yashandb

崖山数据库

YashanDB

2024-09-14

列式数据库和向量化

在这篇文章中，Siddharth Teotia讨论了列式数据库的优点，并介绍了Apache Arrow的向量化处理解决方案，以及基于Arrow的Dremio数据库中查询的详细处理。

作者 : Siddharth Teotia 译者: 方彦

2018-06-11

2771

实时分析利器|全面解读 YashanDB 列式存储引擎的核心技术

在海量数据时代，实时分析成为企业核心竞争力之一。YashanDB 针对这一需求，自研了列式存储引擎 LSC(Large-scale Storage Columnar Table)，通过 CBO 优化器、向量化执行、原生列存格式等多项技术，打造了兼顾极速分析与实时导入能力的新一代数据引擎。

数据库

数据库砖家

2025-04-28

大数据 -184 Elasticsearch Doc Values 机制详解：列式存储如何支撑排序 / 聚合 / 脚本

索引时生成的磁盘列式数据结构，面向排序、聚合与脚本取值优化；多数支持类型默认开启，text 字段默认不提供 doc values，需通过 keyword 子字段或启用 fielddata 才能聚合/排序（有明显堆内存代价）。在 ES 8.x（2025）实践中

Java

大数据

spring

elasticsearch

分布式

武子康

2025-12-15

图灵奖数据库大师 Stonebraker 师徒对数据库近 20 年发展与展望的 2 万字论文

数据库近20年总结与展望：“历史总是不断轮回”

作者 : 叶正盛策划: Tina

2024-07-19

AI 时代，当 MySQL 遇见列式存储引擎 DuckDB

2026年，AliSQL社区的一帮开发者们，开始为AliSQL注入创新的血液！这是他们的第一篇，系统阐述了MySQL深度融合DuckDB的重大技术实践。

阿里云

duckdb

数据库大数据

活动启动

数据Cool

01-23

查询性能提升 10 倍、存储空间节省 65%，Apache Doris 半结构化数据分析方案及典型场景

传统关系型数据库结构严格，难以应对半结构化数据的复杂性及多样性。

作者 : SelectDB 策划: 李冬梅

2024-09-23

TiDB + TiFlash ：朝着真 HTAP 平台演进

随着业务越来越复杂，数据量越来越大，DBA 们再也优化不动 SQL了，怎么办？

作者 : 韦万

2019-09-02

4933

并发提升 20+ 倍、单节点数万 QPS，Apache Doris 高并发特性解读

通过引入行式存储格式、点查询短路径优化、预处理语句以及行存缓存，Apache Doris 实现了单节点上万 QPS 的超高并发，实现了数十倍的性能飞跃。

作者 : SelectDB 策划: 李冬梅

2023-03-23

ClickHouse 发起十亿 JSON 文档挑战，性能完胜 MongoDB、PostgreSQL、ES 和 DuckDB 等数据库

在本文中，我们将 ClickHouse 的 JSON 实现与其他支持 JSON 的数据存储方案进行对比，测试结果可能会让你大吃一惊。

ClickHouse 策划: Luna

2025-06-09

Apache Kylin 权威指南（一）：背景历史和使命

本文节选自华章科技大数据技术丛书《Apache Kylin权威指南(第2版)》一书中的部分章节。

作者 : Apache Kylin核心团队

2020-04-13

400

创作场景

列式存储

为什么 OLAP 需要列式存储

深入分析 Parquet 列式存储格式

把 Nginx 日志压到只剩 1/170：ClickHouse 列式存储是怎么做到的？

火山引擎 ByteHouse：分析型数据库如何设计列式存储

什么是列数据库？全面解析列式存储的核心优势与应用场景

Google Spanner 再出新招：单库同时处理事务和分析，效果如何？

列存数据库，不只是列式存储

数据库内核杂谈（三十）- 大数据时代的存储格式 -Parquet

Lucene 中的 Stored Fields 存储优化

实时分析都靠它→揭秘 YashanDB 列式存储引擎的技术实现

列式数据库和向量化

实时分析利器|全面解读 YashanDB 列式存储引擎的核心技术

大数据 -184 Elasticsearch Doc Values 机制详解：列式存储如何支撑排序 / 聚合 / 脚本

图灵奖数据库大师 Stonebraker 师徒对数据库近 20 年发展与展望的 2 万字论文

AI 时代，当 MySQL 遇见列式存储引擎 DuckDB

查询性能提升 10 倍、存储空间节省 65%，Apache Doris 半结构化数据分析方案及典型场景

TiDB + TiFlash ：朝着真 HTAP 平台演进

并发提升 20+ 倍、单节点数万 QPS，Apache Doris 高并发特性解读

ClickHouse 发起十亿 JSON 文档挑战，性能完胜 MongoDB、PostgreSQL、ES 和 DuckDB 等数据库

Apache Kylin 权威指南（一）：背景历史和使命

热点文章