写点什么

列存储

收录了 列存储 频道下的 50 篇内容

通过 MS SQL 列存储索引实现大数据解决方案

与传统的数据库表存储方式相比,列数据存储技术能够极大地改进性能,但并不代表它在所有场合下都能够执行得更快。Aleksandr Shavlyuga在本文中将带领我们探索SQL Server中的列存储索引的强大性能以及在使用上的限制。

SQL Server 2016:内存列存储索引

SQL Server 2016的一项新特性是可以在“内存优化表(Memory Optimized Table)”上添加“列存储索引(Columnstore Index)”。列存储索引虽然没有传统的B树索引那么快,但比表扫描要快得多。这特别适合于那种无法预测需要什么索引的即时报表。

大数据存取的选择:行存储还是列存储?

本文介绍了大规模数据存储的两种物理存储格式在磁盘上的布局,并分析了两种存储格式各自的优点和缺点,以及在产品设计过程中应避免的一些问题。

SQL Server 2016 —— 聚集列存储索引的功能增强

聚集列存储索引(CC Index)是SQL Server 2014中两大最引人瞩目的特性之一,设计为用于超过1千万条记录的数据表。使用者无需明确的指定索引,也能够保证分析式查询的优良性能。而在SQL Server 2016中,它又获得了支持二级索引的功能。

使用 Google Supersonic 查询列存储数据库

Supersonic是一个面向列存储数据库的查询引擎库,它提供了一组Google宣称“超级快速”数据变换原语。

SQL Server 2016 —— 可更新的非聚集列存储索引

非聚集列存储索引(NCC Index)在SQL Server 2016中也得到了一定程度的功能增强,其中最引人注目的一条在于可以对其进行更新了。

为什么 OLAP 需要列式存储
为什么 OLAP 需要列式存储

ClickHouse 是最近比较热门的用于在线分析处理的(OLAP)1数据存储,与我们常见的 MySQL、PostgreSQL 等传统的关系型数据库相比,ClickHouse、Hive 和 HBase 等用于在线分析处理(OLAP)场景的数据存储往往都会使用列式存储。

SQL Server 2011 中基于列的存储方式

试想一下,如何才能在一秒钟内对拥有十四亿四千万条记录、大小为1TB的表完成点对点的数据挖掘查询呢?这正是微软想要通过使用拥有32个CPU的计算机和基于列的存储引擎所要支持的情况。

深入分析 Parquet 列式存储格式

Parquet是面向分析型业务的列式存储格式,由Twitter和Cloudera合作开发,2015年5月从Apache的孵化器里毕业成为Apache顶级项目,最新的版本是1.8.0。

一篇文章掌握 Sql-On-Hadoop 核心技术

1. SQL On Hadoop分类。 2. 运行引擎的设计。 3.性能优化。

把 Nginx 日志压到只剩 1/170:ClickHouse列式存储是怎么做到的?
把 Nginx 日志压到只剩 1/170:ClickHouse 列式存储是怎么做到的?

在可观测性系统中,日志与追踪和指标一起构成三大支柱。

什么是列存储(Columnar Storage)?深度解析其原理与应用场景
什么是列存储(Columnar Storage)?深度解析其原理与应用场景

深入了解列存储技术的核心原理、关键优势及最佳应用场景,掌握这一数据分析利器如何为企业带来10-100倍查询性能提升。

数据分析
StarRocks
湖仓一体
列存储
延迟物化
读过本文才算真正了解Cassandra数据库
读过本文才算真正了解 Cassandra 数据库

本文介绍Cassandra数据库的部分内容。

为什么已有Elasticsearch,我们还要重造实时分析引擎AresDB?
为什么已有 Elasticsearch,我们还要重造实时分析引擎 AresDB?

Uber开源基于GPU的实时分析引擎AresDB

Michael Stonebraker:主要的 RDBMS 都是过时的技术

Michael Stonebraker——Ingres和 Postgres关系型数据库管理系统(RDBMS)的创造者之一,Vertica Systems的CTO——在数据库社区里提出了一个争议性的观点,他认为现在主要的数据库中,大部分都属于过时的技术。

HTAP 数据库存储引擎技术演进 | DBTalk 技术公开课第5期
HTAP 数据库存储引擎技术演进 | DBTalk 技术公开课第 5 期

近年来 HTAP 数据库受到工业界和学术界越来越多的关注,数据库存储引擎也从以往的面向 TP 场景的行存和面向 AP 场景的列存储独立发展的道路,走向了行存 + 列存并由存储引擎根据数据冷热度自动调度数据分布的混和形式,以实现在同一份数据上同时满足 TP AP 两种需求,并且降低用户存储成本,同时结合云原生时代的廉价对象存储可以进一步降低用户成本,本次分享将带来业界在存储引擎方向兼容 TP 与 AP 能力,打造极致性能的探索与实践。

在 SQL 数据库中使用内存中技术优化性能

使用 Azure SQL 数据库中的内存中技术可在各种工作负荷上实现性能改善:事务工作负荷(联机事务处理 (OLTP))、分析工作负荷(联机分析处理 (OLAP))和混合工作负荷(混合事务/分析处理 (HTAP))。 由于查询和事务处理的效率提升,内存中技术还可降低成本。 用户通常不需要升级数据库的定价层即可实现性能提升。 在某些情况下,即使是降低定价层,使用内存中技术也能实现性能改善。

应运而生! 双 11 当天处理数据 5PB—HiStore 助力打造全球最大列存储数据库

阿里巴巴电商平台历史数据存储与查询相关业务, 大量采用基于列存储技术的HiStore数据库,双11当天HiStore引擎处理数据记录超过6万亿条、原始存储数据量超过5PB。从单日数据处理量上看,该系统已成为全球最大列存储数据库。

Google Spanner 再出新招:单库同时处理事务和分析,效果如何?
Google Spanner 再出新招:单库同时处理事务和分析,效果如何?

Google 为 Spanner 推出列式引擎,实现单库同时处理 OLTP 与 OLAP,性能最高提升 200 倍。

数据库内核杂谈(三十)- 大数据时代的存储格式-Parquet
数据库内核杂谈(三十)- 大数据时代的存储格式 -Parquet

欢迎阅读新一期的数据库内核杂谈。在内核杂谈的第二期(存储演化论)里,我们介绍过数据库如何存储数据文件。

列存储专题_资料-InfoQ中文网