收录了 列存储 频道下的 50 篇内容
与传统的数据库表存储方式相比,列数据存储技术能够极大地改进性能,但并不代表它在所有场合下都能够执行得更快。Aleksandr Shavlyuga在本文中将带领我们探索SQL Server中的列存储索引的强大性能以及在使用上的限制。
SQL Server 2016的一项新特性是可以在“内存优化表(Memory Optimized Table)”上添加“列存储索引(Columnstore Index)”。列存储索引虽然没有传统的B树索引那么快,但比表扫描要快得多。这特别适合于那种无法预测需要什么索引的即时报表。
本文介绍了大规模数据存储的两种物理存储格式在磁盘上的布局,并分析了两种存储格式各自的优点和缺点,以及在产品设计过程中应避免的一些问题。
聚集列存储索引(CC Index)是SQL Server 2014中两大最引人瞩目的特性之一,设计为用于超过1千万条记录的数据表。使用者无需明确的指定索引,也能够保证分析式查询的优良性能。而在SQL Server 2016中,它又获得了支持二级索引的功能。
Supersonic是一个面向列存储数据库的查询引擎库,它提供了一组Google宣称“超级快速”数据变换原语。
非聚集列存储索引(NCC Index)在SQL Server 2016中也得到了一定程度的功能增强,其中最引人注目的一条在于可以对其进行更新了。
ClickHouse 是最近比较热门的用于在线分析处理的(OLAP)1数据存储,与我们常见的 MySQL、PostgreSQL 等传统的关系型数据库相比,ClickHouse、Hive 和 HBase 等用于在线分析处理(OLAP)场景的数据存储往往都会使用列式存储。
试想一下,如何才能在一秒钟内对拥有十四亿四千万条记录、大小为1TB的表完成点对点的数据挖掘查询呢?这正是微软想要通过使用拥有32个CPU的计算机和基于列的存储引擎所要支持的情况。
Parquet是面向分析型业务的列式存储格式,由Twitter和Cloudera合作开发,2015年5月从Apache的孵化器里毕业成为Apache顶级项目,最新的版本是1.8.0。
1. SQL On Hadoop分类。 2. 运行引擎的设计。 3.性能优化。
本文介绍Cassandra数据库的部分内容。
Uber开源基于GPU的实时分析引擎AresDB
观测云数据架构升级实践。
LAXCUS是一套数据管理软件,应用于大规模数据存储和计算环境。这是一个独立和完整的产品,融合了包括数据存储、网络通信、网络计算、数据安全、网络安全、任务调度、容错处理、自动化管理、人机交互接口、应用开发等多方面的技术。LAXCUS采用JAVA语言编写,支持行/列两种数据存储,通过终端或者应用接口嵌入方式接入,执行SQL和类SQL操作。产品布署使用快捷简单,遵循LGPL协议,开放源代码,运行在LINUX平台。
Michael Stonebraker——Ingres和 Postgres关系型数据库管理系统(RDBMS)的创造者之一,Vertica Systems的CTO——在数据库社区里提出了一个争议性的观点,他认为现在主要的数据库中,大部分都属于过时的技术。
Apache Cassandra 官网地址 https://cassandra.apache.org/ 最新版本4.1.1
数据库近20年总结与展望:“历史总是不断轮回”
美国时间 2017 年 10 月 2 日,微软最新一代数据库 SQL Server 2017 正式发布。SQL Server 2017 带来了一系列全新的功能与设计,体现了微软在数据平台建设方面的最新思考和实践。InfoQ 特邀国双科技高级技术总监何恺铎撰文对 SQL Server 2017 进行深入探讨和解析,以飨各位读者。
11 月 4 日,微软正式发布了其新一代数据库产品 SQL Server 2019,带来了大数据集群、数据虚拟化等重磅特性。
NoSQL数据库领域中,存在不同的数据库,支持了各种各样的数据存储模式。InfoQ与四位专家就以下几点进行了讨论:当前采用NoSQL的状况,不同NoSQL数据库所支持的架构模式,广泛持久性及采用NoSQL数据库的安全因素。