写点什么

SQL Server 2011 中基于列的存储方式

  • 2011-03-14
  • 本文字数:827 字

    阅读完需:约 3 分钟

和大多数主流数据库一样,如果表拥有聚集索引,那么 SQL Server 就会以 B- 树的方式存储,否则就会使用的方式存储。这两种方法本质上都是基于行的,其中每页中行的条数会根据总体上行的大小不同而不同。从SQL Server 2011 开始,微软为我们提供了第三种选择。SQL Server 会提供一种“列存储索引”,从而以列而不是行的方式来存储数据。

当使用数据规模为1TB、记录条数为十四亿四千万的表时,微软声称基于列的查询在CPU 时间上会有16 倍的提升,而在使用时间上会有455 倍的提高。在真实情况下,这意味着本来要耗费501 秒的查询,现在只需要1.1 秒就可以完成了。这项测试是在拥有32 个逻辑处理器和256GB 内存的计算机上执行的。

微软把每个列都隔离在自身的一组页中,从而达到了这种惊人的改善。当执行查询的时候,只会从磁盘载入位于结果集中的列。而包含其它列的页会被忽略。

这种方法相当于为每种我们所能想象到的列组合创建替代索引。然而,这种方式不会消耗大量的磁盘空间,它实际上会比传统的表占用更小的空间。由于SQL Server 的压缩会发生在页级别上,并且和行相比,列中的数据更容易重复,所以使用列存储索引的表将会拥有更高的压缩等级。

但暂时我们还不能轻易决定使用列存储索引。首先也是最重要的,它们是不可更新的。一旦创建了列存储的索引,那么就不允许在表上执行插入、更新或者删除等操作了。微软期望更多商店每天对数据进行刷新,否则就需要把数据做只读处理。在刷新周期中,我们会删除索引,更新数据,然后再重新建立索引。由于这肯定是代价昂贵的操作,所以我们可以使用垂直分区来把操作限制到逻辑表的子集范围内。

使用列存储的索引也会导致性能的降低。如果你使用大多数列,那么重新组合行会耗费大量的资源。这意味着OLTP 样式的查询应该避免这种方式,而对于OLAP 形式的查询,这种方式会比较有利。或者换句话说,如果你在编写“SELECT *”或者每次抓取一行数据,那么列存储索引就不适合你。

查看英文原文: Column-based Storage in SQL Server 2011

2011-03-14 07:052792
用户头像

发布了 340 篇内容, 共 143.5 次阅读, 收获喜欢 13 次。

关注

评论

发布
暂无评论
发现更多内容

并发编程系列:关于线程中断

程序员架构进阶

Java 并发 28天写作 2月春节不断更

抽奖助手小程序 发起抽奖用例

Shine

产品

产品经理训练营第四周作业

产品经理训练营

产品经理第 0 期训练营第四周作业提交

Krystal

Electron 多进程方案

将儒

Electron 多进程

如何在不辞职的情况下,改变不喜欢的工作?

熊斌

2月春节不断更

产品经理训练营第四周作业

happy-黑皮

产品经理训练营

产品经理训练营第四次作业

庞玉坤

【STM32】1.44寸TFT液晶屏显示字符、汉字和图片

AXYZdong

硬件 stm32 2月春节不断更

前端冲刺必备指南-执行上下文/作用域链/闭包/一等公民

我是哪吒

面试 大前端 编程语言 2月春节不断更 二月春节不断更

第四次作业及总结

青葵

学习

程序员成长第七篇:面试中需要注意的事项

石云升

面试 招聘 2月春节不断更

产品经理训练营第四章作业(一)

新盛

0期产品训练营-第4周小结

skylar

漂亮壁纸

小马哥

七日更 二月春节不断更 壁纸

百度闯关,照见互联网巨头造芯之路

脑极体

产品经理训练营 - 第四次作业

Jophie

产品经理训练营

手把手教你玩华为eNSP模拟器

【LeetCode】字符串的排列题解

Albert

算法 LeetCode 2月春节不断更

从文字中找回年味儿

熊斌

2月春节不断更

产品训练营-第四次作业

Geek_娴子

机器学习·笔记之:

Nydia

产品经理训练营 Week4 作业(待完善)

Mai

产品经理第四周总结

克比

产品经理训练营-第四周作业

玖玖

用例

z

产品经理训练营第四章作业(一)

猫。

作业

云随心

作业

倒排索引 Inverted Indexes

escray

elastic 七日更 死磕Elasticsearch 60天通过Elastic认证考试 2月春节不断更

1分钟内的Linux性能分析法

Gopher指北

Linux 后端

LeetCode题解:297. 二叉树的序列化与反序列化,BFS,JavaScript,详细注释

Lee Chen

算法 大前端 LeetCode

SQL Server 2011中基于列的存储方式_.NET_Jonathan Allen_InfoQ精选文章