写点什么

SQL Server 2014 RTM 版本中的数据仓库

  • 2014-04-16
  • 本文字数:1678 字

    阅读完需:约 6 分钟

SQL Server 2014 RTM 版已在 4 月 1 日对外发布。在此,我们将揭露新版 SQL Server 的各个新特性,尤其是数据仓库的支持。

当然,我首先还是关注新版本的定价。

微软公司正在推动一种综合定价模式。这对他们来说非常重要,因为客户会把其与 Oracle 公司的菜单式定价模式相比较。Oracle 是按照处理器个数收费,每个约 10,000 至 23,000 美金,一开始便宜,但要获得它所有的功能,价格就增长至 47500/ 每个处理器。相比之下,SQL Server 企业版包含所有功能的前提下,统一价格 27000/ 每个处理器。

列存储

早在 9 月,我们披露了新的可更新的列存储表,而至今它还没有什么真正的新功能。然而,我们对如何使用它,还有更多的建议。

首先,确保你有足够的数据来证明它。 在一列存储表中每个水平分区可容纳多达一百万行记录。所以,如果你在一个单一的表中没有成千上万行数据,则这项技术对你而言并不合适。

另一个要考虑的是访问模式。相比于传统的行存储,在列存储结构中访问一整行相对昂贵。所以我要再次强调,除非你正在使用扫描范围的查询,否则你不应使用这种技术。

下图显示了一个典型查询的逻辑视图。注意整段和列如何被消除,以减少I/O 来处理查询。

在性能方面,大多数查询效率可提高至5 到10 倍。以一个基准来计算,它们比传统的表“惯用索引”节约了91% 的磁盘空间。

应该指出的是,虽然列存储表被认为是它们的“内存数据库”产品系列的一部分,但它们将内存池作为缓存使用,就像其他表一样。但不像一个内存优化表,你在启动时不必将整个表装载到内存。

基于可持续复制的云服务平台( Azure

使用 Windows Azure 的虚拟机主机的可持续复制副本,现在已经可以实现,但还有难度。这些只读的、且具有相同版本的数据库可以分散在不同物理位置,以改善延迟和提高数据消费的吞吐量,就像用于静态网页文件的CDN。由于它们是基于云的,因此人们理论上可以在需求高峰期启动新的服务器,而不是在硬件空闲时期。

SQL Server 2014 新版本的主要变化是向导工具。SQL ServerManagement Studio 内置向导将引导管理员选择虚拟机的大小和加载相应的加密密钥。

为了鼓励更多人使用这项服务,微软只收取了虚拟机、存储和出站流量的费用。从内部部署的 SQL Server 到 Azure 副本入口流量是免费的。

建立一个可持续复制副本时,选择正确的同步模式非常重要。异步更新的副本使得写入主数据库的速度更快,但可能会导致读取到过时的数据。 对于分析,寻找数周,数月,甚至数年的数据就没有问题。 这使得它非常适合采用列存储数据。

相反,同步更新允许用于 OLTP 数据的准确报告。但如果在主站和副本数据库之间有显著的延迟,那可能是严重的性能问题。因此,你不能把同步模式应用于物理上分散的服务器。

混合型数据库和数据归档

SQL Server 的新功能是能够创建真正的混合型数​​据库。 SQL Server 既可以运行于自身服务器上,也可以运行在 Azure 虚拟机上,当然它的部分或全部数据文件都在 Windows Azure 上存储。

Windows Azure 拥有足够大的缓冲池,在批量读取大量文件时,它能提供高效访问,保证性能。但可能会造成延迟问题,所以,这个功能在做数据归档时就显得非常有用。 比如,你可以运行分析过去十年的销售收据,又不用占用昂贵的 SAN 空间。

Windows Azure ExpressRoute**** 服务

减轻延迟问题的一种方法是通过使用 Windows Azure 的快速干线Windows Azure ExpressRoute 服务,而非 VPN 服务器的网络管道。这项服务提供了 Azure 数据中心与你本地设备之间的专用连接。

交换供应商提供 1 Gbps 和 10 Gbps 级得花费分别为每月 600 美金和 10000 美金。另外,每月超过 15/250TB 的流量费为 0.070/GB。

网络服务提供商提供了不同的定价模型。起价 10Mbps,每月 600 美元;封顶 1Gbps,每月 12000 美元。单一方向不收取流量费。

注意,目前这个网站上的价格反映了 50%预先折扣。

参考英文原文: Data Warehousing in SQL Server 2014 RTM


感谢侯伯薇对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ )或者腾讯微博( @InfoQ )关注我们,并与我们的编辑和其他读者朋友交流。

2014-04-16 07:402344

评论

发布
暂无评论
发现更多内容

数据中台中事实表设计概述

穿过生命散发芬芳

数据中台 9月月更

软件测试 | 测试开发 | 测试平台开发-前端开发之Vue.js 框架(一)

测吧(北京)科技有限公司

测试

实现Promise的原型方法--前端面试能力提升

helloworld1024fd

JavaScript

面试官:能用JavaScript手写一个bind函数吗

helloworld1024fd

JavaScript

软件测试 | 测试开发 | Dubbo-admin+Zookeeper 的环境搭建实操与 Could-not-extract-archive 报错踩坑

测吧(北京)科技有限公司

测试

软件测试 | 测试开发 | Docker 镜像构建可以分享的快乐

测吧(北京)科技有限公司

测试

软件测试 | 测试开发 | 黑盒测试方法论—场景法

测吧(北京)科技有限公司

测试

从React源码角度看useCallback,useMemo,useContext

goClient1992

React

深度分析React源码中的合成事件

goClient1992

React

TiFlash 源码阅读(九)TiFlash 中常用算子的设计与实现

TiDB 社区干货传送门

软件测试 | 测试开发 | 被测项目需求你理解到位了么?

测吧(北京)科技有限公司

测试

TDengine3.0流式计算引擎语法规则介绍

TDengine

数据库 tdengine 企业号九月金秋榜

DAPP系统开发Web3合约技术

薇電13242772558

dapp web3

链上自动化何以成就更好的 Web3 | 对话 OAK Network

One Block Community

区块链 自动化 专访 波卡生态

NFT 离商业化还有多远?

One Block Community

区块链 程序员 NFT 商业化

TiDB Lightning导入超大型txt文件实践

TiDB 社区干货传送门

迁移 管理与运维

软件测试 | 测试开发 | 被测系统架构与数据流分析

测吧(北京)科技有限公司

测试

百草味上线“本味甄果”系列罐装坚果 打造高品质坚果新标准

E科讯

隐私计算大规模落地场景的解决之道:分布式计算架构

Jessica@数牍

隐私计算 分布式技术 分布式计算框架

软件测试 | 测试开发 | BAT 大厂最流行的性能压测、监控、剖析技术体系解析

测吧(北京)科技有限公司

测试

弯曲矫正技术概述

合合技术团队

人工智能 深度学习 图片处理

软件测试 | 测试开发 | 软件项目管理与跨部门沟通协作

测吧(北京)科技有限公司

测试

k8s Tidb 实践-运维篇

TiDB 社区干货传送门

数据库前沿趋势

运维成本降低 50%,丽迅物流是如何应对大规模容器镜像管理挑战的

阿里巴巴云原生

阿里云 容器 云原生 镜像

软件测试 | 测试开发 | 30 分钟轻松搞定正则表达式基础

测吧(北京)科技有限公司

测试

k8s Tidb实践-部署篇

TiDB 社区干货传送门

数据库前沿趋势

C语言太细了

清风莫追

c 10月月更

软件测试 | 测试开发 | BAT大厂都在用的Docker。学会这三招,面试、工作轻松hold住

测吧(北京)科技有限公司

测试

软件测试 | 测试开发 | 黑盒测试方法论—等价类

测吧(北京)科技有限公司

测试

软件测试 | 测试开发 | 测试平台开发-前端开发之Vue.js 框架的使用(二)

测吧(北京)科技有限公司

测试

【“玩物立志”-scratch少儿编程】亲手实现小猫走迷宫小游戏:其实挺简单

清风莫追

游戏 scratch 10月月更

SQL Server 2014 RTM版本中的数据仓库_架构_Jonathan Allen_InfoQ精选文章