最新发布《数智时代的AI人才粮仓模型解读白皮书(2024版)》,立即领取! 了解详情
写点什么

SQL Server 2014 RTM 版本中的数据仓库

  • 2014-04-16
  • 本文字数:1678 字

    阅读完需:约 6 分钟

SQL Server 2014 RTM 版已在 4 月 1 日对外发布。在此,我们将揭露新版 SQL Server 的各个新特性,尤其是数据仓库的支持。

当然,我首先还是关注新版本的定价。

微软公司正在推动一种综合定价模式。这对他们来说非常重要,因为客户会把其与 Oracle 公司的菜单式定价模式相比较。Oracle 是按照处理器个数收费,每个约 10,000 至 23,000 美金,一开始便宜,但要获得它所有的功能,价格就增长至 47500/ 每个处理器。相比之下,SQL Server 企业版包含所有功能的前提下,统一价格 27000/ 每个处理器。

列存储

早在 9 月,我们披露了新的可更新的列存储表,而至今它还没有什么真正的新功能。然而,我们对如何使用它,还有更多的建议。

首先,确保你有足够的数据来证明它。 在一列存储表中每个水平分区可容纳多达一百万行记录。所以,如果你在一个单一的表中没有成千上万行数据,则这项技术对你而言并不合适。

另一个要考虑的是访问模式。相比于传统的行存储,在列存储结构中访问一整行相对昂贵。所以我要再次强调,除非你正在使用扫描范围的查询,否则你不应使用这种技术。

下图显示了一个典型查询的逻辑视图。注意整段和列如何被消除,以减少I/O 来处理查询。

在性能方面,大多数查询效率可提高至5 到10 倍。以一个基准来计算,它们比传统的表“惯用索引”节约了91% 的磁盘空间。

应该指出的是,虽然列存储表被认为是它们的“内存数据库”产品系列的一部分,但它们将内存池作为缓存使用,就像其他表一样。但不像一个内存优化表,你在启动时不必将整个表装载到内存。

基于可持续复制的云服务平台( Azure

使用 Windows Azure 的虚拟机主机的可持续复制副本,现在已经可以实现,但还有难度。这些只读的、且具有相同版本的数据库可以分散在不同物理位置,以改善延迟和提高数据消费的吞吐量,就像用于静态网页文件的CDN。由于它们是基于云的,因此人们理论上可以在需求高峰期启动新的服务器,而不是在硬件空闲时期。

SQL Server 2014 新版本的主要变化是向导工具。SQL ServerManagement Studio 内置向导将引导管理员选择虚拟机的大小和加载相应的加密密钥。

为了鼓励更多人使用这项服务,微软只收取了虚拟机、存储和出站流量的费用。从内部部署的 SQL Server 到 Azure 副本入口流量是免费的。

建立一个可持续复制副本时,选择正确的同步模式非常重要。异步更新的副本使得写入主数据库的速度更快,但可能会导致读取到过时的数据。 对于分析,寻找数周,数月,甚至数年的数据就没有问题。 这使得它非常适合采用列存储数据。

相反,同步更新允许用于 OLTP 数据的准确报告。但如果在主站和副本数据库之间有显著的延迟,那可能是严重的性能问题。因此,你不能把同步模式应用于物理上分散的服务器。

混合型数据库和数据归档

SQL Server 的新功能是能够创建真正的混合型数​​据库。 SQL Server 既可以运行于自身服务器上,也可以运行在 Azure 虚拟机上,当然它的部分或全部数据文件都在 Windows Azure 上存储。

Windows Azure 拥有足够大的缓冲池,在批量读取大量文件时,它能提供高效访问,保证性能。但可能会造成延迟问题,所以,这个功能在做数据归档时就显得非常有用。 比如,你可以运行分析过去十年的销售收据,又不用占用昂贵的 SAN 空间。

Windows Azure ExpressRoute**** 服务

减轻延迟问题的一种方法是通过使用 Windows Azure 的快速干线Windows Azure ExpressRoute 服务,而非 VPN 服务器的网络管道。这项服务提供了 Azure 数据中心与你本地设备之间的专用连接。

交换供应商提供 1 Gbps 和 10 Gbps 级得花费分别为每月 600 美金和 10000 美金。另外,每月超过 15/250TB 的流量费为 0.070/GB。

网络服务提供商提供了不同的定价模型。起价 10Mbps,每月 600 美元;封顶 1Gbps,每月 12000 美元。单一方向不收取流量费。

注意,目前这个网站上的价格反映了 50%预先折扣。

参考英文原文: Data Warehousing in SQL Server 2014 RTM


感谢侯伯薇对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ )或者腾讯微博( @InfoQ )关注我们,并与我们的编辑和其他读者朋友交流。

2014-04-16 07:401713

评论

发布
暂无评论
发现更多内容

Java Shutdown Hook 场景使用和源码分析

陈皮的JavaLib

Java 线程安全 Thread

【译】JavaScript 中几种循环遍历方式对比

KooFE

6月日更

Windows 10 如何设置网络属性为私有

HoneyMoose

🌏【架构师指南】带你分析认识缓存穿透/雪崩/击穿

洛神灬殇

缓存穿透 缓存击穿 缓存雪崩 6月日更

【Flutter 专题】106 图解 AnimatedWidget & AnimatedBuilder 动画应用

阿策小和尚

Flutter 小菜 0 基础学习 Flutter Android 小菜鸟 6月日更

给dubbo贡献源码,做梦都在修bug

捉虫大师

dubbo

分享8个可以提高开发效率的JavaScript库

devpoint

node.js axios 6月日更

立flag(第………………次)

凯迪

随笔杂谈

内卷的出路是躺平?

Qien Z.

创新 内卷 6月日更 躺平

金三银四跳槽季,美团、字节、阿里、腾讯Java面经,终入字节

Java 程序员 架构 面试

图解 SQL,这也太形象了吧!

xcbeyond

MySQL 6月日更

系统设计系列之任务队列

看山

MQ 6月日更

🌏【架构师指南】教你如何设计和规划系统架构(13条)

洛神灬殇

架构设计 架构设计原则 架构师技能 6月日更

职场礼仪之坐车礼仪

石云升

6月日更 职场礼仪

区块链行业的《高考志愿填报指南》

CECBC

颠覆与创新,区块链将成音乐产业的下一个风口

CECBC

马丁策略量化交易系统搭建,网格量化策略系统

Kubernetes手记(9)- Ingress 控制器

雪雷

k8s 6月日更

提升代码格调——JavaScript 数组的 reduce() 方法入门

编程三昧

JavaScript 大前端 数组 js ES6

贪心算法最优装载问题(Java代码实现)

若尘

数据结构 贪心算法 6月日更

一文带你深入了解 Java 字节码

mghio

技术 后端 Java 25 周年 基础

Django组队学习Task0

IT蜗壳-Tango

IT蜗壳教学 6月日更 Datawhale

网络攻防学习笔记 Day42

穿过生命散发芬芳

网络攻防 6月日更

《原则》(十二)

Changing Lin

6月日更

MySQL基础之十:union与limit

打工人!

myslq 6月日更

【21-5】Grafana 时间Panel 如何使用

耳东@Erdong

Grafana 6月日更 panel clock

2021年最新阿里巴巴Java面试权威指南(泰山版)震撼来袭

Java 程序员 架构 面试 计算机

GitHub已霸榜!阿里技术官肝了3个月才完成的20万字Java面试手册

Java 程序员 架构 面试

雪花算法的原理及实现

架构精进之路

算法 6月日更

「SQL数据分析系列」1. SQL背景知识介绍

数据与智能

数据库 sql

【LeetCode】重复的DNA序列Java题解

Albert

算法 LeetCode 6月日更

SQL Server 2014 RTM版本中的数据仓库_架构_Jonathan Allen_InfoQ精选文章