硬核干货——《中小企业 AI 实战指南》免费下载! 了解详情
写点什么

SQL Server 2014 RTM 版本中的数据仓库

  • 2014-04-16
  • 本文字数:1678 字

    阅读完需:约 6 分钟

SQL Server 2014 RTM 版已在 4 月 1 日对外发布。在此,我们将揭露新版 SQL Server 的各个新特性,尤其是数据仓库的支持。

当然,我首先还是关注新版本的定价。

微软公司正在推动一种综合定价模式。这对他们来说非常重要,因为客户会把其与 Oracle 公司的菜单式定价模式相比较。Oracle 是按照处理器个数收费,每个约 10,000 至 23,000 美金,一开始便宜,但要获得它所有的功能,价格就增长至 47500/ 每个处理器。相比之下,SQL Server 企业版包含所有功能的前提下,统一价格 27000/ 每个处理器。

列存储

早在 9 月,我们披露了新的可更新的列存储表,而至今它还没有什么真正的新功能。然而,我们对如何使用它,还有更多的建议。

首先,确保你有足够的数据来证明它。 在一列存储表中每个水平分区可容纳多达一百万行记录。所以,如果你在一个单一的表中没有成千上万行数据,则这项技术对你而言并不合适。

另一个要考虑的是访问模式。相比于传统的行存储,在列存储结构中访问一整行相对昂贵。所以我要再次强调,除非你正在使用扫描范围的查询,否则你不应使用这种技术。

下图显示了一个典型查询的逻辑视图。注意整段和列如何被消除,以减少I/O 来处理查询。

在性能方面,大多数查询效率可提高至5 到10 倍。以一个基准来计算,它们比传统的表“惯用索引”节约了91% 的磁盘空间。

应该指出的是,虽然列存储表被认为是它们的“内存数据库”产品系列的一部分,但它们将内存池作为缓存使用,就像其他表一样。但不像一个内存优化表,你在启动时不必将整个表装载到内存。

基于可持续复制的云服务平台( Azure

使用 Windows Azure 的虚拟机主机的可持续复制副本,现在已经可以实现,但还有难度。这些只读的、且具有相同版本的数据库可以分散在不同物理位置,以改善延迟和提高数据消费的吞吐量,就像用于静态网页文件的CDN。由于它们是基于云的,因此人们理论上可以在需求高峰期启动新的服务器,而不是在硬件空闲时期。

SQL Server 2014 新版本的主要变化是向导工具。SQL ServerManagement Studio 内置向导将引导管理员选择虚拟机的大小和加载相应的加密密钥。

为了鼓励更多人使用这项服务,微软只收取了虚拟机、存储和出站流量的费用。从内部部署的 SQL Server 到 Azure 副本入口流量是免费的。

建立一个可持续复制副本时,选择正确的同步模式非常重要。异步更新的副本使得写入主数据库的速度更快,但可能会导致读取到过时的数据。 对于分析,寻找数周,数月,甚至数年的数据就没有问题。 这使得它非常适合采用列存储数据。

相反,同步更新允许用于 OLTP 数据的准确报告。但如果在主站和副本数据库之间有显著的延迟,那可能是严重的性能问题。因此,你不能把同步模式应用于物理上分散的服务器。

混合型数据库和数据归档

SQL Server 的新功能是能够创建真正的混合型数​​据库。 SQL Server 既可以运行于自身服务器上,也可以运行在 Azure 虚拟机上,当然它的部分或全部数据文件都在 Windows Azure 上存储。

Windows Azure 拥有足够大的缓冲池,在批量读取大量文件时,它能提供高效访问,保证性能。但可能会造成延迟问题,所以,这个功能在做数据归档时就显得非常有用。 比如,你可以运行分析过去十年的销售收据,又不用占用昂贵的 SAN 空间。

Windows Azure ExpressRoute**** 服务

减轻延迟问题的一种方法是通过使用 Windows Azure 的快速干线Windows Azure ExpressRoute 服务,而非 VPN 服务器的网络管道。这项服务提供了 Azure 数据中心与你本地设备之间的专用连接。

交换供应商提供 1 Gbps 和 10 Gbps 级得花费分别为每月 600 美金和 10000 美金。另外,每月超过 15/250TB 的流量费为 0.070/GB。

网络服务提供商提供了不同的定价模型。起价 10Mbps,每月 600 美元;封顶 1Gbps,每月 12000 美元。单一方向不收取流量费。

注意,目前这个网站上的价格反映了 50%预先折扣。

参考英文原文: Data Warehousing in SQL Server 2014 RTM


感谢侯伯薇对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ )或者腾讯微博( @InfoQ )关注我们,并与我们的编辑和其他读者朋友交流。

2014-04-16 07:402265

评论

发布
暂无评论
发现更多内容

人工智能丨Deepseek vs 传统测试工具:谁将主导软件质量保障?

测试人

人工智能

一个很有意思的面试失败案例

老张

面试经验 面试求职 职场认知

系统稳定性的基石:限流在 AutoMQ 中的最佳实践

AutoMQ

云计算 大数据 云原生 后端 限流

从报表小白一秒升级为高手,Univer Go 这款免费的报表设计器模版有多厉害?

梦数技术团队

Python 数据库 Excel DeepSeek

在CAD中插入图块后为什么看不到?怎么解决?

在路上

cad cad看图 CAD看图王

DeepSeek本地化部署超简单,比装个office还简单

不在线第一只蜗牛

人工智能 DeepSeek

macOS Sonoma 14.7.4 (23H420) Boot ISO 原版可引导镜像下载

sysin

Sonoma

macOS Sequoia 15.3.1 (24D70) Boot ISO 原版可引导镜像下载

sysin

sequoia

CAD使用教程:怎么在手机上插入CAD图块?

在路上

cad cad看图 CAD看图软件

探索鸿蒙原生应用开发:借助 FinClip 跨端技术之旅

xuyinyin

DeepSeek本地化部署超简单,比装个office还简单

伤感汤姆布利柏

富士胶片集团发布2024财年第三季度财务报告

财见

碳课堂|生物质能如何成为减排利器

AMT企源

能源 碳管理 节能减排

Ai.com指向DeepSeek:中国AI强势崛起,却遭遇2000多仿冒域名阻击

国科云

AutoMQ 如何实现没有写性能劣化的极致冷读效率

AutoMQ

云计算 大数据 后端 压测 流量

从0到1构建 Kubernetes中间件运维平台:标准化、可视化与全栈运维的最佳实践|得物技术

得物技术

运维 后端

接入5家DeepSeek模型提供商!火山引擎边缘大模型网关助力一键畅享大模型

火山引擎边缘云

边缘计算 LLM #大模型 边缘智能 DeepSeek

天润融通已接入DeepSeek,大模型赋能客户服务,效率与体验双提升

天润融通

人工智能 DeepSeek

麦杰魔盒上新了,鸿蒙版边缘智能终端HM-5000正式首发!

麦杰研究院

KubeEdge春季带薪远程实习来了!2025年LFX Mentorship开启申请

华为云原生团队

云计算 容器 云原生

SQL Server 2014 RTM版本中的数据仓库_架构_Jonathan Allen_InfoQ精选文章