写点什么

使用 PolyBase 将 SQL Server 与 Hadoop 相结合

  • 2016-06-07
  • 本文字数:700 字

    阅读完需:约 2 分钟

最近发布的 SQL Server 2016 让开发人员可以使用 SQL 查询 Hadoop 和 Azure blob 存储。这是一项之前在 SQL Server 并行数据仓库中提供的技术,名为 PolyBase

和链接服务器一样,PolyBase 会设法将尽量多的处理工作转移到源数据库。也就是说,当查询 Hadoop 或 Azure blob 存储时,会生成恰当的 map/reduce 操作。这就是所谓的“下推(pushdown)”,下面是一些开发人员需要了解的下推限制:

SQL Server 允许对以下基本表达式和操作符做谓词下推:

  • 用于数值、日期、时间值的二元比较操作符(<、>、=、!=、<>、>=、<=);
  • 算术运算符( +、-、*、/、%);
  • 逻辑运算符(AND、OR);
  • 一元运算符(NOT、IS NULL、IS NOT NULL)。

文档接着写到:

BETWEEN、NOT、IN 和 LIKE 操作符可能也可以下推。这取决于查询优化器如何将它们改写为一系列使用基本关系运算符的语句。

下推可以通过 OPTION (FORCE EXTERNALPUSHDOWN) 显式启用,或通过 OPTION (DISABLE EXTERNALPUSHDOWN) 显式禁用。

将关系型和非关系型数据相结合

由于 PolyBase 是基于普通的 T-SQL,所以开发人员可以使用像连接这样的常见操作。这意味着,你可以在 Hadoop 集群中执行 map-reduce 操作,然后在一个查询中将执行结果和 SQL Server 数据库的表相连接。

导入 / 导出

在 SQL Server、Hadoop 和 Azure blob 存储之间移动数据不再需要外部的 ETL 过程或工具。相反,你可以像操作任意两个普通表一样,使用相同的 INSERT INTO/SELECT FROM 语法。从开发人员的角度来看,Hadoop 和 Azure blob 存储只是配置数据库时多出来的两个可供选择的表类型。(从运维的角度来看,你仍然需要分别管理安全和备份。)

查看英文原文 Combine SQL Server with Hadoop Using PolyBase

2016-06-07 19:002955
用户头像

发布了 1008 篇内容, 共 444.5 次阅读, 收获喜欢 346 次。

关注

评论

发布
暂无评论
发现更多内容

用户说 | 通义灵码2.0,跨语言编码+自动生成单元测试+集成DeepSeek模型且免费使用

阿里云云效

阿里云 云原生 通义灵码 AI程序员 AI程序员体验官

DeepSeek+谷云科技智能体,快速构建企业知识问答

谷云科技RestCloud

AI 智能体 ipaas 知识问答 DeepSeek

项目评审管理系统(源码+文档+讲解+演示)

深圳亥时科技

低代码如何提升开发效率与团队协作

秃头小帅oi

爱回收查询项目IDAPi接口(爱回收API系列)

tbapi

爱回收 爱回收API接口 爱回收商品详情数据接口 爱回收数据采集

TiDB 为华安基金提供强大数据底座,加速数智化转型升级

先锋IT

人工智能丨DeepSeek来袭!普通人的短视频创作,也能如此高大上?

测试人

一文简单了解云安全以及云管平台的区别

行云管家

云计算 云管平台 云管理

《Operating System Concepts》阅读笔记:p95-p124

codists

操作系统

数据项目的“一厢情愿”,无法形成业务闭环

奇点云

大数据

Kubernetes 跨集群 Pod 可用性保护

字节跳动开源

高可用性 多集群管理 Kubernetes Federation PodDisruptionBudget 准入控制

用户说 | 通义灵码2.0,跨语言编码+自动生成单元测试+集成DeepSeek模型且免费使用

阿里巴巴云原生

阿里云 云原生 通义灵码 AI程序员 AI程序员体验官

CST电磁模拟三角偶极子天线(下)MIMO系统, 包络相关系数ECC和分集增益DG

思茂信息

cst cst操作 CST软件

KubeBlocks v0.9.3发布啦!支持增量备份、Redis分片集群继续优化...还有更多Addon功能优化等你体验!

小猿姐

数据库 postgresql Kubernetes MySQL 数据库 redis operator

MaxCompute x Dataworks × DeepSeek,实现使用自定义数据集微调DeepSeek-R1蒸馏模型

阿里云大数据AI技术

人工智能 MaxCompute Dataworks PAI DeepSeek

25年深圳等级保护测评机构有哪些?详细地址在哪里?

行云管家

等保 深圳 等保测评

下载超快!2小时下完DeepSeek !还送算力券!!

天翼云开发者社区

AI CDN加速 DeepSeek

项目管理系统(源码+文档+讲解+演示)

深圳亥时科技

项目管理系统(源码+讲解+演示)

深圳亥时科技

智能制造中的SCADA系统

积木链小链

数字化转型 智能制造 SCADA

关键词搜索爱回收商品列表API接口(爱回收API系列)

tbapi

爱回收API 爱回收数据采集

国外跨境商家疯狂追捧,国内却鲜有人知的 VVIC 搜款网商品详情接口

tbapi

搜款网API VVIC数据采集 VVIC api

使用PolyBase将SQL Server与Hadoop相结合_AI&大模型_Jonathan Allen_InfoQ精选文章