写点什么

谷歌推出 Bigtable 联邦查询,实现零 ETL 数据分析

  • 2022-08-25
    北京
  • 本文字数:944 字

    阅读完需:约 3 分钟

谷歌推出Bigtable联邦查询,实现零ETL数据分析

最近,谷歌宣布 Bigtable 联邦查询普遍可用,用户通过 BigQuery 可以更快地查询 Bigtable 中的数据。此外,查询无需移动或复制所有谷歌云区域中的数据,增加了联邦查询并发性限制,从而缩小了运营数据和分析数据之间长期存在的差距。

 

BigQuery 是谷歌云的无服务器、多云数据仓库,通过将不同来源的数据汇集在一起来简化数据分析。Cloud Bigtable 是谷歌云的全托管 NoSQL 数据库,主要用于对时间比较敏感的事务和分析工作负载。后者适用于多种场景,如实时欺诈检测、推荐、个性化和时间序列。

 

在以前,用户需要使用 ETL 工具(如 Dataflow 或者自己开发的 Python 工具)将数据从 Bigtable 复制到 BigQuery。现在,他们可以直接使用 BigQuery SQL 查询数据。联邦查询 BigQuery 可以访问存储在 Bigtable 中的数据。

 

要查询 Bigtable 中的数据,用户可以通过指定 Cloud Bigtable URI(可以通过 Cloud Bigtable 控制台获得)为 Cloud Bigtable 数据源创建一个外部表。URI 包含以下这些内容:

 

  • 包含 Cloud Bigtable 实例的项目 ID——project_id;

  • Cloud Bigtable 实例 ID——instance_id;

  • 要使用的应用程序配置文件 ID——app_profile(可选);

  • 要查询的表名——table_name。



来源:https://cloud.google.com/blog/products/data-analytics/bigtable-bigquery-federation-brings-hot--cold-data-closer

 

在创建了外部表之后,用户就可以像查询 BigQuery 中的表一样查询 Bigtable。此外,用户还可以利用 BigQuery 的特性,比如 JDBC/ODBC 驱动程序、用于商业智能的连接器、数据可视化工具(Data Studio、Looker 和 Tableau 等),以及用于训练机器学习模型的 AutoML 表和将数据加载到模型开发环境中的 Spark 连接器。

 

大数据爱好者 Christian Laurer 在一篇文章中解释了 Bigtable 联邦查询的好处。

 

你可以使用这种新的方法克服传统 ETL 的一些缺点,如:

 

1. 更多的数据更新(为你的业务提供最新的见解,没有小时级别甚至天级别的旧数据);

2. 不需要为相同的数据存储支付两次费用(用户通常会在 Bigtable 中存储 TB 级甚至更多的数据);

3. 减少 ETL 管道的监控和维护。

 

最后,关于 Bigtable 联邦查询的更多详细信息,请参阅官方的文档页。此外,所有受支持的 Cloud Bigtable 区域都可以使用新的联邦查询。

 

原文链接

Google Introduces Zero-ETL Approach to Analytics on Bigtable Data Using BigQuery

2022-08-25 08:003835

评论

发布
暂无评论
发现更多内容

“最近我给有代码洁癖的同事墙裂安利了通义灵码”

阿里巴巴云原生

内网im聊天软件,私有化部署安全可控

BeeWorks

即时通讯 IM 私有化部署

1688API接口终极宝典:列表、详情全掌握,图片搜索攻略助你一臂之力

tbapi

1688商品详情接口 1688商品数据接口 1688API 1688图片搜索接口

特权账号:企业安全的关键要素与防护策略

天翼云开发者社区

安全 特权账号

办公网络流量隔离:为高效办公保驾护航

天翼云开发者社区

安全 网络

CST如何生成简单通用的IBIS模型文件

思茂信息

cst CST软件 CST Studio Suite

0.4元/TB/月!天翼云HBlock打响软件定义存储价格战

天翼云开发者社区

存储 天翼云HBlock

“全球金牌敏捷课程” · 7月19-20日CSM认证课程 · Jim老师引导讨论AI & Agility话题

ShineScrum

敏捷 敏捷教练 CSM认证 CSM认证培训 敏捷认证

葵花药业集团与用友战略签约,共启医药行业数智化新篇章

用友BIP

1688 商品数据接口终极指南:Python 开发者如何高效获取标题 / 价格 / 销量数据(附调试工具推荐)

tbapi

1688商品列表接口 1688API 1688商品数据采集

WebGL软件开发的技术方案

北京木奇移动技术有限公司

软件外包公司 webgl开发 webgl技术

“最近我给有代码洁癖的同事墙裂安利了通义灵码”

阿里云云效

通义灵码

MCP与华为云CSE珠联璧合,打造AI时代微服务生态引擎

华为云开发者联盟

微服务 华为云开发者联盟 MCP 华为云CSE

【AI智能助手】轻松打造智能助手,定制专属个性风格

JEECG低代码

AI大模型 AI应用 AIGC AI智能助手

网站进行IPv6改造的步骤有哪些?一文看懂

防火墙后吃泡面

让用户反馈成为产品迭代的动力源泉

Feedalyze

效率工具 产品经理 产品迭代 用户反馈 用户需求

从开发者角度看数据库架构进化史:JDBC - 中间件 - TiDB

TiDB 社区干货传送门

开发语言 应用适配 数据库连接 8.x 实践

区块链RWA系统开发框架

北京木奇移动技术有限公司

区块链技术 软件外包公司 RWA开发

区块链ETF软件系统的技术方案

北京木奇移动技术有限公司

区块链技术 软件外包公司 区块链ETF

Blender 入门教程(四):动画制作

北桥苏

游戏引擎 blender CocosCreator

用户实测YRCloudFile KVCache丨以存代算显著提升AI推理性价比

焱融科技

AI推理 大型语言模型LLM KVCache

中国电信重塑天翼AI云手机,为用户开启云端智能新生活

极客天地

深化合作!港华集团数智升级,构建一体化管控平台

用友BIP

TiDB 中新 Hash Join 的设计与性能优化

TiDB 社区干货传送门

区块链RWA软件系统技术方案

北京木奇移动技术有限公司

区块链技术 软件外包公司 RWA开发

WebGIS项目开发技术方案

北京木奇移动技术有限公司

软件外包公司 webGIS开发 webgl开发公司

AI大模型入门 三:5分钟速成Prompt公式,让AI生成代码的通过率从30%到90%

测试人

人工智能

TiDB 替换 HBase 全场景实践指南 ——从架构革新到业务赋能

TiDB 社区干货传送门

TiDB第四届征文-业务场景实战

针对大事务问题对业务存储过程改造

GreatSQL

什么是零信任

天翼云开发者社区

零信任 SDP架构

谷歌推出Bigtable联邦查询,实现零ETL数据分析_大数据_Steef-Jan Wiggers_InfoQ精选文章