写点什么

谷歌推出 Bigtable 联邦查询,实现零 ETL 数据分析

  • 2022-08-25
    北京
  • 本文字数:944 字

    阅读完需:约 3 分钟

谷歌推出Bigtable联邦查询,实现零ETL数据分析

最近,谷歌宣布 Bigtable 联邦查询普遍可用,用户通过 BigQuery 可以更快地查询 Bigtable 中的数据。此外,查询无需移动或复制所有谷歌云区域中的数据,增加了联邦查询并发性限制,从而缩小了运营数据和分析数据之间长期存在的差距。

 

BigQuery 是谷歌云的无服务器、多云数据仓库,通过将不同来源的数据汇集在一起来简化数据分析。Cloud Bigtable 是谷歌云的全托管 NoSQL 数据库,主要用于对时间比较敏感的事务和分析工作负载。后者适用于多种场景,如实时欺诈检测、推荐、个性化和时间序列。

 

在以前,用户需要使用 ETL 工具(如 Dataflow 或者自己开发的 Python 工具)将数据从 Bigtable 复制到 BigQuery。现在,他们可以直接使用 BigQuery SQL 查询数据。联邦查询 BigQuery 可以访问存储在 Bigtable 中的数据。

 

要查询 Bigtable 中的数据,用户可以通过指定 Cloud Bigtable URI(可以通过 Cloud Bigtable 控制台获得)为 Cloud Bigtable 数据源创建一个外部表。URI 包含以下这些内容:

 

  • 包含 Cloud Bigtable 实例的项目 ID——project_id;

  • Cloud Bigtable 实例 ID——instance_id;

  • 要使用的应用程序配置文件 ID——app_profile(可选);

  • 要查询的表名——table_name。



来源:https://cloud.google.com/blog/products/data-analytics/bigtable-bigquery-federation-brings-hot--cold-data-closer

 

在创建了外部表之后,用户就可以像查询 BigQuery 中的表一样查询 Bigtable。此外,用户还可以利用 BigQuery 的特性,比如 JDBC/ODBC 驱动程序、用于商业智能的连接器、数据可视化工具(Data Studio、Looker 和 Tableau 等),以及用于训练机器学习模型的 AutoML 表和将数据加载到模型开发环境中的 Spark 连接器。

 

大数据爱好者 Christian Laurer 在一篇文章中解释了 Bigtable 联邦查询的好处。

 

你可以使用这种新的方法克服传统 ETL 的一些缺点,如:

 

1. 更多的数据更新(为你的业务提供最新的见解,没有小时级别甚至天级别的旧数据);

2. 不需要为相同的数据存储支付两次费用(用户通常会在 Bigtable 中存储 TB 级甚至更多的数据);

3. 减少 ETL 管道的监控和维护。

 

最后,关于 Bigtable 联邦查询的更多详细信息,请参阅官方的文档页。此外,所有受支持的 Cloud Bigtable 区域都可以使用新的联邦查询。

 

原文链接

Google Introduces Zero-ETL Approach to Analytics on Bigtable Data Using BigQuery

2022-08-25 08:003631

评论

发布
暂无评论
发现更多内容

智源最新评测结果发布:豆包大模型“主观评测”排名第一,多榜单位居国内第一

极客天地

京东大数据治理探索与实践 | 京东零售技术实践

京东零售技术

大数据

降本增效!阿里云相关业务团队助力小鹏汽车节省云上资源开支 | 龙蜥案例

OpenAnolis小助手

操作系统 龙蜥案例

Flink 2.0 存算分离状态存储 — ForSt DB

Apache Flink

大数据 flink 实时计算 数据处理 存算分离

【YashanDB知识库】XMLAGG方法的兼容

YashanDB

数据库 yashandb

【YashanDB知识库】YMP迁移过程中报错YAS-02143或YAS-02193

YashanDB

数据库 yashandb

【连载 06】自定义线程池(下)

FunTester

2024开放原子开发者大会龙蜥参会指南一览

OpenAnolis小助手

操作系统 龙蜥社区

Taro 鸿蒙技术内幕系列(四):JDImage 自研鸿蒙图片库

京东零售技术

taro 鸿蒙

【YashanDB知识库】Oracle pipelined函数在YashanDB中的改写

YashanDB

数据库 yashandb

DeFi即将迎来大爆发:2025年金融变革的背后逻辑与机会

chainwiseweb3

DeFi质押挖矿 DeFi流动性挖矿 defi开发 defi金融开发 去中心化合约开发

产品品牌战略升级!原WorkPlus正式改名为BeeWorks,版本重要更新

BeeWorks

【YashanDB知识库】update (子查询) set ORG_ID_STAN -ID 改写

YashanDB

数据库 yashandb

金融保险行业数字化创新实践:如何高效落地自主可控的企业级大数据平台

tapdata

大数据平台 数据集成 数据服务 实时数据集成 银行保险业数字化转型

【IoTDB 线上小课 10】为什么选择 IoTDB 管理时序数据?

Apache IoTDB

一份榜单带你重温2024年那些值得追的影视综漫

最新动态

豆包MarsCode上线新功能 | 告别复制粘贴,一键 Apply 让你编程效率再提升!

Trae

开发者工具 AI编程 豆包MarsCode 代码工具

驱动性能提升,如何加速基于龙蜥和企业平台的Arm系统开发与部署进程?

OpenAnolis小助手

操作系统 龙蜥社区 龙蜥meetup

从高代码到低代码,火山引擎大模型产品、能力再升级!

极客天地

数据云平台的可观测性

奇点云

【YashanDB知识库】复合索引下in大量参数查询性能慢

YashanDB

数据库 yashandb

Anthropic 工程师关于提示词工程的深入探讨

亚马逊云科技 (Amazon Web Services)

《计算机组成及汇编语言原理》阅读笔记:p1-p8

codists

计算机组成及汇编语言原理

谷歌推出Bigtable联邦查询,实现零ETL数据分析_大数据_Steef-Jan Wiggers_InfoQ精选文章