写点什么

谷歌推出 Bigtable 联邦查询,实现零 ETL 数据分析

  • 2022-08-25
    北京
  • 本文字数:944 字

    阅读完需:约 3 分钟

谷歌推出Bigtable联邦查询,实现零ETL数据分析

最近,谷歌宣布 Bigtable 联邦查询普遍可用,用户通过 BigQuery 可以更快地查询 Bigtable 中的数据。此外,查询无需移动或复制所有谷歌云区域中的数据,增加了联邦查询并发性限制,从而缩小了运营数据和分析数据之间长期存在的差距。

 

BigQuery 是谷歌云的无服务器、多云数据仓库,通过将不同来源的数据汇集在一起来简化数据分析。Cloud Bigtable 是谷歌云的全托管 NoSQL 数据库,主要用于对时间比较敏感的事务和分析工作负载。后者适用于多种场景,如实时欺诈检测、推荐、个性化和时间序列。

 

在以前,用户需要使用 ETL 工具(如 Dataflow 或者自己开发的 Python 工具)将数据从 Bigtable 复制到 BigQuery。现在,他们可以直接使用 BigQuery SQL 查询数据。联邦查询 BigQuery 可以访问存储在 Bigtable 中的数据。

 

要查询 Bigtable 中的数据,用户可以通过指定 Cloud Bigtable URI(可以通过 Cloud Bigtable 控制台获得)为 Cloud Bigtable 数据源创建一个外部表。URI 包含以下这些内容:

 

  • 包含 Cloud Bigtable 实例的项目 ID——project_id;

  • Cloud Bigtable 实例 ID——instance_id;

  • 要使用的应用程序配置文件 ID——app_profile(可选);

  • 要查询的表名——table_name。



来源:https://cloud.google.com/blog/products/data-analytics/bigtable-bigquery-federation-brings-hot--cold-data-closer

 

在创建了外部表之后,用户就可以像查询 BigQuery 中的表一样查询 Bigtable。此外,用户还可以利用 BigQuery 的特性,比如 JDBC/ODBC 驱动程序、用于商业智能的连接器、数据可视化工具(Data Studio、Looker 和 Tableau 等),以及用于训练机器学习模型的 AutoML 表和将数据加载到模型开发环境中的 Spark 连接器。

 

大数据爱好者 Christian Laurer 在一篇文章中解释了 Bigtable 联邦查询的好处。

 

你可以使用这种新的方法克服传统 ETL 的一些缺点,如:

 

1. 更多的数据更新(为你的业务提供最新的见解,没有小时级别甚至天级别的旧数据);

2. 不需要为相同的数据存储支付两次费用(用户通常会在 Bigtable 中存储 TB 级甚至更多的数据);

3. 减少 ETL 管道的监控和维护。

 

最后,关于 Bigtable 联邦查询的更多详细信息,请参阅官方的文档页。此外,所有受支持的 Cloud Bigtable 区域都可以使用新的联邦查询。

 

原文链接

Google Introduces Zero-ETL Approach to Analytics on Bigtable Data Using BigQuery

2022-08-25 08:003683

评论

发布
暂无评论
发现更多内容

阿里云数据库PolarDB开源人才培养计划发布!万元好礼等你来拿!

阿里云数据库开源

数据库 阿里云 开源 认证 polarDB

Unity Metaverse(四)、接入环信IM SDK 实现用户登录注册

CoderZ

Unity 登录验证 环信im 8月月更

超人飞来!Flutter 实现满屏的力量感动画!

岛上码农

flutter ios 移动端开发 安卓开发 8月月更

深度解读 | 关于SBOM最基础元素,你需要知道的(Part I)

安势信息

开源 漏洞 SCA SBOM 最基础元素

Linux下Docker安装部署以及云原生的理解

Geek_acae888666

云原生 Docker 镜像

Spring Cloud Stream 消息发送

急需上岸的小谢

8月月更

借问变量何处存,牧童笑称用指针,Go lang1.18入门精炼教程,由白丁入鸿儒,go lang类型指针(Pointer)的使用EP05

刘悦的技术博客

入门 教程 Go web 教程分享 入门介绍

兼容并蓄广纳百川,Go lang1.18入门精炼教程,由白丁入鸿儒,go lang复合容器类型的声明和使用EP04

刘悦的技术博客

golang go doc 教程 教程分享 golang 面试

Netty入门 -- 什么是Netty?

Bug终结者

Netty 8月月更

什么是Shell?从小白到入门你只差一个它

Albert Edison

Linux centos 运维 shell脚本编程 8月月更

企业进行知识共享的好处有哪些?

Geek_da0866

分门别类输入输出,Go lang1.18入门精炼教程,由白丁入鸿儒,go lang基本数据类型和输入输出EP03

刘悦的技术博客

golang 编程 教程 教程分享 golang 面试

开源一夏 | RuntimeException 子类

六月的雨在InfoQ

开源 8月月更

如何让您的wiki内容更高级?

Geek_da0866

舔狗至高境界,学会这个技巧让你从舔狗升华到海王【Python趣味爬虫】

Geek_ac6fb9

后端

SRv6故障管理

穿过生命散发芬芳

8月月更 SRv6

开源一夏 | 基于 Serverless一键体验FastAPI

六月的雨在InfoQ

阿里云 开源 Serverless FC 8月月更

【高并发】别闹了,要实现亿级流量下的分布式限流,这些算法你必须掌握!!

冰河

并发编程 多线程 高并发 协程 异步编程

经验分享|低成本快节奏搭建企业知识管理系统的方法

Baklib

MySQL权限管理

武师叔

8月月更

LeaRun模型驱动开发框架 重塑企业生产力

力软低代码开发平台

抖音开启“818发现好物节”:电商平台造节活动何时休

石头IT视角

微服务架构的核心关键点

阿泽🧸

微服务架构 8月月更

Go-Excelize API源码阅读(四)——Save()

Regan Yue

Go 开源 源码刨析 8月日更 8月月更

培训预告 | 企业应用现代化实用教程——DevOps方法论及最佳实践篇 8月11日上线

York

DevOps 云原生 团队建设 降本增效 应用现代化

低代码实现探索(四十七)低的不止前端,还有后端

零道云-混合式低代码平台

开源一夏 | jQuery对于链和捕获的实战研究

恒山其若陋兮

开源 8月月更

文档管理系统对于企业来说有哪些作用?

Baklib

openEuler 资源利用率提升之道02:典型应用下的效果

openEuler

开源 数据 cpu 操作系统 openEuler

头脑风暴:打家劫舍2

HelloWorld杰少

算法 LeetCode 动态规划 8月月更

直播 | 服务餐饮商户年交易额超 7000 亿,哗啦啦如何用 StarRocks 搞定实时报表

StarRocks

数据库

谷歌推出Bigtable联邦查询,实现零ETL数据分析_大数据_Steef-Jan Wiggers_InfoQ精选文章