阿里、蚂蚁、晟腾、中科加禾精彩分享 AI 基础设施洞见,现购票可享受 9 折优惠 |AICon 了解详情
写点什么

谷歌推出 Bigtable 联邦查询,实现零 ETL 数据分析

  • 2022-08-25
    北京
  • 本文字数:944 字

    阅读完需:约 3 分钟

谷歌推出Bigtable联邦查询,实现零ETL数据分析

最近,谷歌宣布 Bigtable 联邦查询普遍可用,用户通过 BigQuery 可以更快地查询 Bigtable 中的数据。此外,查询无需移动或复制所有谷歌云区域中的数据,增加了联邦查询并发性限制,从而缩小了运营数据和分析数据之间长期存在的差距。

 

BigQuery 是谷歌云的无服务器、多云数据仓库,通过将不同来源的数据汇集在一起来简化数据分析。Cloud Bigtable 是谷歌云的全托管 NoSQL 数据库,主要用于对时间比较敏感的事务和分析工作负载。后者适用于多种场景,如实时欺诈检测、推荐、个性化和时间序列。

 

在以前,用户需要使用 ETL 工具(如 Dataflow 或者自己开发的 Python 工具)将数据从 Bigtable 复制到 BigQuery。现在,他们可以直接使用 BigQuery SQL 查询数据。联邦查询 BigQuery 可以访问存储在 Bigtable 中的数据。

 

要查询 Bigtable 中的数据,用户可以通过指定 Cloud Bigtable URI(可以通过 Cloud Bigtable 控制台获得)为 Cloud Bigtable 数据源创建一个外部表。URI 包含以下这些内容:

 

  • 包含 Cloud Bigtable 实例的项目 ID——project_id;

  • Cloud Bigtable 实例 ID——instance_id;

  • 要使用的应用程序配置文件 ID——app_profile(可选);

  • 要查询的表名——table_name。



来源:https://cloud.google.com/blog/products/data-analytics/bigtable-bigquery-federation-brings-hot--cold-data-closer

 

在创建了外部表之后,用户就可以像查询 BigQuery 中的表一样查询 Bigtable。此外,用户还可以利用 BigQuery 的特性,比如 JDBC/ODBC 驱动程序、用于商业智能的连接器、数据可视化工具(Data Studio、Looker 和 Tableau 等),以及用于训练机器学习模型的 AutoML 表和将数据加载到模型开发环境中的 Spark 连接器。

 

大数据爱好者 Christian Laurer 在一篇文章中解释了 Bigtable 联邦查询的好处。

 

你可以使用这种新的方法克服传统 ETL 的一些缺点,如:

 

1. 更多的数据更新(为你的业务提供最新的见解,没有小时级别甚至天级别的旧数据);

2. 不需要为相同的数据存储支付两次费用(用户通常会在 Bigtable 中存储 TB 级甚至更多的数据);

3. 减少 ETL 管道的监控和维护。

 

最后,关于 Bigtable 联邦查询的更多详细信息,请参阅官方的文档页。此外,所有受支持的 Cloud Bigtable 区域都可以使用新的联邦查询。

 

原文链接

Google Introduces Zero-ETL Approach to Analytics on Bigtable Data Using BigQuery

2022-08-25 08:003343

评论

发布
暂无评论
发现更多内容

英特尔以全栈式产品组合,驱动云服务和AI产业发展

E科讯

微服务回归单体,是技术架构倒退?我看未必!

雾岛听风(锋)

Meetup 回顾|Data Infra 研究社第十五期(含资料发布)

Databend

基于深度学习的语音合成技术的进展与未来趋势

来自四九城儿

Nautilus Chain 引入 $NAUT 通证,延续 $ZBC 的价值

BlockChain先知

引领PC行业大步向前,英特尔做了哪些努力?

E科讯

新基建加码,私有云成传统基建升级首选

青椒云云电脑

桌面云 云桌面

设计师用图形工作站哪种配置比较好?

青椒云云电脑

图形工作站

Java进程CPU100%打满分析

落日楼台H

Java 性能优化 线程 cpu 100%

ARTS-7

进德修业

“存量竞争” 体验为王,火山引擎边缘云助力内容社区破局

火山引擎边缘云

CDN 边缘计算 加速 边缘云

语音合成技术的简介与未来发展

来自四九城儿

Tornado Cash 陷制裁风波,Unijoin.io 能否扛起隐私交易大旗?

股市老人

Nautilus Chain 引入 $NAUT 通证,延续 $ZBC 的价值

大瞿科技

《操作系统实战 45 讲》笔记4——设备与文件系统

袁世超

操作系统 Cosmos LMOS

为什么云办公模式必选云桌面

青椒云云电脑

云桌面 云桌面解决方案

云电脑平台可以提供哪些服务?有什么优势

青椒云云电脑

云电脑 云电脑平台

有史以来最香的日志收集平台是怎样练成的

Yestodorrow

可观测性用观测云

明线与暗线:读懂云厂商鏖战大模型

脑极体

大模型

云电脑云手机相继亮相,传统PC会被淘汰吗?

青椒云云电脑

云电脑

Python 安装与快速入门

小万哥

Python 程序员 软件 后端开发 Python3

论一个优秀的日志采集系统是如何设计和实现数据处理的

Yestodorrow

可观测性用观测云

蓝易云:Ubuntu系统中找不到yum及安装方法!

百度搜索:蓝易云

云计算 Linux ubuntu centos yum

语音合成技术的应用与挑战

来自四九城儿

什么是云电脑平台?有哪些知名的云电脑云平台

青椒云云电脑

云电脑 云电脑平台

C++new和delete运算符介绍

二哈侠

Nautilus Chain 引入 $NAUT 通证,延续 $ZBC 的价值

石头财经

私有云厂商怎么选?私有云三大技术盘点

青椒云云电脑

私有云 私有云厂商

技术升级,详解私有云轻运维模式

青椒云云电脑

私有云 云桌面

MySql数字保留两位小数

源字节1号

开源 软件开发 前端开发 后端开发 小程序开发

linux(ubuntu) 开启ssh root登录

圆弧

SSH 远程登录 root用户

谷歌推出Bigtable联邦查询,实现零ETL数据分析_大数据_Steef-Jan Wiggers_InfoQ精选文章