2天时间,聊今年最热的 Agent、上下文工程、AI 产品创新等话题。2025 年最后一场~ 了解详情
写点什么

谷歌推出 Bigtable 联邦查询,实现零 ETL 数据分析

  • 2022-08-25
    北京
  • 本文字数:944 字

    阅读完需:约 3 分钟

谷歌推出Bigtable联邦查询,实现零ETL数据分析

最近,谷歌宣布 Bigtable 联邦查询普遍可用,用户通过 BigQuery 可以更快地查询 Bigtable 中的数据。此外,查询无需移动或复制所有谷歌云区域中的数据,增加了联邦查询并发性限制,从而缩小了运营数据和分析数据之间长期存在的差距。

 

BigQuery 是谷歌云的无服务器、多云数据仓库,通过将不同来源的数据汇集在一起来简化数据分析。Cloud Bigtable 是谷歌云的全托管 NoSQL 数据库,主要用于对时间比较敏感的事务和分析工作负载。后者适用于多种场景,如实时欺诈检测、推荐、个性化和时间序列。

 

在以前,用户需要使用 ETL 工具(如 Dataflow 或者自己开发的 Python 工具)将数据从 Bigtable 复制到 BigQuery。现在,他们可以直接使用 BigQuery SQL 查询数据。联邦查询 BigQuery 可以访问存储在 Bigtable 中的数据。

 

要查询 Bigtable 中的数据,用户可以通过指定 Cloud Bigtable URI(可以通过 Cloud Bigtable 控制台获得)为 Cloud Bigtable 数据源创建一个外部表。URI 包含以下这些内容:

 

  • 包含 Cloud Bigtable 实例的项目 ID——project_id;

  • Cloud Bigtable 实例 ID——instance_id;

  • 要使用的应用程序配置文件 ID——app_profile(可选);

  • 要查询的表名——table_name。



来源:https://cloud.google.com/blog/products/data-analytics/bigtable-bigquery-federation-brings-hot--cold-data-closer

 

在创建了外部表之后,用户就可以像查询 BigQuery 中的表一样查询 Bigtable。此外,用户还可以利用 BigQuery 的特性,比如 JDBC/ODBC 驱动程序、用于商业智能的连接器、数据可视化工具(Data Studio、Looker 和 Tableau 等),以及用于训练机器学习模型的 AutoML 表和将数据加载到模型开发环境中的 Spark 连接器。

 

大数据爱好者 Christian Laurer 在一篇文章中解释了 Bigtable 联邦查询的好处。

 

你可以使用这种新的方法克服传统 ETL 的一些缺点,如:

 

1. 更多的数据更新(为你的业务提供最新的见解,没有小时级别甚至天级别的旧数据);

2. 不需要为相同的数据存储支付两次费用(用户通常会在 Bigtable 中存储 TB 级甚至更多的数据);

3. 减少 ETL 管道的监控和维护。

 

最后,关于 Bigtable 联邦查询的更多详细信息,请参阅官方的文档页。此外,所有受支持的 Cloud Bigtable 区域都可以使用新的联邦查询。

 

原文链接

Google Introduces Zero-ETL Approach to Analytics on Bigtable Data Using BigQuery

2022-08-25 08:003790

评论

发布
暂无评论
发现更多内容

阿里内部面试手册,Github 上获赞 80K,无论工作几年都可以看看

Java 编程 架构 面试

21分钟 MySQL 入门教程

???

MySQL 编程

算法训练营 - 学习笔记 - 第七周

心在飞

华为内部论坛爆火的一份:Java面试培训笔记,秒变资深面试官

Java架构师迁哥

Java也太卷了,应届生找工作都需要准备这些知识点了!

Java架构师迁哥

🎙️ 如何写好一篇新闻资讯稿?(时事政治篇)

码界西柚

写作技巧 5月日更 新闻资讯 案例分析 时事政治

证监会最新政策重点来了!

容光

监管合规

星石深度:如何看待近期人民币汇率走强?

容光

区块链早报|拜登的2022年预算包括新的加密货币报告提案

容光

加密货币

Java面试基础:面向对象和面向过程的区别

三掌柜

5月日更

架构训练营模块 5 作业

Geek_649372

架构实战营

HashMap源码分析(一)

泽睿

源码分析 hashmap

基于ECS搭建FTP服务

若尘

阿里云 服务器 5月日更

网络攻防学习笔记 Day29

穿过生命散发芬芳

5月日更 网络攻防

爆赞!GitHub上首本IntelliJ IDEA操作手册,标星果然百万名不虚传

Java 编程 程序员 架构师 IntelliJ IDEA

业界大佬跨界造车底气何来?

容光

AI

Redis集群JedisCluster的pipeline自定义实现

叫我阿柒啊

redis cluster pipeline JedisCluster lettuce redission

SM和PO如何参与Daily Scrum——《Scrum指南》重读有感(3)

Bruce Talk

Scrum 敏捷 随笔 Agile

有点东西,GC与内存泄漏之间的联系分不清,居然也可以进微软?

Java架构师迁哥

一篇文章弄清磁盘的里里外外及访问特性

SunnyZhang的IT世界

LogBack 日志等级设置无效,原因竟然是因为这个

楼下小黑哥

spring springboot logback

梯度下降法2

Qien Z.

5月日更

【Flutter 专题】119 图解简易 ACEFrameAnimated 帧动画

阿策小和尚

5月日更 Flutter 小菜 0 基础学习 Flutter Android 小菜鸟

人生算法:复利,营造长期的局部垄断

石云升

读书笔记 思维模型 5月日更 人生算法

这是我在银四拿到的第6个offer!分享我的成功秘籍:阿里巴巴 Java 面试参考指南(2021 最新版)

Java 程序员 架构 面试

已经成功拿到字节offer,阿里内部二十三万字 Java 面试题总结

Java 程序员 架构 面试

无人驾驶汽车有望持牌上路!这些公司称已经布局

容光

AI

Redis - 持久化

旺仔大菜包

redis

微服务注册中心:Consul——服务发现

程序员架构进阶

微服务 Consul API网关 28天写作 5月日更

Mysql 常见概念

water

Don't judge others, Work on yourself

escray

学习 极客时间 5月日更 朱赟的技术管理课

谷歌推出Bigtable联邦查询,实现零ETL数据分析_大数据_Steef-Jan Wiggers_InfoQ精选文章