谷歌发布 Cloud Datalab 测试版

  • Kent Weare
  • 谢丽

2015 年 11 月 25 日

话题:架构

在最近的Google Cloud Platform Next 巴黎体验活动中,谷歌宣布了一个数据可视化服务的测试版本,名为Cloud Dtalab。Cloud Datalab 允许开发人员通过一种交互式 Web 浏览器体验研究和分析数据。

Greg DeMichellie 是谷歌的产品管理总监。他将这项服务描述为“一种工具,该工具允许用户分析原始数据,并以一种快速、简单、高效的方式研究、分享和发布报告。”

DeMichellie列举了 Cloud Datalab 的核心功能:

  • 谷歌云平台上研究、转换、可视化和处理数据。它可以管理兆字节和千兆字节的数据。
  • 可以与多种语言代码完美结合:Python、SQL 及 JavaScript(BigQuery UDF)。
  • 构建和测试 Google BigQuery 部署的数据管道。
  • 创建、优化及部署机器学习模型。

由于 Cloud Datalab 是一项托管服务,所以开发人员和数据科学家可以预期,Cloud Datalab 会通过配置和基于向导的设置过程提供一个很低的使用门槛。要使用 Cloud Datalab,开发人员必须将该服务部署为 Google App Engine 应用程序。这样一来,Datalab 将同时使用 Google Big QueryCloud Storage作为后台服务。

Cloud Datalab 还使用了Jupyter,开发人员可以将脚本、文档、可视化表示和结果存储在 notebook 中。开发人员可以使用现有的 Jupyter 包,包括统计和机器学习库。Datalab 服务的用户还可以同类似 GitHub 和 Bitbucket 这样的非谷歌源码控制库共享 notebook。

下图展示了一个可供新用户使用的预置 notebook 和服务中已有的 GitHub 集成:

图片来源

在价格方面,谷歌表示,用户只需要支付包括 BigQuery 和 Cloud Storage 在内的 App Engine 所消耗的云资源的费用。谷歌还在 GitHub 上开源了 Cloud Datalab 项目,允许开发人员派生或提交 pull request。

在云数据研究和可视化领域,谷歌面临着亚马逊、微软这些熟悉的竞争对手的竞争。亚马逊的QuickSight就是一个低门槛的、基于配置的商业智能工具,客户通过浏览器只需要很短的时间就可以开始可视化他们的数据。亚马逊还采用了一种同谷歌类似的模型,将其可视化平台置于其他自有服务之上,如亚马逊RDS和亚马逊DynamoDB。微软的PowerBi也是一款有名的 BI 工具,允许终端用户和开发人员使用来自各种本地和云服务的数据,并在 Web 浏览器或移动设备上将其可视化。微软还使用了许多类似 Excel 的、用户熟悉的特性,非常有利于该工具的推广。

架构