Greenplum:从大数据战略到实现 (4):ABC:人工智能、大数据和云计算 1.1.2

阅读数:4 2019 年 12 月 18 日 21:07

Greenplum:从大数据战略到实现(4):ABC:人工智能、大数据和云计算 1.1.2

(P 层云的精细化发展)

内容简介
这是一本系统剖析 Greenplum 开源大数据平台的书籍,也是大数据战略制定与落地的实战型指导书!
本书围绕数字原生和云计算、大数据、人工智能驱动的企业数字化转型的核心诉求,从商业和技术实战视角分享了业界领先企业大数据战略的深刻思考,并提供了大数据战略从制定到落地的全面指导。既有高阶数字化战略高度对大数据的解读,又有技术实战角度对使用 Greenplum 大数据和机器学习平台实现大数据战略的实践指南。
本书作者来自 Greenplum 核心研发团队,致力于以开源、开放的理念和先进的技术推进大数据产业生态,助力企业以更低的成本、更高的效率实现数字化转型,并基于 Greenplum 开源社区培养大数据产业更多人才。
本书分为四个部分。

  • 第一部分介绍大数据战略。其中,第 1 章将分享作者对于人工智能、大数据和云计算之间关系的理解以及对人和人工智能的思考。第 2 章将介绍进取型企业为什么需要大数据战略以及如何建立大数据战略。
  • 第二部分介绍大数据平台。其中,第 3 章将以数据平台演进历史和未来趋势为主题,描述三次整合的背景及影响,介绍选择大数据平台需要考虑的因素,以及为什么 Greenplum 是理想的大数据平台。第 4 章将介绍 Greenplum 数据库快速入门指南。第 5 章将介绍 Greenplum 架构的主要特点和核心引擎。第 6 章将介绍数据加载、数据联邦和数据虚拟化。第 7 章将介绍 Greenplum 的资源管理以及对混合负载的支持。
  • 第三部分介绍机器学习。其中,第 8 章介绍 Greenplum 的各种过程化编程语言(用户自定义函数),用户可以使用 Python、R、Java 等实现用户自定义函数,还可以通过容器化技术实现自定义函数的安全性和隔离性。第 9 章将介绍 Greenplum 内建的机器学习库 MADlib,数据科学家可以使用内建的 50 多种机器学习算法用 SQL 对数据进行高级分析,并介绍如何扩展 MADlib 以实现新算法。第 10 章和第 11 章将分别介绍 Greenplum 如何对文本数据和时空数据(GIS)进行存储、计算和分析。第 12 章将介绍 Greenplum 丰富的图计算能力。
  • 第四部分介绍运维管理和数据迁移。其中,第 13 章会介绍各种监控和管理工具及相关企业级产品。第 14 章介绍数据库备份和恢复。第 15 章和第 16 章将分别介绍如何从 Oracle 和 Teradta 迁移到 Greenplum。

Cloud Foundry 和 Pivotal 公司的成功以及 IBM 大手笔收购 Redhat 的举措,使得 P 层云的热度空前高涨。最近 5 年,Docker、Kubernetes 和 Cloud Foundry 技术生态圈不断扩充北向视角的 P 层云,技术不断细化,目前已经形成了如下涵盖容器服务、应用服务和函数服务的架构:

  • 在容器技术层面,代表性技术主要有 Cloud Foundry 为主导的 Garden 容器技术和 Docker 容器技术。在容器编排技术方面,除了 Cloud Foundry,以谷歌为代表的 Kubernetes(缩写为 K8s1)技术逐渐盛行。在 Pivotal 公司发行的 Cloud Foundry 2.0 中也融入了 Kubernetes 和 Docker 容器,并且联合谷歌公司和兄弟公司 VMWare 发布了 Pivotal 容器服务(Pivotal Container Service,PKS2)。

1 K8s 的意思是 Kubernetes 的字母 K 后跳过 8 个字母到 s。把一个长单词用“首字母 + 跳过的字母数”来进行缩写是硅谷的众多缩写方法之一。硅谷有这么多缩写“坏习惯”就是为了让外行读不懂他们的科技文章。

2 注意,PKS 的第二个字母是 K 而不是 C,这是为了和 Google 的容器服务的英文缩写 GKS 保持一致。

  • 在应用服务技术层面,Pivotal Cloud Foundry 2.0 把原来的 1.0 版的 PaaS 应用服务发布成为 Pivotal Application Service(缩写为 PAS),继续为开发者提供透明的应用全生命周期管理。
  • 在函数服务方面,亚马逊最近推出的 Lambda 服务最终成就了函数即服务 (Function as a Servivce,FaaS)。在 FaaS 基础上,AWS 等云计算服务以比服务器更细粒度的服务和对应的计费被业界称为无服务器计算(Serverless Computing)。随后,谷歌在 Knative 的基础上推出了谷歌的无服务器计算。Pivotal 公司在 Knative 的基础上推出了 Pivotal 函数服务(Pivotal Function Service,PFS),PFS 也是 Pivotal Cloud Foundry 2.0 的组成部分。

综上所述,P 层云目前的技术构成可以用图 1-1 表示。

Greenplum:从大数据战略到实现(4):ABC:人工智能、大数据和云计算 1.1.2

图 1-1 P 层云的细化和扩展

这里之所以要剖析 P 层云的层次,是为了帮助读者理解大数据系统在云中部署的实际情况和最新的趋势。

Greenplum:从大数据战略到实现(4):ABC:人工智能、大数据和云计算 1.1.2

购书地址 https://item.jd.com/12668618.html?dist=jd

评论

发布