Greenplum:从大数据战略到实现 (5):ABC:人工智能、大数据和云计算 1.1.3

阅读数:5 2019 年 12 月 18 日 21:07

Greenplum:从大数据战略到实现(5):ABC:人工智能、大数据和云计算 1.1.3

(大数据系统在云中部署不断朝南上移)

内容简介
这是一本系统剖析 Greenplum 开源大数据平台的书籍,也是大数据战略制定与落地的实战型指导书!
本书围绕数字原生和云计算、大数据、人工智能驱动的企业数字化转型的核心诉求,从商业和技术实战视角分享了业界领先企业大数据战略的深刻思考,并提供了大数据战略从制定到落地的全面指导。既有高阶数字化战略高度对大数据的解读,又有技术实战角度对使用 Greenplum 大数据和机器学习平台实现大数据战略的实践指南。
本书作者来自 Greenplum 核心研发团队,致力于以开源、开放的理念和先进的技术推进大数据产业生态,助力企业以更低的成本、更高的效率实现数字化转型,并基于 Greenplum 开源社区培养大数据产业更多人才。
本书分为四个部分。

  • 第一部分介绍大数据战略。其中,第 1 章将分享作者对于人工智能、大数据和云计算之间关系的理解以及对人和人工智能的思考。第 2 章将介绍进取型企业为什么需要大数据战略以及如何建立大数据战略。
  • 第二部分介绍大数据平台。其中,第 3 章将以数据平台演进历史和未来趋势为主题,描述三次整合的背景及影响,介绍选择大数据平台需要考虑的因素,以及为什么 Greenplum 是理想的大数据平台。第 4 章将介绍 Greenplum 数据库快速入门指南。第 5 章将介绍 Greenplum 架构的主要特点和核心引擎。第 6 章将介绍数据加载、数据联邦和数据虚拟化。第 7 章将介绍 Greenplum 的资源管理以及对混合负载的支持。
  • 第三部分介绍机器学习。其中,第 8 章介绍 Greenplum 的各种过程化编程语言(用户自定义函数),用户可以使用 Python、R、Java 等实现用户自定义函数,还可以通过容器化技术实现自定义函数的安全性和隔离性。第 9 章将介绍 Greenplum 内建的机器学习库 MADlib,数据科学家可以使用内建的 50 多种机器学习算法用 SQL 对数据进行高级分析,并介绍如何扩展 MADlib 以实现新算法。第 10 章和第 11 章将分别介绍 Greenplum 如何对文本数据和时空数据(GIS)进行存储、计算和分析。第 12 章将介绍 Greenplum 丰富的图计算能力。
  • 第四部分介绍运维管理和数据迁移。其中,第 13 章会介绍各种监控和管理工具及相关企业级产品。第 14 章介绍数据库备份和恢复。第 15 章和第 16 章将分别介绍如何从 Oracle 和 Teradta 迁移到 Greenplum。

大数据的技术发展动力和商业赋能将在后面的章节展开讨论,本节将讨论云计算技术的发展对 Greenplum 和 Hadoop 这样的大数据系统的部署的影响。在图 1-1 中,大数据系统可以运行在云计算数据中心的裸机硬件、I 层云或者 P 层云的容器服务上。

1)将大数据系统直接运行在硬件上面。因为大数据软件本身的机制,一个好的大数据系统能满足云计算定义:计算资源可以随业务增长的需求而弹性增长。具体细节将在下一节中阐述。国内的公有云厂商为政府和企业提供专有云服务,为其专门部署属于他们自己的硬件环境。

2)将大数据系统运行在公有云或者私有云的 IaaS 上面。不少公有云上的 Hadoop 服务就属于这类情况。

3)将大数据系统运行在 PaaS 云的容器服务上面。截至本书完稿时,Pivotal 和阿里云等主流云计算厂商都认为将 Greenplum 运行在容器层可以有效减轻大数据系统的运维工作。因此,不少公有云服务商喜欢把大数据系统划为 P 层云服务。

现在,主流云计算厂商都支持以上三种形式的大数据系统的部署。当企业将大数据系统部署不断从硬件和 I 层云向北迁移至 P 层云的时候,云计算系统管理和调度的资源粒度更细,大数据系统部署的成本优势和敏捷程度也不断提升。另外,因为 P 层云的容器的标准化,使得大数据系统更容易实现跨云部署。这种北向迁移的变化表面看没有什么特别之处,事实上这标志着大数据系统开始走向平民化。在后面的章节会谈到,在算力和存储资源提升的基础上,大数据系统模型的准确程度也有所提升。在云计算出现之前,小企业投资和管理上百台服务器组成的大数据系统是不敢想象的。公有云按资源使用量收费的模式,使得小企业运行大数据系统成为可能。例如,不少企业在一个季度结束的时候,在公有云上申请几百台服务器和内置的大数据服务,将这些计算资源开启数周来计算自己的企业数据,以获得对自己企业的商业洞察。P 层云带来的更加精细的计费方式和更加标准的服务方式,使得企业可以在整个互联网上快速获得大数据系统运营所需要的资源。云计算从早期 I 层云的跑马圈地转变到 P 层云的应用和分析结果导向的精耕细作,这种精益化运作意味着这项技术走向成熟。

Greenplum:从大数据战略到实现(5):ABC:人工智能、大数据和云计算 1.1.3

购书地址 https://item.jd.com/12668618.html?dist=jd

评论

发布