Greenplum:从大数据战略到实现 (32):建立基于大数据的高阶数字化战略 3.2.1

阅读数:5 2019 年 12 月 18 日 21:28

Greenplum:从大数据战略到实现(32):建立基于大数据的高阶数字化战略 3.2.1

(电子计算机的出现)

内容简介
这是一本系统剖析 Greenplum 开源大数据平台的书籍,也是大数据战略制定与落地的实战型指导书!
本书围绕数字原生和云计算、大数据、人工智能驱动的企业数字化转型的核心诉求,从商业和技术实战视角分享了业界领先企业大数据战略的深刻思考,并提供了大数据战略从制定到落地的全面指导。既有高阶数字化战略高度对大数据的解读,又有技术实战角度对使用 Greenplum 大数据和机器学习平台实现大数据战略的实践指南。
本书作者来自 Greenplum 核心研发团队,致力于以开源、开放的理念和先进的技术推进大数据产业生态,助力企业以更低的成本、更高的效率实现数字化转型,并基于 Greenplum 开源社区培养大数据产业更多人才。
本书分为四个部分。

  • 第一部分介绍大数据战略。其中,第 1 章将分享作者对于人工智能、大数据和云计算之间关系的理解以及对人和人工智能的思考。第 2 章将介绍进取型企业为什么需要大数据战略以及如何建立大数据战略。
  • 第二部分介绍大数据平台。其中,第 3 章将以数据平台演进历史和未来趋势为主题,描述三次整合的背景及影响,介绍选择大数据平台需要考虑的因素,以及为什么 Greenplum 是理想的大数据平台。第 4 章将介绍 Greenplum 数据库快速入门指南。第 5 章将介绍 Greenplum 架构的主要特点和核心引擎。第 6 章将介绍数据加载、数据联邦和数据虚拟化。第 7 章将介绍 Greenplum 的资源管理以及对混合负载的支持。
  • 第三部分介绍机器学习。其中,第 8 章介绍 Greenplum 的各种过程化编程语言(用户自定义函数),用户可以使用 Python、R、Java 等实现用户自定义函数,还可以通过容器化技术实现自定义函数的安全性和隔离性。第 9 章将介绍 Greenplum 内建的机器学习库 MADlib,数据科学家可以使用内建的 50 多种机器学习算法用 SQL 对数据进行高级分析,并介绍如何扩展 MADlib 以实现新算法。第 10 章和第 11 章将分别介绍 Greenplum 如何对文本数据和时空数据(GIS)进行存储、计算和分析。第 12 章将介绍 Greenplum 丰富的图计算能力。
  • 第四部分介绍运维管理和数据迁移。其中,第 13 章会介绍各种监控和管理工具及相关企业级产品。第 14 章介绍数据库备份和恢复。第 15 章和第 16 章将分别介绍如何从 Oracle 和 Teradta 迁移到 Greenplum。

前面说过,在电子计算机出现之前,人类就发明了各种计算工具和机器,早期的人工计算工具有算筹和算盘。1642 年,法国哲学家和数学家帕斯卡(Blaise Pascal)发明了世界上第一台加减法计算机。它利用齿轮转动原理进行机械式计算,通过手摇方式操作运算。1671 年,德国数学家莱布尼兹(G.W. Leibnitz)制造出第一台能够进行加减乘除四则运算的机械式计算机。1833 年,英国科学家巴贝奇(Charles Babbage)提出了制造自动化计算机的设想,他所设计的分析机引进了程序控制的概念。尽管该机器未能实现,但其设计思想和方案成为现代计算机的雏形。1886 年,巴贝奇发明了差分机,使用齿轮进行数值计算。1925 年,美国麻省理工学院制造了第一台机械模拟式计算机,1942 年又研制出采用了速度更快的继电器的模拟式计算机。1944 年,艾肯(Howard Aiken)在 IBM 的资助下成功研制出世界上第一台数字式自动计算机 Mark I,实现了当年巴贝奇的设想。这台机器使用了三千多个继电器,可以进行全自动运算,代表着当时人类制造机械式电动计算机的最高水平。

随着电子技术的发展,美国宾夕法尼亚大学在美国军方的资助下于 1946 年研制出第一台电子数字积分机和计算机(ENIAC),这是世界上第一台通用电子数字计算机。它使用了 18000 多个电子管、1500 个继电器,重 30 吨,占地约 170 平方米,运算速度达到每秒 5000 次,比 Mark I 快 1000 倍以上。

但 ENIAC 有一个致命的缺点—程序和数据分离,即数据存储在存储器中,而程序存储在机器外部的电路里。运算之前,先要按照程序手工把相应的电路接通或通过读卡机读卡以执行各个指令,费时费力,无法发挥它的运算速度。冯·诺依曼(Von Neumann)和宾夕法尼亚大学的莫尔电机系小组提出了“存储程序”的概念,确立了计算机由输入、存储、运算、控制和输出五个基本部件组成的结构,将指令像数据一样进行存储和处理。按照此原则制成的第一台存储程序、顺序控制的电子离散变量自动计算机(EDVAC)于 1949 年在英国的剑桥大学投入使用。EDVAC 也是第一台使用磁带的计算机,可以多次在磁带上存储程序。至今,计算机仍遵循此存储程序原则。

Greenplum:从大数据战略到实现(32):建立基于大数据的高阶数字化战略 3.2.1

购书地址 https://item.jd.com/12668618.html?dist=jd

评论

发布