Greenplum:从大数据战略到实现 (13):ABC:人工智能、大数据和云计算 1.3.2

阅读数:3 2019 年 12 月 18 日 21:09

Greenplum:从大数据战略到实现(13):ABC:人工智能、大数据和云计算 1.3.2

(AI 的发展史)

内容简介
这是一本系统剖析 Greenplum 开源大数据平台的书籍,也是大数据战略制定与落地的实战型指导书!
本书围绕数字原生和云计算、大数据、人工智能驱动的企业数字化转型的核心诉求,从商业和技术实战视角分享了业界领先企业大数据战略的深刻思考,并提供了大数据战略从制定到落地的全面指导。既有高阶数字化战略高度对大数据的解读,又有技术实战角度对使用 Greenplum 大数据和机器学习平台实现大数据战略的实践指南。
本书作者来自 Greenplum 核心研发团队,致力于以开源、开放的理念和先进的技术推进大数据产业生态,助力企业以更低的成本、更高的效率实现数字化转型,并基于 Greenplum 开源社区培养大数据产业更多人才。
本书分为四个部分。

  • 第一部分介绍大数据战略。其中,第 1 章将分享作者对于人工智能、大数据和云计算之间关系的理解以及对人和人工智能的思考。第 2 章将介绍进取型企业为什么需要大数据战略以及如何建立大数据战略。
  • 第二部分介绍大数据平台。其中,第 3 章将以数据平台演进历史和未来趋势为主题,描述三次整合的背景及影响,介绍选择大数据平台需要考虑的因素,以及为什么 Greenplum 是理想的大数据平台。第 4 章将介绍 Greenplum 数据库快速入门指南。第 5 章将介绍 Greenplum 架构的主要特点和核心引擎。第 6 章将介绍数据加载、数据联邦和数据虚拟化。第 7 章将介绍 Greenplum 的资源管理以及对混合负载的支持。
  • 第三部分介绍机器学习。其中,第 8 章介绍 Greenplum 的各种过程化编程语言(用户自定义函数),用户可以使用 Python、R、Java 等实现用户自定义函数,还可以通过容器化技术实现自定义函数的安全性和隔离性。第 9 章将介绍 Greenplum 内建的机器学习库 MADlib,数据科学家可以使用内建的 50 多种机器学习算法用 SQL 对数据进行高级分析,并介绍如何扩展 MADlib 以实现新算法。第 10 章和第 11 章将分别介绍 Greenplum 如何对文本数据和时空数据(GIS)进行存储、计算和分析。第 12 章将介绍 Greenplum 丰富的图计算能力。
  • 第四部分介绍运维管理和数据迁移。其中,第 13 章会介绍各种监控和管理工具及相关企业级产品。第 14 章介绍数据库备份和恢复。第 15 章和第 16 章将分别介绍如何从 Oracle 和 Teradta 迁移到 Greenplum。

自远古时代,人类一直希望能够创造一种类似于人类智能的机器,将人类从乏味的重复劳动中解放出来。直到 1936 年,计算机科学的鼻祖图灵1发表了名为《论可计算数》的论文,机器模拟人类智能的哲学话题才转变成一个可以像数学学科那样被论证的课题。在论文中,图灵构造了假想的机器来模仿人类。电影《模仿游戏》讲述的就是图灵如何构造假想的机器(计算机)来模仿人类的故事。在那个时代,人工智能的概念还没有提出,人们更多地使用“机器智能”这个词来讨论计算机带来的智能。简单地说,图灵的论文证明了机器可以模仿人类智能,所以今天的无人驾驶、聊天机器人、棋类对弈和计算机视觉识别等应用都是图灵预见的,虽然他那时并没有足够的硬件条件测试这些应用。读者如果想深入探讨计算机是否可以模仿所有人类的活动,可以参考 1.5.1 节中关于 AI 和人的讨论。

1 计算机科学的最高奖项图灵奖就以他的名字命名,图灵奖在计算机科学的地位类似于诺贝尔奖在其他自然科学学科的地位。

在图灵提出图灵机后,多个机构便开始设计真正意义上的遵循通用图灵机模型架构的存储程序计算机(Stored-program Computer)2。虽然第一台存储程序计算机(后文称作现代计算机)是谁先发明的至今仍有争议,但是影响较大的是冯·诺依曼提出的 EDVAC(Electronic Discrete Variable Automatic Computer)。冯·诺依曼在后来也确认现代计算机的核心设计思想是受到通用图灵机的启发3。现代计算机发明以后,各种应用如雨后春笋一样蓬勃发展,但是真正把人工智能作为一个应用方向提出来还是在 1956 年的达特茅斯会议。

2 第一台程序存储计算机的候选列表参见 https://en.wikipedia.org/wiki/Stored-program_computer

3 参见 https://en.wikipedia.org/wiki/Computer#Modern_computers

在 20 世纪 40 年代末现代计算机被发明后,从 20 世纪 50 年代开始,各个领域都开始关于“思考机器”(Thinking Machines)的讨论。各个领域的用词和方法的不同带来了很多混淆。于是,达特茅斯学院(Dartmouth College)年轻的助理教授麦卡锡(John McCarthy)决定召集一个会议澄清思考机器这个话题4。召集这样的会议需要赞助,聪明的麦卡锡找到了他在 IBM 公司的朋友罗切斯特(Nathaniel Rochester)和在普林斯顿大学的朋友闵斯基(Marvin Minsky)以及大师香农一起在 1955 年写了一份项目倡议。在倡议中,他使用了人工智能(Artificial Intelligence)这个词,避免和已经有的“思考机器”一词混淆。这里值得一提的是闵斯基,麦卡锡和闵斯基后来在麻省理工学院领导了 AI 实验室,成就了麻省理工学院在人工智能领域首屈一指的地位。会议在 1956 年举行,这里必须提到另外两位短期的参会者,来自卡内基·梅隆大学5的纽厄尔(Alan Newell)和司马贺(Hubert Simon)。他们虽然只呆了一个礼拜,但是他们的报告中公布的一款程序“逻辑理论家”(Logic Theorist)代表了人工智能的另外一条路线。因为纽厄尔和司马贺的奠基工作,卡内基·梅隆大学成为人工智能的另一个重镇。至于其他参会人员和他们之间的趣闻,读者可以参考《东方早报》在人工智能 60 周年的报道6以及相关的著作。

4 参见 https://en.wikipedia.org/wiki/Dartmouth_workshop

5 当时属于卡内基理工学院,现在的卡内基·梅隆大学是由卡内基理工学院和梅隆学院合并形成的。

6 参见《人工智能的起源:六十年前,一场会议决定了今天的人机大战》, https://www.thepaper.cn/newsDetail_forward_1442982

Greenplum:从大数据战略到实现(13):ABC:人工智能、大数据和云计算 1.3.2

购书地址 https://item.jd.com/12668618.html?dist=jd

评论

发布