写点什么

AI 书单|大牛私藏的机器学习书(附 PDF 链接)

2018 年 1 月 30 日

看新闻很累?看技术新闻更累?试试下载 InfoQ 手机客户端,每天上下班路上听新闻,有趣还有料!

本文首发于王天一在极客时间 App 上开始的独家专栏《人工智能基础课》,更多精彩文章,正在专栏更新。 点击此处,或扫描下图二维码订阅,永久阅读专栏内所有内容。

在机器学习上,首先要推荐的是两部国内作者的著作:李航博士所著的**《统计学习方法》周志华教授的《机器学习》**。

《统计学习方法》采用“总 - 分 - 总”的结构,在梳理了统计学习的基本概念后,系统而全面地介绍了统计学习中的 10 种主要方法,最后对这些算法做了总结与比较。这本书以数学公式为主,介绍每种方法时都给出了详尽的数学推导,几乎不含任何废话,因而对读者的数学背景也提出了较高的要求。

相比之下,《机器学习》覆盖的范围更广,具有更强的导论性质,有助于了解机器学习的全景。书中涵盖了机器学习中几乎所有算法类别的基本思想、适用范围、优缺点与主要实现方式,并穿插了大量通俗易懂的实例。

如果说《统计学习方法》胜在深度,那么《机器学习》就胜在广度。在具备广度的前提下,可以根据《机器学习》中提供的丰富参考文献继续深挖。

读完以上两本书,就可以阅读一些经典著作了。经典著作首推 Tom Mitchell 所著的 Machine Learning,中译本名为《机器学习》。本书成书于 1997 年,虽然难以覆盖机器学习中的最新进展,但对于基本理论和核心算法的论述依然鞭辟入里,毕竟经典理论经得起时间的考验。这本书的侧重点也在于广度,并不涉及大量复杂的数学推导,是比较理想的入门书籍。作者曾在自己的主页上说本书要出新版,并补充了一些章节的内容,也许近两年可以期待新版本的出现。

另一本经典著作是 Trevor Hastie 等人所著的 Elements of Statistical Learning,于 2016 年出版了第二版。这本书没有中译,只有影印本。高手的书都不会用大量复杂的数学公式来吓唬人(专于算法推导的书除外),这一本也不例外。它强调的是各种学习方法的内涵和外延,相比于具体的推演,通过方法的来龙去脉来理解其应用场景和发展方向恐怕更加重要。

压轴登场的非 Christopher Bishop 所著的 Pattern Recognition and Machine Learning 莫属了。本书出版于 2007 年,没有中译本,也许原因在于将这样一本煌煌巨著翻译出来不知要花费多少挑灯夜战的夜晚。这本书的特点在于将机器学习看成一个整体,不管于基于频率的方法还是贝叶斯方法,不管是回归模型还是分类模型,都只是一个问题的不同侧面。作者能够开启上帝视角,将机器学习的林林总总都纳入一张巨网之中,遗憾的是,大多数读者跟不上他高屋建瓴的思路(也包括我自己)。

最后推荐的是 David J C MacKay 所著的 Information Theory, Inference and Learning Algorithms,成书于 2003 年,中译本名为《信息论,推理与学习算法》。本书作者是一位全才型的科学家,这本书也并非机器学习的专著,而是将多个相关学科熔于一炉,内容涉猎相当广泛。相比于前面板着脸的教科书,阅读本书的感觉就像在和作者聊天,他会在谈笑间抛出各种各样的问题让你思考。广泛的主题使本书的阅读体验并不轻松,但可以作为扩展视野的一个调节。

部分书目链接

本文首发于王天一在极客时间 App 上开始的独家专栏《人工智能基础课》,更多私藏书单,正在专栏更新。 点击此处,或扫描下图二维码订阅,永久阅读专栏内所有内容。

2018 年 1 月 30 日 18:009596

评论

发布
暂无评论
发现更多内容

有问必答(2020-05-09):如何督促自己做好一件事情?

冯夷

生活

EasyExcel最权威教程

知春秋

Java Excel EasyExcel

从零到部署:用 Vue 和 Express 实现迷你全栈电商应用(一)

图雀社区

node.js vue.js Vue

Kotlin协程实践之进程、线程、协程

陈吉米

Java kotlin 协程 Coroutine

2020年比以往任何时候更想做成的使命感

乐少

发布Maven包的正确姿势

廖雪峰

maven 开源

游戏夜读 | Scikit-learn迎来0.21版本

game1night

少说废话,先干起来

白鸽

学习 个人成长 自律

都前后端分离了,咱就别做页面跳转了!统统 JSON 交互

江南一点雨

spring Spring Boot spring security

机会,是不会让你准备好的

Winann

学习 生活 知识管理 机会

键入网址后,其间发生了什么?

小林coding

TCP 计算机网络 网络协议 IP HTTP

微服务为什么要有服务发现与注册?

攀岩飞鱼

微服务 微服务冶理 微服务发现

如何搞定Kafka重复消费?

奈学教育

kafka kafka配置

笔记:《如何系统思考》之如何应用系统思考

wiflish

思维方式

JAVA内存模型与线程

颇风

Java 内存模型 JVM

Design Sprint 教你五天完成产品迭代

Yanel 说敏捷产品

产品 敏捷 设计 产品设计 团队

程序员的晚餐 | 5 月 17 日 当西红柿遇上鱼

清远

美食

Collaboration on SaaS

zhenglei

SaaS Collaboration Cisco Webex

【高级进阶】写给大忙人看的JDK14新特性

知春秋

Java java 14 java 14 新特性

11 万字的字节码编程系列合集放送(ASM、Javassist、Byte-buddy、Javaagent)

小傅哥

Java asm bytebuddy 《字节码编程》

一种练好英语口语的方法

七镜花园-董一凡

学习

《零基础学 Java》 FAQ 之 8-Java方法调用是传值还是传引用

臧萌

Java

比AtomicLong更优秀的LongAdder确定不来了解一下吗?

一枝花算不算浪漫

并发编程 jdk源码

2020第一篇技术博客

java劝退师首席大弟子

生活

如何用一套引擎搞定机器学习全流程?

Apache Flink

大数据 flink 流计算 实时计算 大数据处理

回“疫”录(19):都什么时候了,还在搞“填表抗疫”

小天同学

疫情 回忆录 现实纪录 纪实 形式主义

从连续两届图灵奖(2018-2019)看GPU发展史

GPU

人工智能 gpu 计算机基础 计算机图形学 计算机体系结构

Docker 镜像制作教程:针对不同语言的精简策略

米开朗基杨

Docker Dockerfile

DevOps生命周期,你想知道的全都在这里了!

陈琦

DevOps 测试 持续集成

写作对我的意义

Neco.W

总结 思考 写作 感悟

Java如何处理异常情况

Rayjun

Java 异常

InfoQ 极客传媒开发者生态共创计划线上发布会

InfoQ 极客传媒开发者生态共创计划线上发布会

AI书单|大牛私藏的机器学习书(附PDF链接)-InfoQ