写点什么

这可能是人工智能、机器学习和大数据领域覆盖最全的一份速查表

  • 2018-11-27
  • 本文字数:1915 字

    阅读完需:约 6 分钟

这可能是人工智能、机器学习和大数据领域覆盖最全的一份速查表

本文是根据 Stefan Kojouharov 发表在 Medium 上的文章整理而成的一份人工智能、神经网络、机器学习、深度学习和大数据方面的速查表。为了便于查找与使用,本文对每个主题进行了分类,希望可以对各位的工作有所帮助。


注意!这可能是相关领域最全的的一份速查表,文末还列出了各种算法的复杂度统计。

神经网络


图 1:神经网络速查表

神经网络图


图 2:神经网络结构图速查表



图 3a:神经网络相关概念速查表(上)



图 3b:神经网络相关概念速查表(下)

机器学习概览


图 4:机器学习速查表

机器学习:Scikit-learn 算法

如果在你的项目中出现了一些未知问题,那么这份机器学习速查表可以帮助你快速地找到出问题的那部分。下面这个流程图可以帮助你快速的浏览文档并快速导航,这可以帮助你更深入的理解问题的原因,同时为你提供对应的解决方案。



图 5:机器学习速查表

Scikit-Learn

Scikit-learn(原 scikits.learn) 是基于 Python 的一款免费机器学习库。它涵盖了很多分类回归以及聚类算法,包括支持向量机随机森林梯度加速k-means聚类以及DBSGAN聚类算法。该库可以与 Python 的科学计算库Numpy以及SciPy互操作。



图 6:Scikit-Learn 速查表

机器学习:算法速查表

这份来自微软 Azure 的机器学习速查表可以帮助你在解决方案的预分析过程中快速选择合适的机器学习算法。使用这份速查表时,你可以根据自己的目的和数据特征快速地选择对应的算法。



图 7:机器学习速查表

Python 的数据科学相关功能


图 8:Python 数据科学速查表



图 9:大数据速查表

TensorFlow

2017 年 5 月,Google 发布了第二代 TPU(张量计算单元),同时在谷歌计算引擎上提供了 TPU 集群。第二代 TPU 提供了高达每秒 180 万亿次的浮点数运算能力,由 64 个 TPU 组成的集群可以提供每秒 1.15 亿亿次的浮点数运算能力。



图 10:TensoFlow 速查表

Keras

2017 年,Google 的 TensorFlow 团队决定在 TensorFlow 的核心库中添加 Keras 支持。Ghollet 解释说,Keras 是按接口来设计的,而不是一个端到端的机器学习框架。它代表着更高级、更直观的使用方式,这使得配置神经网络变得更为简单,用户不需要再去了解复杂的后端科学计算库。



图 11:Keras 速查表

Numpy

Numpy 旨在作为 Python 的CPython参考实现,它是一个非优化的字节码解释器。针对这个 Python 版本编写的一些数学算法通常比相同代码的编译版本慢一些。Numpy 通过提供多维数组和函数,以及在数组上的高效运算符来解决运算缓慢的问题,这需要需要重写一些代码,主要是使用 NumPy 的一些内循环。



图 12:Numpy 速查表

Pandas

“Pandas” 这个名称来源于术语 “面板数据”, 这是多维结构化数据集的一个计量经济学术语。



图 13:Pandas 速查表

数据清洗

“数据清洗”正逐渐渗入流行文化。在 2017 年的电影《金刚:骷髅岛》中,由 Marc Evan Jackson 扮演的角色 Steve Woodward 就是一位数据清洗师。



图 14:数据清洗速查表



图 15:Pandas 数据清洗速查表

使用 dplyr 和 tidyr 进行数据清洗


图 16a:基于 dplyr 和 tidyr 的数据清洗速查表



图 16b:基于 dplyr 和 tidyr 的数据清洗速查表

Scipy

Scipy 是基于 Numpy 数组对象的一个科学计算库,它是 NumPy 全家桶(包括 Matplotlib、Pandas、SymPy 等工具包)的一部分,也是科学计算库的一个扩展集。这个 Numpy 全家桶与其他应用程序(如 MATLAB、GNU Octave 和 Scilab)有很多共同的用户。NumPy 全家桶有时也被称为 SciPy 全家桶。



图 17:Scipy 速查表

Matplotlib

Matplotlib 是一个面向 Python 编程语言及其数学计算库 NumPy 的绘图工具库。Matplotlib 提供了面向对象的 API,它使用通用的 GUI 工具包(例如 Tkinter、wxPython、Qt 或者 GTK+)。虽然也有基于状态机的程序接口“pylab“(像 OpenGL),其设计与 MATLAB 非常相似,但是大家却不提倡使用它。SciPy 使用了 matplotlib。


pyplot 是 matplotlib 中的一个模块,提供类似 MATLAB 的接口。按照设计,Matplotlib 可以跟 MATLAB 一样使用,你可以在 Python 中使用它,并且是免费的。



图 18:Matplotlib 速查表

数据可视化


图 19:数据可视化速查表



图 20:ggplot 速查表

PySpark


图 21:Pyspark 速查表

Big-O(时间复杂度)


图 22:Big-O 算法速查表



图 23:Big-O 算法复杂度表



图 24:不同数据结构实现算法的时间复杂度



图 25:不同的数组排序算法时间复杂度

关于作者

Stefan 是 Chatbot’s Life 的创始人,这是一家聊天机器人媒体和咨询公司。到目前为止,Chatbot’s Life 每月的浏览量超过了 150k,成了在线学习 Bots&AI 的优质资源。同时,Chatbot’s Life 还为多家顶级机器人企业提供咨询工作,例如 Swelly、Instavest、OutBrain 和 NearGrop。


查看英文原文:Cheat Sheets for AI, Neural Networks, Machine Learning, Deep Learning & Big Data



2018-11-27 19:004492

评论 1 条评论

发布
暂无评论
发现更多内容

云流化技术在汽车行业中的应用

3DCAT实时渲染

XR 云流化

腾讯云的一场硬仗

ToB行业头条

NFT挖矿游GameFi链游系统开发搭建

薇電13242772558

智能合约 NFT

wallys/WiFi 6 (802.11ax) 4×4 MU-MIMO 5GHz QCN9074 Single Band Wireless Module

wallys-wifi6

【合集- 行业解决方案】如何搭建高性能的数据加速与数据编排平台

Alluxio

人工智能 互联网 金融 科技 电信

充值满赠,IM+RTC+X 全通信服务「回馈季」开启

融云 RongCloud

ABAP-发布Restful服务

桥下本有油菜花

abap

小程序容器技术,促进园区运营效率提升

Speedoooo

智慧园区 小程序容器 园区运营

LeaRun.Java可视化拖拽编辑的BI大屏

力软低代码开发平台

“阿里爸爸”最新Java面试指南,基础+框架+数据库+系统设计+算法

Java全栈架构师

Java spring 程序员 面试 架构设计

1 分钟 Serverless 搭建你的首个个人网站(完成就送猫超卡)

阿里巴巴云原生

阿里云 Serverless 云原生 网站

CODING 正式入驻腾讯会议应用市场!

CODING DevOps

CloudXR如何推动XR的未来发展

3DCAT实时渲染

CLOUDXR

流批一体在京东的探索与实践

Apache Flink

大数据 flink 编程 流计算 实时计算

先写API文档还是先写代码?

Liam

Java 前端 Postman 后端开发 后端技术

联想YOGA 27 2022,超强配置全面升级

极客天地

什么是XR扩展现实,XR云串流平台有哪些

3DCAT实时渲染

XR 云XR

边缘计算平台如何助力物联网发展

3DCAT实时渲染

边缘计算

云化XR,如何助力产业升级

3DCAT实时渲染

XR

GameFi链游系统开发NFT技术

薇電13242772558

NFT gamefi

做自助洗车合伙人要投入多少

共享电单车厂家

自助洗车加盟 自助洗车合伙人

大学生研究生毕业找工作,该选择哪个方向?

C++后台开发

后端开发 应届生 C++后台开发 研究生 C++开发

“低代码”在企业数字化转型中扮演着什么角色?

优秀

低代码 数字化

如何成为一名共享自助洗车合伙人

共享电单车厂家

共享自助洗车 自助洗车加盟 自助洗车合伙人

知名互联网房屋租赁服务公司物联网关键业务迁移上云实践

EMQ映云科技

物联网 IoT 云服务 emqx 6月月更

小程序容器与物联网结合的方式

Geek_99967b

小程序 物联网

日均 6000+ 实例,TB 级数据流量,Apache DolphinScheduler 如何做联通医疗大数据平台的“顶梁柱”?

白鲸开源

Apache 大数据 开源 Apache DolphinScheduler

实时渲染和预渲染有什么区别

3DCAT实时渲染

渲染 实时渲染

NFT铸造交易平台开发详情

开发微hkkf5566

墨天轮沙龙 | 清华乔嘉林:Apache IoTDB,源于清华,建设开源生态之路

墨天轮

数据库 国产数据库 apache 社区 Apache IoTDB

wallys/WiFi 6 (802.11ax) 4×4 MU-MIMO 2.4GHz QCN9074 Single Band Wireless Module

wallys-wifi6

这可能是人工智能、机器学习和大数据领域覆盖最全的一份速查表_AI&大模型_Stefan Kojouharov_InfoQ精选文章