NVIDIA 初创加速计划,免费加速您的创业启动 了解详情
写点什么

这可能是人工智能、机器学习和大数据领域覆盖最全的一份速查表

  • 2018-11-27
  • 本文字数:1915 字

    阅读完需:约 6 分钟

这可能是人工智能、机器学习和大数据领域覆盖最全的一份速查表

本文是根据 Stefan Kojouharov 发表在 Medium 上的文章整理而成的一份人工智能、神经网络、机器学习、深度学习和大数据方面的速查表。为了便于查找与使用,本文对每个主题进行了分类,希望可以对各位的工作有所帮助。


注意!这可能是相关领域最全的的一份速查表,文末还列出了各种算法的复杂度统计。

神经网络


图 1:神经网络速查表

神经网络图


图 2:神经网络结构图速查表



图 3a:神经网络相关概念速查表(上)



图 3b:神经网络相关概念速查表(下)

机器学习概览


图 4:机器学习速查表

机器学习:Scikit-learn 算法

如果在你的项目中出现了一些未知问题,那么这份机器学习速查表可以帮助你快速地找到出问题的那部分。下面这个流程图可以帮助你快速的浏览文档并快速导航,这可以帮助你更深入的理解问题的原因,同时为你提供对应的解决方案。



图 5:机器学习速查表

Scikit-Learn

Scikit-learn(原 scikits.learn) 是基于 Python 的一款免费机器学习库。它涵盖了很多分类回归以及聚类算法,包括支持向量机随机森林梯度加速k-means聚类以及DBSGAN聚类算法。该库可以与 Python 的科学计算库Numpy以及SciPy互操作。



图 6:Scikit-Learn 速查表

机器学习:算法速查表

这份来自微软 Azure 的机器学习速查表可以帮助你在解决方案的预分析过程中快速选择合适的机器学习算法。使用这份速查表时,你可以根据自己的目的和数据特征快速地选择对应的算法。



图 7:机器学习速查表

Python 的数据科学相关功能


图 8:Python 数据科学速查表



图 9:大数据速查表

TensorFlow

2017 年 5 月,Google 发布了第二代 TPU(张量计算单元),同时在谷歌计算引擎上提供了 TPU 集群。第二代 TPU 提供了高达每秒 180 万亿次的浮点数运算能力,由 64 个 TPU 组成的集群可以提供每秒 1.15 亿亿次的浮点数运算能力。



图 10:TensoFlow 速查表

Keras

2017 年,Google 的 TensorFlow 团队决定在 TensorFlow 的核心库中添加 Keras 支持。Ghollet 解释说,Keras 是按接口来设计的,而不是一个端到端的机器学习框架。它代表着更高级、更直观的使用方式,这使得配置神经网络变得更为简单,用户不需要再去了解复杂的后端科学计算库。



图 11:Keras 速查表

Numpy

Numpy 旨在作为 Python 的CPython参考实现,它是一个非优化的字节码解释器。针对这个 Python 版本编写的一些数学算法通常比相同代码的编译版本慢一些。Numpy 通过提供多维数组和函数,以及在数组上的高效运算符来解决运算缓慢的问题,这需要需要重写一些代码,主要是使用 NumPy 的一些内循环。



图 12:Numpy 速查表

Pandas

“Pandas” 这个名称来源于术语 “面板数据”, 这是多维结构化数据集的一个计量经济学术语。



图 13:Pandas 速查表

数据清洗

“数据清洗”正逐渐渗入流行文化。在 2017 年的电影《金刚:骷髅岛》中,由 Marc Evan Jackson 扮演的角色 Steve Woodward 就是一位数据清洗师。



图 14:数据清洗速查表



图 15:Pandas 数据清洗速查表

使用 dplyr 和 tidyr 进行数据清洗


图 16a:基于 dplyr 和 tidyr 的数据清洗速查表



图 16b:基于 dplyr 和 tidyr 的数据清洗速查表

Scipy

Scipy 是基于 Numpy 数组对象的一个科学计算库,它是 NumPy 全家桶(包括 Matplotlib、Pandas、SymPy 等工具包)的一部分,也是科学计算库的一个扩展集。这个 Numpy 全家桶与其他应用程序(如 MATLAB、GNU Octave 和 Scilab)有很多共同的用户。NumPy 全家桶有时也被称为 SciPy 全家桶。



图 17:Scipy 速查表

Matplotlib

Matplotlib 是一个面向 Python 编程语言及其数学计算库 NumPy 的绘图工具库。Matplotlib 提供了面向对象的 API,它使用通用的 GUI 工具包(例如 Tkinter、wxPython、Qt 或者 GTK+)。虽然也有基于状态机的程序接口“pylab“(像 OpenGL),其设计与 MATLAB 非常相似,但是大家却不提倡使用它。SciPy 使用了 matplotlib。


pyplot 是 matplotlib 中的一个模块,提供类似 MATLAB 的接口。按照设计,Matplotlib 可以跟 MATLAB 一样使用,你可以在 Python 中使用它,并且是免费的。



图 18:Matplotlib 速查表

数据可视化


图 19:数据可视化速查表



图 20:ggplot 速查表

PySpark


图 21:Pyspark 速查表

Big-O(时间复杂度)


图 22:Big-O 算法速查表



图 23:Big-O 算法复杂度表



图 24:不同数据结构实现算法的时间复杂度



图 25:不同的数组排序算法时间复杂度

关于作者

Stefan 是 Chatbot’s Life 的创始人,这是一家聊天机器人媒体和咨询公司。到目前为止,Chatbot’s Life 每月的浏览量超过了 150k,成了在线学习 Bots&AI 的优质资源。同时,Chatbot’s Life 还为多家顶级机器人企业提供咨询工作,例如 Swelly、Instavest、OutBrain 和 NearGrop。


查看英文原文:Cheat Sheets for AI, Neural Networks, Machine Learning, Deep Learning & Big Data



公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2018-11-27 19:004086

评论 1 条评论

发布
暂无评论
发现更多内容

vue项目nginx服务器部署

百度搜索:蓝易云

vue.js Linux 运维 Web 云服务器

告别内卷,瓴羊飞渡,中国ToB生态迎来 iPhone 时刻

B Impact

H5页面秒开优化与实践

汽车之家客户端前端团队

Nautilus Chain 更换全新测试网,主网即将在不久上线

股市老人

CentOS7系统搭建SFTP教程。

百度搜索:蓝易云

Linux 运维 SSH 云服务器 sftp

24款绘画软件app推荐免费!手绘爱好者必备。

彭宏豪95

效率工具 软件推荐 科技 画图工具 绘图软件

大模型基础:理论与技术演进

永佳

小巧玲珑的AVIF,你的网页图片换新装!

汽车之家客户端前端团队

不容错过!10个Python自动化办公库免费送!(上)

程序员晚枫

Python 自动化办公

Centos7系列安装FineBI教程。

百度搜索:蓝易云

云计算 Linux centos 运维 FineBI

Linux系统安装redis教程。

百度搜索:蓝易云

redis 云计算 Linux 运维 云服务器

给我五分钟!让你掌握React的Redux中间件原理

汽车之家客户端前端团队

快速离线安装MySql数据库

zhengzai7

MySQL

代码随想录Day16 - 二叉树(三)

jjn0703

Docker学习路线6:使用第三方镜像

小万哥

Docker 容器 运维 后端 开发

突破:GGX(Golden Gate)发布悉尼测试网,跨链基础设施迈出重要一步

股市老人

以 AI 变革组织运营与管理,2023 Kyligence 用户大会盛大举行

Kyligence

数据分析 数智化

Nautilus Chain 更换全新测试网,主网即将在不久上线

EOSdreamer111

Nautilus Chain 更换全新测试网,主网即将在不久上线

威廉META

“开放合作 共享未来”华秋联手伙伴共创硬件生态,助力物联网硬件加速创新

华秋电子

学科知识图谱学习平台项目 :技术栈Java、Neo4j、MySQL等超详细教学

汀丶人工智能

人工智能 自然语言处理 深度学习 neo4j 知识图谱

从十万行代码定位undefined is not an object (evaluating 't.length')

汽车之家客户端前端团队

给大模型穹顶,树一根存力支柱

脑极体

存储

Cnetos7系统安装git仓库教程

百度搜索:蓝易云

git Linux centos7 运维 云服务器

牛刀专业低代码开发实战—奖酬金预分配

牛刀专业低代码

低代码 牛刀低代码 低代码paas平台 java低代码 私有化低代码

2023-07-14:讲一讲Kafka与RocketMQ中存储设计的异同?

福大大架构师每日一题

福大大架构师每日一题

深入了解C++优先队列

智趣匠

Linux系统iptables与Firewalld防火墙区别?

百度搜索:蓝易云

云计算 Linux 运维 Firewalld iptables

Docker学习路线5:在 Docker 中实现数据持久化

小万哥

Java c++ Go Docker 后端

Amazon 上的数字孪生:使用 L3 预测性数字孪生来预测“行为”

亚马逊云科技 (Amazon Web Services)

Amazon

Nautilus Chain 更换全新测试网,主网即将在不久上线

鳄鱼视界

这可能是人工智能、机器学习和大数据领域覆盖最全的一份速查表_AI&大模型_Stefan Kojouharov_InfoQ精选文章