阿里云「飞天发布时刻」2024来啦!新产品、新特性、新能力、新方案,等你来探~ 了解详情
写点什么

2018 年最受欢迎的 Python 库,你都用过吗?

  • 2018-12-20
  • 本文字数:2383 字

    阅读完需:约 8 分钟

2018年最受欢迎的Python库,你都用过吗?

AI 前线导读: 近日,数据科学网站 KDnuggets 评选出了顶级 Python 库 Top15,领域横跨数据科学、数据可视化、深度学习和机器学习。


和往常一样,我们需要你们的意见,如果你觉得项目没有上榜单是不公平的,或者对我们的选择有异议,请在评论求留言让我们知道。


更多干货内容请关注微信公众号“AI 前线”(ID:ai-front)



图 1:根据 GitHub star 和贡献评选出的 2018 顶级 Python 库。形状大小与贡献者数量成正比。

1 TensorFlow(贡献者:1757,贡献:25756,Stars:116765)

“TensorFlow 是一个使用数据流图进行数值计算的开源软件库。图形节点表示数学运算,而图形边缘表示在它们之间流动的多维数据阵列(张量)。这种灵活的体系结构使用户可以将计算部署到桌面、服务器或移动设备中的一个或多个 CPU/GPU,而无需重写代码。 ”


GitHub 地址:https://github.com/tensorflow/tensorflow

2 pandas(贡献者:1360,贡献:18441,Stars :17388)

“pandas 是一个 Python 包,、供快速,灵活和富有表现力的数据结构,旨在让”关系“或”标记“数据使用既简单又直观。它的目标是成为用 Python 进行实际,真实数据分析的基础高级构建块。”


GitHub 地址:https://github.com/pandas-dev/pandas

3 scikit-learn(贡献者:1218,贡献者:23509,Stars :32326)

“scikit-learn 是一个基于 NumPy,SciPy 和 matplotlib 的机器学习 Python 模块。它为数据挖掘和数据分析提供了简单而有效的工具。SKLearn 所有人都可用,并可在各种环境中重复使用。


GitHub 地址:https://github.com/scikit-learn/scikit-learn

4 PyTorch(贡献者:861,贡献:15362,Stars:22763)

“PyTorch 是一个 Python 包,提供两个高级功能:


  • 具有强大的 GPU 加速度的张量计算(如 NumPy)

  • 基于磁带的自动编程系统构建的深度神经网络


你可以重复使用自己喜欢的 Python 软件包,如 NumPy,SciPy 和 Cython,以便在需要时扩展 PyTorch。”


GitHub 地址:https://github.com/pytorch/pytorch

5 Matplotlib(贡献者:778,贡献:28094,Stars :8362)

“Matplotlib 是一个 Python 2D 绘图库,可以生成各种可用于出版品质的硬拷贝格式和跨平台交互式环境数据。Matplotlib 可用于 Python 脚本,Python 和 IPython shell(例如 MATLAB 或 Mathematica),Web 应用程序服务器和各种图形用户界面工具包。”


GitHub 地址:https://github.com/matplotlib/matplotlib

6 Keras(贡献者:856,贡者:4936,Stars :36450)

“Keras 是一个高级神经网络 API,用 Python 编写,能够在 TensorFlow,CNTK 或 Theano 之上运行。它旨在实现快速实验,能够以最小的延迟把想法变成结果,这是进行研究的关键。”


GitHub 地址:https://github.com/keras-team/keras

7 NumPy(贡献者:714,贡献:19399,Stars:9010)

“NumPy 是使用 Python 进行科学计算所需的基础包。它提供了强大的 N 维数组对象,复杂的(广播)功能,集成 C / C ++和 Fortran 代码的工具以及有用的线性代数,傅里叶变换和随机数功能。


GitHub 地址:https://github.com/numpy/numpy

8 SciPy(贡献者:676,贡献:20180,Stars:5188)

“SciPy(发音为”Sigh Pie“)是数学、科学和工程方向的开源软件,包含统计、优化、集成、线性代数、傅立叶变换、信号和图像处理、ODE 求解器等模块。”


GitHub 地址:https://github.com/scipy/scipy

9 Apache MXNet(贡献者:653,贡献:9060,Stars:15812)

“Apache MXNet(孵化)是一个深度学习框架,旨在提高效率和灵活性,让你可以混合符号和命令式编程,以最大限度地提高效率和生产力。 MXNet 的核心是一个动态依赖调度程序,可以动态地自动并行化符号和命令操作。”


GitHub 地址:https://github.com/apache/incubator-mxnet

10 Theano(贡献者:333,贡献:28060,Stars :8614)

“Theano 是一个 Python 库,让你可以有效地定义、优化和评估涉及多维数组的数学表达式。它可以使用 GPU 并实现有效的符号区分。”


GitHub 地址:https://github.com/Theano/Theano

11 Bokeh(贡献者:334,贡献:17395,Stars :8649)

“Bokeh 是一个用于 Python 的交互式可视化库,可以在现代 Web 浏览器中实现美观且有意义的数据视觉呈现。使用 Bokeh,你可以快速轻松地创建交互式图表、仪表板和数据应用程序。”


GitHub 地址:https://github.com/bokeh/bokeh

12 XGBoost(贡献者:335,贡献:3557,Stars:14389)

“XGBoost 是一个优化的分布式梯度增强库,旨在变得高效、强大、灵活和便携。它在 Gradient Boosting 框架下实现机器学习算法。XGBoost 提供了梯度提升决策树(也称为 GBDT,GBM),可以快速准确地解决许多数据科学问题,可以在主要的分布式环境(Hadoop,SGE,MPI)上运行相同的代码,并可以解决数十亿个示例之外的问题。”


GitHub 地址:https://github.com/dmlc/xgboost

13 Gensim(贡献者:301,贡献:3687,Stars :8295)

“Gensim 是一个用于主题建模、文档索引和大型语料库相似性检索的 Python 库,目标受众是自然语言处理(NLP)和信息检索(IR)社区。”


GitHub 地址:https://github.com/RaRe-Technologies/gensim

14 Scrapy(贡献者:297,贡献:6808,Stars :30507)

“Scrapy 是一种快速的高级 Web 爬行和 Web 抓取框架,用于抓取网站并从其页面中提取结构化数据。它可用于从数据挖掘到监控和自动化测试的各种用途。”


GitHub 地址:https://github.com/scrapy/scrapy

15 Caffe(贡献者:270,贡献:4152,Stars :26531)

“Caffe 是一个以表达、速度和模块化为基础的深度学习框架,由伯克利人工智能研究(BAIR)/伯克利视觉与学习中心(BVLC)和社区贡献者开发。”


GitHub 地址:https://github.com/BVLC/caffe


参考链接:


https://www.kdnuggets.com/2018/12/top-python-libraries-2018.html


公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2018-12-20 14:023533

评论 2 条评论

发布
用户头像
基本上都是科学计算这一类的
2018-12-21 16:44
回复
没有更多了
发现更多内容

从渔夫和游客说到晒太阳的狗狗派

mtfelix

28天写作

Netflix系统架构

俞凡

架构 微服务 netflix 大厂实践

架构实战营模块三课后作业-外包学生管理系统架构文档

Jude

架构实战营

FFmpeg的一些使用实践

为自己带盐

ffmpeg 28天写作 12月日更

2021,中国计算产业的“攀登者勋章”

脑极体

Kubernetes 集群部署 Metrics Server 获取集群 Metric 数据

zuozewei

Kubernetes 性能监控 12月日更

HarmonyOS(鸿蒙)——双击事件

李子捌

28天写作 21天挑战 鸿蒙开发 12月日更

数据管理典范!「山东城商行联盟数据库准实时数据采集系统」入选2021中国大数据应用样板案例

DataPipeline数见科技

大数据 数据同步 数据融合 数据迁移 数据管理

宏昆酒店集团携手DataPipeline打造实时数据融合平台,酒店业精益管理的新秘诀

DataPipeline数见科技

数据库 中间件 数据同步 数据融合 数据管理

Spring核心原理之 IoC容器中那些鲜为人知的细节(3)

Tom弹架构

Java spring 源码

模块四-reids存储方案

撿破爛ぃ

「架构实战营」

kali系统之复现漏洞分析与审计

网络安全学海

黑客 网络安全 安全 信息安全 渗透测试

Spark-概览

xujiangniao

git tips(qbit)

qbit

git #Github

荐书📚——《剑指Offer》专项突破版

宇宙之一粟

推荐书籍 12月日更

100% 展示 MySQL 语句执行的神器-Optimizer Trace

程序员历小冰

MySQL 28天写作 12月日更

《权力——为什么只为某些人拥有》读书笔记

圣迪

特质 权力 影响力

虚拟机性能监控与故障处理

Joseph295

程序员做技术管理需要懂哪些方面?

Seven的代码实验室

程序员 技术管理

[架构实战营] 模块三作业

Geek_0ed632

「架构实战营」

Dubbo 框架学习笔记十二

风翱

dubbo 12月日更

在线上传图片二维码识别解析

入门小站

工具

HarmonyOS(鸿蒙)——单击事件的四种写法

李子捌

28天写作 21天挑战 鸿蒙系统 12月日更

儿童教育有感-说话用词不当

wood

28天写作

linux动态链接的程序如何在其他系统上运行

SkyFire

动态链接 装载器

【Java 进阶训练营】 JVM 知识总结

wgl

Gin-Vue-Admin 使用gin+vue进行极速开发的全栈开发基础平台【gva第一节】

坚果

Go 28天写作 Vue 3 12月日更

注意:字符串substring方法在jkd6,7,8中的差异

CRMEB

webpack-dev-server启动后, localhost:8080返回index.html的原理

Jerry Wang

JavaScript 前端开发 webpack 28天写作 12月日更

模块三-架构文档

撿破爛ぃ

「架构实战营」

【安全漏洞】CVE-2021-42287&CVE-2021-42278 域内提权

H

网络安全 信息安全 漏洞

2018年最受欢迎的Python库,你都用过吗?_数据库_Goutham Veeramachaneni_InfoQ精选文章