写点什么

2018 年最受欢迎的 Python 库,你都用过吗?

  • 2018-12-20
  • 本文字数:2383 字

    阅读完需:约 8 分钟

2018年最受欢迎的Python库,你都用过吗?

AI 前线导读: 近日,数据科学网站 KDnuggets 评选出了顶级 Python 库 Top15,领域横跨数据科学、数据可视化、深度学习和机器学习。


和往常一样,我们需要你们的意见,如果你觉得项目没有上榜单是不公平的,或者对我们的选择有异议,请在评论求留言让我们知道。


更多干货内容请关注微信公众号“AI 前线”(ID:ai-front)



图 1:根据 GitHub star 和贡献评选出的 2018 顶级 Python 库。形状大小与贡献者数量成正比。

1 TensorFlow(贡献者:1757,贡献:25756,Stars:116765)

“TensorFlow 是一个使用数据流图进行数值计算的开源软件库。图形节点表示数学运算,而图形边缘表示在它们之间流动的多维数据阵列(张量)。这种灵活的体系结构使用户可以将计算部署到桌面、服务器或移动设备中的一个或多个 CPU/GPU,而无需重写代码。 ”


GitHub 地址:https://github.com/tensorflow/tensorflow

2 pandas(贡献者:1360,贡献:18441,Stars :17388)

“pandas 是一个 Python 包,、供快速,灵活和富有表现力的数据结构,旨在让”关系“或”标记“数据使用既简单又直观。它的目标是成为用 Python 进行实际,真实数据分析的基础高级构建块。”


GitHub 地址:https://github.com/pandas-dev/pandas

3 scikit-learn(贡献者:1218,贡献者:23509,Stars :32326)

“scikit-learn 是一个基于 NumPy,SciPy 和 matplotlib 的机器学习 Python 模块。它为数据挖掘和数据分析提供了简单而有效的工具。SKLearn 所有人都可用,并可在各种环境中重复使用。


GitHub 地址:https://github.com/scikit-learn/scikit-learn

4 PyTorch(贡献者:861,贡献:15362,Stars:22763)

“PyTorch 是一个 Python 包,提供两个高级功能:


  • 具有强大的 GPU 加速度的张量计算(如 NumPy)

  • 基于磁带的自动编程系统构建的深度神经网络


你可以重复使用自己喜欢的 Python 软件包,如 NumPy,SciPy 和 Cython,以便在需要时扩展 PyTorch。”


GitHub 地址:https://github.com/pytorch/pytorch

5 Matplotlib(贡献者:778,贡献:28094,Stars :8362)

“Matplotlib 是一个 Python 2D 绘图库,可以生成各种可用于出版品质的硬拷贝格式和跨平台交互式环境数据。Matplotlib 可用于 Python 脚本,Python 和 IPython shell(例如 MATLAB 或 Mathematica),Web 应用程序服务器和各种图形用户界面工具包。”


GitHub 地址:https://github.com/matplotlib/matplotlib

6 Keras(贡献者:856,贡者:4936,Stars :36450)

“Keras 是一个高级神经网络 API,用 Python 编写,能够在 TensorFlow,CNTK 或 Theano 之上运行。它旨在实现快速实验,能够以最小的延迟把想法变成结果,这是进行研究的关键。”


GitHub 地址:https://github.com/keras-team/keras

7 NumPy(贡献者:714,贡献:19399,Stars:9010)

“NumPy 是使用 Python 进行科学计算所需的基础包。它提供了强大的 N 维数组对象,复杂的(广播)功能,集成 C / C ++和 Fortran 代码的工具以及有用的线性代数,傅里叶变换和随机数功能。


GitHub 地址:https://github.com/numpy/numpy

8 SciPy(贡献者:676,贡献:20180,Stars:5188)

“SciPy(发音为”Sigh Pie“)是数学、科学和工程方向的开源软件,包含统计、优化、集成、线性代数、傅立叶变换、信号和图像处理、ODE 求解器等模块。”


GitHub 地址:https://github.com/scipy/scipy

9 Apache MXNet(贡献者:653,贡献:9060,Stars:15812)

“Apache MXNet(孵化)是一个深度学习框架,旨在提高效率和灵活性,让你可以混合符号和命令式编程,以最大限度地提高效率和生产力。 MXNet 的核心是一个动态依赖调度程序,可以动态地自动并行化符号和命令操作。”


GitHub 地址:https://github.com/apache/incubator-mxnet

10 Theano(贡献者:333,贡献:28060,Stars :8614)

“Theano 是一个 Python 库,让你可以有效地定义、优化和评估涉及多维数组的数学表达式。它可以使用 GPU 并实现有效的符号区分。”


GitHub 地址:https://github.com/Theano/Theano

11 Bokeh(贡献者:334,贡献:17395,Stars :8649)

“Bokeh 是一个用于 Python 的交互式可视化库,可以在现代 Web 浏览器中实现美观且有意义的数据视觉呈现。使用 Bokeh,你可以快速轻松地创建交互式图表、仪表板和数据应用程序。”


GitHub 地址:https://github.com/bokeh/bokeh

12 XGBoost(贡献者:335,贡献:3557,Stars:14389)

“XGBoost 是一个优化的分布式梯度增强库,旨在变得高效、强大、灵活和便携。它在 Gradient Boosting 框架下实现机器学习算法。XGBoost 提供了梯度提升决策树(也称为 GBDT,GBM),可以快速准确地解决许多数据科学问题,可以在主要的分布式环境(Hadoop,SGE,MPI)上运行相同的代码,并可以解决数十亿个示例之外的问题。”


GitHub 地址:https://github.com/dmlc/xgboost

13 Gensim(贡献者:301,贡献:3687,Stars :8295)

“Gensim 是一个用于主题建模、文档索引和大型语料库相似性检索的 Python 库,目标受众是自然语言处理(NLP)和信息检索(IR)社区。”


GitHub 地址:https://github.com/RaRe-Technologies/gensim

14 Scrapy(贡献者:297,贡献:6808,Stars :30507)

“Scrapy 是一种快速的高级 Web 爬行和 Web 抓取框架,用于抓取网站并从其页面中提取结构化数据。它可用于从数据挖掘到监控和自动化测试的各种用途。”


GitHub 地址:https://github.com/scrapy/scrapy

15 Caffe(贡献者:270,贡献:4152,Stars :26531)

“Caffe 是一个以表达、速度和模块化为基础的深度学习框架,由伯克利人工智能研究(BAIR)/伯克利视觉与学习中心(BVLC)和社区贡献者开发。”


GitHub 地址:https://github.com/BVLC/caffe


参考链接:


https://www.kdnuggets.com/2018/12/top-python-libraries-2018.html


2018-12-20 14:023725

评论 2 条评论

发布
用户头像
基本上都是科学计算这一类的
2018-12-21 16:44
回复
没有更多了
发现更多内容

ReentrantLock和Synchronized使用与区别,多线程安全问题

共饮一杯无

synchronized ReentrantLock 三周年连更

SOA/ESB架构升级之路:从微服务到ServiceMesh,再到Sermant

IT科技苏辞

分布式政企应用如何快速实现云原生的微服务架构改造

IT科技苏辞

selenium源码通读·6 |webdriver/common/alert.py-Alert类分析

Python 源码 自动化测试 selenium

实战分享丨 MySQL 与 Django 版本匹配相关经验

Java你猿哥

Java MySQL SSM框架 实战 Diango

解析单存储库:定义、优势与挑战

龙智—DevSecOps解决方案

谷歌 Monorepo Monolith 单储存库

600+ 道 Java面试题及答案整理(建议收藏)

会踢球的程序源

Java 面试 java面试 应届生 Java八股文

2023最新整理上千道Java面试攻略,近500页PDF文档

会踢球的程序源

Java 面试 找工作 java面试 应届生

某程序员哀叹:写几年代码,回头一看80%都没用,没法写上简历!

Java你猿哥

Java 程序员 面试 简历

解决流水线瓶颈、提升编码效率的五个方法(上篇)

龙智—DevSecOps解决方案

ci cicd 持续集成 流水线

第二届“鼎新杯”数字化转型应用大赛申报通道正式开启

信通院IOMM数字化转型团队

数字化转型 鼎新杯

分布式文件系统FastDFS

会踢球的程序源

Java fastdfs 分布系统

关于自托管环境,您了解多少?

龙智—DevSecOps解决方案

Atlassian Data Center

运维审计录像的作用是什么?用什么软件好?

行云管家

堡垒机 运维审计 审计录像

【Linux】系统中安装Go环境

A-刘晨阳

Go Linux 三周年连更

研究思考丨关于软件复杂度的困局

阿里巴巴云原生

阿里云 云原生 复杂度

华为云智能编程助手助力哈尔滨工业大学(深圳)学子,引领软件研发新趋势

爱尚科技

搭建数据驱动的技术底座,助力企业数智化变革

用友BIP

技术大会 用友iuap 用友技术大会 升级企业数智化底座

仅凭这份 Java 大纲笔记,我如愿拿到了阿里 offer。

三十而立

总结年初到 10 月底 Java 基础、架构面试题,共计 1327 道!涵盖蚂蚁金服、腾讯、字节跳动、美团、拼多多等等一线大厂!

三十而立

涅槃重生!字节大牛力荐大型分布式手册,凤凰架构让你浴火成神

Java你猿哥

架构 分布式架构 凤凰架构

华为云智能编程助手助力哈尔滨工业大学(深圳)培养新时代软件研发人才

爱尚科技

技术分享 | 如何迅速将分布式政企应用转型为云原生微服务架构

IT科技苏辞

华为云智能编程助手赋能高校,揭示行业发展新动向

爱尚科技

2023 寻找企业出海“新势力”

Jessie

企业出海 出海

阿里,快手,拼多多等 7 家大厂 Java 面试真题,Java 笔试题及答案详解

三十而立

【Meetup回顾第1期】竟是这样的国产数据库,YashanDB技术内幕曝光

YashanDB

打造安全无忧软件应用的十大最佳实践

龙智—DevSecOps解决方案

软件开发 软件开发安全

云服务是什么意思?有什么用?

行云管家

云计算 云服务

爆肝一月!527页文档详解SpringCloud微服务和分布式系统实践

Java你猿哥

数据库 分布式 SSM框架 微服务设计

白嫖!字节跳动 Java岗顶级面试解析(2023版),GitHub巅峰神作!

三十而立

2018年最受欢迎的Python库,你都用过吗?_数据库_Goutham Veeramachaneni_InfoQ精选文章