NVIDIA 初创加速计划,免费加速您的创业启动 了解详情
写点什么

2018 年最受欢迎的 Python 库,你都用过吗?

  • 2018-12-20
  • 本文字数:2383 字

    阅读完需:约 8 分钟

2018年最受欢迎的Python库,你都用过吗?

AI 前线导读: 近日,数据科学网站 KDnuggets 评选出了顶级 Python 库 Top15,领域横跨数据科学、数据可视化、深度学习和机器学习。


和往常一样,我们需要你们的意见,如果你觉得项目没有上榜单是不公平的,或者对我们的选择有异议,请在评论求留言让我们知道。


更多干货内容请关注微信公众号“AI 前线”(ID:ai-front)



图 1:根据 GitHub star 和贡献评选出的 2018 顶级 Python 库。形状大小与贡献者数量成正比。

1 TensorFlow(贡献者:1757,贡献:25756,Stars:116765)

“TensorFlow 是一个使用数据流图进行数值计算的开源软件库。图形节点表示数学运算,而图形边缘表示在它们之间流动的多维数据阵列(张量)。这种灵活的体系结构使用户可以将计算部署到桌面、服务器或移动设备中的一个或多个 CPU/GPU,而无需重写代码。 ”


GitHub 地址:https://github.com/tensorflow/tensorflow

2 pandas(贡献者:1360,贡献:18441,Stars :17388)

“pandas 是一个 Python 包,、供快速,灵活和富有表现力的数据结构,旨在让”关系“或”标记“数据使用既简单又直观。它的目标是成为用 Python 进行实际,真实数据分析的基础高级构建块。”


GitHub 地址:https://github.com/pandas-dev/pandas

3 scikit-learn(贡献者:1218,贡献者:23509,Stars :32326)

“scikit-learn 是一个基于 NumPy,SciPy 和 matplotlib 的机器学习 Python 模块。它为数据挖掘和数据分析提供了简单而有效的工具。SKLearn 所有人都可用,并可在各种环境中重复使用。


GitHub 地址:https://github.com/scikit-learn/scikit-learn

4 PyTorch(贡献者:861,贡献:15362,Stars:22763)

“PyTorch 是一个 Python 包,提供两个高级功能:


  • 具有强大的 GPU 加速度的张量计算(如 NumPy)

  • 基于磁带的自动编程系统构建的深度神经网络


你可以重复使用自己喜欢的 Python 软件包,如 NumPy,SciPy 和 Cython,以便在需要时扩展 PyTorch。”


GitHub 地址:https://github.com/pytorch/pytorch

5 Matplotlib(贡献者:778,贡献:28094,Stars :8362)

“Matplotlib 是一个 Python 2D 绘图库,可以生成各种可用于出版品质的硬拷贝格式和跨平台交互式环境数据。Matplotlib 可用于 Python 脚本,Python 和 IPython shell(例如 MATLAB 或 Mathematica),Web 应用程序服务器和各种图形用户界面工具包。”


GitHub 地址:https://github.com/matplotlib/matplotlib

6 Keras(贡献者:856,贡者:4936,Stars :36450)

“Keras 是一个高级神经网络 API,用 Python 编写,能够在 TensorFlow,CNTK 或 Theano 之上运行。它旨在实现快速实验,能够以最小的延迟把想法变成结果,这是进行研究的关键。”


GitHub 地址:https://github.com/keras-team/keras

7 NumPy(贡献者:714,贡献:19399,Stars:9010)

“NumPy 是使用 Python 进行科学计算所需的基础包。它提供了强大的 N 维数组对象,复杂的(广播)功能,集成 C / C ++和 Fortran 代码的工具以及有用的线性代数,傅里叶变换和随机数功能。


GitHub 地址:https://github.com/numpy/numpy

8 SciPy(贡献者:676,贡献:20180,Stars:5188)

“SciPy(发音为”Sigh Pie“)是数学、科学和工程方向的开源软件,包含统计、优化、集成、线性代数、傅立叶变换、信号和图像处理、ODE 求解器等模块。”


GitHub 地址:https://github.com/scipy/scipy

9 Apache MXNet(贡献者:653,贡献:9060,Stars:15812)

“Apache MXNet(孵化)是一个深度学习框架,旨在提高效率和灵活性,让你可以混合符号和命令式编程,以最大限度地提高效率和生产力。 MXNet 的核心是一个动态依赖调度程序,可以动态地自动并行化符号和命令操作。”


GitHub 地址:https://github.com/apache/incubator-mxnet

10 Theano(贡献者:333,贡献:28060,Stars :8614)

“Theano 是一个 Python 库,让你可以有效地定义、优化和评估涉及多维数组的数学表达式。它可以使用 GPU 并实现有效的符号区分。”


GitHub 地址:https://github.com/Theano/Theano

11 Bokeh(贡献者:334,贡献:17395,Stars :8649)

“Bokeh 是一个用于 Python 的交互式可视化库,可以在现代 Web 浏览器中实现美观且有意义的数据视觉呈现。使用 Bokeh,你可以快速轻松地创建交互式图表、仪表板和数据应用程序。”


GitHub 地址:https://github.com/bokeh/bokeh

12 XGBoost(贡献者:335,贡献:3557,Stars:14389)

“XGBoost 是一个优化的分布式梯度增强库,旨在变得高效、强大、灵活和便携。它在 Gradient Boosting 框架下实现机器学习算法。XGBoost 提供了梯度提升决策树(也称为 GBDT,GBM),可以快速准确地解决许多数据科学问题,可以在主要的分布式环境(Hadoop,SGE,MPI)上运行相同的代码,并可以解决数十亿个示例之外的问题。”


GitHub 地址:https://github.com/dmlc/xgboost

13 Gensim(贡献者:301,贡献:3687,Stars :8295)

“Gensim 是一个用于主题建模、文档索引和大型语料库相似性检索的 Python 库,目标受众是自然语言处理(NLP)和信息检索(IR)社区。”


GitHub 地址:https://github.com/RaRe-Technologies/gensim

14 Scrapy(贡献者:297,贡献:6808,Stars :30507)

“Scrapy 是一种快速的高级 Web 爬行和 Web 抓取框架,用于抓取网站并从其页面中提取结构化数据。它可用于从数据挖掘到监控和自动化测试的各种用途。”


GitHub 地址:https://github.com/scrapy/scrapy

15 Caffe(贡献者:270,贡献:4152,Stars :26531)

“Caffe 是一个以表达、速度和模块化为基础的深度学习框架,由伯克利人工智能研究(BAIR)/伯克利视觉与学习中心(BVLC)和社区贡献者开发。”


GitHub 地址:https://github.com/BVLC/caffe


参考链接:


https://www.kdnuggets.com/2018/12/top-python-libraries-2018.html


公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2018-12-20 14:023535

评论 2 条评论

发布
用户头像
基本上都是科学计算这一类的
2018-12-21 16:44
回复
没有更多了
发现更多内容

更人性化的无阈值监控不再为无效告警烦恼

观测云

运维 可观测性 监控告警 观测云 可观测性用观测云

详解基于 Celestia、Eclipse 构建的首个Layer3 链 Nautilus Chain

威廉META

Deploy Workshop|DIY部署环境,让OceanBase跑起来

OceanBase 数据库

数据库 oceanbase

程序调试利器——GDB使用指南

京东科技开发者

c++ debug gdb 企业号 3 月 PK 榜 程序检测

「资源广场」上线|以开发者为中心,打造开放资源共享平台

Jianmu

jenkins CI/CD 镜像仓库 容器镜像 建木

引领云数仓创新浪潮 HashData闪耀PostgreSQL中国技术大会

酷克数据HashData

打造成熟产品矩阵,瓴羊Quick BI数据可视化获认可

小偏执o

Apache Flink 1.16 功能解读

Apache Flink

大数据 flink 实时计算

Mac应用程序无法打开提示不明开发者或文件损坏的处理方法

魔仙苹果mac堡

Mac软件打不开

面对“中国式报表”需求, 瓴羊 Quick BI的电子表格优于Tableau?

夏日星河

写入性能:TDengine 最高达到 InfluxDB 的 10.3 倍,TimeScaleDB 的 6.74 倍

TDengine

大数据 tdengine 性能测试 时序数据库 国产数据库

OceanBase 4.0 解读:全链路追踪要解决什么问题?从一条慢SQL说起

OceanBase 数据库

数据库 oceanbase

使用metrics-server监控k8s的资源指标

tiandizhiguai

DevOps 微服务 云原生 k8s

详解基于 Celestia、Eclipse 构建的首个Layer3 链 Nautilus Chain

鳄鱼视界

如何使用 Apache IoTDB 中的 UDF

Apache IoTDB

UDF IoTDB

敏捷开发工具leangoo时间线视图管理项目

顿顿顿

Scrum 敏捷开发 甘特图 敏捷开发管理 时间线

类加载机制

Apache IoTDB

IoTDB

Apache IoTDB v1.0.1 发布|修复分区计算,优化集群启停流程

Apache IoTDB

IoTDB

OceanBase 第六期技术征文活动|小鱼还能“更快”吗?你来试试

OceanBase 数据库

数据库 oceanbase

关于前端低代码的一些个人看法

这我可不懂

前端 低代码 低代码开发平台 JNPF 引迈

详细剖析|袋鼠云数栈前端框架Antd 3.x 升级 4.x 的踩坑之路

袋鼠云数栈

前端‘’

开源项目的演进会遇到哪些“坑”?KubeVela 从发起到晋级 CNCF 孵化的全程回顾

阿里巴巴云原生

阿里云 开源 云原生 KubeVela

Apache IoTDB v0.13.4 发布|优化监控功能

Apache IoTDB

IoTDB

初识VUE响应式原理

京东科技开发者

Vue 系统架构 Proxy 企业号 3 月 PK 榜 响应系统

mac无损音乐播放器软件:Audirvana使用设置技巧

魔仙苹果mac堡

Audirvana

瓴羊Quick BI与Power BI之争:数据大屏优势明显

对不起该用户已成仙‖

k8s 探测方法总结

Geek_f24c45

#k8s

A/B实验避坑指南:为什么不建议开AABB实验

字节跳动数据平台

大数据 云服务 数据产品 AB testing实战

【云图说】 | 第268期 初识开天企业工作台MSSE

华为云开发者联盟

云计算 后端 华为云 华为云开发者联盟 企业号 3 月 PK 榜

为企业全方位解决进销存管理难题的ERP套件

力软低代码开发平台

数据基础设施 NFTScan 新增支持 Gnosis 网络

NFT Research

NFT 区块链、

2018年最受欢迎的Python库,你都用过吗?_数据库_Goutham Veeramachaneni_InfoQ精选文章