AICon 上海站|日程100%上线,解锁Al未来! 了解详情
写点什么

2018 年 Github 最受欢迎机器学习语言 Python 稳坐冠军,numpy、scipy 是最受欢迎软件包

  • 2019-01-25
  • 本文字数:1233 字

    阅读完需:约 4 分钟

2018年Github最受欢迎机器学习语言Python稳坐冠军,numpy、scipy是最受欢迎软件包

在 GitHub 2018 年的 Octoverse 报告中,机器学习和数据科学是 GitHub 上的热门话题。其中,tensorflow / tensorflow 是项目贡献最多的项目之一,pytorch / pytorch 是增长最快的项目之一,而 Python 是 GitHub 上第三大最受欢迎的语言。于是,GitHub 决定更加深入地研究一下,机器学习和数据科学在该平台究竟是怎样的情况。


GitHub 提取了 2018 年 1 月 1 日到 2018 年 12 月 31 日之间的贡献数据。这些贡献可能包括推送代码、发起话题或提取请求、评论问题或提取请求,以及审查拉取请求。对于大多数导入的程序包,GitHub 使用了从依赖关系图中获得的数据,其中包括所有公共存储库和已选择加入依赖关系图的所有私有存储库。

机器学习编程语言:Python 稳坐冠军


GitHub 以使用“机器学习”主题标记的存储库的贡献者为依据,对存储库中最常见的主要编程语言进行了排名。结果显示,Python 是机器学习库中最常用的语言,也是 GitHub 上第三种最常用的语言。然而,并非所有机器学习项目都使用 Python:GitHub 上还有其他一些最常见的机器学习通用语言,如 C ++、JavaScript、Java、C#、Shel l 和 TypeScript 跻身 GitHub 编程语言 Top10,同时是机器学习项目的 Top10 语言。Julia、R 和 Scala 都出现在机器学习项目编程语言的前 10 名,但未上榜 GitHub 整体最受欢迎编程语言 Top10。Julia 和 R 都是数据科学家常用的语言,Scala 在 与 Apache Spark 等大数据系统交互时变得越来越常用。

最受欢迎机器学习和数据科学包:numpy、scipy、pandas 占据前三


我们从依赖图中提取数据,以计算导入流行 Python 包的机器学习或数据科学项目的百分比。上表为项目导入最多程序包 Top10 排名。我们发现:


  • Numpy,一个支持多维数据数学运算的软件包,是导入最多的软件包,近四分之三的机器学习和数据科学项目使用此包。

  • Scipy,一个用于科学计算的软件,pandas,一个用于管理数据集的软件包,以及可视化库matplotlib,都在超过 40% 的机器学习和数据科学项目中使用。

  • Scikit-learn 是一种流行的机器学习包,包含大量机器学习算法的实现,近 40% 的项目使用此包。

  • Tensorflow 是一种用于处理神经网络的软件包,近四分之一的项目使用。


前十名中其他的包均为实用程序包:排名第六的是 Python 2 和 3 兼容性库,python-dateutilpytz 是用于处理日期的包。

最受欢迎的机器学习项目:Tensorflow


2018 年,带有“机器学习”标签、贡献最多的开源项目为 Tensorflow,是迄今为止最受欢迎的机器学习项目,且其贡献者数量是第二大受欢迎项目 scikit-learn 的五倍多。排名第三和第九的 explosion/spaCy/ spaCy 和 RasaHQ / rasa_nlu 是两个专注于自然语言处理问题的项目。另外四个项目,CMU-Perceptual-Computing-Lab / openpose,thtrieu / darkflow,ageitgey / face_recognition 和 tesseract-ocr / tesseract 则专注于图像处理。另外,Julia 语言源代码也是 2018 年项目贡献最多的项目之一。


原文链接:


https://github.blog/2019-01-24-the-state-of-the-octoverse-machine-learning/


2019-01-25 12:446749
用户头像

发布了 98 篇内容, 共 65.4 次阅读, 收获喜欢 285 次。

关注

评论

发布
暂无评论
发现更多内容

又双叒叕获奖!天翼云推动算力服务便捷普惠泛在!

天翼云开发者社区

云计算 网络安全 云服务

揭秘高级控件技巧:让您的App与众不同

测吧(北京)科技有限公司

测试

吴晓波频道:构建知识付费领域的数据飞轮

字节跳动数据平台

大数据 企业号2024年4月PK榜 #数据飞轮

App自动化测试:高级控件交互方法

霍格沃兹测试开发学社

离散型工厂生产制造MES管理系统解决方案

万界星空科技

数字化 制造业 mes 万界星空科技 离散型制造业

Flink Checkpoint 机制深度解析:原理、注意事项与最佳实践

木南曌

flink 实时计算

科技改变财务规划:提升企业对自动化技术的管理

智达方通

企业管理 财务分析 财务规划与分析

xz工具供应链后门事件 紧急处理

徐凌云

上云有道 | 一图读懂天翼云边缘安全加速平台AccessOne!

天翼云开发者社区

边缘计算 云服务 云平台 边缘安全

NFTScan | 03.25~03.31 NFT 市场热点汇总

NFT Research

NFT\ NFTScan nft工具

制造业工厂为什么需要生产管理MES系统

万界星空科技

制造业 智能制造 mes 万界星空科技

揭秘高级控件技巧:让您的App与众不同

测试人

软件测试

为什么选择霍格沃兹测试开发学社Python全栈开发与测试班?

霍格沃兹测试开发学社

base链市值机器人

区块链技术

了解 Websocket 断连技巧:易懂的实战指导

Apifox

程序员 后端 网络协议 websocket 网络通信

玩转云端| AccessOne实用窍门之三步搞定门户网站防护与加速

天翼云开发者社区

云计算 网络安全 云服务

用友陈强兵:企业数智化进入“加速期”

ToB行业头条

测试要失业了?

禅道项目管理

团队管理 软件测试 测试 项目管理软件

企业号 4月 PK 榜,火热开启!

极客时间

热门活动 企业号 4 月 PK 榜

「天工大模型3.0」将于4月17日发布 同步开源4000亿参数MoE超级模型

新消费日报

探索GaussDB(DWS)湖仓融合:Hudi与元数据打通的深度解析

华为云开发者联盟

数据库 华为云 华为云开发者联盟 华为云GaussDB(DWS) 企业号2024年4月PK榜

实例演示如何使用CCE XGPU虚拟化

华为云开发者联盟

开发 华为云 华为云开发者联盟 华为云CCE 企业号2024年4月PK榜

玩转云端| 如何防爬虫?天翼云边缘安全加速平台AccessOne带你涨姿势!

天翼云开发者社区

云计算 网络安全 云服务 云平台

Redis开源协议调整,我们怎么办?

华为云PaaS服务小智

redis 华为云

飞天发布时刻丨阿里云 ApsaraMQ 全面升级,携手 Confluent 发布全新产品

阿里巴巴云原生

阿里云 云原生 Confluent ApsaraMQ

2018年Github最受欢迎机器学习语言Python稳坐冠军,numpy、scipy是最受欢迎软件包_编程语言_Thomas_InfoQ精选文章