万里挑一!热门机器学习开源资源最强盘点

阅读数:4923 2019 年 2 月 9 日

在过去的一年里,我们比较了近 22000 个机器学习开源工具和项目,选出了前 49 个(约占 0.22%)。

这些工具和项目分为 6 个类别,如下:

  • 计算机视觉(1~5)
  • 强化学习(6~13)
  • 自然语言处理(14~20)
  • 生成对抗网络(21~26)
  • 神经网络(27~35)
  • 工具包(36~49)

这是一份极具竞争力的列表,它精心挑选了 2018 年 1 月到 12 月发布的最佳开源机器学习资源。Mybridge AI 通过考虑受欢迎程度、参与度和回头率来评估质量。为了让你对质量有直观的了解,Github 上⭐平均颗数是 3566

对程序员来说,开源项目非常有用。给你足够的时间让你去尝试过去一年里可能错过的机器学习开源项目。

学习建议

A)初学者:Python 下的机器学习、数据科学和深度学习。TensorFlow 和神经网络( http://bit.ly/2FbgIcv
【84632 个推荐,4.5/5 ⭐】

B)高阶:Python 深度强化学习( http://bit.ly/2DQxHjq
【20396 个推荐,4.6/5 ⭐】

计算机视觉

【No 1】Detectron

用于对象检研究的 FAIR 研究平台,实现了 Mask R-CNN、RetinaNet 等流行算法。
【在 Github 有 18913 颗⭐】

地址:
https://github.com/facebookresearch/Detectron?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

image

【No 2】Openpose

用于身体、面部和手部的姿态估计的实时多人关键点检测库。
【在 Github 有 11052 颗⭐】

地址:
https://github.com/CMU-Perceptual-Computing-Lab/openpose?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

image

【No 3】DensePose

一种将 2D RGB 图像中所有人类像素映射到基于 3D 表面的人体模型的实施方法。
【在 Github 上有 4156 颗⭐】

地址:
https://github.com/facebookresearch/Densepose?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

image

【No 4】Maskrcnn-benchmark

Pytorch 中语义分割和对象检测算法的快速模块化参考实现。
【在 Github 上有 3888 颗⭐】

地址:
https://github.com/facebookresearch/maskrcnn-benchmark?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

image

【No 5】SNIPER

一种高效的多尺度对象检测算法。
【在 Github 上有 1963 颗⭐】

地址:
https://github.com/mahyarnajibi/SNIPER?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

image

强化学习

【No 6】Psychlab

使用 Psychlab 平台(基于智能体人工智能的 3D 平台)实现的实验范例。
【在 Github 上有 5595 颗⭐】

地址:
https://github.com/deepmind/lab/tree/master/game_scripts/levels/contributed/psychlab?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

image

【No 7】ELF

一个广泛的、轻量级的、灵活的游戏研究平台。我们用它创建了围棋游戏机器人 ——ELF OpenGo,以 14:0 的比分击败了全球前 30 名棋手中的四名。
【在 Github 上有 2406 颗⭐】

地址:
https://github.com/pytorch/elf?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

image

【No 8】TRFL

一个有用的构件块库,用于编写 TensorFlow 中的增强学习智能体。
【在 Github 上有 2312 颗⭐】

地址:
https://github.com/deepmind/trfl?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

image

【No 9】Horizon

第一个面向大规模产品和服务的开源强化学习平台。
【在 Github 上有 1703 颗⭐】

地址:
https://github.com/facebookresearch/Horizon?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

image

【No 10】Chess-alpha-zero

通过 Alpha Zero 方法进行国际象棋强化学习。
【在 Github 上有 1307 颗⭐】

地址:
https://github.com/Zeta36/chess-alpha-zero?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

image

【No 11】Dm_control

DeepMind 控制套件和控制包。
【在 Github 上有 1231 颗⭐】

地址:
https://github.com/deepmind/dm_control?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

image

【No 12】MAMEToolkit

街机游戏强化学习 Python 库。
【在 Github 上有 437 颗⭐】

地址:
https://github.com/M-J-Murray/MAMEToolkit?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

image

【No 13】Reaver

模块化深度强化学习框架。专注于星际争霸 II。支持 Gym、Atari 和 MuJoCo。匹配参考结果。
【在 Github 上有 355 颗⭐】

地址:
https://github.com/inoryy/reaver?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

image

自然语言处理

【No 14】Bert:

为 BERT 提供 TensorFlow 代码和预训练模型。
【在 Github 上有 11703 颗⭐】

地址:
https://github.com/google-research/bert?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

image

【No 15】Pytext

基于 PyTorch 的自然语言建模框架。
【在 Github 上有 4466 颗⭐】

地址:
https://github.com/facebookresearch/pytext?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

image

【No 16】Bert-as-service

由 Google 开发的用于预训练语言表示的 NLP 模型。它利用了网上公开提供发的大量纯文本数据,并以无人监督的方式进行训练。
【在 Github 上有 2055 颗⭐】

地址:
https://github.com/hanxiao/bert-as-service?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

image

【No 17】UnsupervisedMT

基于短语和神经无监督机器翻译 ——来自 Facebook 研究。
【在 Github 上有 1068 颗⭐】

地址:
https://github.com/facebookresearch/UnsupervisedMT?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

image

【No 18】DecaNLP

自然语言十项全能:面向销售队伍的 NLP 多任务挑战。
【在 Github 上有 1648 颗⭐】

地址:
https://github.com/salesforce/decaNLP?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

image

【No 19】Nlp-architect

Intel 人工智能实验室的 NLP 架构师:用于探索最先进的深度学习拓扑和技术的 Python 库。
【在 Github 上有 1751 颗⭐】

地址:
https://github.com/NervanaSystems/nlp-architect?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

image

【No 20】Gluon-NLP

使 NLP 变得容易使用。
【在 Github 上有 1263 颗⭐】

地址:
https://github.com/dmlc/gluon-nlp?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

image

生成对抗网络

【No 21】DeOldify

基于深度学习的项目,用于着色和恢复老照片。
【在 Github 上有 5060 颗⭐】

地址:
https://github.com/jantic/DeOldify?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

image

【No 22】Progressive_growing_of_gans

渐进式增长的生成对抗网络,可以提高质量、稳定性和变异性。
【在 Github 上有 4046 颗⭐】

地址:
https://github.com/tkarras/progressive_growing_of_gans?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

image

【No 23】MUNIT

多模态无监督图像到图像转换。
【在 Github 上有 1339 颗⭐】

地址:
https://github.com/NVlabs/MUNIT?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

image

【No 24】Transparent_latent_gan

使用有监督学习来阐明 GAN 的潜在空间,以进行受控生成和编辑。
【在 Github 上有 1337 颗⭐】

地址:
https://github.com/SummitKwan/transparent_latent_gan?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

image

【No 25】Gandissect

基于 pytorch 的工具,用于可视化和理解 GAN 的神经元。
【在 Github 上有 1065 颗⭐】

地址:
https://github.com/CSAILVision/gandissect?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

image

【No 26】GANimation

从一张图像中感知具有解剖学意义的面部动画。
【在 Github 上有 869 颗⭐】

地址:
https://github.com/albertpumarola/GANimation?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

image

神经网络

【No 27】Fastai

它使用现代最佳实践简化了快速准确的神经网络训练。
【在 Github 上有 11597 颗⭐】

地址:
https://github.com/fastai/fastai?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

image

【No 28】DeepCreamPy

用深度神经网络去除成人漫画的马赛克。
【在 Github 上有 7046 颗⭐】

地址:
https://github.com/deeppomf/DeepCreamPy?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

image

【No 29】Augmentor v0.2

用于机器学习的 Python 图像增强库。
【在 Github 上有 2805 颗⭐】

地址:
https://github.com/mdbloice/Augmentor?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

image

【No 30】Graph_nets

在 TensorFlow 中构建图网。
【在 Github 上有 2723 颗⭐】

地址:
https://github.com/deepmind/graph_nets?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

image

【No 31】Textgenrnn

Python 模块,可使用预训练的基于字符的递归神经网络轻松地生成文本。
【在 Github 上有 1900 颗⭐】

地址:
https://github.com/minimaxir/textgenrnn?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

image

【No 32】Person-blocker

使用预训练的神经网络自动 “屏蔽” 图像中的人(如英国独立单元剧《黑镜》(Black Mirror))。
【在 Github 上有 1806 颗⭐】

地址:
https://github.com/minimaxir/person-blocker?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

image

【No 33】Deepvariant

Deepvariant 是一个分析管道,使用深度神经网络调用来自下一代 DNA 测序数据的遗传变异。
【在 Github 上有 1502 颗⭐】

地址:
https://github.com/google/deepvariant?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

image

【No 34】Video-nonlocal-net

用于视频分类的非本地神经网络。
【在 Github 上有 1049 颗⭐】

地址:
https://github.com/facebookresearch/video-nonlocal-net?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

image

【No 35】Ann-visualizer

用于可视化人工神经网络(Artificial Neural Networks ,ANN)的 Python 库。
【在 Github 上有 922 颗⭐】

地址:
https://github.com/Prodicode/ann-visualizer?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

image

工具包

【No 36】Tfjs

一个 WebGL 加速的、基于浏览器的 JavaScript 库,用于训练和部署机器学习模型。
【在 Github 上有 10268 颗⭐】

地址:
https://github.com/tensorflow/tfjs?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

image

【No 37】Dopamine

Google 出的强化学习算法快速原型化的研究框架。
【在 Github 上有 7142 颗⭐】

地址:
https://github.com/google/dopamine?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

image

【No 38】Lime

解释任何机器学习分类器的预测。
【在 Github 上有 5173 颗⭐】

地址:
https://github.com/marcotcr/lime?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

image

【No 39】Autokeras

一种用于自动机器学习(AutoML)的开源软件库。
【在 Github 上有 4520 颗⭐】

地址:
https://github.com/jhfjhfj1/autokeras?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

image

【No 40】Shap

使用期望值和 Shapley 值解释任何机器学习模型的输出。
【在 Github 上有 3496 颗⭐】

地址:
https://github.com/slundberg/shap?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

image

【No 41】MMdnn

一套用于帮助用户在不同深度学习框架之间进行互操作的工具。例如模型转换和可视化。在 Caffe、Keras、MXNet、TensorFlow 之间进行转换模型。
【在 Github 上有 3021 颗⭐】

地址:
https://github.com/Microsoft/MMdnn?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

image

【No 42】Mlflow

用于机器学习生命周期的开源平台。
【在 Github 上有 3013 颗⭐】

地址:
https://github.com/mlflow/mlflow?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

image

【No 43】Mace

用于移动异构计算平台优化的深度学习推理框架。
【在 Github 上有 2979 颗⭐】

地址:
https://github.com/XiaoMi/mace?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

image

【No 44】PySyft

用于安全、私密的深度学习的 Python 库。PySyft 使用 PyTorch 的多方计算(Multi-Party Computation,MPC)将私有数据从模型训练中分离出来。
【在 Github 上有 2595 颗⭐】

地址:
https://github.com/OpenMined/PySyft?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

image

【No 45】Adanet

具有学习保证(learning guarantees)的快速灵活的 AutoML。
【在 Github 上有 2293 颗⭐】

地址:
https://github.com/tensorflow/adanet?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

image

【No 46】Tencent-ml-images

最大的多标签图像数据库;ResNet-101 模型;ImageNet 上的 80.73% 的 top-1 acc。
【在 Github 上有 2094 颗⭐】

地址:
https://github.com/Tencent/tencent-ml-images?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

image

【No 47】Donkeycar

开源软硬件平台,打造小型自动驾驶汽车。
【在 Github 上有 1207 颗⭐】

地址:
https://github.com/autorope/donkeycar?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

image

【No 48】PocketFlow

自动模型压缩框架(Automatic Model Compression,AutoMC),用于开发更小、更快的人工智能应用。
【在 Github 上有 1677 颗⭐】

地址:
https://github.com/Tencent/PocketFlow?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

image

【No 49】DALI

包含高度优化的构件块和用于深度学习应用中的数据预处理的执行引擎的库。
【在 Github 上有 1013 颗⭐】

地址:
https://github.com/NVIDIA/dali?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

image

以上就是 2018 年度的机器学习教程的全部内容。如果你喜欢这份报道,请阅读更多由 Mybridge 排名的博文: https://medium.mybridge.co/

原文链接:

https://medium.mybridge.co/amazing-machine-learning-open-source-tools-projects-of-the-year-v-2019-95d772e4e985

收藏

评论

微博

发表评论

注册/登录 InfoQ 发表评论