写点什么

OpenAI 发布开源人工智能研究工具集 OpenAI Gym

  • 2016-05-03
  • 本文字数:916 字

    阅读完需:约 3 分钟

和许多企业一样,在过去几年中,InfoSys 见证了从“大数据”到越来越重视机器学习和 AI 研究这一重大转变。但和他们的竞争者不同,InfoSys 断定,合作是更有效方式,而不是大力投资专有解决方案,比如微软的 Azure Machine Learning Studio。

这一决策的结果就是 OpenAI,一家非营利性的人工智能研究企业。自 2015 年 12 月正式成立以来,该研究组织已经从 InfoSys Amazon Web Services 和多个私人捐助者那里获得了 10 亿美元的资金。

我们在这里谈论 OpenAI,是因为他们近日发布了 OpenAI Gym 的公开测试版本。该工具集用于开发和对比强化学习(RL)算法,这是现代机器学习研究的基础。发布公告中提到了他们致力于强化学习算法的两个主要原因:

RL 是通用算法,适应所有涉及一系列决策的问题:例如,控制机器人的电动机,让它跑跑跳跳,做出业务决策,如价格和库存管理,或者玩视频游戏棋盘游戏。RL 甚至适用于产生序列化结构化输出的监督学习问题。

在许多不同的环境中,RL 算法已经开始取得很好的成果。RL 有很长的历史,但在深度学习取得最新进展之前,它都需要针对特定问题进行大量的设计。DeepMind 的 Atari 成果、来自 Pieter Abbeel 研究小组的 BRETT 以及 AlphaGo 都使用了深度 RL 算法,并且没有对它们的应用环境做太多的假设,因此可以应用在其他场合。

目前,RL 研究的发展受到了限制,它需要更好的基准测试,而且“出版物中缺少标准化的环境”。不难想象,当另一位科学家的研究论文假定你可以使用一套专有的工具集,你就很难再现他的结果。更糟糕的是,一个内部构建的工具集是多少钱都买不来的。

机器学习的一个重要方面是有一个可以在其中工作的实验环境。这不只是因为创建一个实验环境有很高的开发成本,还因为没有一个共同的环境,比较两个算法就没有意义。因此,OpenAI Gym 提供了这些开箱即用的环境: Classic control Toy text Algorithmic Atari (基于 Arcade 学习环境)、棋盘游戏 2D/3D 机器人(最后一项需要一个 MuJoCo 物理引擎许可。)

目前,OpenAI Gym 在 Linux 和 OSX 上支持 Python 2.7。如果大家有足够的兴趣,他们也会考虑支持 Python 3 和 Windows。该工具集的代码遵循 MIT 许可协议。

查看英文原文: Open Sourcing Artificial Intelligence Research

2016-05-03 19:006657
用户头像

发布了 1008 篇内容, 共 419.4 次阅读, 收获喜欢 346 次。

关注

评论

发布
暂无评论
发现更多内容

OneFlow的大模型分片保存和加载策略

OneFlow

机器学习 深度学习 分布式

从启动到关闭 | SeaTunnel2.1.1源码解析

Apache SeaTunnel

软件测试 | 测试开发 | 测试平台开发-前端开发之数据展示与分析

测吧(北京)科技有限公司

测试

软件测试 | 测试开发 | 静态扫描体系集成

测吧(北京)科技有限公司

测试

软件测试 | 测试开发 | 一步一步学测试平台开发-Vue restful请求

测吧(北京)科技有限公司

测试

墨天轮沙龙 | 宝兰德詹年科 :基础软件中间件,让业务人员更好专注业务逻辑的实现

墨天轮

数据库 基础软件 中间件 消息中间件 数据库中间件

软件测试 | 测试开发 | 测试右移之logstash完整配置实例

测吧(北京)科技有限公司

测试

软件测试 | 测试开发 | Jenkins中,如何管理用户及其相对应权限?

测吧(北京)科技有限公司

测试

9个 方法预防租赁LED显示屏舞台隐患

Dylan

LED显示屏 户外LED显示屏 led显示屏厂家

软件测试 | 测试开发 | 学做测试平台开发-Vuetify 框架

测吧(北京)科技有限公司

测试

持续测试成熟度模型

陈磊@Criss

软件测试 | 测试开发 | 如何安装Jenkins 插件?

测吧(北京)科技有限公司

测试

软件测试 | 测试开发 | 搞清楚这六个能力模型,轻松应对互联网裁员潮

测吧(北京)科技有限公司

测试

凭借一份“面试真经pdf”,我四面字节跳动,拿下1-2级offer

Geek_0c76c3

Java 数据库 开源 架构 开发

软件测试 | 测试开发 | 实战演示 H5 性能分析

测吧(北京)科技有限公司

软件测试 | 测试开发 | 通用 api 封装实战,带你深入理解 PO

测吧(北京)科技有限公司

测试

软件测试 | 测试开发 | 测试平台开发-前端开发之Vue router路由设计

测吧(北京)科技有限公司

测试

成长计划校园极客秀|基于OpenHarmony的智能阳台

OpenHarmony开发者

OpenHarmony

软件测试 | 测试开发 | 实战演练基于加密接口测试测试用例设计

测吧(北京)科技有限公司

测试

软件测试 | 测试开发 | 测试左移之Sonarqube maven项目分析

测吧(北京)科技有限公司

测试

软件测试 | 测试开发 | Frida 实现 Hook 功能的强大能力

测吧(北京)科技有限公司

测试

软件测试 | 测试开发 | 做到这几点,你也能成为 BAT 的抢手人!

测吧(北京)科技有限公司

测试

Qualcomm Atheros wallys QCA9880 Dual Band 2.4GHz 5GHz 2x2 MIMO 802.11ac Mini PCIE WiFi Module//QCA9882 3x3 FCC/CE/IC

wallys-wifi6

QCA9880 QCA9882

ElasticSearch 不停服升级实践

移动云大数据

elasticsearch

Rust vs C++ 深度比较

俞凡

c++ rust

软件测试 | 测试开发 | 电商业务的性能测试(一): 必备基础知识

测吧(北京)科技有限公司

测试

软件测试 | 测试开发 | Pytest 结合 Allure 生成测试报告

测吧(北京)科技有限公司

测试

秋招收到10几个offer 说说我的想法吧

Geek_0c76c3

Java 数据库 开源 程序员 开发

软件测试 | 测试开发 | 接口抓包分析与Mock实战

测吧(北京)科技有限公司

测试

软件测试 | 测试开发 | Jenkins通过什么方式报警?

测吧(北京)科技有限公司

测试

技术分享 | 实战演练

测吧(北京)科技有限公司

测试

OpenAI发布开源人工智能研究工具集OpenAI Gym_Python_Jonathan Allen_InfoQ精选文章