AI 年度盘点与2025发展趋势展望,50+案例解析亮相AICon 了解详情
写点什么

OpenAI 发布开源人工智能研究工具集 OpenAI Gym

  • 2016-05-03
  • 本文字数:916 字

    阅读完需:约 3 分钟

和许多企业一样,在过去几年中,InfoSys 见证了从“大数据”到越来越重视机器学习和 AI 研究这一重大转变。但和他们的竞争者不同,InfoSys 断定,合作是更有效方式,而不是大力投资专有解决方案,比如微软的 Azure Machine Learning Studio。

这一决策的结果就是 OpenAI,一家非营利性的人工智能研究企业。自 2015 年 12 月正式成立以来,该研究组织已经从 InfoSys Amazon Web Services 和多个私人捐助者那里获得了 10 亿美元的资金。

我们在这里谈论 OpenAI,是因为他们近日发布了 OpenAI Gym 的公开测试版本。该工具集用于开发和对比强化学习(RL)算法,这是现代机器学习研究的基础。发布公告中提到了他们致力于强化学习算法的两个主要原因:

RL 是通用算法,适应所有涉及一系列决策的问题:例如,控制机器人的电动机,让它跑跑跳跳,做出业务决策,如价格和库存管理,或者玩视频游戏棋盘游戏。RL 甚至适用于产生序列化结构化输出的监督学习问题。

在许多不同的环境中,RL 算法已经开始取得很好的成果。RL 有很长的历史,但在深度学习取得最新进展之前,它都需要针对特定问题进行大量的设计。DeepMind 的 Atari 成果、来自 Pieter Abbeel 研究小组的 BRETT 以及 AlphaGo 都使用了深度 RL 算法,并且没有对它们的应用环境做太多的假设,因此可以应用在其他场合。

目前,RL 研究的发展受到了限制,它需要更好的基准测试,而且“出版物中缺少标准化的环境”。不难想象,当另一位科学家的研究论文假定你可以使用一套专有的工具集,你就很难再现他的结果。更糟糕的是,一个内部构建的工具集是多少钱都买不来的。

机器学习的一个重要方面是有一个可以在其中工作的实验环境。这不只是因为创建一个实验环境有很高的开发成本,还因为没有一个共同的环境,比较两个算法就没有意义。因此,OpenAI Gym 提供了这些开箱即用的环境: Classic control Toy text Algorithmic Atari (基于 Arcade 学习环境)、棋盘游戏 2D/3D 机器人(最后一项需要一个 MuJoCo 物理引擎许可。)

目前,OpenAI Gym 在 Linux 和 OSX 上支持 Python 2.7。如果大家有足够的兴趣,他们也会考虑支持 Python 3 和 Windows。该工具集的代码遵循 MIT 许可协议。

查看英文原文: Open Sourcing Artificial Intelligence Research

2016-05-03 19:006408
用户头像

发布了 1008 篇内容, 共 391.4 次阅读, 收获喜欢 344 次。

关注

评论

发布
暂无评论
发现更多内容

C#/VB.NET: 为Excel表格添加超链接

Geek_249eec

C# Excel VB.NET 超链接

阿里云一站式专家测试服务,护航APP线上质量,发版无忧

移动研发平台EMAS

阿里云 移动测试 限时活动

实战 | JMeter 典型电商场景(下单/支付)的性能压测

霍格沃兹测试开发学社

Linux系统安装Nginx

nginx Linux tree 9月月更

国内唯一|阿里云入选 Gartner 应用性能监控与可观测魔力象限

阿里巴巴云原生

阿里云 云原生 Gartner 可观测

从普通网站到 PWA 你还在重新写代码吗?

鼎道智联

前端 OS PWA

45张图带你从入门到精通学习WireShark!

wljslmz

Wireshark 网络技术 抓包分析 9月月更

如何做好性能压测(一):压测环境的设计和搭建

霍格沃兹测试开发学社

实战 | UI 自动化测试框架设计与 PageObject 改造

霍格沃兹测试开发学社

史上最全 Appium 自动化测试从基础到框架实战精华学习笔记(一)

霍格沃兹测试开发学社

IDaaS系统方舟一账通ArkID内置OIDC认证插件配置流程

龙归科技

Idaas OIDC ArkID

如何用Sonic云真机打王者

霍格沃兹测试开发学社

学习Docker就应该掌握的dockerfile语法与指令

霍格沃兹测试开发学社

易观千帆《银行APP用户体验分析白皮书》重磅首发,助力银行打造获客新增长点

易观分析

金融 银行

Java线程池创建方式和应用场景

Java快了!

线程池 java;

【InfoQ】博睿数据CTO孟曦东访谈实录:可观测性技术是未来发展方向

博睿数据

可观测性 博睿数据 智能运维AIOps 极客有约

极致体验!基于阿里云 Serverless 快速部署 Function

阿里巴巴云原生

阿里云 Serverless 云原生

大话测试数据(一)

霍格沃兹测试开发学社

如何利用 xUnit 框架对测试用例进行维护?

霍格沃兹测试开发学社

多云时代如何实现自动化运维?博云给你最优解!

BoCloud博云

云计算 云原生 多云管理平台

谈安全测试的重要性

京东科技开发者

漏洞 软件系统 安全测试 网络安全渗透测试

小六六学Netty系列之编解码器和handler的调用机制

自然

Netty 网络 9月月更

小六六学Netty系列之再遇Netty

自然

Netty 网络 9月日更

Axios的引入与使用-提供可响应api案例

Sam9029

前端 网络 axios 9月月更

实战 | 基于JMeter 完成典型电商场景(首页浏览)的性能压测

霍格沃兹测试开发学社

融云 2022 社交泛娱乐出海嘉年华,邀你一起「超浪」!

融云 RongCloud

IT 程序猿 社交娱乐

港股交易系统开发之APP原生or封装?

软件开发大鱼V15988750073

证券 港股交易系统开发 港股打新系统 港股多账户系统 证券app

从成都核酸系统崩溃,谈谈IT系统如何应对10倍以上流量冲击

星汉未来

数据可视化分析工具如何在国内弯道超车,迅速崛起?

葡萄城技术团队

大话JMeter4|不同的并发数可以自动化做压测吗?

霍格沃兹测试开发学社

内卷时代下的前端技术-使用JavaScript在浏览器中生成PDF文档

葡萄城技术团队

前端 PDF JavaScrip

OpenAI发布开源人工智能研究工具集OpenAI Gym_Python_Jonathan Allen_InfoQ精选文章