AICon 上海站|日程100%上线,解锁Al未来! 了解详情
写点什么

OpenAI 发布开源人工智能研究工具集 OpenAI Gym

  • 2016-05-03
  • 本文字数:916 字

    阅读完需:约 3 分钟

和许多企业一样,在过去几年中,InfoSys 见证了从“大数据”到越来越重视机器学习和 AI 研究这一重大转变。但和他们的竞争者不同,InfoSys 断定,合作是更有效方式,而不是大力投资专有解决方案,比如微软的 Azure Machine Learning Studio。

这一决策的结果就是 OpenAI,一家非营利性的人工智能研究企业。自 2015 年 12 月正式成立以来,该研究组织已经从 InfoSys Amazon Web Services 和多个私人捐助者那里获得了 10 亿美元的资金。

我们在这里谈论 OpenAI,是因为他们近日发布了 OpenAI Gym 的公开测试版本。该工具集用于开发和对比强化学习(RL)算法,这是现代机器学习研究的基础。发布公告中提到了他们致力于强化学习算法的两个主要原因:

RL 是通用算法,适应所有涉及一系列决策的问题:例如,控制机器人的电动机,让它跑跑跳跳,做出业务决策,如价格和库存管理,或者玩视频游戏棋盘游戏。RL 甚至适用于产生序列化结构化输出的监督学习问题。

在许多不同的环境中,RL 算法已经开始取得很好的成果。RL 有很长的历史,但在深度学习取得最新进展之前,它都需要针对特定问题进行大量的设计。DeepMind 的 Atari 成果、来自 Pieter Abbeel 研究小组的 BRETT 以及 AlphaGo 都使用了深度 RL 算法,并且没有对它们的应用环境做太多的假设,因此可以应用在其他场合。

目前,RL 研究的发展受到了限制,它需要更好的基准测试,而且“出版物中缺少标准化的环境”。不难想象,当另一位科学家的研究论文假定你可以使用一套专有的工具集,你就很难再现他的结果。更糟糕的是,一个内部构建的工具集是多少钱都买不来的。

机器学习的一个重要方面是有一个可以在其中工作的实验环境。这不只是因为创建一个实验环境有很高的开发成本,还因为没有一个共同的环境,比较两个算法就没有意义。因此,OpenAI Gym 提供了这些开箱即用的环境: Classic control Toy text Algorithmic Atari (基于 Arcade 学习环境)、棋盘游戏 2D/3D 机器人(最后一项需要一个 MuJoCo 物理引擎许可。)

目前,OpenAI Gym 在 Linux 和 OSX 上支持 Python 2.7。如果大家有足够的兴趣,他们也会考虑支持 Python 3 和 Windows。该工具集的代码遵循 MIT 许可协议。

查看英文原文: Open Sourcing Artificial Intelligence Research

2016-05-03 19:006595
用户头像

发布了 1008 篇内容, 共 412.2 次阅读, 收获喜欢 346 次。

关注

评论

发布
暂无评论
发现更多内容

大模型再加速,保障京东618又便宜又好

京东科技开发者

【YashanDB知识库】oracle dblink varchar类型查询报错记录

YashanDB

yashandb 崖山数据库 崖山DB

万界星空科技电线电缆行业MES系统核心功能

万界星空科技

mes 万界星空科技 电线电缆行业 电线电缆mes

麻省理工IOT教授撰写的1058页Python程序设计人工智能实践手册!

我再BUG界嘎嘎乱杀

Python 人工智能 程序设计 后端 开发语言

Apache Paimon 在蚂蚁的应用

Apache Flink

大数据 flink 流计算 paimon

「邀您参会」首个中国可观测日即将盛大开幕

观测云

可观测性 AWS

被种草新版 FinClip Cloud,主打一个好用!

Onegun

finclip 小程序容器

茶思屋直播|向下扎根,向上生长,TinyEngine 灵活构建个性化低代码平台

OpenTiny社区

开源 前端 低代码 OpenTiny TinyEngine

TimechoDB v1.3.3 发布 | 新增多种数据类型,增加数据订阅、配置项设置等功能

Apache IoTDB

【程序大侠传】服务发布引发mq消息重复消费

Disaster

无需业务改造,一套数据库满足 OLTP 和 OLAP,GaiaDB 发布并行查询能力

Baidu AICLOUD

OLAP 云原生数据库 HTAP

如何冲破大模型时代的算力关卡?天翼云给出答案

脑极体

AI

AI心理助手:随时待命,伴你左右

心大陆多智能体

智能体 AI大模型 心理健康 数字心理 CBT

Altair HyperWorks 新版本|AI 赋能设计与仿真,驱动全球领先创新技术

Altair RapidMiner

人工智能 设计 仿真 工程 altair

计算机视觉的基础概念与入门

我再BUG界嘎嘎乱杀

Python 编程 后端 计算机视觉 开发语言

Workflow通用并发控制组件:ResourcePool资源池

1412

c++ 开源项目 workflow 并发’

客户在哪儿AI助ToB企业决策层开启营销的上帝视角

客户在哪儿AI

ToB营销 ToB增长 ToB销售

国内低代码平台推荐--万界星空科技低代码平台

万界星空科技

低代码 低代码开发 低代码平台 mes

嘿!通义灵码周边「超大鼠标垫」上线啦,更多玩法等待解锁

阿里巴巴云原生

阿里云 云原生 通义灵码

嘿!通义灵码周边「超大鼠标垫」上线啦,更多玩法等待解锁

阿里云云效

阿里云 云原生 通义灵码

说说XXLJob分片任务实现原理?

王磊

Java

网络爬虫开发:JavaScript与Python特性的小差异

我再BUG界嘎嘎乱杀

Python JavaScript 爬虫 开发语言

作为ToB市场总监的你 被老板质疑过花销太大吗?

客户在哪儿AI

ToB营销 ToB获客 ToB增长 ToB销售

OpenAI发布开源人工智能研究工具集OpenAI Gym_Python_Jonathan Allen_InfoQ精选文章