写点什么

谷歌发布开源 Dopamine 2.0,让强化学习变得更灵活

  • 2019-02-09
  • 本文字数:715 字

    阅读完需:约 2 分钟

谷歌发布开源Dopamine 2.0,让强化学习变得更灵活

强化学习(RL)已成为最受欢迎的机器学习领域之一,并且在过去几年中取得了许多重大进展。因此,研究人员和教育工作者越来越需要获得一个清晰可靠的 RL 研究和教育框架。去年 8 月,谷歌发布了一款全新的开源强化学习框架 Dopamine,该框架基于 TensorFlow,主打灵活性、稳定性、复现性,能够提供快速的基准测试。


今天,谷歌发布 Dopamine 2.0,为强化学习提供了更高的灵活性以及更多的测试环境。


去年八月,谷歌发布了 Dopamine,这是一款灵活的强化学习框架。初始版本专注于特定类型的 RL 研究:基于 Arcade 学习环境(一个成熟的、易于理解的基准)和四个基于值的代理 DQN、C51、Rainbow 代理的简化版本以及隐式分位数网络代理实现的。


开源地址:https://github.com/google/dopamine


据官方博客介绍:


开发小组收到的最常见的请求之一是对更多环境的支持。这证实了他们在内部看到的情况,在测试新算法时,OpenAI 的 Gym 支持的简单环境非常有用。于是,谷歌正式发布 Dopamine 2.0,这一版本包括了对离散域 Gym 环境(如离散状态和动作)的支持。框架的核心保持不变,只是简单地概括了与环境的接口。为了向后兼容,用户仍然可以下载 1.0 版本。


此外,新版本还包括两个经典控制环境的默认配置:CartPole 和 Acrobot;在这些环境中,用户可以在几分钟内训练 Dopamine 代理。与标准 Atari 2600 游戏的训练时间(标准 GPU 上大约 5 天)相比,这些环境允许研究人员在更大规模的 Atari 游戏上测试比之前更快地迭代研究思路。新版本还包括一个合作实验室,演示如何在 Cartpole 和 Acrobot 上训练代理。最后,GymPreprocessing 类为如何将 Dopamine 与其他自定义环境一起使用提供了示例。


拓展阅读


吊打OpenAI!谷歌重磅开源强化学习框架Dopamine


2019-02-09 09:003809
用户头像
陈思 InfoQ编辑

发布了 576 篇内容, 共 240.2 次阅读, 收获喜欢 1272 次。

关注

评论

发布
暂无评论
发现更多内容

架构实战营模块七作业

zhihai.tu

「趣学前端」“寓教于乐”的Node.js学习记录

叶一一

node.js 前端 9月月更

关于 DynamoDB

Joseph295

腾讯前端二面面试题(附答案)

beifeng1996

JavaScript 前端

数据治理(十五):Ranger 管理 Hive 安全

Lansonli

数据治理 9月月更

分布式事务

想要飞的猪

3PC 2PC注意事项 TCC 本地消息表

近期对前端性能优化的总结

南城FE

性能优化 前端 性能 性能提升

Elasticsearch聚合学习之一:基本操作

程序员欣宸

Elastic Search 9月月更

社招前端必会面试题

bb_xiaxia1998

JavaScript 前端

MySQL架构与历史

阿柠xn

MySQL innodb 事务 sql 9月月更

『数据结构与算法』之时间复杂度与空间复杂度,看这一篇就够啦

喜羊羊

9月月更

关于AWS Aurora

Joseph295

OpenHarmony源码的编译构建

坚果

OpenHarmony 9月月更

Python基础(三) | Python的组合数据类型

timerring

Python. 9月月更

还能把浏览器当作 Web 服务器?骚操作,学废了~

掘金安东尼

前端 9月月更

基于阿里云GPU云服务器的AIACC助力UC搜索业务性能提效380%,每年节省数千万成本

阿里云弹性计算

神龙 加速引擎 TensorRT QTC

库调多了,都忘了最基础的概念《Mysql相关知识》

知识浅谈

MySQL 9月月更

美团前端二面高频面试题合集

loveX001

JavaScript 前端

Qt实现文本编辑器(二)

中国好公民st

c++ qt 9月月更

SpringCloud Feign 远程调用(史上最详细讲解)

SpringCloud Fegin 9月月更

频面试题合集

helloworld1024fd

JavaScript 前端

社招前端二面面试题

夏天的味道123

JavaScript 前端

nft平台搭建:nft商城开发nft平台开发

开源直播系统源码

NFT 数字藏品 数字藏品开发 数字藏品系统

手部骨骼跟踪能力,打造控制虚拟世界的手势密码

HMS Core

谷歌发布开源Dopamine 2.0,让强化学习变得更灵活_AI_谷歌博客_InfoQ精选文章