rlpyt: A Research Code Base for Deep Reinforcement Learning in PyTorch

Installation

Clone this repository to the local machine.
Install the anaconda environment appropriate for the machine.

conda env create -f linux_[cpu|cuda9|cuda10].yml

source activate rlpyt

Either A) Edit the PYTHONPATH to include the rlpyt directory, or B) Install as editable python package

#A

export PYTHONPATH=path_to_rlpyt:$PYTHONPATH

#B

pip install -e .

Install any packages / files pertaining to desired environments (e.g. gym, mujoco). Atari is included.

pip install gym

Hint: for easy access, add the following to your ~/.bashrc (might substitute conda for source).

alias rlpyt="source activate rlpyt; cd path_to_rlpyt"

rlpyt/example/atari_dqn_async_cpu.py：设置n_socket=1；

rlpyt/example/atari_dqn_async_gpu.py：设置n_socket=1；

rlpyt/example/atari_dqn_async_serial.py：设置n_socket=1；

rlpyt（Deep Reinforcement Learning in PyTorch）的更多相关文章

深度强化学习（Deep Reinforcement Learning）入门：RL base & DQN-DDPG-A3C introduction
转自https://zhuanlan.zhihu.com/p/25239682 过去的一段时间在深度强化学习领域投入了不少精力,工作中也在应用DRL解决业务问题.子曰:温故而知新,在进一步深入研究和应 ...
repost: Deep Reinforcement Learning
From: http://wanghaitao8118.blog.163.com/blog/static/13986977220153811210319/ accessed 2016-03-10 深度 ...
深度学习课程笔记（十八）Deep Reinforcement Learning - Part 1 (17/11/27) Lectured by Yun-Nung Chen @ NTU CSIE
深度学习课程笔记(十八)Deep Reinforcement Learning - Part 1 (17/11/27) Lectured by Yun-Nung Chen @ NTU CSIE 201 ...
Deep Reinforcement Learning 基础知识（DQN方面）
Introduction 深度增强学习Deep Reinforcement Learning是将深度学习与增强学习结合起来从而实现从Perception感知到Action动作的端对端学习的一种全新的算 ...
增强学习（Reinforcement Learning and Control）
增强学习(Reinforcement Learning and Control) [pdf版本]增强学习.pdf 在之前的讨论中,我们总是给定一个样本x,然后给或者不给label y.之后对样本进行 ...
Learning Roadmap of Deep Reinforcement Learning
1. 知乎上关于DQN入门的系列文章 1.1 DQN 从入门到放弃 DQN 从入门到放弃1 DQN与增强学习 DQN 从入门到放弃2 增强学习与MDP DQN 从入门到放弃3 价值函数与Bellman ...
论文笔记之：Dueling Network Architectures for Deep Reinforcement Learning
Dueling Network Architectures for Deep Reinforcement Learning ICML 2016 Best Paper 摘要:本文的贡献点主要是在 DQN ...
论文笔记之：Asynchronous Methods for Deep Reinforcement Learning
Asynchronous Methods for Deep Reinforcement Learning ICML 2016 深度强化学习最近被人发现貌似不太稳定,有人提出很多改善的方法,这些方法有很 ...
论文笔记之：Deep Reinforcement Learning with Double Q-learning
Deep Reinforcement Learning with Double Q-learning Google DeepMind Abstract 主流的 Q-learning 算法过高的估计在特 ...

随机推荐

PHP系列之钩子
PHP 提供的钩子 PHP 和 Zend Engine 为扩展提供了许多不同的钩子,这些扩展允许扩展开发人员以 PHP userland 无法提供的方式控制 PHP 运行时. 本章将展示各种钩子和从扩 ...
PHP array_rand() 函数
实例返回一个包含随机键名的数组: <?php $a=array("red","green","blue","yellow& ...
PHP cosh() 函数
实例返回不同数的双曲余弦: <?phpecho(cosh(3) . "<br>");echo(cosh(-3) . "<br>" ...
luogu P4725 多项式对数函数（多项式 ln）
LINK:多项式对数函数多项式 ln 如题是一个模板题.刚学会导数几个知识点 \([f(x)\cdot g(x)]'=f(x)'g(x)+f(x)g(x)',f(g(x))'=f'(g(x))g ...
CI4框架应用三 - app目录
我们再来看一下项目的app目录结构,这个目录就是我们开发的主目录,项目的配置,代码的编写都在这个目录中. Administrator@PC- MINGW64 /c/wamp64/www/ci4/app ...
vue-cookies 使用
import VueCookies from 'vue-cookies' Vue.use(VueCookies) $cookies.config() 设置默认值 $cookies.config(exp ...
19、Java 序列化
1.序列化的概念,意义以及使用场景序列化: 将对象写入到IO流中,也就是把Java对象转换为字节序列的过程反序列化: 从IO流中恢复对象*,也就是把字节序列恢复为Java对象的过程意义: 序列化 ...
C/C++中char[]和string的连接/合并
一: C风格字符串连接 #include <iostream> using namespace std; int main() { const char *str = "hell ...
LeetCode 931. 下降路径最小和详解
题目详情给定一个方形整数数组 A,我们想要得到通过 A 的下降路径的最小和. 下降路径可以从第一行中的任何元素开始,并从每一行中选择一个元素.在下一行选择的元素和当前行所选元素最多相隔一列. 示例: ...
Oracle创建主键优劣
创建主键方式一个表的主键是唯一标识,不能有重复,不允许为空. 一个表的主键可以由一个字段或多个字段共同组成. -- 列级,表级建立主键 1.create table constraint_test ...

rlpyt（Deep Reinforcement Learning in PyTorch）

rlpyt: A Research Code Base for Deep Reinforcement Learning in PyTorch

Installation

rlpyt（Deep Reinforcement Learning in PyTorch）的更多相关文章

随机推荐

热门专题