用Keras 和 DDPG play TORCS（环境配置篇）

原作者Using Keras and Deep Deterministic Policy Gradient to play TORCS

配置gym-torcs，参考

由于使用的环境是ubuntu 14.04 desktop版，故不需要安装opencv。

安装一些依赖包：

sudo apt-get install xautomation

sudo pip install numpy

sudo pip install gym

下载gym_torcs源码

然后将

gym_torcs/vtorcs-RL-color/src/modules/simu/simuv2/simu.cpp

中第64行替换为

if (isnan((float)(car->ctrl->gear)) || isinf(((float)(car->ctrl->gear)))) car->ctrl->gear = 0;

即添加两个（float），否则，下一步make的时候会出现error，安转失败

cd 到 gym_torcs/vtorcs-Rl-color目录，

执行以下命令：

sudo apt-get install libglib2.0-dev  libgl1-mesa-dev libglu1-mesa-dev  freeglut3-dev  libplib-dev  libopenal-dev libalut-dev libxi-dev libxmu-dev libxrender-dev  libxrandr-dev libpng12-dev 

./configure

make

sudo make install

sudo make datainstall

输入命令

torcs

即将打开，熟悉的TORCS 界面，已打patch scr

DDPG源码

pip install keras

pip install tensorflow

git clone https://github.com/yanpanlau/DDPG-Keras-Torcs.git

cd DDPG-Keras-Torcs

cp *.* ../gym_torcs

cd ../gym_torcs

下面运行ddpg.py

python ddpg.py

开始看到漂亮的训练过程啦

在笔记本上运行ddpg.py的时候会出现 keras.backecd中没有set_session模块，初步猜想应该是GPU的问题，在带GPU台式机的虚拟机ubuntu14.04上，即可以正常运行。

注意到，笔记本中一个细节是：Using Theano backend
而，虚拟机中显示的是：Using tensorflow backend
在keras/backend主页找到问题所在,是keras的配置问题

打开~/.keras/keras.json，把backend选项，修改Theano为tensorflow，然后wq，退出即可。

  {

      "image_dim_ordering": "tf",

      "epsilon": 1e-07,

      "floatx": "float32",

      "backend": "tensorflow"

  }

修改默认python

删除系统自带的python软链接
```
  rm /user/bin/python
```

建立新安装的python 的软链接

  ln -s ~/anaconda2/bin/python /user/bin/python

现在打开命令行python 即是安装在~/anaconda2/bin/python 的python程序

用Keras 和 DDPG play TORCS（1）的更多相关文章

GPU 服务器环境安装中一些基础note
GPU 服务器环境安装中一些基础note GPU 服务器: 添加组,用户,并为之新建主目录. c302@c302-dl:~$ sudo addgroup testgroup Adding group ...
常用增强学习实验环境 I (MuJoCo, OpenAI Gym, rllab, DeepMind Lab, TORCS, PySC2) (转载)
原文地址:http://blog.csdn.net/jinzhuojun/article/details/77144590 和其它的机器学习方向一样,强化学习(Reinforcement Learni ...
Ubuntu下常用强化学习实验环境搭建(MuJoCo, OpenAI Gym, rllab, DeepMind Lab, TORCS, PySC2)
http://lib.csdn.net/article/aimachinelearning/68113 原文地址:http://blog.csdn.net/jinzhuojun/article/det ...
深度强化学习：Policy-Based methods、Actor-Critic以及DDPG
Policy-Based methods 在上篇文章中介绍的Deep Q-Learning算法属于基于价值(Value-Based)的方法,即估计最优的action-value function $q ...
[Keras] Develop Neural Network With Keras Step-By-Step
简单地训练一个四层全连接网络. Ref: http://machinelearningmastery.com/tutorial-first-neural-network-python-keras/ 1 ...
keras 中如何自定义损失函数
http://lazycoderx.com/2016/10/09/keras%E4%BF%9D%E5%AD%98%E6%A8%A1%E5%9E%8B%E6%97%B6%E4%BD%BF%E7%94%A ...
keras安装
找对工具真的很重要,周末和学霸折腾了一天才装了几个包,问了同事找了一个方便的包,装起来不要太快啊.二十分钟全部搞定. 一.Anaconda 真是大杀器,牛到飞起来,一键部署,所有常用的机器学习包全部包 ...
ubuntu系统theano和keras的安装
说明:系统是unbuntu14.04LTS,32位的操作系统,以前安装了python3.4,现在想要安装theano和keras.步骤如下: 1,安装pip sudo apt-get install ...
neurosolutions 人工神经网络集成开发环境 keras
人工神经网络集成开发环境 : http://www.neurosolutions.com/ keras: https://github.com/fchollet/keras 文档 http ...

随机推荐

Activiti工作流引擎简介
Activiti工作流引擎简介一.概述 Activiti是由Alfresco软件在2010年5月17日发布的业务流程管理(BPM)框架,它是覆盖了业务流程管理,工作流,服务协作等领域的一个开源,灵活 ...
Mininet 跑一个简单的ping测试
安装地址:https://github.com/mininet/mininet/wiki/Mininet-VM-Images 登录用户:mininet 密码:mininet 执行命令:sudo mn ...
QT 正则表达式无效
背景:写了一个判断IP地址合法的正则表达式,并让它应用在输入框中代码如下 QRegExp rx_ip("^((2[0-4]\\d|25[0-5]|[01]?\\d\\d?)\\.){3}( ...
Codeforces Round #169 (Div. 2) E. Little Girl and Problem on Trees dfs序+线段树
E. Little Girl and Problem on Trees time limit per test 2 seconds memory limit per test 256 megabyte ...
递归--练习1--noi3089爬楼梯
递归--练习1--noi3089爬楼梯一.心得根据输入,是要写连续输入多个值的程序二.题目 3089:爬楼梯总时间限制: 1000ms 内存限制: 65536kB 描述树老师爬楼梯,他可 ...
gitlab访问限制问题------Forbidden
解决方案: cd /etc/gitlab vim /gitlab.rb gitlab_rails['rack_attack_git_basic_auth'] = { 'enabled' => t ...
51nod-1055-最长等差数列(dp+优化)
1055 最长等差数列基准时间限制:2 秒空间限制:262144 KB 分值: 80 难度:5级算法题收藏关注 N个不同的正整数,找出由这些数组成的最长的等差数列. 例如:1 3 ...
UVA-1605 Building for UN （构造）
题目大意:n个国家的人要在一栋大厦里办公,要求任意两个国家的办公室要相邻(同层同边或邻层同面),设计一个满足要求的方案. 题目分析:题目限制较少,任意构造出一个解即可. 代码如下: # include ...
记一次生产环境axis2服务特别慢的问题。
情况如下: 某服务,在测试环境测试的时候整个响应过程也就0.5s左右,测试环境和生产环境axis2版本一致,tomcat版本一致,但是生产环境需要差不多20S. 后来,越来越慢,导致服务一起来,整个生 ...
phython
转载 http://www.cnblogs.com/chenny7/p/4062693.html

用Keras 和 DDPG play TORCS（1）