安装部署OpenPAI + VSCode 提交
==========================================================
安装openpai请参考这篇
https://www.cnblogs.com/jins-note/p/9673883.html
==========================================================
首先准备两台服务器(必须为Ubuntu16.04 Server),一台作为master,一台作为worker(master和worker由我们自己指定)。每台服务器都必须要有的:
1、ssh服务(这在安装Ubuntu16.04 Server的时候有选择)
2、docker-ce
3、两台服务器必须要有相同的用户名以及密码
4、用于登录每台计算机的用户名应具有sudo权限
5、两台服务器要在同一个网段中
准备好之后,我们需要先在master的docker中执行以下命令:
sudo docker pull docker.io/openpai/dev-box sudo docker run -itd \ -e COLUMNS=$COLUMNS -e LINES=$LINES -e TERM=$TERM \ -v /var/lib/docker:/var/lib/docker \ -v /var/run/docker.sock:/var/run/docker.sock \ -v /pathHadoop:/pathHadoop \ -v /pathConfiguration:/cluster-configuration \ --pid=host \ --privileged=true \ --net=host \ --name=dev-box \ docker.io/openpai/dev-box sudo docker exec -it dev-box /bin/bash cd /pai/pai-management
第一条指令是拉dev-box的镜像
第二条指令是运行dev-box
第三条指令是进入dev-box
然后
cd quick-start cp quick-start-example.yaml ../quick-start.yaml cd .. vi quick-start.yaml
master-ip写你指定的master的ip
worker-ip就是另外一台服务器的ip
ssh-username就是你的服务器的username
ssh-password就是相应的password
完成之后
python paictl.py cluster generate-configuration \ -i quick-start.yaml \ -o /path/to/cluster-configuration/dir
/path/to/cluster-configuration/dir 这个路径可以随意放置,建议写成 /cluster-configuration/
然后进入 /cluster-configuration/ 会发现有四个.yaml文件,一般是不用改的。
然后执行
python paictl.py cluster k8s-bootup \ -p /path/to/cluster-configuration/dir
同样,这里的/path/to/cluster-configuration/dir 写成你放那四个.yaml配置文件的地方,/cluster-configuration/
这时可能要等一段时间,执行快完成的时候如果出现kube-proxy已经存在的错误的话,执行
python paictl.py cluster k8s-clean -p /cluster-configuration 这个paictl.py文件在/pai/pai-management/ 目录下
然后再执行第二步的命令就可以了。
此时你可以访问
http://<master>:9090
这个网页
然后就是最后一步
python paictl.py service start \ -p /path/to/cluster-configuration/dir
同样的/path/to/cluster-configuration/dir改为你放四个.yaml文件的目录,这里是 /cluster-configuration/
这里执行也要等一段时间,如果出现了driver-one-shot等待,这里可以等一段时间,如果等待时间过长的话,直接终止,然后执行
python paictl.py service delete -p /cluster-configuration
这里的/cluster-configuration改为你存放四个.yaml文件的目录,相当于清理容器内容
然后再执行
python paictl.py cluster k8s-clean -p /cluster-configuration
这个命令,相当于卸载k8s
然后再从第二步开始执行。
如果出现zookeeper错误的话,你执行
echo hostname
这个命令,然后进入你存放四个yaml文件的目录,查看cluster-configuration.yaml这个文件,看看machine-list中的master的hostname是否和执行上面的命令的hostname不一样,如果不一样则修改回和执行上面的命令一样的hostname。
如果你发现执行上面的命令和.yaml文件一样的hostname,那很遗憾,执行这两条命令吧:
python paictl.py service delete -p /cluster-configuration python paictl.py cluster k8s-clean -p /cluster-configuration
然后从第二步开始执行。
如果一直没报错的话,恭喜你安装成功可以访问
http://<master>:9286
这个网页,如果你发现你的GPU没有显示信息,很可能是因为你的GPU版本太低,楼主的GeForce GT 730就是不支持显示,但不代表没有GPU。
然后就是如何提交代码了。
=================================================================
我们这里使用vscode,首先安装vscode,最新版就可以,然后下载vs的插件https://marketplace.visualstudio.com/items?itemName=ms-toolsai.vscode-ai 点击install然后再vscode里面安装即可。
安装完成之后会有这些东西
然后右击PAI-Cluster Add Configuration
这个username 是 admin
password 是admin-password
这个账号密码是默认的,如何添加新的账户,我还没研究好。
然后其他的uri将ip改为你的master的ip,端口别改。
然后点finish你会发现你的PAI-Cluster目录里面多了一个东西,然后右击它,点击submit job,会进入一个json文件,需要改的地方为
改为这个,*为通配符,这里是提交.py文件,如果你要提交其他东西的话,如名字为data.xls你可以再includes里面再加入"*.xls"即可。
这个是docker的镜像,你可以去docker-hub找到。
这个codeDir是存放代码文件的目录,你可以右击PAI-Clusters目录下的东西,然后点击open storage explorer,就可以看到一些目录,你可以自己创一个目录,或者使用里面已经有的目录,在codeDir添加上去就可以了。
然后这个command 就是你执行这个代码文件的命令,如python 123.py (如果有参数,可以添加)。
然后点击Finish就可以了,然后他就会上传。
如果出现submit fail 没有这个文件的是因为你的AI Storage Explorer里面没有这个目录,你可以自己添加进去。就像outputDir一样。
安装部署OpenPAI + VSCode 提交的更多相关文章
- 安装部署 OpenPAI Install OpenPAI on Ubuntu
介绍 不管是机器学习的老手,还是入门的新人,都应该装备上尽可能强大的算力.除此之外,还要压榨出硬件的所有潜力来加快模型训练.OpenPAI作为GPU管理的利器,不管是一块GPU,还是上千块GPU, ...
- OpenPAI大规模人工智能平台安装部署文档
环境要求: 如果需要图形界面,需要在Ubuntu系统安装,否则centos系统安装时是没有问题的(web端和命令行进行任务提交) 安装过程需要有另外一台控制端机器(注意:区别于集群所在的任何一台服务器 ...
- Storm集群安装部署步骤【详细版】
作者: 大圆那些事 | 文章可以转载,请以超链接形式标明文章原始出处和作者信息 网址: http://www.cnblogs.com/panfeng412/archive/2012/11/30/how ...
- 161209、简要分析ZooKeeper基本原理及安装部署
一.ZooKeeper 基本概念 1.ZooKeeper 是什么? Zookeeper官网地址: http://zookeeper.apache.org/ Zookeeper官网文档地址:http:/ ...
- 开源分布式实时计算引擎 Iveely Computing 之 安装部署(2)
在Github中下载代码和二进制程序中,您都会看到一个bin\iveely computing目录,里面即是Iveely Computing的运行库. 以前总是有 ...
- Storm入门教程 第三章Storm集群安装部署步骤、storm开发环境
一. Storm集群组件 Storm集群中包含两类节点:主控节点(Master Node)和工作节点(Work Node).其分别对应的角色如下: 主控节点(Master Node)上运行一个被称为N ...
- 【Spark学习】Spark 1.1.0 with CDH5.2 安装部署
[时间]2014年11月18日 [平台]Centos 6.5 [工具]scp [软件]jdk-7u67-linux-x64.rpm spark-worker-1.1.0+cdh5.2.0+56-1.c ...
- 使用docker安装部署Spark集群来训练CNN(含Python实例)
使用docker安装部署Spark集群来训练CNN(含Python实例) http://blog.csdn.net/cyh_24/article/details/49683221 实验室有4台神服务器 ...
- Storm-0.9.0.1安装部署 指导
可以带着下面问题来阅读本文章: 1.Storm只支持什么传输 2.通过什么配置,可以更改Zookeeper默认端口 3.Storm UI必须和Storm Nimbus部署在同一台机器上,UI无法正常工 ...
随机推荐
- 【9】JMicro微服务-发布订阅消息服务
如非授权,禁止用于商业用途,转载请注明出处作者:mynewworldyyl 1. JMicro消息服务目前实现特性 a. JMicro只支持发布订阅消息服务,不支持队列式消息服务: b. 不支持消息持 ...
- iOS 枚举讲解
枚举增强程序的可读性,用法上还是需要注意的 1.C语言的写法 enum XMPPReconnectFlags { kShouldReconnect = 1 << 0, // If set, ...
- RDLC_部署到不同的浏览器
首先我用的是vs2015 的reportview插件 在数据库中应该配置报表的服务器地址,在项目中添加ReportViewer 插件,单独用一个页面显示接收报表 <form id="f ...
- Java之集合(九)LinkedHashMap
转载请注明源出处:http://www.cnblogs.com/lighten/p/7367525.html 1.前言 前一章对Map中的HashMap进行了讲解(虽然只详细介绍了一下红黑树的部分), ...
- 利用wget配合bash脚本同时下载多个文件
先把需要下载的文件写入到一个文件中,命名为urls.txt,比如: http://blog.is36.com/a.jpg http://blog.is36.com/b.jpg http://blog. ...
- 【树】Unique Binary Search Trees II
题目: Given n, generate all structurally unique BST's (binary search trees) that store values 1...n. F ...
- css 中 stick footer 布局实现
做项目中,我们在写弹框的时候,不管弹框的内容多或者少,可能需要一些内容需要固定在框底部,比如关闭按钮.stick footer 就是让 footer 元素固定在底部 当内容不足满屏时,footer 紧 ...
- 一分钟让你学会使用Android AsyncTask
AsyncTask相信大多数朋友对它的用法都已经非常熟悉,这里记录一下主要是献给那些刚刚接触的Android 或者AsyncTask的同学们,高手请绕道. AsyncTask类是Android1.5版 ...
- 如何正确删除VMare虚拟机上的系统机器(图文详解)
不多说,直接上干货! 打开虚拟机进入操作系统列表 在操作系统列表,点击要删除的操作系统,如win7, 点击要删除的操作系统后,在主菜单中找到虚拟机. 如图所示,从磁盘中彻底删除. 是 即,成功从虚拟机 ...
- 软件魔方制作系统启动盘并安装win7系统
不多说,直接上干货! 推荐软件:软件魔方 http://mofang.ruanmei.com/ 这里,我想说的是,这个软件来制作系统盘,是真的方便和好处多多.具体我不多说,本人也是用过其他的如大白菜等 ...