本文是在宿主机Ubuntu16.04上拉取cuda10.1-cudnn7-ubuntu18.04的镜像,在容器中通过Miniconda3创建python3.7.5的环境并成功安装mindspore_gpu_1.0.1;

一、前期踩过的坑

二、安装成功的流程

【1】拉取cuda10.1-cudnn7-ubuntu18.04的镜像
【2】镜像内创建容器,此处一定是nvidia-docker创建
【3】在容器内安装Miniconda
【4】使用conda创建python3.7.5的虚拟环境并激活
【5】通过可执行文件安装mindspore_gpu_1.0.1.whl并测试

一、前期踩过的坑

在ubuntu上安装GPU版本mindspore的具体流程


主要有以下几点:

1. Ubuntu18.04(系统版本至少为18.04及以上) :
基于我使用的是共用版Ubuntu16.04的服务器,无法直接升级,只能通过容器方式,拉取Ubuntu18.04的镜像;

2. cuda10.1 (cuda版本必须为10.1):
3. cudnn >= 7.6 (cudnn7.6.5可行,但cudnn8是会报错的):

因Nvidia提供了[cuda+cudnn+ubuntu的镜像](https://hub.docker.com/r/nvidia/cuda),
所以可以一次性拉取需要的cuda10.1-cudnn7-ubuntu18.04的镜像;

因要求的是cudnn>=7.6,所以最开始拉取的是cudnn8版本的,一直报错 `libcudnn.so.7: cannot open shared object file: No such file or directory` ,后改为cudnn7版本就没报错了;

4. devel和runtime版本区别:本文选择devel版

找到cuda10.1-cudnn7-ubuntu18.04,(cudnn7它标明的是cudnn7.6.5)发现有两个版本cuda devel和cuda runtime:

官方解释:
devel是说只涵盖了开发bai所需的所有工具,包含编译、debug等,以及编译需要的头文件、静态库。
runtime是说只涵盖了运行环境的最小集合,例如动态库等
所以runtime的镜像大小会比devel小一些

5. docker与nvidia-docker的区别:

docker创建的容器里需要再次安装nvidia-driver,且需要容器里的nvidia-driver版本与宿主机里的nvidia-driver版本一致,才能在容器里使用GPU;

nvidia-docker创建的容器,只需要在宿主机上安装nvidia-driver,容器内就可以直接使用GPU;

安装nvidia-docker之前必须在宿主机上安装nvidia-driver和docker;

  1. nvidia-smi # 检查宿主机是否安装了 nvidia-driver
  2. docker version # 检查宿主机上安装的docker版本
  3. nvidia-docker version # 检查宿主机上安装的nvidia-docker版本

二、 安装成功的流程

【1】拉取nvidia/cuda:10.1-cudnn8-devel-ubuntu18.04的镜像

为避免不必要的错误,后续使用的全部都是nvidia-docker

选择devel版本

  1. nvidia-docker pull nvidia/cuda:10.1-cudnn7-devel-ubuntu18.04

【2】镜像内创建容器,此处一定是nvidia-docker创建

  1. nvidia-docker run -it nvidia/cuda:10.1-cudnn7-devel-ubuntu18.04 /bin/bash

【3】在容器内安装Miniconda

因为在容器内使用wget下载miniconda一直失败,所以选择在windows上下载并上传至ubuntu宿主机上,再从ubuntu宿主机上拷贝至容器内;

  1. nvidia-docker cp miniconda3.sh路径 containerID:/ # 退出容器,并将miniconda3.sh 文件拷贝至容器根目录下
  2.  
  3. nvidia-docker start containerID # 启动容器并进入
  4. nvidia-docker exec -it containerID /bin/bash
  5.  
  6. bash Miniconda3-latest-Linux-x86_64.sh # 安装miniconda

【4】使用conda创建python3.7.5的虚拟环境并激活

安装miniconda后需先退出容器再进入,才能再容器中使用conda

  1. conda create -n mindspore1.0.1 python=3.7.5 # conda create -n 虚拟环境名 指定python版本

  1. conda activate mindspore1.0.1 # 激活指定环境

同上,windows上下载mindspore_gpu_1.0.1.whl,并拷贝至容器内;

【5】通过可执行文件安装mindspore_gpu_1.0.1.whl并测试;

  1. pip install mindspore_gpu-1.0.1-cp37-cp37m-linux_x86_64.whl

安装完成后,在python环境下执行以下代码

  1. import numpy as np
  2. from mindspore import Tensor
  3. from mindspore.ops import functional as F
  4. import mindspore.context as context
  5.  
  6. context.set_context(device_target="GPU")
  7. x = Tensor(np.ones([1,3,3,4]).astype(np.float32))
  8. y = Tensor(np.ones([1,3,3,4]).astype(np.float32))
  9. print(F.tensor_add(x, y))

如果出现以下,则说明安装成功:

【MindSpore】Ubuntu16.04上成功安装GPU版MindSpore1.0.1的更多相关文章

  1. 【Caffe】Ubuntu16.04上配置安装caffe(Only CPU)

    一.首先看看自己的系统,Ubuntu16.04,cpu,没有Nvidia,没有opencv 二.安装依赖包 安装protobuf,leveldb,snappy,OpenCV,hdf5, protobu ...

  2. zabbix在ubuntu16.04上的安装

    开始安装 zabbix具体安装可以参考官方文档写的很详细,令人高兴的是现在有了中文的版本的翻译,这里简要说下. 上篇文章我写了在ubuntu14.04上安装zabbix,见这里http://www.c ...

  3. 深度学习环境搭建(ubuntu16.04+Titan Xp安装显卡驱动+Cuda9.0+cudnn+其他软件)

    一.硬件环境 ubuntu 16.04LTS + windows10 双系统 NVIDIA TiTan XP 显卡(12G) 二.软件环境 搜狗输入法 下载地址 显卡驱动:LINUX X64 (AMD ...

  4. ubuntu16.04+Titan Xp安装显卡驱动+Cuda9.0+cudnn

    硬件环境 ubuntu 16.04LTS + windows10 双系统 NVIDIA TiTan XP 显卡(12G) 软件环境 搜狗输入法 显卡驱动:LINUX X64 (AMD64/EM64T) ...

  5. 【MindSpore】Docker上成功使用MindSpore1.0.0的GPU版本

    本文是在宿主机Ubuntu16.04上安装Docker(nvidia-docker),并成功进行MindSpore1.0.0的GPU训练: Ubuntu 16.04 Docker Nvidia-doc ...

  6. Ubuntu16.04上安装cudnn教程和opencv

    https://blog.csdn.net/wang15061955806/article/details/80791112 Ubuntu16.04上安装cudnn教程 2018年06月24日 14: ...

  7. Ubuntu16.04上用源代码安装ICE

    ubuntu16.04上用源代码安装ICE

  8. Ubuntu16.04上安装neo4j数据库

    什么是neo4j数据库? neo4j数据库是图数据库的一种,属于nosql的一种,常见的nosql数据库还有redis.memcached.mongDB等,不同于传统的关系型数据库,nosql数据也有 ...

  9. 在ubuntu16.04上安装eclipse

     在ubuntu16.04上安装eclipse 一.下载     首先我们需要安装jdk1.8及其以上,然后从官网:https://www.eclipse.org/downloads/上下载,需要注意 ...

随机推荐

  1. Tarjan算法求割点

    (声明:以下图片来源于网络) Tarjan算法求出割点个数 首先来了解什么是连通图 在图论中,连通图基于连通的概念.在一个无向图 G 中,若从顶点i到顶点j有路径相连(当然从j到i也一定有路径),则称 ...

  2. python的pip快速安装代码

    pip install xx,经常由于网速,或者安装版本问题导致安装速度慢超时等问题, 现提供一个py镜像安装代码,安装库文件前执行下这个程序,可以很快下载 cmd 进入命令提示符 python .p ...

  3. MySQL 5.x乱码问题解决

    MySQL是一款常用的开源数据库软件,但是对于初次使用者好像并不是太友好,MySQL5.x的版本中默认字符集是latin1也就是我们所知道的ISO-8859-1字符集,这个字符集编码并没有包含汉字,所 ...

  4. workerman搭建聊天室

    首先,先打开官网手册   http://doc.workerman.net/ 根据手册里安装里的提示,完成环境检测,和安装对应的扩展,并把对应的WorkerMan代码包下载解压至根目录 在根目录下创建 ...

  5. ctf-misc-图片隐写术套路总结

    1.直接右键notepad打开,搜索flag,如果图片很多的话,可以写py脚本也    可以打开后搜索全部打开文件 2.是一个压缩包,改了后缀 3.图片中藏了一个二维码,用Stegsolve加几次滤镜 ...

  6. lca(lowestCommonAncestor)

  7. 03生成微博授权URL接口

    1.创建apps/oauth模块进行oauth认证 '''2.1 在apps文件夹下新建应用: oauth''' cd syl/apps python ../manage.py startapp oa ...

  8. 记一次Ddos遭遇

    万年不用的vps最近借朋友用了几天,今天突然跟我说连不上了 上服务器先暴力重启一波 还是不行,netstat一看 端口的连接状态是这个样子: 估计连接被打满了,遂换了个端口 重启之 问题解决

  9. JQuery 和 Bootstrap

    https://jquery.com/ 1. JQuery  的基础语法 $(select).action() 2. 查找标签 基本选择器 class选择器: $(".className&q ...

  10. JZOJ2020年9月5日提高组反思

    JZOJ2020年9月5日提高组反思 T1 考试的时候没有头绪,就打了个暴力,愉快的拿到了10分的\(impossible\) 正解是\(DP\),设\(f[i][j][k]\)表示地\(i\)种币值 ...