Ubuntu18.04发行已经有一段时间了,正好最近Tensorflow也发布了1.8版本,于是决定两个一起装上,以下是安装总结,大致可

以分为5个步骤

  1. 确认当前软件和硬件环境、版本
  2. 更新显卡驱动,软件版本准备
  3. CUDA 9.0 ToolKit安装
  4. cuDNN7.1.3 for CUDA9.0安装
  5. TensorFlow GPU 安装
  6. Test it!

1.确认硬件软件环境、版本

系统版本,Ubuntu18.04 自然没什么好说的, 使用指令sudo lsb_release -a ,得到以下输出结果

GCC和G++ 版本,18.04的ubuntu默认的是7.0,同时也有附带安装6.0,不过我们这次安装需要更低版本的GCC以及G++

  1. gcc --version #查看GCC版本号 gcc (Ubuntu 7.0 -4ubuntu8) 7.0
  2. g++ --version #查看G++版本号 g++ (Ubuntu 7.0-4ubuntu8) 7.0

我选择采用的是4.8版本gcc和g++,后面给出降级方法。

英伟达显卡驱动版本, 使用nvidia-smi 可以得到相关信息,我使用的是GTX1080显卡,驱动已经更新到390.48版本。

表头释义: 

Fan:显示风扇转速,数值在0到100%之间,是计算机的期望转速,如果计算机不是通过风扇冷却或者风扇坏了,显示出来就是N/A; 

Temp:显卡内部的温度,单位是摄氏度;

Perf:表征性能状态,从P0到P12,P0表示最大性能,P12表示状态最小性能;

Pwr:能耗表示; 

Bus-Id:涉及GPU总线的相关信息; 

Disp.A:是Display Active的意思,表示GPU的显示是否初始化; 

Memory Usage:显存的使用率; 

Volatile GPU-Util:浮动的GPU利用率;

Compute M:计算模式;

Python 版本, 使用python -V 查看相关信息。


2.更新显卡驱动,软件版本准备

主要是更新显卡驱动,以及降级默认GCC/G++版本.

如果是已经装过NVIDIA显卡驱动,通过以下指令升级

  1. sudo add-apt-repository ppa:graphics-drivers/ppa
  2. sudo apt update
  3. sudo apt install nvidia-390

如果有NVIDIA显卡,但是没有安装过显卡相应驱动,CUDA Toolkit中会有集成的384版本驱动,需要关闭图形界面到指令行界面

安装,相关方法请上网查找。

GCC降级

  1. sudo apt-get install gcc-4.8
  2. sudo apt-get install g++-4.8

装完后进入到/usr/bin目录下

  1. ls -l gcc*

会显示以下结果

  1. lrwxrwxrwx 1 root root 7th May 16 18:16 /usr/bin/gcc -> gcc-7.0

发现gcc链接到gcc-7.0, 需要将它改为链接到gcc-4.8,方法如下:

  1. sudo mv gcc gcc.bak #备份
  2. sudo ln -s gcc-4.8 gcc #重新链接

同理,对g++也做同样的修改:

  1. ls -l g++*
  2. lrwxrwxrwx 1 root root 7th May 15:17 g++ -> g++-7.0

需要将g++链接改为g++-4.8:

  1. sudo mv g++ g++.bak
  2. sudo ln -s g++-4.8 g++

再查看gcc和g++版本号:

  1. gcc -v
  2. g++ -v

均显示gcc version 4.8 ,说明gcc 48.8安装成功。


3.CUDA ToolKit 安装

CUDA 到CUDA9.0 下载页面下载runfile(最近NVIDIA官网被停)安装,Tensorflow官网给的暂时还是9.0版本,新版本可以尝试一下

稳妥起见,这里选择9.0。

下载9.0安装包和2个补丁包之后,

~/下载 文件夹应该有 以下三个文件

  1. ls |grep cuda_9.0
  2. cuda_9.0.176.1_linux.run
  3. cuda_9.0.176.2_linux.run
  4. cuda_9.0.176_384.81_linux.run

在确认GCC版本在4.8后, 直接输入以下指令

  1. sh cuda_9.0.176_384.81_linux.run --override

执行,如果有安装了显卡驱动的,注意在提问是否安装显卡驱动时选择no,其他 选择默认路径或者yes即可。 如果没有安装显卡

驱动,需要退出图形界面,到命令行终端安装,这里不再赘述。

安装完成后,可能会得到提示,CUDA 安装不完整,这是因为显卡驱动没有安装,这里忽略掉。同样的方法安装两个补丁包.

  1. sh cuda_9.0.176.1_linux.run
  2. sh cuda_9.0.176.2_linux.run

安装完毕之后,将以下两条加入.bashrc文件中

  1. echo 'export PATH=/usr/local/cuda-9.0/bin${PATH:+:${PATH}}' >> ~/.bashrc
  2. echo 'export LD_LIBRARY_PATH=/usr/local/cuda-9.0/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}' >> ~/.bashrc
  3. source ~/.bashrc

4.cuDNN7.1.3安装

cuDNN 到 cuDNN 官网页面下载即可,这里注意要选择对应CUDA9.0的软件包, 下载完毕后,切到默认的Downloads文件夹,

可以看到 cudnn-9.0-linux-x64-v7.1.tgz 压缩包

先解压,后复制到CUDA安装文件夹里面

  1. tar zxvf cudnn-9.0-linux-x64-v7.1.tgz
  1. sudo cp cuda/include/cudnn.h /usr/local/cuda/include
  2. sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64
  3. sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*

完成后,可以到~/NVIDIA_CUDA-9.0_Samples/文件夹下测试CUDA功能完整性

  1. cd /usr/local/cuda-8.0/samples/1_Utilities/deviceQuery
  2. sudo make
  3. ./deviceQuery


5.Tensorflow 安装

这里选择的是在本机上安装Tensorflow,其他安装方式可以参照官网介绍。

  1. pip install tensorflow-gpu

默认安装最新版本1.8,如果要安装教老版本, 上述指令后面加上==$版本号 即可。


6.验证测试

在python3 中输入以下代码

  1. # -*- coding: utf-8 -*-
  2. import tensorflow as tf
  3. import os
  4. os.environ['TF_CPP_MIN_LOG_LEVEL'] = '2'
  5. a = tf.constant([1.0,2.0],shape=[2],name='a')
  6. b = tf.constant([2.0,3.0],shape=[2],name='b')
  7. result = a+b
  8. print(result)
  9. print(a.graph is tf.get_default_graph)
  10. sess = tf.Session()
  11. print(sess.run(result))
  12. print(result)
  13. g = tf.Graph()
  14. with g.device('gpu:0'):
  15. result = a+b
  16. print(sess.run(result))

输出结果应该是 :

并且附带上GPU相关信息。

至此安装过程全部完成。


在终端执行程序时指定GPU

  1. CUDA_VISIBLE_DEVICES=1   python  your_file.py

这样在跑你的网络之前,告诉程序只能看到1号GPU,其他的GPU它不可见

可用的形式如下:

CUDA_VISIBLE_DEVICES=1           Only device 1 will be seen

CUDA_VISIBLE_DEVICES=0,1         Devices 0 and 1 will be visible

CUDA_VISIBLE_DEVICES="0,1"       Same as above, quotation marks are optional

CUDA_VISIBLE_DEVICES=0,2,3       Devices 0, 2, 3 will be visible; device 1 is masked

CUDA_VISIBLE_DEVICES=""          No GPU will be visible

在Python代码中指定GPU

  1. import os
  2. os.environ["CUDA_VISIBLE_DEVICES"] = "0"

设置定量的GPU使用量

  1. config = tf.ConfigProto() 
  2. config.gpu_options.per_process_gpu_memory_fraction = 0.9 # 占用GPU90%的显存 
  3. session = tf.Session(config=config)

设置最小的GPU使用量

  1. config = tf.ConfigProto() 
  2. config.gpu_options.allow_growth = True 
  3. session = tf.Session(config=config)  

Ubuntu18.04+CUDA9.0+cuDNN7.1.3+TensorFlow1.8 安装总结的更多相关文章

  1. Ubuntu18.04+CUDA9.0+cuDNN7.1.3+openface安装总结

    目录 前言 编译工具CMake C++标准库安装 下载OpenFace代码 OpenCV安装 luarocks-Lua 包管理器,提供一个命令行的方式来管理 Lua 包依赖.安装第三方 Lua 包等功 ...

  2. Ubuntu18.04 + CUDA9.0 + cuDNN7.3 + Tensorflow-gpu-1.12 + Jupyter Notebook深度学习环境配置

    目录 一.Ubuntu18.04 LTS系统的安装 1. 安装文件下载 2. 制作U盘安装镜像文件 3. 开始安装 二.设置软件源的国内镜像 1. 设置方法 2.关于ubuntu镜像的小知识 三.Nv ...

  3. Ubuntu18.04 + cuda9.0+cudnn7.0

    1 cannot find Toolkit in /usr/local/cuda-8.0 2017年05月27日 17:37:33 阅读数:2754  对于新版本ubuntukylin17.04安装C ...

  4. y7000笔记本 darknet-yolo安装与测试(Ubuntu18.04+Cuda9.0+Cudnn7.1)

    环境配置看上一贴 https://www.cnblogs.com/clemente/p/10386479.html 1 安装darknet 1-1 克隆darknet repo git clone h ...

  5. ubuntu18.04+ cuda9.0+opencv3.1+caffe-ssd安装

    详细Ubuntu18.04,CUDA9.0,OpenCV3.1,Tensorflow完全配置指南 问题1:使用Cmake编译opencv源码 CMake Error: The following va ...

  6. Ubuntu16.04 + cuda9.0 +cudnn7.1(转载)

    转载一个详细可用的ubuntu16.04+cuda9.0+cudnn7.1教程. 0 - 参考材料 https://blog.csdn.net/Umi_you/article/details/8026 ...

  7. ubuntun16.04+cuda9.0+cudnn7+anaconda3+pytorch+anaconda3下py2安装pytorch

    一.电脑配置 说明: 电脑配置: LEGION笔记本CPU Inter Core i7 8代GPU NVIDIA GeForce GTX1060Windows10 所需的环境: Anaconda3(6 ...

  8. Ubuntu16.04 + CUDA9.0 + cuDNN7.3 + Tensorflow-gpu-1.12 + Jupyter Notebook 深度学习环境配置

    目录 一.Ubuntu16.04 LTS系统的安装 二.设置软件源的国内镜像 1. 设置方法 2.关于ubuntu镜像的小知识 三.Nvidia显卡驱动的安装 1. 首先查看显卡型号和推荐的显卡驱动 ...

  9. 问题记录 | 配置ubuntu18.04+cuda9.0+cudnn服务器tensorflow-gpu深度学习环境

    因为实验室服务器资源有限,我被分配的服务器经常变化,但是常常就分到连显卡驱动以及cuda都没有装的服务器,真的很头疼,我已经配了四五台了,特此记录一下,以便以后直接照版本安装. Install nvi ...

随机推荐

  1. 动态新增删除tbody表格行与ajax请求完成后刷新父窗口问题

    获取tbody内的一行数据,包括hidden类型的数据$("#tbody_id").find("tr").each(function(){ var tdArr ...

  2. Django中如何将javascript中的变量传给位于javascript内的{% url %}中的参数?

    这个问题困扰了我一天,不知道困扰了你多久,希望能帮助你 django 中的url模版使用起来可以说是非常方便的,但是怎么在url模版中传入参数的 {% url "url.index" ...

  3. python学习笔记(十六)python操作redis数据库

    Redis是一个key-value存储系统,它支持丰富的数据类型,如:string.list.set.zset(sorted set).hash. Redis特点 Redis以内存作为数据存储介质,所 ...

  4. FTP错误 [ftp: connect: No route to host] 解决方法

    问题: 昨天在局域网内的两台机器上用ftp命令传文件.因为是新机器所以没安装ftp. 分别在两台机器上安装了ftp的服务端和客户端,并启动了ftp服务器进程. 当用启动ftp连接另一台机器时发生了如下 ...

  5. ### Error updating database. Cause: com.microsoft.sqlserver.jdbc.SQLServerException: 必须声明标量变量 "@P23@P24"。(sql少一个逗号)【??】

    (?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,[??],?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?, ...

  6. oracle系统对象

    select * from all_tab_comments-- 查询所有用户的表,视图等 select * from user_tab_comments  -- 查询本用户的表,视图等 select ...

  7. ERROR 1146 (42S02): Table 'mysql.servers' doesn't exist

    MySQL版本:mysql5.7.21 修改用户权限,刷新权限表,报1146 mysql> flush privileges; ERROR 1146 (42S02): Table 'mysql. ...

  8. EhCache缓存框架的使用

    EhCache 是一个纯Java的进程内缓存框架,具有快速.精干等特点,是Hibernate中默认的CacheProvider. 我们使用EhCache缓存框架主要是为了判断重复Url,每次爬取一个网 ...

  9. Java-package import关键字

    package包关键字,在java中,有包的概念,主要是用来归类 分类作用: 便于项目的开发和维护: 通过分包,可以很清晰的来管理类: 上述 一个类Animal: 在开头有个 package com. ...

  10. Windows 10 Shell命令

    可以在[win+R] run 窗口 和 explorer窗口中使用 在command prompt中使用: C:\Users\a>explorer shell:sendto “ shell:Ac ...