Ubuntu server16.04安装配置驱动418.87、cuda10.1、cudnn7.6.4.38、anaconda、pytorch超详细解决

本篇博文根据本人亲装碰到的问题搜集总结而成,具体参考见结尾REFERENCE

安装GCC

服务器版未装有gcc,但英伟达驱动安装需要gcc,尝试过换源、更新软件库、以及overstack的几种方法均未能解决,最终发现可以通过安装build-essential软件包来解决问题,它会安装一堆新包,包括gcc, g++和make。

sudo apt install build-essential

安装NVIDIA驱动

由于直接安装cuda如果选择安装驱动会直接版本较低的驱动,所以采用先装驱动后装cuda的方式。

1. 卸载原有驱动(没装跳过)

  1. 方法一、通用sudo apt-get remove –purge nvidia*
  2. 方法二、 非官网驱动sudo apt-get remove --purge nvidia(版本全称,如我的nvidia-384.130)
  3. 方法三、官网驱动 sh ./nvidia.run --uninstall

2. 禁用nouveau

安装NVIDIA需要先禁用系统自带的驱动

  1. 打开文件sudo gedit /etc/modprobe.d/blacklist.conf

  2. 在文本末尾添加

    blacklist nouveau
    option nouveau modeset=0

    无视warn

  3. wq, 执行sudo update-initramfs -u

  4. 检测,lsmod | grep nouveau,没有任何输出说明禁用成功

3. 安装NVIDIA显卡驱动

  1. 查看支持的驱动版本

    sudo apt-cache search nvidia*,一般安装大于等于最大的版本就好,我安装的是418.87

  2. 下载NVIDIA驱动,

    官网地址

  3. 禁用X服务(最好有一台备用电脑,因为这一步会黑屏...因为我是采用ssh连接,所以对我没影响)

    sudo service lightdm stop

  4. 给文件赋执行权限并cd到下载目录

    cd ~
    sudo chmod a+x NVIDIA-Linux-x86_64-384.130.run
  5. 安装

    sudo sh ./NVIDIA-Linux-x86_64-375.20.run –no-opengl-files

  6. 检测是否成功 nvidia-smi

安装CUDA10.1

  1. 官网地址

  2. 禁用X服务(黑屏)

    sudo service lightdm stop

  3. 给文件赋执行权限并安装

    sudo chmod a+x cuda_10.1.243_418.87.00_linux.run
    
    sudo sh cuda_10.1.243_418.87.00_linux.run --override

    accepted, 除了驱动不选择,其他都选。

  4. 打开配置文件 vim ~/.bashrc,末尾写入

    export PATH=/usr/local/cuda-10.1/bin:$PATH
    export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH

    生效 source ~/.bashrc

  5. 检测是否成功 nvcc -V

安装cudnn

  1. 官网下载,找到与cuda版本配对的cudnn,查看官网配对,以及更全的版本配对,我的cuda为10.1所以,cudnn选的是7.6.4

  2. 将下载的添加为压缩包并解压

    # compression
    cp cudnn-8.0-linux-x64-v5.1.solitairetheme8 good.tgz
    # decompression
    tar -xvf good.tgz
  3. 安装,其实就是改变文件位置和权限

    sudo cp cuda/include/cudnn.h /usr/local/cuda/include/
    $ sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64/ -d
    $ sudo chmod a+r /usr/local/cuda/include/cudnn.h
    $ sudo chmod a+r /usr/local/cuda/lib64/libcudnn*
  4. 查看cudnn版本:

    cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2


以上便配置好服务器,以下为非root用户根据需要安装。

我安装的是anaconda、tensorflow、pytorch

安装anaconda

  1. 卸载anaconda(如有) rm-rf ~/anaconda,然后修改配置文件~/.bashrc

  2. 官网下载并安装

  3. 配置文件/home/yourusername/.profile,在最后一行添加如下

    # Anaconda
    export PATH=$PATH:/home/username/anaconda3/bin

    生效 source /home/username/.profile

安装tensorflow

查看官网配对,确定安装版本

# 如果你安装的是 Python 3.6 版的Anaconda:
conda create --name tf_gpu_env tensorflow-gpu # tf_gpu_env是这个环境的名字 # 如果你安装的是 Python 3.7 版的Anaconda,则需要声明新创建的环境使用 Python 3.6:
conda create --name tf_gpu_env python=3.6 anaconda tensorflow-gpu

安装pytorch

  1. 新建虚拟环境并激活环境

    conda create -n pytorch python=3.7
    activate pytroch
  2. 查看官网选择版本,获得代码

    如我的

解决问题:

  1. ERROR: Cannot uninstall 'wrapt'. during upgrade
  2. tensorboard 1.14.0 has requirement setuptools>=41.0.0, but you'll have setuptools 39.1.0

Reference

https://blog.csdn.net/zhang970187013/article/details/81012845

https://www.linuxidc.com/Linux/2019-06/159059.htm

https://blog.csdn.net/Eddy_zheng/article/details/52910249

https://blog.csdn.net/DarrenXf/article/details/82182449

https://blog.csdn.net/qq_41620607/article/details/81236525

https://www.cnblogs.com/onemorepoint/p/7453766.html

https://blog.csdn.net/qq_22474567/article/details/54984257

https://blog.csdn.net/yuejisuo1948/article/details/81043962

https://github.com/tensorflow/tensorflow/issues/30191

https://blog.csdn.net/weixin_44179909/article/details/96973208

https://zhuanlan.zhihu.com/p/59278962

Ubuntu server16.04安装配置驱动418.87、cuda10.1、cudnn7.6.4.38、anaconda、pytorch超详细解决的更多相关文章

  1. 【科研民工笔记2】Ubuntu 16.04 安装nvidia驱动

    我的主机是2060的显卡,用的是安装在U盘中的Ubuntu,开机进入后,因为没有安装驱动,所以界面看以来比较大. 通过手动方式,成功安装驱动,最终成功的方案使用的是run文件安装的方式. 1.手动下载 ...

  2. Ubuntu 18.04安装配置Apache Ant

    Ubuntu 18.04安装配置Apache Ant 文章目录 Ubuntu 18.04安装配置Apache Ant 下载 执行以下命令 `/etc/profile`中配置环境变量 载入配置 测试 执 ...

  3. Ubuntu 18.04 安装配置 go 语言

    Ubuntu 18.04 安装配置 go 语言 1.下载 下载 jdk 到 Downloands 文件夹下 cd 进入 /usr/local, 创建 go 文件夹, 然后 cd 进这个文件夹 cd / ...

  4. Ubuntu 16.04 安装显卡驱动后循环登录和无法设置分辨率的一种解决方案

    1. 安装环境 电脑:MSI GP63 显卡:GeForce GTX 1070 系统:Ubuntu 16.04 驱动版本:NVIDIA 384.130 2. 循环登录 如果按照这篇文章 Ubuntu ...

  5. Ubuntu 18.04 安装配置 MySQL 5.7

    Ubuntu 18.04 安装 mysql 的过程中,竟然没有让你输入秘密?!(之前在 Ubuntu 14.04 下,安装过程中会询问密码),这导致安装完 mysql 初始秘密不知道的问题. $ su ...

  6. 【转】Ubuntu 16.04安装配置TensorFlow GPU版本

    之前摸爬滚打总是各种坑,今天参考这篇文章终于解决了,甚是鸡冻\(≧▽≦)/,电脑不知道怎么的,安装不了16.04,就安装15.10再升级到16.04 requirements: Ubuntu 16.0 ...

  7. Ubuntu 14.04 安装配置备忘录

    完全在 Linux 下工作,大概有3年时间了. 之前都是用 Windows, 而把 Linux 装在虚拟机里,现在反过来,把 Windows 装在了虚拟机里,只是因为偶尔还要用网银的缘故. 以我这几年 ...

  8. ubuntu 12.04 安装无线网卡驱动

    安装ubuntu 12.04后,无线网卡不可用,采用以下方式解决: 1.在终端中运行如下命令,重新安装b43相关的全部驱动和firmware: sudo apt-get install bcmwl-k ...

  9. Ubuntu 16.04安装NVIDIA驱动后循环登录问题

    问题描述 最近买了两块NVIDIA Titan X Pascal显卡装到了服务器(运行Ubuntu 16.04)上.为了使用这两块GPU显卡,首先需要安装显卡驱动,安装方式为 #安装一个依赖文件,并更 ...

随机推荐

  1. Java连载23-for循环练习、while\dowhile详解

    一.for循环练习 1.例子:输入九九乘法表 public class d23_{ public static void main(String[] args) { for(int i = 1;i&l ...

  2. Java 安全之:csrf防护实战分析

    上文总结了csrf攻击以及一些常用的防护方式,csrf全称Cross-site request forgery(跨站请求伪造),是一类利用信任用户已经获取的注册凭证,绕过后台用户验证,向被攻击网站发送 ...

  3. Delphi - cxGrid内容xlsx、xls、csv格式导出

    .xls格式导出,uses中添加cxGridExportLink 代码如下: function SaveToExcel(gridMain: TcxGrid; FileName: string): st ...

  4. 小白专场-多项式乘法与加法运算-c语言实现

    目录 一.题意理解 二.求解思路 三.多项式的表示 3.1 数组 3.2 链表 四.程序框架搭建 五.如何读入多项式 六.如何将两个多项式相加 七.如何将两个多项式相乘 八.如何将多项式输出 一.题意 ...

  5. 图解Nginx限流配置

    本文以示例的形式,由浅入深讲解Nginx限流相关配置,是对简略的官方文档的积极补充. Nginx限流使用的是leaky bucket算法,如对算法感兴趣,可移步维基百科先行阅读.不过不了解此算法,不影 ...

  6. python编写排列组合,密码生产功能

    python编写排列组合 python在编写排列组合是会用到  itertools 模块 排列 import itertools mylist = list(itertools.permutation ...

  7. 牛客网暑期ACM多校训练营(第三场)---A.PACM Team

    链接:https://www.nowcoder.com/acm/contest/141/A 来源:牛客网 题目描述 Eddy was a contestant participating in ACM ...

  8. Python作业本——第3章 函数

    今天看完了第三章,习题都是一些概念性的问题,就不一一解答了. 实践项目是创建一个Collatz序列,并且加上验证输入是不是一个整数. def collatz(number): if number % ...

  9. mysql之explain详解

    mysql之explain详解 mysql之explain各个字段的详细意思: 字段 含义 select_type 分为简单(simple)和复杂 type all : 即全表扫描 index : 按 ...

  10. ASN1编码中的OID

    0.9.2342.19200300.100.1.25, domainComponent1.2.36.68980861.1.1.10, Signet pilot1.2.36.68980861.1.1.1 ...