ubuntu16.04下安装配置深度学习环境（一、cuda7.5的安装）

1.下载所需要的软件

cuda7.5下载（点击下载链接），cudnn4.0下载

2.安装NVIDIA驱动。

一般有两种方法：1）一种方法是利用“软件和更新”来安装，依次选择系统设置->软件和更新->附加驱动->选择最新的驱动->应用更改

安装时可能遇到的问题：点击完应用更改一段时间后并没有成功安装，再次点击却出现闪退的现象，这个问题困扰了我一晚上，最后发现是因为依赖的问题，通过在终端输入以下命令：sudo apt-get install -f 后再次安装问题就解决了

2）方法二就是下载安装包后通过命令行安装，因为这个比较麻烦，我没有尝试，看网上其他教程说需要关了xwindows安装才行。

3.安装cuda7.5

（1）在终端cd到所下载的安装包所在的目录，输入sh cuda_7.5.18_linux.run --override

跑起来后一路空格完那些协议，然后输入accept，除了有一个是让安装驱动的选择N外，其他的一路Y下去

（2）安装cudnn（这个是GPU加速用的）

解压下载好的安装包，在终端输入以下命令：

sudo cp cudnn.h /usr/local/cuda/include/

cd ~/cuda/lib64

sudo cp lib* /usr/local/cuda/lib64/

cd /usr/local/cuda/lib64/ sudo rm -rf libcudnn.so libcudnn.so.4 sudo ln -s libcudnn.so.4.0.7 libcudnn.so.4 sudo ln -s libcudnn.so.4 libcudnn.so

然后设置环境变量

sudo gedit /etc/profile

在末尾加入

export PATH=/usr/local/cuda/bin:$PATH export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH

保存之后创建链接文件

sudo vim /etc/ld.so.conf.d/cuda.conf

键盘按i进入编辑状态，添加文字

/usr/local/cuda/lib64

然后按esc，输入:wq保存退出。

终端下接着输入

sudo ldconfig 使链接生效

3.生成Cuda Sample测试

（1）首先在此之前先把需要的依赖包都安装好，为接下来make caffe做准备

sudo apt-get install libprotobuf-dev libleveldb-dev libsnappy-dev libopencv-dev libhdf5-serial-dev protobuf-compiler

sudo apt-get install --no-install-recommends libboost-all-dev

sudo apt-get install libatlas-base-dev

sudo apt-get install libgflags-dev libgoogle-glog-dev liblmdb-dev

（2）更改gcc版本（我一开始没有更改，直接make没有报错，但make玩后测试出错，所以这里最好是改一下，如果报报错“unsupported GNU version! gcc versions later than 4.9 are not supported!”错误，那就一定得改了）原因就是这个cuda不支持gcc5.0以上

cd /usr/local/cuda-7.5/include

cp host_config.h host_config.h.bak

sudo gedit host_config.h

Ctrl+F寻找有”4.9”的地方，应该是只有一处，在其上方的

#if __GNUC__ > 4 || (__GNUC__ == 4 && __GNUC_MINOR__ > 9)将两个4改成5，保存退出，继续

cd /home/gomee/NVIDIA_CUDA-7.5_Samples

（3）正式开始make example了

终端输入 make all -j4 (j4代表开多少个线程，一般你的电脑是几核的就开几个)

这就应该开始make了，此处大约有4,5分钟。完成之后

cd /home/gomee/NVIDIA_CUDA-7.5_Samples/bin/x86_64/linux/realease

./deviceQuery

如果出现如下信息

CUDA Device Query (Runtime API) version (CUDART static linking)

Detected 1 CUDA Capable device(s)

Device 0: "GeForce GT 650M"
CUDA Driver Version / Runtime Version          8.0 / 7.5
CUDA Capability Major/Minor version number:    3.0
Total amount of global memory:                 1999 MBytes (2096300032 bytes)
( 2) Multiprocessors, (192) CUDA Cores/MP:     384 CUDA Cores
GPU Max Clock rate:                            885 MHz (0.88 GHz)
Memory Clock rate:                             2000 Mhz
Memory Bus Width:                              128-bit
L2 Cache Size:                                 262144 bytes
Maximum Texture Dimension Size (x,y,z)         1D=(65536), 2D=(65536, 65536), 3D=(4096, 4096, 4096)
Maximum Layered 1D Texture Size, (num) layers 1D=(16384), 2048 layers
Maximum Layered 2D Texture Size, (num) layers 2D=(16384, 16384), 2048 layers
Total amount of constant memory:               65536 bytes
Total amount of shared memory per block:       49152 bytes
Total number of registers available per block: 65536
Warp size:                                     32
Maximum number of threads per multiprocessor: 2048
Maximum number of threads per block:           1024
Max dimension size of a thread block (x,y,z): (1024, 1024, 64)
Max dimension size of a grid size    (x,y,z): (2147483647, 65535, 65535)
Maximum memory pitch:                          2147483647 bytes
Texture alignment:                             512 bytes
Concurrent copy and kernel execution:          Yes with 1 copy engine(s)
Run time limit on kernels:                     Yes
Integrated GPU sharing Host Memory:            No
Support host page-locked memory mapping:       Yes
Alignment requirement for Surfaces:            Yes
Device has ECC support:                        Disabled
Device supports Unified Addressing (UVA):      Yes
Device PCI Domain ID / Bus ID / location ID:   0 / 1 / 0
Compute Mode:
     < Default (multiple host threads can use ::cudaSetDevice() with device simultaneously) >

deviceQuery, CUDA Driver = CUDART, CUDA Driver Version = 8.0, CUDA Runtime Version = 7.5, NumDevs = 1, Device0 = GeForce GT 650M
Result = PASS
证明cuda安装成功。

ubuntu16.04下安装配置深度学习环境（一、cuda7.5的安装）的更多相关文章

ubuntu16.04下安装配置深度学习环境（Ubuntu 16.04/16.10+ cuda7.5/8+cudnn4/5+caffe）
主要参照以下两篇博文:http://blog.csdn.net/g0m3e/article/details/51420565 http://blog.csdn.net/xuzhongxiong/a ...
Faster-RCNN-TensorFlow-Python3.5 在Ubuntu16.04下的配置方法
目录 Faster-RCNN-TensorFlow-Python3.5 在Ubuntu16.04下的配置方法安装过程 1. 深度学习环境Tensorflow的安装 2. 安装python包 3. ...
ubuntu18+gtx1060 +cuda9+cudnn-v7+opencv3.1.0 配置深度学习环境
将笔记本的ubuntu系统更新到18版本后重新配置深度学习环境,在此记载方便日后参考具体配置为 Ubuntu18.04+gtx1060+opencv-3.1 第1步安装依赖包 sudo apt-g ...
ubuntu16.04下Hyperledger之搭建Fabric环境简单操作(五步启动e2e_cli)
如果你已经安装好go等工具.git及checkout相关代及下载相关镜像,您只需下面5步就能up e2e_cli~/go/src/github.com/hyperledger/fabric$ sudo ...
安装 Win10 & Ubuntu 16.04 双系统以及 Ubuntu 配置深度学习环境记录
0. 前言坑爹的Ubuntu晚上运行还是好好的,第二天中午的时候打开机器发现屏幕分辨率不正常了:2K屏显示800*600左右的分辨率(无法调节),一个图标一拳头大,窗口和网页显示不全.Google查 ...
Windows配置深度学习环境详细教程（一）：安装Pycharm和Miniconda、conda环境介绍
序言对于想要入门Python或者深度学习的初学者而言,配置环境一直是一个令人头疼的问题.相信有许多人经历过安装第三方包失败,安装好了却在使用中报错,安装CUDA.tensorflow.pytorch ...
【系统配置】Ubuntu和Windons系统安装配置深度学习环境
Ubuntu系统 1.备份在服务器上整个装系统之前,需要做好一个工作,也就是相关重要数据的备份,这里主要是将固态中的数据备份到机械硬盘或移动硬盘里,可能在备份的过程中会遇到无法写入的问题,是因为文件 ...
Ubuntu16.04下搭建mysql + uwsgi + nginx环境启动flask 项目
1.安装mysql Sudo apt-get install mysql 配置mysql的数据存储路径,默认在 /var/lib/mysql sudo cp -R /var/lib/mysql/* / ...
Ubuntu深度学习环境搭建 tensorflow+pytorch
目前电脑配置:Ubuntu 16.04 + GTX1080显卡配置深度学习环境,利用清华源安装一个miniconda环境是非常好的选择.尤其是今天发现conda install -c menpo o ...

随机推荐

写了一个复杂的sql语句
$sp_sql = "select sp_ProductNo, sp_ProductName,sp_Standard,sp_Unit,sum(sp_Amount) as amount fro ...
在DataGrid中实现Button Command
Command="{Binding butCommand}"会默认查找ListViewItems中对象的属性,而你的ListViewItems中对象应该不包括butCommand属 ...
MI & CI
目前,很多特征选择文献主要是依据对共信息的直观认识使用它,即:正值表示表型的存在使特征间依赖程度增加,是特征间存在相互作用的证据:负值表示表型的存在使特征间冗余性增加:零表示特征是相互独立的,或者说, ...
第四组UI组件：AdapterView及子类
AdapterView组件是一组重要的组件,AdapterView本省是一个抽象基类,它派生的子类在用法上十分相似,只是显示界面与一定的区别,因此这次针对它们的共性集中讲解,并突出介绍他们的区别. A ...
Velocity教程
Velocity 语法(转) 一.基本语法 1."#"用来标识Velocity的脚本语句,包括#set.#if .#else.#end.#foreach.#end.#iinclud ...
css块级标签，行内标签，行内块标签的转换（2）
css块级标签,行内标签,行内块标签的转换版权声明本文原创作者:雨点的名字作者博客地址:https://home.cnblogs.com/u/qdhxhz/ 在基础1中,我详细讲 ...
es6笔记6^_^generator
1.简介 Generator函数是一个函数的内部状态的遍历器(也就是说,Generator函数是一个状态机). 形式上,Generator函数是一个普通函数,但是有两个特征. function命令与函 ...
SPI在linux3.14.78 FS_S5PC100（Cortex A8）和S3C2440上驱动移植(deep dive)
由于工作的原因,对SPI的理解最为深刻,也和SPI最有感情了,之前工作都是基于OSEK操作系统上进行实现,也在US/OS3上实现过SPI驱动的实现和测试,但是都是基于基本的寄存器操作,没有一个系统软件 ...
SQL关键字转换大写核心算法实现
1 不跟你多废话上代码! /// <summary> /// SQL关键字转换器 /// </summary> public class SqlConverter : IKe ...
WinForm 控件（上）
窗体的事件每一个窗体都有一个事件,这个窗体加载完成之后执行哪一段代码位置:1)右键属性→事件→load 双击进入 2)双击窗体任意一个位置进入删除事件:先将事件页面里面的挂好的事件删除,再删后台 ...

ubuntu16.04下安装配置深度学习环境（一、cuda7.5的安装）

ubuntu16.04下安装配置深度学习环境（一、cuda7.5的安装）的更多相关文章

随机推荐

热门专题