安装基础包

yum -y install epel-release
yum -y install kernel-devel
yum -y install dkms

编辑文件 /etc/default/grub 修改 “GRUB_CMDLINE_LINUX
rd.driver.blacklist=nouveau nouveau.modeset=0

grub2-mkconfig -o /boot/grub2/grub.cfg

重启

安装显卡驱动

下载显卡驱动

 
 
下载完成是类似这样的文件 NVIDIA-Linux-x86_64-410.72.run 直接执行即可,
卸载 直接接参数 --uninstall
 
 
验证驱动是否正常
nvidia-smi

安装CUDA 9.0

我们使用rpm的方式安装

https://developer.nvidia.com/cuda-91-download-archive?target_os=Linux&target_arch=x86_64&target_distro=CentOS&target_version=7&target_type=rpmlocal

需要把patch也一并下载

-rw-r--r-- 1 root root   155023660 Jul 14  2018 cuda-repo-rhel7-9-0-176-local-patch-4-1.0-1.x86_64.rpm
-rw-r--r-- 1 root root  1595730326 Sep 23  2017 cuda-repo-rhel7-9-0-local-9.0.176-1.x86_64.rpm
-rw-r--r-- 1 root root   150679337 Dec 21  2017 cuda-repo-rhel7-9-0-local-cublas-performance-update-1.0-1.x86_64.rpm
-rw-r--r-- 1 root root   149765568 Feb 15  2018 cuda-repo-rhel7-9-0-local-cublas-performance-update-2-1.0-1.x86_64.rpm
-rw-r--r-- 1 root root   173037836 May 24  2018 cuda-repo-rhel7-9-0-local-cublas-performance-update-3-1.0-1.x86_64.rpm

在安装时,可能会有写软件包有冲突,比如ipa-client, salt-minion等, 我们可以暂时先把有冲突的卸载,回头在装回来

冲突的原因是用yum安装了python的模块,会造成python的pip管理有问题, 所以有冲突

rpm -ivh 安装完这些rpm 还没完事, 它其实只是解压在了/var目录

(paddle-venv) root@algorithmgpu-11-123:/var# ls -ld /var/cuda*
drwxr-xr-x 3 root root  138 Aug  6 11:48 /var/cuda-repo-9-0-176-local-patch-4/
drwxr-xr-x 3 root root 4096 Aug  6 11:56 /var/cuda-repo-9-0-local/
drwxr-xr-x 3 root root  138 Aug  6 11:48 /var/cuda-repo-9-0-local-cublas-performance-update/
drwxr-xr-x 3 root root  138 Aug  6 11:48 /var/cuda-repo-9-0-local-cublas-performance-update-2/
drwxr-xr-x 3 root root  182 Aug  6 11:48 /var/cuda-repo-9-0-local-cublas-performance-update-3/

我们需要在进入这些目录安装里面的rpm, 安装也是有顺序的

  1. /var/cuda-repo-9-0-local/   rpm -ivh *
  2. /var/cuda-repo-9-0-local/   rpm -Uvh *    其余patch依次按顺序

这样cuda就安装完成了, 安装目录在 /usr/local/cuda-9.0

下面配置环境变量

cat /etc/profile.d/cuda.sh
export LD_LIBRARY_PATH=/usr/local/cuda/lib64/:${LD_LIBRARY_PATH}
export PATH=/usr/local/cuda/bin/:${PATH}

导入一下环境变量  source  /etc/profile

安装cudnn-9.0-linux-x64-v7.1

下载上面的版本
https://developer.nvidia.com/rdp/cudnn-download
安装
https://docs.nvidia.com/deeplearning/sdk/cudnn-install/index.html
其实只是拷贝到对应目录
 
 
$ sudo cp cuda/include/cudnn.h /usr/local/cuda/include
$ sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64
$ sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*

编译安装paddle

文档

https://paddlepaddle.org.cn/documentation/docs/zh/1.5/beginners_guide/install/compile/compile_CentOS.html

注意这句话 执行编译前请您确认在虚环境中安装有编译依赖表中提到的相关依赖:

我们使用本机编译的方法, 非docker

照着文档一步步做就可以了

tips

make -j$(nproc) 这个命令执行时间可能得半天,根据不同网络而定

因为要下载很多git上的仓库

最后这个paddle的目录有 8.4G

GPU机器安装paddle的更多相关文章

  1. 百度Paddle速查_CPU和GPU的mnist预测训练_模型导出_模型导入再预测_导出onnx并预测

    需要做点什么 方便广大烟酒生研究生.人工智障炼丹师算法工程师快速使用百度PaddelPaddle,所以特写此文章,默认使用者已有基本的深度学习概念.数据集概念. 系统环境 python 3.7.4 p ...

  2. 百度Paddle会和Python一样,成为最流行的深度学习引擎吗?

    PaddlePaddle会和Python一样流行吗? 深度学习引擎最近经历了开源热.2013年Caffe开源,很快成为了深度学习在图像处理中的主要框架,但那时候的开源框架还不多.随着越来越多的开发者开 ...

  3. 使用 paddle来进行文本生成

    paddle 简单介绍 paddle 是百度在2016年9月份开源的深度学习框架. 就我最近体验的感受来说的它具有几大优点: 1. 本身内嵌了许多和实际业务非常贴近的模型比如个性化推荐,情感分析,词向 ...

  4. Google Colab 免费GPU服务器使用教程

    Google免费GPU使用教程(亲测可用)   今天突然看到一篇推文,里面讲解了如何薅资本主义羊毛,即如何免费使用Google免费提供的GPU使用权. 可以免费使用的方式就是通过Google Cola ...

  5. window 10 安装paddlepaddle 1.7 GPU版本

    window 10 安装paddlepaddle 1.7 GPU版本 1)更新显卡驱动 2)安装cuda 10 https://developer.nvidia.com/cuda-10.0-downl ...

  6. 安装paddle的问题,报错Can not find library: libcudnn.so. The process maybe hang.

    今天在服务器上安装paddle的GPU版时报错 报错截图如下: 其实报错已经提示的很明显了,就是要添加一个环境变量.但我想到我之前并没有在全局环境下安装cudnn,以为是这个原因.因为之前安装pyto ...

  7. Paddle源码之内存管理技术

    前言 在深度学习模型训练中,每次迭代过程中都涉及到Tensor的创建和销毁,伴随着的是内存的频繁 malloc和free操作,可能对模型训练带来不必要的 overhead. 在主流的深度学习框架中,会 ...

  8. Paddle Inference推理部署

    Paddle Inference推理部署 飞桨(PaddlePaddle)是集深度学习核心框架.工具组件和服务平台为一体的技术先进.功能完备的开源深度学习平台,已被中国企业广泛使用,深度契合企业应用需 ...

  9. Paddle Release Note

    Paddle Release Note 重要更新 飞桨paddle框架2.0.0版本有如下重要更新: 编程范式:默认开启动态图模式进行模型开发和训练,通过动转静的方式进行模型部署和训练加速.如果需要使 ...

随机推荐

  1. ajax请求数据时,get和post的区别

    发送机制 1.get请求会将参数跟在URL后面进行参数传递,而post请求则是作为http消息的实体内容发送给web服务器: 2.get提交的数据限制是1024字节,这种显示是来自特定浏览器和服务器对 ...

  2. scala 学习笔记--模式匹配

    1.switch java代码 switch (cause) { case ‘2‘ : dropTime=time; case ‘8’:case ‘9’ : case ‘10’:case ‘11’ : ...

  3. Supercharging your ETL with Airflow and Singer

    转自:https://www.stitchdata.com/blog/supercharging-etl-with-airflow-and-singer/ singer 团队关于singer 与air ...

  4. 关于singer elt 的几篇很不错的文章

    以下是链接来自singer 团队的实践,很不错,值得学习 参考连接 https://www.stitchdata.com/blog/100-billion-records-later-refining ...

  5. thymeleaf做if判定

    <div class="showing"> <h2>条件判断</h2> <p th:if="${testBoolean}&quo ...

  6. MVC框架与增强

    一.什么是MVC MVC全名是Model View Controller,是模型(model)-视图(view)-控制器(controller)的缩写,一种软件设计典范,用一种业务逻辑.数据.界面显示 ...

  7. python变量d的说明

    [变量] 什么是变量: 变:现实世界中的状态是会发生改变的. 量:记录现实世界中的状态,让计算机能够像人一样去识别世间万物 是变化的量 变量的组成: 变量名:变量名用来引用变量值,但凡需要用变量值,都 ...

  8. centos7 出现“FirewallD is not running”

    原因:没有开启防火墙 #提示没有开启防火墙服务,–permanent #永久生效,没有此参数重启后失效 [root@uJZ ~]# firewall-cmd --permanent --zone=/t ...

  9. 【AtCoder】 ARC 097

    link C-K-th Substring 题意:找出已知串中第\(k\)大的子串,子串相同的不算 \(k\)好小啊,要怎么做啊 不是[Tjoi2015]弦论吗 算了,直接SAM吧 #include& ...

  10. yum本地安装rrdtool报错,提示版本冲突的解决办法

    [root@mysql-mon40 mm]# yum localinstall rrdtool-1.4.7-1.el6.rfx.x86_64.rpm -y 错误: Multilib version p ...