记录从裸机到TensorFlow GPU版运行 的配置过程
实验室原来有一台装Ubuntu Server系统的服务器,安装有tensorflow,在使用过程中经常出现断网、死机、自动关机等毛病,忍无可忍,决定重装系统
- 配置如下:Dell工作站,Xeon-E5 2代 8线程处理器 x2,共32个逻辑核,quadro k4000 显卡 x1, 16 GB 内存,1TB 硬盘,双网卡。
- 打算安装 CentOS 7.4 1708 x64
一. CentOS的安装
教育网用户可从各个高校的镜像站下载CentOS 7,如清华大学开源软件镜像站
公网用户可选择阿里云镜像站、网易163镜像站下载
这里选择处于同一校园网的浙江大学开源镜像站 下载CentOS 7.4速度更快
- ISO格式光盘镜像文件位于/centos/7.4.1708/isos/x86_64/, 任何一个镜像站其目录格式都是相同的。目录下有五种类型的安装包镜像文件
CentOS-7-x86_64-DVD-1708.iso
标准安装光盘版。作者下载的是这个版本
CentOS-7-x86_64-NetInstall-1708.iso
网络安装与系统恢复盘
CentOS-7-x86_64-Everything-1708.iso
对完整版安装盘的软件进行补充,集成所有软件
CentOS-7-x86_64-LiveGNOME-1708.iso
CentOS-7-x86_64-LiveKDE-1708.iso
Gnome与KDE桌面版。live版相当于win pe,直接在光盘、u盘上加载到内存运行,但是无法安装
CentOS-7-x86_64-Minimal-1708.iso
最小安装版
二. CentOS系统的配置
配置网关(重新启动后无需再次配置)
blog.csdn.net/q_l_s/article/details/51762662
添加用户
www.cnblogs.com/irisrain/p/4324593.html
更新源配置
选择内网更新源
mirrors.zju.edu.cn
请删除/etc/yum.repos.d中的所有文件,然后在/etc/yum.repos.d目录中建立CentOS.repo文件,并填入下列内容
[base]
name=CentOS-$releasever - Base
baseurl=http://mirrors.zju.edu.cn/centos/$releasever/os/$basearch/
gpgcheck=1
gpgkey=file:///etc/pki/rpm-gpg/RPM-GPG-KEY-CentOS-7
[updates]
name=CentOS-$releasever - Updates
baseurl=http://mirrors.zju.edu.cn/centos/$releasever/updates/$basearch/
gpgcheck=1
gpgkey=file:///etc/pki/rpm-gpg/RPM-GPG-KEY-CentOS-7
[extras]
name=CentOS-$releasever - Extras
baseurl=http://mirrors.zju.edu.cn/centos/$releasever/extras/$basearch/
gpgcheck=1
gpgkey=file:///etc/pki/rpm-gpg/RPM-GPG-KEY-CentOS-7
yum命令大全
http://man.linuxde.net/yum
支持ntfs格式
由于重装系统前采用ntfs格式移动硬盘备份数据,而OS系统原声不支持ntfs,需要安装ntfs-3g
安装教程如下
jingyan.baidu.com/article/380abd0a6a99731d90192cc5.html
ntfs-3g下载地址
www.linuxfromscratch.org/blfs/view/svn/postlfs/ntfs-3g.html
由于我是通过ssh连接的,下载后需要通过sftp上传到服务器
三.Tensorflow及其环境的安装
CentOS 7 下图片查看工具 eog
pdf阅读器 evince
安装过程参考资料TensorFlow —— GPU版安装指南
Anaconda
https://www.cnblogs.com/willnote/p/6746499.html
在清华大学开源软件镜像站可以下载到对应操作系统与所需Python版本的Anaconda安装包
这里安装的是Python 3.5 版本。下载安装包后执行命令
$bash Anaconda3-4.3.1-Linux-x86_64.sh
通过$Python3.5 -V
来验证安装
Nvidia显卡驱动安装
参考资料https://www.cnblogs.com/snake553/p/7159376.html
CUDA安装
NOTE:
通过cuda安装显卡驱动会碰到下列问题,加上--kernel-source-path后仍无法解决
The driver installation is unable to locate the kernel source
从CUDA官网上下载CUDA 8.0-Linux-64 (runfile),执行,不要再次安装显卡驱动
https://developer.nvidia.com/cuda-downloads
安装完成后,通过编译执行Sample中的deviceQuery程序来验证安装与查看设备情况。
\#cd .../NVIDIA_CUDA-8.0_Samples/1_Utilities/deviceQuery
\# make
\# ./deviceQuery
当输出显示Result = PASS时,说明CUDA安装成功且显卡支持
通过nvidia-smi查看显卡使用情况
Cudnn库
从https://developer.nvidia.com/rdp/cudnn-archive 下载对应版本的cuDNN库,需要注册。
我下载的cudnn-8.0-linux-x64-v6.tgz。通过命令
tar -xvf cudnn-8.0-linux-x64-v6.tgz
解压,将解压得到的所有文件复制到cuda的相应目录。注意到链接文件无法复制,需要重新创建。
\#rm -rf libcudnn.so libcudnn.so.6 #删除原有动态文件
\#ln -s libcudnn.so.6.0.21 libcudnn.so.6 #生成软衔接
\#ln -s libcudnn.so.6 libcudnn.so #生成软链接
TensorFlow安装配置
安装Anaconda时应该已经安装了pip,如有必要,请根据提示更新pip\pip3
直接通过pip从google下载TensorFlow非常的慢,强烈推荐采用国内镜像下载。可
通过清华大学开源软件镜像站-TensorFlow 镜像使用帮助获取相应的Tensorflow版本
pip3 install \
-i https://pypi.tuna.tsinghua.edu.cn/simple/ \
https://mirrors.tuna.tsinghua.edu.cn/tensorflow/linux/gpu/tensorflow_gpu-1.4.1-cp35-cp35m-linux_x86_64.whl
安装完成后,启动Python验证安装
\#python3.5
>>import tensorflow as tf
若无错误消息输出,基本上可认为安装成功
note:
清华大学开源软件镜像站-使用帮助https://mirrors.tuna.tsinghua.edu.cn/help/是个非常好的资源
记录从裸机到TensorFlow GPU版运行 的配置过程的更多相关文章
- Win10下 tensorflow gpu版安装
准备: 系统环境: windows10 + Anaconda3 + Pycharm (1)环境配置: 打开Anaconda Prompt,输入清华仓库镜像,这样更新会快一些: 输入: conda co ...
- Windows下Anaconda安装 python + tensorflow GPU版
这里首先确认没有安装CPU版本,并默认已经安装了CUDA和Cudnn以及anaconda. 安装gpu版本的tensorflow 接下来需要安装GPU版本的tensorflow: 打开cmd并输入: ...
- Ubuntu 16.04安装N卡驱动、cuda、cudnn和tensorflow GPU版
安装驱动 最开始在英伟达官网下载了官方驱动,安装之后无法登录系统,在登录界面反复循环,用cuda里的驱动也出现了同样的问题.最后解决办法是把驱动卸载之后,通过命令行在线安装驱动. 卸载驱动: sudo ...
- tensorflow GPU版本安装及配置
经检测速度大幅度上升,不枉费我折腾了这么久,最坑的就是网上教程.书都没有写将cuda的bin加入全局变量,还是根据报错信息推出来的. 1.cuda9.0下载安装 https://developer.n ...
- windows安装tensorflow GPU
一.安装Anaconda Anaconda是Python发行包,包含了很多Python科学计算库.它是比直接安装Python更好的选择. 二.安装Tensorflow 如果安装了tensorflow, ...
- GPU版TensorFlow怎么指定让CPU运行
由于某些原因GPU版的TensorFlow运行起来会出现一些问题,比如内存溢出等情况.此时我们可以用CPU和系统内存来运行我们的程序. 代码如下: import osos.environ[" ...
- [转载]tensorflow中使用tf.ConfigProto()配置Session运行参数&&GPU设备指定
tf.ConfigProto()函数用在创建session的时候,用来对session进行参数配置: config = tf.ConfigProto(allow_soft_placement=True ...
- tensorflow中使用tf.ConfigProto()配置Session运行参数&&GPU设备指定
tf.ConfigProto()函数用在创建session的时候,用来对session进行参数配置: config = tf.ConfigProto(allow_soft_placement=True ...
- tf.Session()函数的参数应用(tensorflow中使用tf.ConfigProto()配置Session运行参数&&GPU设备指定)
版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明.本文链接:https://blog.csdn.net/dcrmg/article/details ...
随机推荐
- Mysql 定时备份(mysqldump)
#!/bin/bash today=`date +%Y-%m-%d` deleday=`date -d '7 day ago' +%Y-%m-%d` path=/home/data/mysqlback ...
- firefox 获取xpath
在做一个爬虫是,输入内容后,会自动显示内容,而且只能选择,不能根据输入的提交,一点就失去焦点,找不到相关内容 后来发现firefox的查看元素的最左边的类似于鼠标尖头的按钮,就是确保这种情况下,去查找 ...
- nodejs模块fs——文件操作api
// fs模块常用api // 读取文件 .写入文件 .追加文件. 拷贝文件 .删除文件 // 读取文件 // fs.readFile(path[, options], callback) // fs ...
- 用chattr命令防止系统中某个关键文件被修改
用chattr命令防止系统中某个关键文件被修改:# chattr +i /etc/resolv.conf
- jmeter接口测试中的用例数据分离
用jmeter做接口测试的话,一个jmx文件就可以是一个用例,而用例的设计多数还是等价类.边界值等方法.用例越来越多的时候,维护比较麻烦,所以可以把用例的数据存在csv文件中,然后通过组件(CSV D ...
- python练习:面向对象1
面向对象习题: 一:定义一个学生类.有下面的类属性: 1 姓名 2 年龄 3 成绩(语文,数学,英语)[每课成绩的类型为整数] 类方法: 1 获取学生的姓名:get_name() 返回类型:str 2 ...
- php中需要注意的函数(持续更新)
explode 函数 $a = null; explode("#",$a); //不会报错会返回一个只包含空字符串的数组
- Django-cms show_menu参数解释
当页面结构设置(/admin/cms/page)如下: - Home (level=0) - About Us (level=1) - About Company Services (level=2) ...
- JavaScript,遍历,for
(for循环,for...in ,for...of ,forEach)(:for in总是得到数组,字符串的下标,而for of和forEach一样,是直接得到值) (forEach() 方法用于调用 ...
- 了解Scrum敏捷开发过程的优点
Scrum 1. 我们的团队 1.1 团队名称 开发小分队&7号 1.2 团队成员 徐棒 彭康明 刘鹏芝 罗樟 王小莉 胡广健 沈兴艳 1.3 我在团队中位置 需求实现团队(负责将需求模块实现 ...