课题需要用到GPU加速。目前使用的台式电脑只有核心显卡,而实验室有一台服务器装有NVIDIA GTX980独显。因此,想搭建一个CUDA的开发环境,来实现在台式机上面开发cuda程序,程序在服务器而不必每次都跑去服务器上面。
目前找到的远程调试方案有三个:

  1. Windows平台下,通过Nsight Monitor连接 带有NVIDIA显卡的Windows笔记本电脑。
  2. Linux平台下,通过Nsight Eclipse Edition 连接Linux服务器
  3. 通过Xshell连接到服务器(操作系统为CentOS 7),用Xmanager启动Nsight Eclipse Edition图形界面。由于开发时可能会改动服务器环境参数和配置导致其他程序出错,并且我没有服务器root权限,因此尽量不在服务器上进行开发。

一、Windows平台 Nsight Monitor方案

客户端:台式机,core I3-6100,核心显卡,4G内存, SSD,Windows 7 64bit sp1
服务器端:笔记本电脑,core I5-450m,GT310m, 4G内存, SSD, Windows 7 64bit sp1

  1. 安装Visual studio 2012
    服务器最好也要安装。不安装Nsight VS Edition好像安装不上(未证实)

  2. 安装显卡驱动
    我的客户端因无NVIDIA显卡,因此只在服务器端安装驱动。

  3. 在客户端与服务器安装cuda toolkit (Win 64bit)
    进入NVIDIA开发者网站https://developer.nvidia.com/cuda-toolkit下载相应的CUDA Toolkit。注意客户端与服务器版本最好相同。NVIDIA网站最近因“网站尚未备案”无法访问,可将http改为https。我下载安装版本为cuda toolkit 8.0 对应 Nsight Monitor 5.4、Nsight Visual Studio Edition 5.4。

  4. 参考CUDA远程调试
    设置客户端与服务器的Nsight Monitor,在客户端添加Trusted Machines ip地址;关闭防火墙;建立CUDA工程,修改Nsight User Properties,然后编译调试

遇到的坑有三个:

二、Linux平台 Nsight Eclipse Edition方案

客户端:虚拟机,核心显卡, Ubuntu 16.04.4 LTS
服务器端:GTX980, CentOS 7

  1. 安装虚拟机与linux
    台式机装的是Windows系统,因此要在虚拟机上安装Linux系统。
    我从清华大学开源镜像站下载VirtualBox与Ubuntu 16.04.4 LTS 镜像安装文件
    .高校与教育网用户还可以访问
    浙大开源镜像站http://mirrors.zju.edu.cn/.
    其他国内用户可访问
    阿里云开源镜像站https://opsx.alibaba.com/mirror
    网易开源镜像站http://mirrors.163.com/

    virtualbox 安装 ubuntu系统参考 基于VirtualBox虚拟机安装Ubuntu图文教程

  2. Linux系统下安装NVIDIA 显卡驱动与CUDA toolkit
    参考我之前的博客http://www.cnblogs.com/kaikaikai/p/8343816.html。 在NVIDIA开发者网站https://developer.nvidia.com/cuda-toolkit下载对应版本的CUDA toolkit Linux run文件并执行,按照安装脚本配置路径即可。最好显卡驱动和CUDA分开安装

    注意客户端上由于没有NVIDIA的显卡,不需要(也无法)安装NVIDIA显卡驱动。要想简化配置,客户端的CUDA版本最好与服务器相同,toolkit安装位置及Samples的安装位置最好也相同。如不同需在Nsight中添加路径。我安装版本为cuda 7.0

  3. 客户端上重装gcc与g++,使其版本号与服务器相同
    参考Ubuntu如何重新安装g++编译器。通过gcc -v可查看gcc版本。若安装完成后找不到gcc(g++),在/usr/bin/中添加链接
    ln -s gcc-* gcc
    ln -s g++-* g++
    其中gcc-*为所安装gcc版本,如我安装的为gcc 4.8,g++ 4.8
  4. 在服务器防火墙添加2345端口,或关闭防火墙
  5. 参考NSight Eclipse Edition 下创建CUDA程序并执行远程编译及调试 建立CUDA工程,然后编译调试。

Note

  • NSIGHT ECLIPSE EDITION Getting Started Guide中列出了三种开发模式:(1)、本机编辑生成调试 (2)、本机编辑生成、远程调试 (3)、本机编辑代码、远程生成调试。

    若采用模式(3)需添加远程机(服务器)的相关路径,否则会报错,如:

    error: helper_functions.h: No such file or directory

    如果第2步中客户端服务器安装位置相同,通常不需要额外添加路径

  • 采用模式(3)时,若编译生成时出现报错

    需将客户端与服务器的user.name 设置为同一个名字,user.email为同一个地址。
    git config --global user.name <anyname>
    git config --global user.email <anyemail>

  • 远程Debug连接超时,需打开服务器2345端口

CUDA并行程序设计 开发环境搭建与远程调试的更多相关文章

  1. spark JAVA 开发环境搭建及远程调试

    spark JAVA 开发环境搭建及远程调试 以后要在项目中使用Spark 用户昵称文本做一下聚类分析,找出一些违规的昵称信息.以前折腾过Hadoop,于是看了下Spark官网的文档以及 github ...

  2. 《Java Web程序设计——开发环境搭建》

    Java Web程序设计--开发环境搭建       一.JDK下载.安装以及环境变量的配置: 官网:https://www.oracle.com/java/technologies/download ...

  3. Go 开发环境搭建和代码调试

    写这篇笔记的目的,主要是分享我在Go学习中遇到的坑.让后面的学习者能否参考有用的经验. 其中有一些小技巧,对初学者来说,可能会大大节约填坑的时间. 比如如何设置vscode的Go调试器,Go的语法高亮 ...

  4. arm-linux-gdb+gdbserver环境搭建以及远程调试

    0) gdb源码下载:http://ftp.gnu.org/gnu/gdb/ 1) 编译arm-linux-gdb 指定交叉编译工具链的位置 export PATH=$PATH:/usr/local/ ...

  5. 《CUDA并行程序设计:GPU编程指南》

    <CUDA并行程序设计:GPU编程指南> 基本信息 原书名:CUDA Programming:A Developer’s Guide to Parallel Computing with ...

  6. [.net 面向对象程序设计深入](9).NET Core 跨平台开发环境搭建

    [.net 面向对象程序设计深入](9).NET Core 跨平台开发环境搭建 1.概述 读前必备:认识.NET Core 上篇介绍了.NET 新的生态环境:包括.NET Framework..NET ...

  7. python学习之python开发环境搭建

    Python简介 Python是一种面向对象.解释型计算机程序设计语言.Python语法简洁而清晰,具有丰富和强大的类库等等众多的特性,这是来自百度百科的介绍,在百度百科还能看到它的更详细的介绍信息, ...

  8. 基于WDF的PCI/PCIe接口卡Windows驱动程序(1)-WDF概述及开发环境搭建

    原文出处:http://www.cnblogs.com/jacklu/p/4619110.html 本科毕业设计是这方面的工作,所以想开几篇博客来介绍使用WDF开发PCI/PCIe接口卡的驱动程序方法 ...

  9. (转)微信公众平台开发之基于百度 BAE3.0 的开发环境搭建(采用 Baidu Eclipse)

    原文传送门(http://blog.csdn.net/bingtianxuelong/article/details/17843111) 版本说明:     V1:         2014-2-13 ...

随机推荐

  1. jstack的使用:死锁问题实战

  2. ORACLE数据库实现自增的两种方式

    Mysql数据库因为其有自动+1,故一般我们不需要花费太多时间,直接用关键字auto_increment即可,但是Oracle不行,它没有自动增长机制.顾我们需要自己去实现.一般有两种方式,但是这两种 ...

  3. ITIL《信息技术基础架构库》

    一 概述 1. ITIL 自上世纪70年代开始,个人计算机以及计算机网络开始在欧美发达国家普及.随着时间的推移,信息系统的规模越来越大,人们对信息系统的依赖也越来越强.特别是到了80年代,互联网开始普 ...

  4. PDA日常问题

    一.连接网络异常 1.摩托摩拉3190连接wifi时报错,提示:scan error adapter unavailable 确认网卡是不是禁用状态,CE是右下角有个蓝色的图,上面有个X,点一下,然后 ...

  5. python BeautifulSoup4--例子

    from bs4 import BeautifulSoup import requests import re #请求博客园首页 r=requests.get('http://www.cnblogs. ...

  6. SWD下载k60

    转:JTAG各类接口针脚定义,含义及SWD接线方式 IAR设置如下

  7. Bad state: Stream has already been listened to.

    https://stackoverflow.com/questions/51396769/flutter-bad-state-stream-has-already-been-listened-to T ...

  8. 北航OO课程完结总结

    什么是OO? 面向对象,是一种编程的思想方法,但是在这门课程中,我们实际学习到的是将理论运用到具体实践上,将自己的想法付诸实践,不断去探索和优化的这一体验. 后两次作业架构总结 本单元两次作业,我们面 ...

  9. 'adb' 不是内部或外部命令,也不是可运行的程序 或批处理文件—解决方法

    Windows键 + R → 输入cmd → 输入adb,提示“adb不是内部或外部命令,也不是可运行的程序 或批处理文件“,错误信息如下: 解决方法: 此电脑(右击)→ 属性 → 高级系统设置 → ...

  10. UCOSIII优先级反转

    反转现象 任务优先级:H>M>L 绿色部分:任务占用共享资源 理想状态:7释放信号量后,最高优先级H任务抢占CPU 反转原因:H和L等待同一个信号量,H的任务优先级被降至和L相同优先级,此 ...