在安装使用 detectron2 的时候碰到**Kernel not compiled with GPU support **问题,前后拖了好久都没解决,现总结一下以备以后查阅。

不想看心路历程的可以直接跳到最后一小节,哈哈哈。

environment

因为我使用的是实验室的服务器,所以很多东西没法改,我的 cuda 环境如下:

  • ubuntu
  • nvcc默认版本是 9.2
  • nvidia-smi版本又是 10.0 的

我之前一直没搞清楚这nvccnvidia-smi版本为什么可以不一样,想了解原因的可以看一下我之前的文章显卡,显卡驱动,nvcc, cuda driver,cudatoolkit,cudnn 到底是什么?

reproduce

我一般都用 Anaconda 来安装 pytorch,第一次安装的时候使用的如下命令安装的:

  1. conda create -n myenv python=3.7
  2. conda activate myenv
  3. conda install pytorch torchvision cudatoolkit=10.1 -c pytorch

按理说这个命令会给myenv环境安装 cuda 编译器和驱动等,但是在运行代码的时候还是会出现标题中的报错信息。我猜可能是因为 detectron2 在 build 的时候使用的是/usr/local路径下的 cuda compiler(即 nvcc),而不是我的虚拟幻境下的 compiler。所以我重新安装了 cuda-9.2 版本的 pytorch,

  1. conda install pytorch torchvision cudatoolkit=9.2 -c pytorch

但是运行的时候还是出现同样的错误,这更加说明 detectron2 的编译使用的不是虚拟环境路径下的编译器,所以我在想是不是我没有正确设置系统路径下的 CUDA,于是我用官方提供的检验代码查看 CUDA 路径:

  1. python -c 'import torch; from torch.utils.cpp_extension import CUDA_HOME; print(torch.cuda.is_available(), CUDA_HOME)'

输出的结果是

  1. true /usr/local

可以看到CUDA_HOME对应的输出结果有问题,照理来说输出结果应该是/usr/local/cuda或者/usr/local/cuda-9.2之类的,于是我又查看了~/.bashrc文件,找到与 CUDA 有关的代码部分,发现我并没有设置CUDA_HOME这个环境变量,于是我做了如下修改:

  1. # vim ~/.bashrc
  2. export CUDA_HOME=/usr/local/cuda
  3. export PATH=$PATH:/usr/local/cuda/bin
  4. export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda/lib64:/usr/local/cuda/lib
  5. export LIBRARY_PATH=$LIBRARY_PATH:/usr/local/cuda/lib64

之后 souce 一下

  1. source ~/.bashrc

再运行python -c 'import torch; from torch.utils.cpp_extension import CUDA_HOME; print(torch.cuda.is_available(), CUDA_HOME)'输出的结果变为true /usr/local/cuda

此时Kernel not compiled with GPU support的问题就解决了,代码正常运行了。

总结

步骤总结

  1. 安装相关库
  1. conda create -n myenv python=3.7
  2. conda activate myenv
  3. conda install pytorch torchvision cudatoolkit=9.2 -c pytorch
  4. pip install opencv-python
  5. pip install 'git+https://github.com/facebookresearch/fvcore'
  6. pip install cython; pip install 'git+https://github.com/cocodataset/cocoapi.git#subdirectory=PythonAPI'
  1. 编译 detectron2
  1. python setup.py build develop

可能出现的问题和解决办法

出现标题中的错误的原因主要是因为你的 cuda 版本或者路径除了问题,你可以按照如下几个步骤排查可能是那个地方出了问题:

  1. 运行nvcc --version查看你的 cuda 编译器版本,那么你的 pytorch-gpu 也建议安装对应版本。当然如果你nvcc都没安装。。。那你就先找教程安装。
  2. 如果安装的 pytorch 版本和nvcc版本一致,你可以看一下你的 CUDA 路径是否在~/.bashrc中设置正确,参考的配置路径如下:
  1. # vim ~/.bashrc
  2. export CUDA_HOME=/usr/local/cuda
  3. export PATH=$PATH:/usr/local/cuda/bin
  4. export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda/lib64:/usr/local/cuda/lib
  5. export LIBRARY_PATH=$LIBRARY_PATH:/usr/local/cuda/lib64

设置好后source ~/.bashrc,然后删除detectron2/build文件夹(如果你之前已经编译过一遍了),然后重新编译dete2tron2

感谢xiedian一句话总结了上面的问题根本原因:

上述问题其实是因为 conda 安装的 cudatools 只是一个子集,里面是没有 nvcc 的,要用 nvcc 就必须用系统装的

微信公众号:AutoML机器学习

MARSGGBO♥原创

如有意合作或学术讨论欢迎私戳联系~
邮箱:marsggbo@foxmail.com


2019-11-23 10:52:25

detectron2安装出现Kernel not compiled with GPU support 报错信息的更多相关文章

  1. PXE+kickstart网络安装CentOS7.4系统及过程中各种报错

    环境:关闭防火墙.selinux 注意:虚拟机进行网络安装的话,7.3以后的系统是需要2G以上的内存 [root@kickstart ~]# cat /etc/redhat-release CentO ...

  2. Linux下安装redis报错信息

    redis在Linux安装报错 标签: redislinuxcentos 2017-02-24 13:46 384人阅读 评论(0) 收藏 举报  分类: Linux安装工具(2)  版权声明:本文为 ...

  3. epel安装第三方扩展源后,运行yum报错的解决方案

    yum安装报错:Cannot retrieve metalink for repository: epel. Please verify its path and try again 解决方法: 一句 ...

  4. 解决Ubuntu(Linux)平台下Sublime Text 3 安装中文输入支持库后 开启gnome-terminal报错的问题

    在Ubuntu下安装Sublim Text3后发现无法输入中文,按照此链接的方法解决后.然后用下列代码配置C++的编译系统: { "cmd":["g++",&q ...

  5. 安装HDP时的报错信息

    1,安装ambari时报错:Bootstrap process timed out. It will be destroyed. 报错原因:/etc/sudoers文件中未设置免密权限 解决办法:ha ...

  6. 安装php WampServer之后,运行的时候报错“phpMyAdmin - 错误 缺少 mysqli 扩展。请检查 PHP 配置。”

    今天在安装了WampServer2.1a-x32之后,点击WampServer的图标启动WampServer,在电脑右下角就可以看到WampServer启动之后的图标,然后点击“Start All S ...

  7. python安装matplotlib:python -m pip install matplotlib报错

    matplotlib是python中强大的画图模块. 首先确保已经安装python,然后用pip来安装matplotlib模块. 进入到cmd窗口下,建议执行python -m pip install ...

  8. 安装监控MongoDB的Python安装包时候报错:HTTP Error 403: SSL is required

    安装pymongo-2.3.tar.gz,执行命令python setup.py install报错: HTTP Error 403: SSL is required 分析原因:安装需要下载这个dis ...

  9. 14、CentOS7安装过程中,磁盘大于2T的报错处理

    问题描述 服务器磁盘单盘空间大于2TB,在安装CentOS7时出现下图报错: Boot failure.Reboot and Select proper Boot device... 问题原因: 安装 ...

随机推荐

  1. linux下找到JVM占用资源最高的线程

    linux的top命令不仅可以看线程的资源占用,还可以看进程下线程的资源占用,结合对应的java命令可以定位到具体有问题的Java代码,以找出占用CPU最高的线程为例: 第一步: 通过 top命令查找 ...

  2. MySQL基础指令和安装

    数据库概念 那Mysql能干嘛呢?它就是一款软件,安装在任何一台计算机或者服务器上的时候,只要我告诉它创建一个文件,新增一个数据,删除一个数据它就能帮我去做想要的操作 那我们暂且能不能理解为mysql ...

  3. Java-volatile底层实现原理

    一.volatile 代码 package jvm; public class VolatileVisibilityTest { private static boolean initFlag = f ...

  4. 聊聊Runloop

    1.什么是Runloop 在开始聊RunLoop之前,我们先来了解一下程序的执行原理.一般来说,程序是在线程中执行,一个线程一次只能执行一个任务(关于GCD,可看上篇文章介绍),执行完成后线程就会退出 ...

  5. 实战django(二)--登录实现记住我

    上节初步实现了登录和注册模块,这节我们进一步实现“记住我”功能. 大体功能分为以下模块: 1.在登录时如果勾选记住我,那么就将用户username存进cookie中,跳转到index页面: 2.此时, ...

  6. Java 微信支付分对接记录 (先享后付)

    微信支付分(先享后付)对接记录: 微信支付分对接步骤 填写开通支付分的申请表格 此步骤大概需要审核 1-3 个工作日; (模板-服务信息配置表-[先享后付免确认]-[商户名].xls) 填写商户信息 ...

  7. Java并发之原子性,可见性,有序性

    原子性 ​原子性指的是一个或者多个操作在 CPU 执行的过程中不被中断的特性 在多线程情况下,线程会被操作系统调度进行任务切换,占有CPU时间片段的就执行,否则就阻塞 java中对基础类型的变量赋值是 ...

  8. thinkphp3.2.3使用formdata的多文件上传

    使用formdata的多文件上传  废话少说 直接上代码 1 JS部分 //选择文件后的处理 function handleFileSelect() { var exerciseid=$(" ...

  9. 单片机成长之路(51基础篇)- 024 基于 N76E003 的按键按键状态机

    前端时间要用按键,搞了个状态机(如图): main.c #include <N76E003.H> #include <SFR_Macro.h> //N76E003 SFR寄存器 ...

  10. .net 将base64转为图片

    1.base64的格式为: data:image/jpeg;base64,sandkansncquiueui3jk 2.ajax传输会把+转为空格 3.后台处理的代码: string imgPath ...