参考:

https://blog.csdn.net/TracelessLe/article/details/107405544

====================================================

发现了一个python版本的可以查看和管理NVIDIA显卡的工具pynvml,安装方法:

pip install nvidia-ml-py

在这个库的基础上自己写了一个小程序,用来监控GPU的使用情况:

import psutil
import pynvml #导包 UNIT = 1024 * 1024 pynvml.nvmlInit() #初始化
gpuDeriveInfo = pynvml.nvmlSystemGetDriverVersion()
print("Drive版本: ", str(gpuDeriveInfo, encoding='utf-8')) #显示驱动信息 gpuDeviceCount = pynvml.nvmlDeviceGetCount()#获取Nvidia GPU块数
print("GPU个数:", gpuDeviceCount ) for i in range(gpuDeviceCount):
handle = pynvml.nvmlDeviceGetHandleByIndex(i)#获取GPU i的handle,后续通过handle来处理 memoryInfo = pynvml.nvmlDeviceGetMemoryInfo(handle)#通过handle获取GPU i的信息 gpuName = str(pynvml.nvmlDeviceGetName(handle), encoding='utf-8') gpuTemperature = pynvml.nvmlDeviceGetTemperature(handle, 0) gpuFanSpeed = pynvml.nvmlDeviceGetFanSpeed(handle) gpuPowerState = pynvml.nvmlDeviceGetPowerState(handle) gpuUtilRate = pynvml.nvmlDeviceGetUtilizationRates(handle).gpu
gpuMemoryRate = pynvml.nvmlDeviceGetUtilizationRates(handle).memory print("第 %d 张卡:"%i, "-"*30)
print("显卡名:", gpuName)
print("内存总容量:", memoryInfo.total/UNIT, "MB")
print("使用容量:", memoryInfo.used/UNIT, "MB")
print("剩余容量:", memoryInfo.free/UNIT, "MB")
print("显存空闲率:", memoryInfo.free/memoryInfo.total)
print("温度:", gpuTemperature, "摄氏度")
print("风扇速率:", gpuFanSpeed)
print("供电水平:", gpuPowerState)
print("gpu计算核心满速使用率:", gpuUtilRate)
print("gpu内存读写满速使用率:", gpuMemoryRate)
print("内存占用率:", memoryInfo.used/memoryInfo.total) """
# 设置显卡工作模式
# 设置完显卡驱动模式后,需要重启才能生效
# 0 为 WDDM模式,1为TCC 模式
gpuMode = 0 # WDDM
gpuMode = 1 # TCC
pynvml.nvmlDeviceSetDriverModel(handle, gpuMode)
# 很多显卡不支持设置模式,会报错
# pynvml.nvml.NVMLError_NotSupported: Not Supported
""" # 对pid的gpu消耗进行统计
pidAllInfo = pynvml.nvmlDeviceGetComputeRunningProcesses(handle)#获取所有GPU上正在运行的进程信息
for pidInfo in pidAllInfo:
pidUser = psutil.Process(pidInfo.pid).username()
print("进程pid:", pidInfo.pid, "用户名:", pidUser,
"显存占有:", pidInfo.usedGpuMemory/UNIT, "Mb") # 统计某pid使用的显存 pynvml.nvmlShutdown() #最后关闭管理工具

输出:

Drive版本:  470.63.01
GPU个数: 4
第 0 张卡: ------------------------------
显卡名: NVIDIA GeForce RTX 3090
内存总容量: 24268.3125 MB
使用容量: 14168.625 MB
剩余容量: 10099.6875 MB
显存空闲率: 0.41616768780276747
温度: 59 摄氏度
风扇速率: 51
供电水平: 2
gpu计算核心满速使用率: 46
gpu内存读写满速使用率: 46
内存占用率: 0.5838323121972325
进程pid: 68028 用户名: xxxxxx 显存占有: 14165.0 Mb
第 1 张卡: ------------------------------
显卡名: NVIDIA GeForce RTX 3090
内存总容量: 24268.3125 MB
使用容量: 3.625 MB
剩余容量: 24264.6875 MB
显存空闲率: 0.9998506282626779
温度: 32 摄氏度
风扇速率: 30
供电水平: 8
gpu计算核心满速使用率: 0
gpu内存读写满速使用率: 0
内存占用率: 0.0001493717373220738
第 2 张卡: ------------------------------
显卡名: NVIDIA GeForce RTX 3090
内存总容量: 24268.3125 MB
使用容量: 3.625 MB
剩余容量: 24264.6875 MB
显存空闲率: 0.9998506282626779
温度: 33 摄氏度
风扇速率: 30
供电水平: 8
gpu计算核心满速使用率: 0
gpu内存读写满速使用率: 0
内存占用率: 0.0001493717373220738
第 3 张卡: ------------------------------
显卡名: NVIDIA GeForce RTX 3090
内存总容量: 24268.3125 MB
使用容量: 3.625 MB
剩余容量: 24264.6875 MB
显存空闲率: 0.9998506282626779
温度: 33 摄氏度
风扇速率: 30
供电水平: 8
gpu计算核心满速使用率: 0
gpu内存读写满速使用率: 0
内存占用率: 0.0001493717373220738

注意的是上面代码需要安装第三方依赖库:psutil

相关资料:

[1] NVIDIA官方GPU管理和部署文档
[2] 【Python管理GPU】pynvml工具的安装与使用
[3] pypi下的nvidia-ml-py包

https://pythonhosted.org/nvidia-ml-py/

https://github.com/gpuopenanalytics/pynvml

==================================================

Python使用pynvml查看GPU信息的更多相关文章

  1. 【MonkeyRunner】[技术博客]用python编写脚本查看设备信息

    [MonkeyRunner]用python编写脚本查看设备信息 原以为是个简单的操作,在实践的时候发现了一些问题. python脚本 test.py: from com.android.monkeyr ...

  2. 【tensorflow基础】TensorFlow查看GPU信息

    re 1. TensorFlow查看GPU信息; end

  3. pytorch中查看gpu信息

    其他:windows使用nvidia-smi查看gpu信息 为什么将数据转移至GPU的方法叫做.cuda而不是.gpu,就像将数据转移至CPU调用的方法是.cpu?这是因为GPU的编程接口采用CUDA ...

  4. Linux查看GPU信息和使用情况

    Linux查看显卡信息: lspci | grep -i vga 使用nvidia GPU可以: lspci | grep -i nvidia [root@gpu-server-002 ~]# lsp ...

  5. 如何在linux下查看gpu信息

    ~$ lspci | grep -i vga01:00.0 VGA compatible controller: NVIDIA Corporation GF119 [GeForce GT 610] ( ...

  6. 怎么用 pytorch 查看 GPU 信息

    如果你用的 Keras 或者 TensorFlow, 请移步 怎么查看keras 或者 tensorflow 正在使用的GPU In [1]: import torch In [2]: torch.c ...

  7. linux 查看gpu信息

  8. 新手篇丨Python任意网段Web端口信息探测工具

    你学习Python的目的是什么?是想写爬虫爬取数据(数据.图片等内容),还是想自写自动化的小工具,又或是作为一个新手小白单纯的欣赏这门语言呢? 今天i春秋分享的是一篇关于多线程工具的文章,工具使用效率 ...

  9. ubuntu 查看进程信息

    查看进程信息 ps ps -aux 查看所有进程,每行一个程序 top 显示当前运行程序 kill 98 (98为PID号,) kill -9 98 (强制杀死98) ps -e Linux如何查看端 ...

  10. python爬虫之User-Agent用户信息

    python爬虫之User-Agent用户信息 爬虫是自动的爬取网站信息,实质上我们也只是一段代码,并不是真正的浏览器用户,加上User-Agent(用户代理,简称UA)信息,只是让我们伪装成一个浏览 ...

随机推荐

  1. reactHooks的组件通信

    父组件调用子组件的方法 // 父组件 import React, { useEffect, useRef, useState } from 'react'; import StopModal from ...

  2. uniapp 开发微信小程序 使用微信小程序一键登录

    研究了一天的uniapp开发微信小程序的第一步,登录! 刚开始使用uni.getUserInfo函数No!不行,无法运行,研究文档发现是这个函数被微信小程序团队给禁用了,OK换! 后来换成了uni.g ...

  3. 第一篇Scrum冲刺博客--原班人马打造队

    0 项目地址 点此进入 1 第一次开会/任务认领 1.1 第一次例会(2024.4.27) 第一次开会照片记录 1.2 开发认领 在查看老师在实验报告中学长的博客给了我一定的启发,我在腾讯表格中创建了 ...

  4. mysql这个垃圾迁移数据费劲半天

    mysql垃圾得很!  对于一些小系统还可以.大型系统自己找麻烦--必须有高昂的人工费! 没有高昂的人工(必须有好的程序员和工程师才能解决一些复杂的问题),构建基于大量数据的应用,非常麻烦. 而这些费 ...

  5. 算法金 | 没有思考过 Embedding,不足以谈 AI

    大侠幸会,在下全网同名「算法金」 0 基础转 AI 上岸,多个算法赛 Top 「日更万日,让更多人享受智能乐趣」 抱个拳,送个礼 在当今的人工智能(AI)领域,Embedding 是一个不可或缺的概念 ...

  6. uCos 学习:0-有关概念

    先说一下UCOSIII:Micrium在2009年推出了UCOSIII,相对于之前的UCOSII版本,在性能上有了进一步的提升,主要是支持时间片轮调度,极短的关中断事件等. 可剥夺多任务管理: 什么是 ...

  7. 3568F-Linux-RT系统测试手册

  8. html2canvas 页面截屏

    $(document).ready(function () { $(".example1").on("click", function (event) { va ...

  9. PyQt 右键菜单的实现(Qt.CustomContextMenu方式)

    从Qt文档Qt::ContextMenuPolicy的值可以看出,实现右键菜单的方式有三种,这对于所有继承于QWidget的类都是通用的,在用每一种方式实现之前都要调用QWidget::setCont ...

  10. 网络基础 登录对接CAS-跨域导致的一个意想不到的Bug

    登录对接CAS-跨域导致的一个意想不到的Bug 背景描述 业务需求是平台登录,接入Cas验证 问题描述 平台登录页,点击登录方式,跳转Cas登录页,提交登录请求,结果发现,又返回平台登录页: 再次点击 ...