nvprof 使用记录; 以及使用 nvprof 查看tensorflow-gpu 核函数运行记录

最近需要使用 nvprof 此时cuda 程序运行的性能，下面对使用过程进行简要记录，进行备忘：

常用使用命令：nvprof --unified-memory-profiling off python run.py （这是因为某块内存被设置了不允许分析，导致）参考：https://docs.nvidia.com/cuda/profiler-users-guide/index.html#unified-memory-profiling
nvprof --unified-memory-profiling off python run.py （2>run.txt 1>out.txt）
nvprof --unified-memory-profiling off --print-gpu-trace python run.py
nvprof --unified-memory-profiling off --print-gpu-trace -o prof.nvvp python run.py
nvvp prof.nvvp (使用 x11 forwarding)
./run.sh 2>runsh_out.txt

Non-Visual Profiler 和 Visual Profiler 的使用：

# nvprof

nvprof python train_mnist.py

nvprof --print-gpu-trace python train_mnist.py 

#nvvp (可以使用x11 forwarding 使用，当然更适合在本机使用)

nvprof -o prof.nvvp python train_mnist.py （在GPU集群上生成 .nvvp文件）

scp your_gpu_machine:/path/to/prof.nvvp . （scp 拷贝文件到本地）

nvvp prof.nvvp （在本地机器上进行可视化分析）

参考链接：

https://blog.csdn.net/yinhuier/article/details/80551268 （简单使用教程）

https://docs.nvidia.com/cuda/profiler-users-guide/index.html （nvidia 官网教程）

https://gist.github.com/sonots/5abc0bccec2010ac69ff74788b265086 （一个日本工程师写的文档，不错，本文大多命令摘自此文档，文档中有较为详细的实例截图，可以参考）

https://blog.csdn.net/haoqimao_hard/article/details/80557740 (CSDN 上较为简洁的博客，可以参考使用)

https://indico-jsc.fz-juelich.de/event/32/material/0/5.pdf (德国一个简单介绍的资料)

保持更新，更多内容请关注 cnblogs.com/xuyaowen; 如果对您有帮助，还请点击推荐或关注~！

nvprof 使用记录; 以及使用 nvprof 查看tensorflow-gpu 核函数运行记录的更多相关文章

[记录点滴]授人以渔，从Tensorflow找不到dll扩展到如何排查问题
[记录点滴]授人以渔,从Tensorflow找不到dll扩展到如何排查问题目录 [记录点滴]授人以渔,从Tensorflow找不到dll扩展到如何排查问题 0x00 摘要 0x01 引言 0x02 ...
查看tensorflow pb模型文件的节点信息
查看tensorflow pb模型文件的节点信息: import tensorflow as tf with tf.Session() as sess: with open('./quantized_ ...
记录从裸机到TensorFlow GPU版运行的配置过程
实验室原来有一台装Ubuntu Server系统的服务器,安装有tensorflow,在使用过程中经常出现断网.死机.自动关机等毛病,忍无可忍,决定重装系统配置如下:Dell工作站,Xeon-E5 ...
查看TensorFlow的版本以及安装路径
查看TensorFlow的版本以及安装路径进入到Python环境 import tensorflow as tf tf.__version__ # 查看版本 tf.__path__ # 查看安装路径 ...
TensorFlow DeepLab教程初稿-tensorflow gpu安装教程
TensorFlow DeepLab教程初稿-tensorflow gpu安装教程商务合作,科技咨询,版权转让:向日葵,135-4855__4328,xiexiaokui#qq.com Summar ...
【转】Ubuntu 16.04安装配置TensorFlow GPU版本
之前摸爬滚打总是各种坑,今天参考这篇文章终于解决了,甚是鸡冻\(≧▽≦)/,电脑不知道怎么的,安装不了16.04,就安装15.10再升级到16.04 requirements: Ubuntu 16.0 ...
Ubuntu 16.04 + CUDA 8.0 + cuDNN v5.1 + TensorFlow(GPU support)安装配置详解
随着图像识别和深度学习领域的迅猛发展,GPU时代即将来临.由于GPU处理深度学习算法的高效性,使得配置一台搭载有GPU的服务器变得尤为必要. 本文主要介绍在Ubuntu 16.04环境下如何配置Ten ...
备注： ubt 16.04 安装 gtx 1060 --- 成功运行 tensorflow - gpu
---------------------------------------------------------------------------------------------------- ...
通过Anaconda在Ubuntu16.04上安装 TensorFlow(GPU版本)
一. 安装环境 Ubuntu16.04.3 LST GPU: GeForce GTX1070 Python: 3.5 CUDA Toolkit 8.0 GA1 (Sept 2016) cuDNN v6 ...

随机推荐

Mysql中处理JSON字段
处理json字段,可以用json_extract函数: select * from (select json_extract(ext_value,'$.high')+0 highx,batch_id ...
Java中数组与集合的相互转换
数组与List的相互转换 List转数组:采用集合的toArray()方法数组转List:采用Arrays的asList()方法数组转换为集合注意:在数组转集合的过程中,要注意是否使用了视图的方 ...
js中数组去重方法及性能对比
js中数组的数组去重常用的数组去重方法以及效率分析: 首先我们先构建一个数组,主要是用于进行去重实验,我们主要实验的量级为1000,10000,100000,500000.具体的生成数组的方法如下 ...
Fibonacci数Python的四种解法
1: # 计算Fibonacci数: # Naive版本,时间效率O(1.618^n) # 记忆化版本(增加line8.10.13),时间效率O(n) # 注意:当n超过1000,可能超过系统允许的最 ...
CSS transition 的默认值
语法 transition: property duration timing-function delay|initial|inherit; 示例: div { width: 100px; ...
C lang: The Command line
Ax_command line h Ax_a command line describe The command line is in enviroment for DOS,to user opera ...
Python中列表乘法需注意的问题/
前几天看到一个关于Python的面试题 lst = [1, 2, [3]] lst1 = lst * 2 # [1, 2, [3], 1, 2, [3]] lst1[2].append(4) # ...
浮点运算与boost.multiprecision
在C++中,float占4个字节,double占8个字节,均采用 IEEE 754 浮点标准:内部都是以二进制为基础,表述实数,有些实数可以被精确表述,比如0.2,但有些不行,比如0.3.针对这一点, ...
前端笔记之微信小程序（一）初识微信小程序&WXSS与CSS|WXML与HTML的差异&像素和DPR
一.小程序概述 2017 年 1 月 9 日小程序正式上线,腾讯开放了个人开发者开发小程序,小程序从此就开始火爆,这一年,小程序狂揽 4 亿用户.1.7 亿的日常活跃,上线 58 万个.这是一个巨大的 ...
基于Casbin实现ABAC
最近同事在研究Casbin的权限设计,我们主要是考虑使用ABAC基于属性的访问控制,Casbin给的示例不多,于是自己写了几个示例. 首先我们看看提到ABAC时,一般描述如下: ABAC被一些人称为是 ...

nvprof 使用记录; 以及使用 nvprof 查看tensorflow-gpu 核函数运行记录

nvprof 使用记录; 以及使用 nvprof 查看tensorflow-gpu 核函数运行记录的更多相关文章

随机推荐

热门专题