profiler报告包含每次内核启动分析期间收集的所有信息。在用户界面中,它包含一个包含常规信息的标题,以及用于在报告页面或单个收集的启动之间切换的控件。默认情况下,报告以选定的详细信息页面开始。

页眉

页面下拉列表可用于在可用报告页面之间切换,下一节将对此进行详细说明。

探查器报告标头

Launch下拉列表可用于在所有收集的内核启动之间切换。每个页面中显示的信息通常表示选定的启动实例。在某些页面(例如Raw),显示所有启动的信息,并突出显示所选实例。您可以输入这个下拉列表来快速过滤并找到一个内核启动。

应用过滤器按钮打开过滤器对话框。可以使用多个筛选器缩小结果范围。在“过滤器”对话框中,输入过滤器参数并按“确定”按钮。将相应地过滤“启动”下拉列表。选择箭头下拉菜单以访问“清除过滤器”按钮,该按钮将删除所有过滤器。

过滤器对话框

“添加基线”按钮可将焦点中的当前结果提升为此报告中所有其他结果的基线,以及在同一个NVIDIA Nsight Compute实例中打开的任何其他报告的基线。选择箭头下拉列表以访问“清除基线”按钮,该按钮将删除所有当前活动的基线。

“应用规则”按钮应用此报表的所有可用规则。如果以前应用过规则,这些结果将被替换。默认情况下,一旦分析了内核启动过程,就会立即应用规则。这可以在“工具”>“选项”>“配置文件”>“报表UI”>“自动应用适用规则”下的选项中进行更改。

右侧的按钮提供了可以在页面上执行的多个操作。可用操作包括:

复制为图像-将页面内容作为图像复制到剪贴板。

另存为图像-将页面内容作为图像保存到文件中。

另存为PDF-将页面内容以PDF格式保存到文件中。

导出到CSV-将页面内容导出为CSV格式。

重置为默认值-通过删除任何保留的设置将页面重置为默认状态。

请注意,并非所有的功能都在所有页面上可用。

关于所选内核的信息显示为当前的。[+]和[-]按钮可用于显示或隐藏节正文内容。信息切换按钮i改变了章节描述的可见性。

报告页数

使用页眉中的Page下拉菜单在报表页之间切换。

会话页面

此会话页包含有关报告和计算机的基本信息,以及为其分析启动的所有设备的设备属性。在启动实例之间切换时,将突出显示相应的设备属性。

摘要页

摘要页面显示此报告中收集的所有结果的列表,以及选定的重要摘要度量。它为您提供了一个快速的比较概述,涵盖了所有已分析的内核启动。您可以使用“转置”按钮来转置内核和度量表。

详细信息页

Details页面是内核启动期间收集的所有度量数据的主页面。页面被分成单独的部分。每个部分由一个标题表和一个可选的可扩展正文组成。这些部分完全是用户定义的,可以通过更新它们各自的文件轻松地进行更改。有关自定义节的详细信息,请参见《自定义手册》。有关NVIDIA Nsight Compute附带的部分列表,请参阅《内核评测指南》。

默认情况下,收集到新的概要文件结果后,将应用所有适用的规则。任何规则结果都将在此页面上显示为建议。大多数规则结果都是纯信息性的,或者有一个警告图标来指示某些性能问题。带有错误图标的结果通常表示应用规则时出错。

规则结果通常指出性能问题并指导整个分析过程。

如果启用,SOL Rooflines部分包含一个Roofline图表,它对于直观地显示内核性能特别有用。(要在报告中启用roofline图表,请确保在分析时选择了GPU Speed of Light roofline Chart部分。)有关如何使用和读取此图表的更多信息,请参阅Kernel profiling Guide。

屋顶线图样本。

可以使用下表中的控件缩放和平移屋顶线图表,以便进行更有效的数据分析。

表1屋顶线图表缩放和平移控件

如果启用,内存工作负载分析部分将包含一个内存图表,用于可视化数据传输、缓存命中率、指令和内存请求。关于如何使用和阅读这个图表的更多信息可以在内核评测指南中找到。

源计数器等部分可以包含源热点表。这些表显示了内核源代码中一个或多个度量的N个最高或最低值。选择位置链接以在源页面中直接导航到此位置。将鼠标悬停在某个值上,以查看哪些度量对该值起作用。

热点表指出源代码中的性能问题。

Nsight Compute Profilier 分析的更多相关文章

  1. NSight Compute 用户手册(下)

    主菜单 文件 新建项目使用"新建项目"对话框创建新的分析项目 4. Main Menu and Toolbar Information on the main menu and t ...

  2. NSight Compute 用户手册(中)

    NSight Compute 用户手册(中) NVIDIA Nsight Compute支持密码和私钥身份验证方法.在此对话框中,选择身份验证方法并输入以下信息: 密码 IP/主机名:目标设备的IP地 ...

  3. NSight Compute 用户手册(上)

    NSight Compute 用户手册(上) 非交互式配置文件活动 从NVIDIA Nsight Compute启动目标应用程序 启动NVIDIA Nsight Compute时,将出现欢迎页面.单击 ...

  4. 如何使用Nsight Compute?

    如何使用Nsight Compute? 下图command Line Argunments是指训练或测试命令,Linux下直接用测试或训练命令

  5. 用NVIDIA NsightcComputeRoofline分析加速高性能HPC的应用

    用NVIDIA NsightcComputeRoofline分析加速高性能HPC的应用 编写高性能的软件不是一件简单的任务.当有了可以编译和运行的代码之后,当您尝试并理解它在可用硬件上的执行情况时,将 ...

  6. CUDA 11功能清单

    CUDA 11功能清单 基于NVIDIA Ampere GPU架构的新型NVIDIA A100 GPU在加速计算方面实现了最大的飞跃.A100 GPU具有革命性的硬件功能,CUDA 11与A100一起 ...

  7. CUDA 11功能展示

    CUDA 11功能展示 CUDA 11 Features Revealed 新的NVIDIA A100 GPU基于NVIDIA安培GPU架构,实现了加速计算的最大一代飞跃.A100 GPU具有革命性的 ...

  8. 构建可扩展的GPU加速应用程序(NVIDIA HPC)

    构建可扩展的GPU加速应用程序(NVIDIA HPC) 研究人员.科学家和开发人员正在通过加速NVIDIA GPU上的高性能计算(HPC)应用来推进科学发展,NVIDIA GPU具有处理当今最具挑战性 ...

  9. Oracle_高级功能(2) 索引

    1.oracle优化器 优化目标分为4种: choose (选择性) rule (基于规则) first rows(第一行) all rows(所有行) Description:描述sql的执行计划 ...

随机推荐

  1. 病毒木马查杀实战第025篇:JS下载者脚本木马的分析与防御

    前言 这次我与大家分享的是我所总结的关于JS下载者脚本木马的分析与防御技术.之所以要选择这样的一个题目,是因为在日常的病毒分析工作中,每天都会遇到这类病毒样本,少则几个,多则几十个(当然了,更多的样本 ...

  2. hdu4907 水dp 或者set

    题意:       给你一些被占用的时间点,然后有一些询问,每次输出大于等于询问时间的没被占用的最小的那个时间. 思路:       直接把所有用过的时间标记上,然后倒着更新一遍当前最小空余时间,或者 ...

  3. 内核模式下的线程同步的分析(Windows核心编程)

    内核模式下的线程同步 内核模式下的线程同步是用户模式下的线程同步的扩展,因为用户模式下的线程同步有一定的局限性.但用户模式下线程同步的好处是速度快,不需要切换到内核模式(需要额外的 CPU 时间).通 ...

  4. Hexo 博客Next 搭建与美化主题

    ========================================================================================将页面部署到GitHub ...

  5. 【phpstorm】Server's certificate is not trusted

    问题描述 phpstorm 一直跳出 问题解决 file-->Settings然后搜索Server Certificates,选中框打钩

  6. Python数模笔记-Sklearn(4)线性回归

    1.什么是线性回归? 回归分析(Regression analysis)是一种统计分析方法,研究自变量和因变量之间的定量关系.回归分析不仅包括建立数学模型并估计模型参数,检验数学模型的可信度,也包括利 ...

  7. Python数模笔记-Sklearn(5)支持向量机

    支持向量机(Support vector machine, SVM)是一种二分类模型,是按有监督学习方式对数据进行二元分类的广义线性分类器. 支持向量机经常应用于模式识别问题,如人像识别.文本分类.手 ...

  8. MFC对话框不能使用菜单更新宏ON_UPDATE_COMMAND_UI

    菜单更新宏的原理 更新处理宏的工作原理是基于框架窗口类的.MFC中对话框菜单更新宏的原理是:当我们使用从CFrameWnd框架窗口类中派生的类创建窗口时,当我们单击菜单且菜单还未弹出前会产生WM_IN ...

  9. Can’t update table ‘xxx’ in stored function/trigger because it is already used by statement which invoked this stored function/trigger

    MySQL: Solution for ERROR 1442 (HY000): Can't update table 'xxx' in stored function/trigger because ...

  10. 『动善时』JMeter基础 — 18、JMeter配置元件【计数器】

    目录 1.计数器介绍 2.计数器界面详解 3.计数器的使用 (1)测试计划内包含的元件 (2)线程组界面内容 (3)计数器界面内容 (4)HTTP请求界面内容 (5)查看结果 1.计数器介绍 如果需要 ...