原网站:https://devblogs.nvidia.com/increase-performance-gpu-boost-k80-autoboost/

由于我主要使用nvidia-smi,故nvcc不做了解...有需要的可以参考原网站

NVIDIA®GPU Boost™是NVIDIA®GeForce®和Tesla®GPU上的一项功能,可在有足够的功率和散热空间的情况下通过提高GPU内核和内存时钟速率来提高应用程序性能)。对于Tesla GPU,GPU Boost是针对在集群上运行的计算密集型工作负载而定制的。在这篇文章中,我将更详细地描述GPU Boost,并向您展示如何在应用程序中利用它。我还介绍了Tesla K80 autoboost,并演示了它可以自动匹配显式控制的应用程序时钟的性能。

Tesla GPU的目标是特定的功率预算,例如Tesla K40的TDP(热设计功率)为235W,Tesla K80的TDP为300W。这些TDP额定值是上限,图1中的图表显示许多HPC工作负载并不接近此功率极限。特斯拉的NVIDIA GPU Boost可让用户通过使用可用功率余量来选择更高的图形时钟速率,从而提高应用程序性能。

                    图1:实际应用程序的平均GPU功耗

NVIDIA GPU Boost通过应用程序时钟设置公开给Tesla加速器使用,并且在新的Tesla K80加速器上也可以通过新的autoboost功能启用,该功能默认启用。用户或系统管理员可以通过以下任一方法禁用自动升压功能并为应用程序手动设置正确的时钟:

nvidia-smi  在节点上本地运行命令行工具

使用NVIDIA系统管理界面控制GPU Boost

您可以 nvidia-smi  用来控制应用程序时钟,而无需对应用程序进行任何更改。

您可以通过将查询选项(-q)  传递给来显示当前应用程序时钟设置nvidia-smi。使用  -i 和显示选项(-d),您可以过滤此视图以仅显示特定GPU的时钟信息。

nvidia-smi -q -i -d CLOCK

==============NVSMI LOG==============

Timestamp                           : Sat May   ::
Driver Version : 384.81 Attached GPUs :
GPU ::00.0
Clocks
Graphics : MHz
SM : MHz
Memory : MHz
Video : MHz
Applications Clocks
Graphics : MHz
Memory : MHz
Default Applications Clocks
Graphics : MHz
Memory : MHz
Max Clocks
Graphics : MHz
SM : MHz
Memory : MHz
Video : MHz
Max Customer Boost Clocks
Graphics : N/A
SM Clock Samples
Duration : 26.64 sec
Number of Samples :
Max : MHz
Min : MHz
Avg : MHz
Memory Clock Samples
Duration : 26.64 sec
Number of Samples :
Max : MHz
Min : MHz
Avg : MHz
Clock Policy
Auto Boost : On
Auto Boost Default : On

在更改应用程序时钟之前,您需要将GPU置于持久性模式并查询可用的应用程序时钟速率。持久模式可确保即使GPU上没有运行CUDA或X应用程序,驱动程序仍保持加载状态。这将保持当前状态,包括请求的应用程序时钟。持久性模式对于使应用程序时钟更改持续到应用程序运行是必需的。使用以下命令行启用持久性模式(对于GPU 0)。可以看出GPU0的对应频率为Graphics : 562 MHz,Memory : 2505 MHz

sudo nvidia-smi -pm ENABLED -i -smi -pm ENABLED -i

之后可以查看频率

nvidia-smi -q -i , -d SUPPORTED_CLOCKS

Timestamp                           : Sat May   ::
Driver Version : 384.81 Attached GPUs :
GPU ::00.0
Supported Clocks
Memory : MHz
Graphics : MHz
Graphics : MHz
Graphics : MHz
Graphics : MHz
Graphics : MHz
Graphics : MHz
Graphics : MHz
Graphics : MHz
Graphics : MHz
Graphics : MHz
Graphics : MHz
Graphics : MHz
Graphics : MHz
Graphics : MHz
Graphics : MHz
Graphics : MHz
Graphics : MHz
Graphics : MHz
Graphics : MHz
Graphics : MHz
Graphics : MHz
Graphics : MHz
Graphics : MHz
Graphics : MHz
Graphics : MHz
Memory : MHz
Graphics : MHz GPU ::00.0
Supported Clocks
Memory : MHz
Graphics : MHz
Graphics : MHz
Graphics : MHz
Graphics : MHz
Graphics : MHz
Graphics : MHz
Graphics : MHz
Graphics : MHz
Graphics : MHz
Graphics : MHz
Graphics : MHz
Graphics : MHz
Graphics : MHz
Graphics : MHz
Graphics : MHz
Graphics : MHz
Graphics : MHz
Graphics : MHz
Graphics : MHz
Graphics : MHz
Graphics : MHz
Graphics : MHz
Graphics : MHz
Graphics : MHz
Graphics : MHz
Memory : MHz
Graphics : MHz

请注意,支持的图形时钟频率与特定的内存时钟频率相关,因此在设置应用程序时钟时,必须同时设置内存时钟和图形时钟。使用 -ac 命令行选项执行此操作

sudo nvidia-smi -ac , -i 0

 Applications clocks set to "(MEM 3004, SM 875)" for GPU ::00.0 All done

可以使用 -rac  (“重置应用程序时钟”)选项重置默认值

$ sudo nvidia-smi  -rac -i
All done.

为避免在多用户环境中出现麻烦,更改应用程序时钟需要管理特权。但是,系统管理员可以通过将应用程序时钟许可权设置为 UNRESTRICTED  使用   -acp  (“应用程序时钟许可权”)选项来  放宽此要求,以允许非管理员用户更改应用程序时钟  nvidia-smi

$ sudo nvidia-smi -acp UNRESTRICTED -i
Applications clocks commands have been set to UNRESTRICTED for GPU ::00.0
All done.

请注意,建议使用应用程序时钟设置。如果由于散热或功耗等原因,GPU无法在选定的时钟上安全地运行,它将动态降低时钟。您可以使用来查询是否发生了这种情况   nvidia-smi -q -i -d PERFORMANCE 。此行为可确保即使应用程序时钟设置得太高,您也始终可以获得正确的结果。

借助GPU Boost和K80 Autoboost提高性能的更多相关文章

  1. ASP.NET MVC之如何看待内置配置来提高性能优化(四)

    前言 前几篇我们比较基础的讲了下MVC中的知识,这一节我们穿插点知识,讲讲MVC中我们可以提高性能的办法. Razor视图引擎优化(优化一) 我们知道默认情况下配置MVC去解析一个视图会首先约定通过查 ...

  2. CSS性能分析,如何优化CSS提高性能

    不负十年后的自己,共勉! 前端性能优化一直是一个比较热门的话题,我们总是在尽我们最大的努力去,提高我们的页面性能,比如减少HTTP请求,利用工具对资源进行合并压缩,脚本置底,避免重复请求,css sp ...

  3. 对于大批量赋值功能,使用if判断是否能提高性能

    场景: 如果对某变量进行赋值,是否需要判断一下,如果相等就不用赋值,这样会不会提高性能. 代码如下: "; "; , x2=, x3=; Stopwatch w = new Sto ...

  4. Java编程提高性能时需注意的地方

    1.尽量在合适的场合使用单例 使用单例可以减轻加载的负担,缩短加载的时间,提高加载的效率,但并不是所有地方都适用于单例,简单来说,单例主要适用于以下三个方面 第一,控制资源的使用,通过线程同步来控制资 ...

  5. 使用C# yield关键字来提高性能和可读性

    对于”yield”这个关键字我已经见过N次了,直到最近我才知道这个关键字所蕴含的力量.我将在下面展示出一些使用”yield”让你的代码有更高可读性和更好性能的例子. 为了让你对yield有一些快速概览 ...

  6. 使用WITH AS提高性能简化嵌套SQL(转载)

    使用WITH AS提高性能简化嵌套SQL http://www.cnblogs.com/fygh/archive/2011/08/31/2160266.html

  7. Java 编程:如何提高性能?(简单总结篇)

    开发者在编程中除了要有编程规范,还要注意性能,在 Java 编程中有什么提高性能的好办法呢? 本文转自国内 ITOM 行业领军企业 OneAPM Cloud Insight(一款能够优雅监控多种操作系 ...

  8. 05_Smart-image通过SoftReference提高性能

    文章导读: 文件介绍了常见的图片下载开源插件smart-image, 由于移动设备硬件受限,因此Android的相关app都要考虑到性能的关系, 所以很多的第三方插件都使用到了缓存cache技术,本人 ...

  9. FMDB官方使用文档-GCD的使用-提高性能(翻译)

    FMDB官方使用文档-GCD的使用-提高性能(翻译) 发布于:2013-08-19 10:01阅读数:13395 由于FMDB是建立在SQLite的之上的,所以你至少也该把这篇文章从头到尾读一遍.与此 ...

随机推荐

  1. day58 前端收尾

    目录 一.jQuery结束 1 阻止后续事件执行 2 阻止事件冒泡 3 事件委托 4 页面加载 5 动画效果 6 补充知识点 二.前端框架Bootstrap 1 布局容器 2 栅格系统 3 栅格参数 ...

  2. day28 作业

    import uuid import pickle import os # 学校类 class School: #校区的名字:如"老男孩上海校区" #校区的地址:如"上海 ...

  3. 记一次线上服务CPU 100%的处理过程

    告警 正在开会,突然钉钉告警声响个不停,同时市场人员反馈客户在投诉系统登不进了,报504错误.查看钉钉上的告警信息,几台业务服务器节点全部报CPU超过告警阈值,达100%. 赶紧从会上下来,SSH登录 ...

  4. redis(十二):Redis 集合(Set)

    Redis 集合(Set) Redis 的 Set 是 String 类型的无序集合.集合成员是唯一的,这就意味着集合中不能出现重复的数据. Redis 中集合是通过哈希表实现的,所以添加,删除,查找 ...

  5. 1.对Java平台的理解。“Java是解释执行”对吗

    Java本身是一种面向对象的语言,最显著的特性有两个方面,一是所谓的“书写一次,到处运行”,能够非常容易地获得跨平台能力: 另外就是垃圾收集(GC),Java通过垃圾收集器(Garbage Colle ...

  6. 深入理解Java虚拟机--个人总结(持续更新)

    深入理解Java虚拟机--个人总结(持续更新) 每天按照书本学一点,会把自己的总结思考写下来,形成输出,持续更新,立帖为证 -- 2020年7月7日 开始第一次学习 -- 2020年7月8日 今天在百 ...

  7. 想用@Autowired注入static静态成员?官方不推荐你却还偏要这么做

    生命太短暂,不要去做一些根本没有人想要的东西.本文已被 https://www.yourbatman.cn 收录,里面一并有Spring技术栈.MyBatis.JVM.中间件等小而美的专栏供以免费学习 ...

  8. echarts 实战 : 标题的富文本样式

    官方文档在这一块交待的不是很清楚,记录一下. title:{ left:15, top:10, subtext:"AAA {yellow|316} BBB {blue|219}", ...

  9. DirectX11 With Windows SDK--35 粒子系统

    前言 在这一章中,我们主要关注的是如何模拟一系列粒子,并控制它们运动.这些粒子的行为都是类似的,但它们也带有一定的随机性.这一堆粒子的几何我们叫它为粒子系统,它可以被用于模拟一些比较现象,如:火焰.雨 ...

  10. 解决win10安装flask-mysqldb报错 Python2.7

    win10上安装的pycharm,在pycharm创建的py2.7虚拟环境中安装flask-sqlalchemy 执行pip install flask-mysqldb报错 error: Micros ...