Intel VTune Amplifier XE 使用
VTune
1. 安装
1.1 软件安装
- 下载:
(安装包下载地址) - 安装:
# 1.解压
tar -zxvf filename.tar.gz
# 2.安装
cd dirname/
./install.sh
1.2 配置环境
csh/tcsh用户:source <install_dir>/amplxe-vars.csh
bash 用户: source <install_dir>/amplxe-vars.sh
默认情况下<install_dir>是:
root用户:/opt/intel/vtune_amplifier_xe_2018
非root用户: $HOME/intel/vtune_amplifier_xe_2018
2. 使用
2.1 图形界面
amplxe-gui
图形界面具体使用参考:《VTune 开发者手册》
2.2 命令行
2.2.1 使用方法:
amplxe-cl <-action> [-action-option] [-global-option] [[--] target [target options]]
常用action包括(具体使用方法请点击后阅读手册):
2.2.2 应用实例
- 查看帮助
amplxe-cl -help [action-option]
- 列出分析类型
# 1. 列出所支持的分析类型
amplxe-cl –collect-list
# 2. 列出可支持的报告类型
amplxe-cl –report-list
- 热点收集
amplxe-cl -collect hotspots -result-dir r0001hs -- ./gsexample2a datafile.txt
amplxe-cl -collect concurrency -r r0002cc -search-dir all:rp=/home/ompPrimes -- ./ompPrime1.icc
amplxe-cl -collect locksandwaits -user-data-dir /tmp -r r0003lw -- ./ompPrime1.icc
amplxe-cl -collect lightweight-hotspots -r r0004lh -- ./primes.gcc
amplxe-cl -collect nehalem_memory-access -duration 10
amplxe-cl -collect lightweight-hotspots -target-process gnome-power-manager -duration 10
amplxe-cl -collect concurrency -duration n -target-process program
amplxe-cl -collect concurrency -duration n -target-pid pid
- 指定事件收集
《事件表》
# 1. 查看事件类型
amplxe-cl -collect-with runsa -knob event-config=?
# 2. 收集指定事件
amplxe-cl -collect-with runsa -knob event-config=MEM_LOAD_RETIRED.LLC_MISS,MEM_LOAD_RETIRED.LLC_UNSHARED_HIT -target-pid=$pid
- 输入、分析VTune性能分析结果
# 1. 导入结果
amplxe-cl -import tbsf141.tb5 -r r001
# 2. 分析结果
amplxe-cl -report pmu-events -r r001 -group-by function
- 热点分析
# 1. 仅列出模块gsexample2a相关的热点函数
amplxe-cl -report hotspots -result-dir r001hs -group-by function -filter module=gsexample2a
# 2. 列出所有的热点函数,包含链接库的
amplxe-cl -report hotspots -result-dir r001hs -call-stack-mode=all -group-by function
# 3. 列出占处理器时间80%的函数(模块)信息
amplxe-cl -report perf-detail -r r000hs -cumulative-threshold-percent 80
# 4. 结果中加入分隔符
amplxe-cl -report perf -csv-delimiter="," -r r000hs
3. 参考:
- 《VTUNE 性能分析器之简介》
- 《使用amplxe-cl 命令行进行性能数据收集和分析》
- 《Cache Miss Rates in Intel® VTune™ Amplifier XE》
- 《使用VTune™ Amplifier XE针对你的项目进行性能调优》
- 《VTune 开发者手册》
Intel VTune Amplifier XE 使用的更多相关文章
- 【性能分析】使用Intel VTune Amplifier
本文转自 https://software.intel.com/zh-cn/blogs/2010/11/10/amplxe-cl/版权归原作者所有,如原作者有任何不允许转载之理由,本文将自行删除. I ...
- intel vtune 介绍、安装和使用
intel vtune 介绍 https://software.intel.com/en-us/vtune intel vtune 安装包下载地址 https://software.intel.com ...
- Intel.parallel.studio.xe.2015.Update.2.ISO-TBE 下载
磁力链下载点我 还有linux版本 Intel.parallel.studio.xe.2015.Update.1.LINUX.ISO-TBE 收集自网络,要跨请跨原作者,谢谢.
- Unreal Engine* 4/英特尔® VTune™ Amplifier 使用指南
借助英特尔 VTune Amplifier,可以通过单一易用的分析界面获得先进的分析功能.UE4 和英特尔 VTune Amplifier 相互配合,支持调查代码并进行分析,从而在多个内核上顺畅运行. ...
- 如何使用Intel vtune profilier?
如何使用Intel vtune profilier?
- Intel VTune性能分析器基础
https://wenku.baidu.com/view/b0fe162ebd64783e09122b66.html
- <转> Intel VTune分析结果中的名词释译
原文转自http://blog.chinaunix.net/uid-26000296-id-3369740.html Elapsed Time(执行耗时): the total time your t ...
- Enhancing the Scalability of Memcached
原文地址: https://software.intel.com/en-us/articles/enhancing-the-scalability-of-memcached-0 1 Introduct ...
- Parrot源代码分析之海贼王
我们的目的是找到speedup-example在使用Parrot加速的原因,假设仅仅说它源于Context Switch的降低,有点简单了,它究竟为什么降低了?除了Context Switch外是否还 ...
随机推荐
- day34-3 类和对象小知识
目录 属性查找顺序 类与对象的绑定方法 类与数据类型 对象的高度整合 属性查找顺序 属性查找顺序:先从对象自身查找,对象没有就去类中查找,类中没有则报错 class Student: name = ' ...
- 【转载】jmeter将上一个接口返回值作为下一个接口的请求参数
第一:通过JSON Extractor 插件来提取JSON响应结果 原文地址:http://blog.csdn.net/dreamtl/article/details/68957122 接口响应结果, ...
- kernel学习单
lock (spin_lock, mutex, rw_mutex/spinlock) waitqueue, tasklet, softIRQ, hardIRQ basic struct (atomic ...
- win10家庭版转专业版并激活
之前重装win10的时候没注意,不小心装成家庭版. 本以为家庭版也没什么,后来发现这对程序员来说造成致命打击. 在系统信息页面底部点击“更改密匙”,输入win10升级产品密匙:VK7JG-NPHTM- ...
- 51nod1242斐波那契数列的第N项 【矩阵快速幂】
斐波那契数列的定义如下: F(0) = 0 F(1) = 1 F(n) = F(n - 1) + F(n - 2) (n >= 2) (1, 1, 2, 3, 5, 8, 13, 21, 34, ...
- 洛谷 P1068 分数线划定【排序+模拟】
世博会志愿者的选拔工作正在 A 市如火如荼的进行.为了选拔最合适的人才,AA市对 所有报名的选手进行了笔试,笔试分数达到面试分数线的选手方可进入面试.面试分数线根 据计划录取人数的150\%150%划 ...
- nyoj51-管闲事的小明
管闲事的小明 时间限制:4000 ms | 内存限制:65535 KB 难度:2 描述 某校大门外长度为L的马路上有一排树,每两棵相邻的树之间的间隔都是1米.我们可以把马路看成一个数轴,马路的一端 ...
- [luogu4158 SCOI2009] 粉刷匠(dp)
传送门 Solution 把状态都记上暴力转移即可 Code //By Menteur_Hxy #include <queue> #include <cmath> #inclu ...
- 在UEditor编辑器的工具栏上加一行文字
<!DOCTYPE HTML> <html> <head> <meta http-equiv="Content-Type" content ...
- What identity values you get with the @@IDENTITY and SCOPE_IDENTITY functions
--测试表及数据 CREATE TABLE TZ ( Z_id int IDENTITY(1,1)PRIMARY KEY, Z_name varchar(20) NOT NULL) INSE ...