intelvtune性能分析器基础

上传人:n**** 文档编号:101283838 上传时间:2019-09-27 格式:PDF 页数:43 大小:3.24MB
返回 下载 相关 举报
intelvtune性能分析器基础_第1页
第1页 / 共43页
intelvtune性能分析器基础_第2页
第2页 / 共43页
intelvtune性能分析器基础_第3页
第3页 / 共43页
intelvtune性能分析器基础_第4页
第4页 / 共43页
intelvtune性能分析器基础_第5页
第5页 / 共43页
点击查看更多>>
资源描述

《intelvtune性能分析器基础》由会员分享,可在线阅读,更多相关《intelvtune性能分析器基础(43页珍藏版)》请在金锄头文库上搜索。

1、Intel VTune 性能分析器基础性能分析器基础 杨全胜杨全胜 东南大学成贤学院计算机系东南大学成贤学院计算机系 多核结构与程序设计 Southeast University 东东 南南 大大 学学 2 内容内容 VTune 性能分析器性能分析器 使用采样器使用采样器 如何采样的如何采样的 Sampling Over Time Call Graph 多核结构与程序设计 Southeast University 东东 南南 大大 学学 3 VTuneVTune 性能分析器性能分析器 通过下来方法帮助你识别和描述性能问题:通过下来方法帮助你识别和描述性能问题: 从系统运行你的应用程序中收集性能

2、数据从系统运行你的应用程序中收集性能数据 在不同的交互视窗中组织和显示数据,从系统层在不同的交互视窗中组织和显示数据,从系统层 面到源码级或者处理器指令级面到源码级或者处理器指令级. 标识出潜在的性能问题并提出改进建议标识出潜在的性能问题并提出改进建议 多核结构与程序设计 Southeast University 东东 南南 大大 学学 4 VTuneVTune 性能分析器性能分析器 支持环境支持环境 本地和远程数据采集本地和远程数据采集 检测在安装了分析器的系统中运行的应用程序的检测在安装了分析器的系统中运行的应用程序的 性能,或者性能,或者 在运行了在运行了Vtune分析器远程代理的其他机

3、器中执行分析器远程代理的其他机器中执行 性能分析性能分析 多核结构与程序设计 Southeast University 东东 南南 大大 学学 5 VTuneVTune 性能分析性能分析 本地性能分析本地性能分析 Intel IA-32处理器处理器 Microsoft Windows*操作系统操作系统 Red Hat Linux*操作系统操作系统 SuSE Linux操作系统操作系统 Itanium(安腾)系列处理器(安腾)系列处理器 Microsoft Windows*操作系统操作系统 Red Hat Linux*操作系统操作系统 SuSE Linux操作系统操作系统 对于特定的操作系统版本

4、,看版本注释对于特定的操作系统版本,看版本注释 多核结构与程序设计 Southeast University 东东 南南 大大 学学 6 VTuneVTune 性能分析性能分析 主主/目标环境目标环境 VTune性能分析器主持远程数据收集性能分析器主持远程数据收集 VTune 性能分析器安装在主系统中性能分析器安装在主系统中 远程代理安装在目标系统远程代理安装在目标系统 主系统主系统 Windows* 操作系统操作系统 控制目标控制目标 看收集到的数据看收集到的数据 目标系统目标系统 IA-32 或或 Itanium 系系 列处理器列处理器 Windows 或或 Linux* 执行执行Wind

5、ows CE*的的 Intel PXA2xx处理器处理器 局域网连接局域网连接 多核结构与程序设计 Southeast University 东东 南南 大大 学学 7 VTuneVTune 性能分析性能分析 Intel VTuneTM 性能分析器提供帮助性能调节性能分析器提供帮助性能调节 的特性的特性: Sampling(采样)(采样): 计算一个应用程序在一段时计算一个应用程序在一段时 间不同处理器事件下的性能间不同处理器事件下的性能 Call Graph(调用图形)(调用图形): 提供一个图示化的应提供一个图示化的应 用程序执行流并帮助你识别关键性函数和时序的用程序执行流并帮助你识别关键

6、性函数和时序的 细节。细节。 Counter Monitor(计数器监测)(计数器监测): 提供系统级性提供系统级性 能信息,比如应用程序执行阶段的资源利用情况。能信息,比如应用程序执行阶段的资源利用情况。 这个功能只在这个功能只在Windows上实现。上实现。 多核结构与程序设计 Southeast University 东东 南南 大大 学学 8 VTuneVTune 性能分析性能分析 Intel VTuneTM 性能分析器提供帮助性能调节性能分析器提供帮助性能调节 的特性的特性: Hotspots View(热点观察)(热点观察): 帮助标识代码中最帮助标识代码中最 耗处理器事件的部分耗

7、处理器事件的部分 Tuning Assistant(调节助手)(调节助手): 根据性能数据根据性能数据 的分析提供调节建议。调节建议提供给程序员一的分析提供调节建议。调节建议提供给程序员一 个改善某应用程序性能的指导。这个功能只有个改善某应用程序性能的指导。这个功能只有 Windows下能用。下能用。 多核结构与程序设计 Southeast University 东东 南南 大大 学学 9 VTuneVTune 性能分析器性能分析器 采样收集全系统的性能数据采样收集全系统的性能数据 多核结构与程序设计 Southeast University 东东 南南 大大 学学 10 VTuneVTune

8、 性能分析器性能分析器 Sampling Over Time 视窗显示采样数据在时间段内如何变化视窗显示采样数据在时间段内如何变化 多核结构与程序设计 Southeast University 东东 南南 大大 学学 11 VTuneVTune 性能分析器性能分析器 Sampling Source View显示带注释的源代码的性能数据显示带注释的源代码的性能数据 多核结构与程序设计 Southeast University 东东 南南 大大 学学 12 VTuneVTune 性能分析器性能分析器 Call Graph Collects 显示有关程序流的信息显示有关程序流的信息 多核结构与程序设

9、计 Southeast University 东东 南南 大大 学学 13 内容内容 VTune 性能分析器性能分析器 使用采样器使用采样器 如何采样的如何采样的 Sampling Over Time Call Graph 多核结构与程序设计 Southeast University 东东 南南 大大 学学 14 使用采样器使用采样器 什么是热点什么是热点? 热点热点是一段包含大量活跃的内部处理器事件的代是一段包含大量活跃的内部处理器事件的代 码片段,这些内部处理器事件比如码片段,这些内部处理器事件比如clockticks、 cache不命中或磁盘读操作不命中或磁盘读操作 瓶颈瓶颈是应用程序中

10、运行较慢的代码区域,优化代是应用程序中运行较慢的代码区域,优化代 码,就是要消除这些瓶颈码,就是要消除这些瓶颈 ! 注意注意 通常人们会混淆热点和瓶颈。一个热点显示在寻找瓶颈的时通常人们会混淆热点和瓶颈。一个热点显示在寻找瓶颈的时 候,哪里值得你去关注。所有的瓶颈都是热点,但是所有的候,哪里值得你去关注。所有的瓶颈都是热点,但是所有的 热点并不一定是瓶颈。热点并不一定是瓶颈。 多核结构与程序设计 Southeast University 东东 南南 大大 学学 15 使用采样器使用采样器 统计方法寻找热点统计方法寻找热点 采样器采样器 周期性地中断周期性地中断CPU 基于时间的基于时间的 基于

11、事件的:一定数量的微架构事件发生后被触发基于事件的:一定数量的微架构事件发生后被触发 收集运行环境:收集运行环境: 内存中的运行地址内存中的运行地址(CS:IP) 操作系统的进程和线程操作系统的进程和线程ID 执行模块被装载的地址执行模块被装载的地址 如果你有该模块的符号,后处理过程能够标识出在存储地如果你有该模块的符号,后处理过程能够标识出在存储地 址中的函数或模块。址中的函数或模块。 符号文件的行号能直接告诉你源代码中的相关行。符号文件的行号能直接告诉你源代码中的相关行。 多核结构与程序设计 Southeast University 东东 南南 大大 学学 16 使用采样器使用采样器 采集

12、器采集器 周期性中断处理器来获得运行环境周期性中断处理器来获得运行环境 基于时间的采样基于时间的采样(TBS)被下述情况触发:被下述情况触发: 操作系统时钟服务操作系统时钟服务 每每n个处理器个处理器clockticks 基于事件的采样基于事件的采样(EBS)在处理器事件计数器溢出的在处理器事件计数器溢出的 时候被触发时候被触发 这些事件是处理器特有的,像这些事件是处理器特有的,像L2 Cache不命中、分不命中、分 支预测错误、浮点指令退回等等支预测错误、浮点指令退回等等 多核结构与程序设计 Southeast University 东东 南南 大大 学学 17 使用采样器使用采样器 操作系

13、统的进程的操作系统的进程的 采样结果采样结果 这个操作系统进程有最多的这个操作系统进程有最多的 clockticks采样值采样值 多核结构与程序设计 Southeast University 东东 南南 大大 学学 18 使用采样器使用采样器 只显示只显示 CPU_CLK_UNHALTED.CORE 采样数据采样数据 点击这里看操作系点击这里看操作系 统统 进程进程 点这里看点这里看 Over Time 多核结构与程序设计 Southeast University 东东 南南 大大 学学 19 使用采样器使用采样器 这个视图来自进程视图的某个选择项这个视图来自进程视图的某个选择项 点这里点这里

14、 观察观察 CPU 多核结构与程序设计 Southeast University 东东 南南 大大 学学 20 使用采样器使用采样器 所有操作系统进程的一个模块或所有操作系统进程的一个模块或 按功能分组的线程的热点视图按功能分组的线程的热点视图 多核结构与程序设计 Southeast University 东东 南南 大大 学学 21 使用采样器使用采样器 多核结构与程序设计 Southeast University 东东 南南 大大 学学 22 使用采样器使用采样器 源代码行的总计源代码行的总计 活动的指令活动的指令 的位置的位置 点这里点这里 看反汇编看反汇编 视图视图 多核结构与程序设计

15、 Southeast University 东东 南南 大大 学学 23 使用采样器使用采样器 红色的时间间隔说明有很多红色的时间间隔说明有很多 的采样值的采样值 放大放大 缩小缩小 选择事件选择事件 多核结构与程序设计 Southeast University 东东 南南 大大 学学 24 使用采样器使用采样器 实践实践1: 寻找热点寻找热点 学习如何用学习如何用VTuneTM分析器识别热点分析器识别热点 多核结构与程序设计 Southeast University 东东 南南 大大 学学 25 使用采样器使用采样器 采样的三个主要好处采样的三个主要好处 你无须修改你的代码你无须修改你的代码 但是却使编译但是却使编译/连接形成符号和行号连接形成符号和行号 但确实优化了发行版本但确实优化了发行版本 采样是全系统的采样是全系统的 不仅仅是你的应用程序不仅仅是你的应用程序 你可以看到活动的操作系统代码,包括驱动程序你可以看到活动的操作系统代码,包括驱动程序 采样的开销很低采样的开销很低 干扰低的时候,有效性很高干扰低的时候,有效性很高. 通过关闭用户界面上的进度表就能降低开销通过关闭用户界面上的进度表就能降低开销 多核结构与程序设计 Southeast University 东东 南南 大大 学学 26 内容内容 VTune 性能分析器性能分析器

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 大杂烩/其它

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号