定量分析技术基础课件

上传人:我*** 文档编号:143155083 上传时间:2020-08-26 格式:PPT 页数:31 大小:369.50KB
返回 下载 相关 举报
定量分析技术基础课件_第1页
第1页 / 共31页
定量分析技术基础课件_第2页
第2页 / 共31页
定量分析技术基础课件_第3页
第3页 / 共31页
定量分析技术基础课件_第4页
第4页 / 共31页
定量分析技术基础课件_第5页
第5页 / 共31页
点击查看更多>>
资源描述

《定量分析技术基础课件》由会员分享,可在线阅读,更多相关《定量分析技术基础课件(31页珍藏版)》请在金锄头文库上搜索。

1、1.5定量分析技术基础,1.5.1 计算机性能的评测, 响应时间:从事件开始到结束之间的时间, 也称为执行时间。 (计算机完成某一任务所花费的全部时间) 流量:在单位时间内所能完成的工作量。,相同点:都认为能够以最短时间完成指定任务的 计算机就是最快的。 不同点:响应时间针对单任务,而流量针对多任务。,第一章 计算机体系结构的基本概念,响应时间与性能成反比,上式变成 n = = =,1. 假设两台计算机为X和Y,“X比Y快”的意思是 对于给定任务,X的响应时间比Y少。 X比Y快n倍: = n,用户CPU时间 系统CPU时间,2. CPU时间 CPU工作的时间,不包含I/O等待时间及运行 其它程

2、序的时间。,1.5 定量分析技术基础,1.5.2 测试程序,1.目前常用的测试程序可以分为五类: (按测试可靠性由高至低的顺序列出) (1) 实际应用程序 (2) 修正的(或者脚本化)应用程序 (3) 核心测试程序 (3) 小测试程序 (4) 合成测试程序,1.5 定量分析技术基础,2. 测试程序组件 选择一组各个方面有代表性的测试程序, 组成一个通用测试程序集合。 最大优点: 避免了独立测试程序存在的片面性,尽 可能全面地测试了一个计算机系统的性能。 最常见的测试程序组件是基于UNIX的SPEC 主要版本包括SPEC89、SPEC92、 SPEC95和SPEC2000等。,1.5 定量分析技

3、术基础,表1.7SPEC不同版本所包含测试程序的演化过程,表1.8SPEC CPU2000测试程序组件中的程序, SPEC2000测试程序组件,除了含有测试CPU的 SPEC CPU2000,还包括其他一系列测试程序组 件:,SPECviewperf 用于测试图形系统支持OpenGL库的性能 SPECapc 测试图形密集型应用的性能 SPECSFS 基于NFS文件系统的文件服务器测试程 SPECWeb Web服务器测试程序,1.5 定量分析技术基础, TPC测试程序组件 事务处理(Transaction-processing,TP) 测试程序主要测试在线事务处理系统的性能。 核心内容:数据库访

4、问和相关的信息决策能力。,TPC-A TPC-C 模拟一个复杂队列环境。 TPC-H 一个特别的决策支持模型,其队列执 行时间特别长。,1.5 定量分析技术基础,TPC-R 模拟面向一组标准队列的商业决策支持 系统,涉及到DBMS的优化。 TPC-W 基于Web的商业事务处理活动。,面向事务处理的测试程序组件主要用于测试服 务器的性能。 测试基于Microsoft公司的Windows系列操 作系统平台的测试组件,1.5 定量分析技术基础,PCMark04 包括中央处理器测试组、内存测试组、图 形芯片测试组、硬盘测试组等。 Business Winstone 2004 主要用于测试计算机系统商业

5、应用的综合 性能。 Multimedia Content Creation Winstone 2004 主要用于测试计算机系统多媒体应用的综合性能。,1.5 定量分析技术基础,SiSoft Sandra Pro 2004 拥有超过30种以上的分析与测试模组, 主要包括有CPU、存储器、I/O接口(如SCSI、 APM/ACPI、网络等)、I/O设备(如CD- ROM/DVD、鼠标、键盘、打印机等)、主板 等。,1.5 定量分析技术基础,3DMark03 主要测试显卡性能和DirectX的性能。 Prime95 用来估计分布式计算程序的通信情况, 可使计算机高负荷运转,所以也用来测试计 算机的稳

6、定性。 SuperPi/SuperE 计算圆周率/自然指数e的软件,通常 用来测试CPU的稳定性。, 一些专门的性能指标测试程序,1.5 定量分析技术基础,1.5.3 性能设计和评测的基本原则,三条基本原则和方法:,1. 大概率事件优先的原则 对于大概率事件(最常见的事件),赋予 它优先的处理权和资源使用权,以获得全局的 最优结果。 2. Amdahl定律 加快某部件执行速度所获得的系统性能 加速比,受限于该部件在系统中所占的重要性。,1.5 定量分析技术基础,(1) 加速比,系统加速比依赖于两个因素: 可改进比例:可改进部分在原系统计算时间中所占的 比例,它总是小于等于的。 例如: 一个需运

7、行60秒的程序中有20秒的运算 可以加速,那么该比例就是20/60。,系统加速比 = =,部件加速比:可改进部分改进以后的性能提高, 一般情况下它是大于的 。 例如: 系统改进后执行程序,其中可改进部分花 费2秒的时间,而改进前该部分需花费5秒, 则性能提高为5/2。,1.5 定量分析技术基础,总执行时间改进后=(1-可改进比例)总执行时间改进前 + = (1-可改进比例) + 总执行时间改进前,总执行时间改进后 = 不可改进部分的执行时间 + 可改进部分改进后的执行时间,系统加速比为改进前与改进后总执行时间之比: 系统加速比 = =,(2) Amdahl定律:性能递减规则 如果仅仅对计算机中

8、的一部分做性能改 进,则改进越多,系统获得的效果越小。 推论:如果只针对整个任务的一部分进行优化, 那么所获得的加速比不大于1/(1-fe)。 (3) 一个“好”的计算机系统:具有高性价比的计 算机系统是一个带宽平衡的系统,而不是看它 使用的某些部件的性能 。,1.5 定量分析技术基础,3. 程序的局部性原理 程序在执行时所访问地址的分布不是随机 的,而是相对地簇聚;这种簇聚包括指令和数 据两部分。 程序的时间局部性:程序即将用到的信息很 可能就是目前正在使用的信息。 程序的空间局部性:程序即将用到的信息很 可能与目前正在使用的信息在空间上相邻或者 临近。,1.5 定量分析技术基础,1.5.4

9、 CPU的性能 1. 将程序执行的时间进行分解 (1) 计算机工作的时钟频率 计算机系统中与实现技术和工艺有关的因素。 单位是MHz(f)。 (2) 总时钟周期数,程序执行的cpu时间 :,CPU时间 = 总时钟周期数 / 时钟频率,1.5 定量分析技术基础,2. “指令时钟数”CPI(Cycles Per Instruction) 一个与计算机体系结构有关的参数。,CPI = 总时钟周期数 / IC,3. 程序执行的CPU时间可以写成 总CPU时间 = CPI IC / 时钟频率, 时钟频率:反映了计算机实现技术、生产工艺 和计算机组织。,IC:程序执行过程中所处理的指令数。,1.5 定量分

10、析技术基础, CPI:反映了计算机实现技术、计算机指令集 的结构和计算机组织。 IC:反映了计算机指令集的结构和编译技术。,1.5 定量分析技术基础,假设:计算机系统有n种指令; CPIi :第i种指令的处理时间; ICi :在程序中第i种指令出现的次数; 则程序执行时间为 CPU时间 = (CPIi ICi) / 时钟频率 CPI = (CPIi ICi) / IC = (CPIi ICi / IC) 其中:(ICi / IC)反映了第i种指令在程序中所占的 比例。,i=1,i=1,i=1,n,n,n,1.5 定量分析技术基础,4. 对CPU性能公式进行进一步细化,例1.1 假设我们考虑条件

11、分支指令的两种不同设计方法如下:,(1) CPUA:通过比较指令设置条件码,然后测试条 件码进行分支。 CPUB:在分支指令中包括比较过程,在两种CPU中,条件分支指令都占用2个时钟周 期而所有其它指令占用1个时钟周期,对于CPUA,执 行的指令中分支指令占20%;由于每个分支指令之前 都需要有比较指令,因此比较指令也占20%。由于CPUA,1.5 定量分析技术基础,在分支时不需要比较,因此假设它的时钟周期时间 比CPUB快1.25倍。哪一个CPU更快?如果CPUA的时钟 周期时间仅仅比CPUB快1.1倍,哪一个CPU更快呢?,解:我们不考虑所有系统问题,所以可用CPU性能公式。占用2个时钟周

12、期的分支指令占总指令的20%,剩下的指令占用1个时钟周期。所以 CPIA = 0.2 2 + 0.80 1 = 1.2 则CPU性能为: 总CPU时间A = IC 1.2 时钟周期A,1.5 定量分析技术基础,根据假设,有: 时钟周期B = 1.25 时钟周期A 在CPUB中没有独立的比较指令,所以CPUB的程序量为CPUA的80%,分支指令的比例为: 20%/80% = 25% 这些分支指令占用2个时钟周期,而剩下的75%的指令占用1个时钟周期,因此: CPIB = 0.25 2 + 0.75 1 = 1.25 因为CPUB不执行比较,故: ICB = 0.8 ICA,1.5 定量分析技术基

13、础,因此CPUB性能为: 总CPU时间B = ICB CPIB 时钟周期B = 0.8 ICA 1.25 (1.25 时钟周期A) = 1.25 ICA 时钟周期A 在这些假设之下,尽管CPUB执行指令条数较少,CPUA因为有着更短的时钟周期,所以比CPUB快。,1.5 定量分析技术基础,如果CPUA的时钟周期时间仅仅比CPUB快1.1倍,则 时钟周期B = 1.10 时钟周期A CPUB的性能为: 总CPU时间B = ICB CPIB 时钟周期B = 0.8 ICA 1.25 (1.10 时钟周期A) = 1.10 ICA 时钟周期A 因此CPUB由于执行更少指令条数,比CPUA运行更快。,1.5 定量分析技术基础,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > PPT模板库 > PPT素材/模板

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号