高等计算机系统结构

上传人:第*** 文档编号:38819805 上传时间:2018-05-08 格式:PDF 页数:29 大小:2.13MB
返回 下载 相关 举报
高等计算机系统结构_第1页
第1页 / 共29页
高等计算机系统结构_第2页
第2页 / 共29页
高等计算机系统结构_第3页
第3页 / 共29页
高等计算机系统结构_第4页
第4页 / 共29页
高等计算机系统结构_第5页
第5页 / 共29页
点击查看更多>>
资源描述

《高等计算机系统结构》由会员分享,可在线阅读,更多相关《高等计算机系统结构(29页珍藏版)》请在金锄头文库上搜索。

1、北京大学计算机科学技术系北京大学微处理器研究开发中心(第二讲)2005年2月28日程 旭复习高等计算机系统结构高等计算机系统结构北京大学计算机科学技术系北京大学微处理器研究开发中心计算机工程化方法论计算机工程化方法论Technology TrendsEvaluate ExistingEvaluate Existing Systems for Systems for BottlenecksBottlenecksBenchmarksSimulate NewSimulate New Designs andDesigns and OrganizationsOrganizationsWorkloadsI

2、mplement NextImplement Next Generation SystemGeneration SystemImplementation Complexity北京大学计算机科学技术系北京大学微处理器研究开发中心 基准程序(基准程序(Benchmarks)、踪迹()、踪迹(Traces)、频度 ()、频度 (Mixes) 成本成本(Cost)、延迟、延迟(delay)、大小、大小(area)、功率、功率(power) 模拟模拟(Simulation) (多个级别多个级别)ISA, RT, Gate, Circuit 排队论排队论(Queuing Theory) 经验知识经验知识(

3、Rules of Thumb) 基本原则基本原则(Fundamental Laws)测量工具测量工具北京大学计算机科学技术系北京大学微处理器研究开发中心复习性能、成本北京大学计算机科学技术系北京大学微处理器研究开发中心 完成任务的时间完成任务的时间 (执行时间执行时间) 执行时间执行时间(execution time), 响应时间响应时间(response time), 延迟延迟 (latency) 单位时间单位时间(每天、小时、星期、秒、纳秒每天、小时、星期、秒、纳秒等等等等)内完成的任务数 量内完成的任务数 量(性能性能) 吞吐率吞吐率(throughput), 带宽带宽(bandwidt

4、h)飞机飞机Boeing 747BAD/Sud Concorde速度速度610 mph1350 mph华盛顿华盛顿 - 巴黎巴黎6.5 小时3 小时乘客数量乘客数量470132吞吐率吞吐率 (pmph)286,700178,200性能和成本性能和成本北京大学计算机科学技术系北京大学微处理器研究开发中心 速度速度: Concorde 与与 Boeing 747 吞吐率吞吐率: Boeing 747 与与 Concorde“X 比比 Y 快快 n 倍倍” (“ X is n times faster than Y” ) 是指是指)X(ExTime1)X(Performace= =)Y(ePerfo

5、rmanc)X(ePerformanc )X(ExTime)Y(ExTime= =性能和成本(续)性能和成本(续)北京大学计算机科学技术系北京大学微处理器研究开发中心通过 增加 E,获得的加速比(Speedup):假设,增加可以加速整个任务的 F 部分,加速因子为 S;并且这个 任务的其他部分不受影响那么通过 增加 E,获得的加速比(Speedup):假设,增加可以加速整个任务的 F 部分,加速因子为 S;并且这个 任务的其他部分不受影响那么( )( )时的性能没有后的性能增加 后的执行时间增加时的执行时间没有加速比时的性能没有后的性能增加 后的执行时间增加时的执行时间没有加速比EE EEE=

6、()()()()ESFF1)E(没有执行时间增加执行时间没有执行时间增加执行时间 += +=()()()()()()()()ESFF1EE 没有执行时间没有执行时间增加加速比 没有执行时间没有执行时间增加加速比 += +=Amdahl定律Amdahl定律北京大学计算机科学技术系北京大学微处理器研究开发中心Amdahl定律(续)Amdahl定律(续)?浮点指令的性能改进了两倍; 但是只有10%的实 际指令是浮点指令浮点指令的性能改进了两倍; 但是只有10%的实 际指令是浮点指令Speedupoverall=ExTimenew=10.95=1.053ExTimeoldx (0.9 + .1/2)

7、= 0.95 x ExTimeold大规律事件原则大规律事件原则北京大学计算机科学技术系北京大学微处理器研究开发中心(millions) of Instructions per second - MIPS (millions) of (F.P.) operations per second - MFLOP/sCycles per second (clock rate)Megabytes per second每月的响应 每秒的操作每月的响应 每秒的操作编译器编译器编程语言编程语言应用程序应用程序数据通路 控制数据通路 控制晶体管导线管脚晶体管导线管脚ISA功能部件功能部件性能的计量性能的计量北京

8、大学计算机科学技术系北京大学微处理器研究开发中心影响CPU性能的几个方面影响CPU性能的几个方面指令总数CPI时钟频率指令总数CPI时钟频率程序编译器指令系统体系结构组成工艺技术程序编译器指令系统体系结构组成工艺技术周期秒数 指令时钟数 程序指令数 程序秒数时间周期秒数 指令时钟数 程序指令数 程序秒数时间=CPUXXXXXXXX北京大学计算机科学技术系北京大学微处理器研究开发中心CPICPI“指令频率指令频率” (“instruction frequency”)哪里是瓶颈(时间不够用), 就对那里的资源 增加投资!哪里是瓶颈(时间不够用), 就对那里的资源 增加投资!每条指令的平均周期数每条

9、指令的平均周期数 (Average cycles per instruction)指令总数时钟周期数指令总数时钟频率时间指令总数时钟周期数指令总数时钟频率时间=CPUCPI = =n1jjjFCPICPI = =n1jjjICPICPU时钟周期时间时间时钟周期时间时间指令总数指令总数j jIF = =这里这里北京大学计算机科学技术系北京大学微处理器研究开发中心示例: 计算CPI示例: 计算CPITypical MixBase Machine (Reg / Reg) OpFreqCPIiCPIi*Fi(% Time) ALU50%1.5(33%) Load20%2.4(27%) Store10%

10、2.2(13%) Branch20%2.4(27%) 1.5北京大学计算机科学技术系北京大学微处理器研究开发中心选择基准程序集(Benchmark Sets)选择基准程序集(Benchmark Sets)Toy benchmarksToy benchmarksKernelsKernelsSynthetic benchmarksSynthetic benchmarks e.g. Whetstones and Dhrystonese.g. Whetstones and DhrystonesReal programsReal programs北京大学计算机科学技术系北京大学微处理器研究开发中心SPE

11、C: System Performance Evaluation CooperativeSPEC: System Performance Evaluation Cooperative?第一版 1989第一版 1989?10个程序(6Fp+4Int)产生单一数值(SPECmarks)10个程序(6Fp+4Int)产生单一数值(SPECmarks)?第二版 1992第二版 1992?SPECInt92 (6Int) 和 SPECfp92 (14Fp)SPECInt92 (6Int) 和 SPECfp92 (14Fp)? 不限制编译器的开关. DEC 4000 Model 610在93年3月:不限制

12、编译器的开关. DEC 4000 Model 610在93年3月: spice: unix.c:/def=(sysv,has_bcopy,攂copy(a,b,c)=memcpy(b,a,c)wave5: /ali=(all,dcom=nat)/ag=a/ur=4/ur=200nasa7: /norecu/ag=a/ur=4/ur2=200/lc=blas?第三版 1995第三版 1995?一组新的程序: SPECint95 (8Int) 和 SPECfp95 (10Fp) 一组新的程序: SPECint95 (8Int) 和 SPECfp95 (10Fp) ?揵有效期 三年 ?揵有效期 三年

13、?对所有程序使用同一开关设置: SPECint_base95, SPECfp_base95 对所有程序使用同一开关设置: SPECint_base95, SPECfp_base95 北京大学计算机科学技术系北京大学微处理器研究开发中心? 1989年,第一版; 10 个程序, 用单一数值来总结性能 (6Fp+4Int), 相对于VAX 11/7801989年,第一版; 10 个程序, 用单一数值来总结性能 (6Fp+4Int), 相对于VAX 11/780? 其中有一个程序: 99%的时间耗费在该程序的单一一行代码上其中有一个程序: 99%的时间耗费在该程序的单一一行代码上? 新型前端编译器可以

14、非常显著地改进它的性能新型前端编译器可以非常显著地改进它的性能Benchmark0100200300400500600700800gccepressospicedoducnasa7lieqntottmatrix300fpppptomcatv第一版SPEC第一版SPEC北京大学计算机科学技术系北京大学微处理器研究开发中心BenchmarkDescriptiongoArtificial intelligence; plays the game of Go m88ksimMotorola 88k chip simulator; runs test program gccThe Gnu C compi

15、ler generating SPARC code compressCompresses and decompresses file in memory liLisp interpreter ijpegGraphic compression and decompression perlManipulates strings and prime numbers in the special-purpose programming language Perl vortexA database program tomcatvA mesh generation program swimShallow water model with 513 x 513 gri

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 中学教育 > 其它中学文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号