精选题体系结构学习教案

上传人:枫** 文档编号:570126919 上传时间:2024-08-02 格式:PPT 页数:22 大小:579KB
返回 下载 相关 举报
精选题体系结构学习教案_第1页
第1页 / 共22页
精选题体系结构学习教案_第2页
第2页 / 共22页
精选题体系结构学习教案_第3页
第3页 / 共22页
精选题体系结构学习教案_第4页
第4页 / 共22页
精选题体系结构学习教案_第5页
第5页 / 共22页
点击查看更多>>
资源描述

《精选题体系结构学习教案》由会员分享,可在线阅读,更多相关《精选题体系结构学习教案(22页珍藏版)》请在金锄头文库上搜索。

1、会计学1精选精选(jn xun)题体系结构题体系结构第一页,共22页。解:解: 如前所述,约如前所述,约 75%75%的访存为取指令。因此,的访存为取指令。因此,分离分离CacheCache的总体失效率为:的总体失效率为: (75%0.64%) (75%0.64%)(25%6.47%)(25%6.47%) 2.10%2.10% 根据表根据表5 54 4,容量为,容量为32KB32KB的混合的混合CacheCache的失的失效率略低一些效率略低一些 (yxi)(yxi) ,只有,只有1.99%.1.99%.比,哪种比,哪种CacheCache的失效率更低?又假设采用写直达的失效率更低?又假设采用

2、写直达策略,且有一个写缓冲器,并且忽略写缓冲器引策略,且有一个写缓冲器,并且忽略写缓冲器引起的等待。请问上述两种情况下平均起的等待。请问上述两种情况下平均(pngjn)(pngjn)访存时间各访存时间各是多少?是多少?5.2 Cache 基本知识第1页/共21页第二页,共22页。平均访存时间公式可以分为平均访存时间公式可以分为(fn wi)(fn wi)指令访问和数据指令访问和数据访问两部分:访问两部分:平均访存时间指令所占的百分比平均访存时间指令所占的百分比 ( (指令命中时间指令失效率指令命中时间指令失效率失效开销失效开销) ) 数据所占的百分比数据所占的百分比 ( (数据命中时间数据失效

3、率数据命中时间数据失效率失效开销失效开销) )所以,两种结构的平均访存时间分别为:所以,两种结构的平均访存时间分别为:平均访存时间分离平均访存时间分离75%(175%(10.64%50)0.64%50) 25%(1 25%(16.47%50)6.47%50) (75%1.32)(75%1.32)(25%4.325)(25%4.325) 0.9900.9901.0591.0592.052.055.2 Cache 基本知识第2页/共21页第三页,共22页。平均平均(pngjn)(pngjn) 访存时间混合访存时间混合 75%(175%(11.99%50)1.99%50) 25%(1 25%(11

4、11.99%50)1.99%50) (75%1.995)(75%1.995) (25%2.995)(25%2.995) 1.4961.4960.7490.7492.242.243. 程序执行时间(shjin) CPU时间(shjin)(CPU执行周期数存储器停顿周期数) 时钟周期时间(shjin) 其中, 存储器停顿周期数访存次数失效率 失效开销5.2 Cache 基本知识第3页/共21页第四页,共22页。例例5.25.2 我们用一个和我们用一个和Alpha AXPAlpha AXP类似的机器作为类似的机器作为第一个例子。假设第一个例子。假设CacheCache失效开销为失效开销为5050个时

5、钟个时钟(shzhng)(shzhng)周期,当不考虑存储器停顿时,所有指令的周期,当不考虑存储器停顿时,所有指令的执行时间都是执行时间都是2.02.0个时钟个时钟(shzhng)(shzhng)周期,周期, Cache Cache的失效的失效率为率为2%2%,平均每条指令访存,平均每条指令访存1.331.33次。试分析次。试分析CacheCache对性能的影响。对性能的影响。第4页/共21页第五页,共22页。考虑考虑CacheCache的失效的失效(sh xio)(sh xio)后,性能为:后,性能为:CPU CPU 时间有时间有cachecacheIC(2.0IC(2.0(1.332%50

6、)(1.332%50) 时钟周期时间时钟周期时间 IC3.33IC3.33时钟周期时间时钟周期时间CPU CPU 时间时间(shjin)(shjin)IC(CPIexeIC(CPIexe ) ) 时钟周期时间时钟周期时间(shjin)(shjin)存储器停顿存储器停顿 (tngdn)周期数周期数指令数指令数解:解:5.2 Cache 基本知识实际实际CPI CPI :3.333.333.33/2.0 = 1.67(3.33/2.0 = 1.67(倍倍) )第5页/共21页第六页,共22页。 CPU CPU时间也增加时间也增加(zngji)(zngji)为原来的为原来的1.671.67倍。但若不

7、采用倍。但若不采用Cache,Cache,则:则: CPI CPI2.0+501.332.0+501.3368.568.55.2 Cache 基本知识第6页/共21页第七页,共22页。 考虑两种不同组织结构的考虑两种不同组织结构的 CacheCache:直接映象:直接映象CacheCache和两路组相联和两路组相联 CacheCache,试问它们对,试问它们对 CPUCPU的性的性能有何影响?先求平均访存时间能有何影响?先求平均访存时间 (shjin)(shjin) ,然后再计算,然后再计算CPUCPU性能。分析时请用以下假设:性能。分析时请用以下假设: 理想理想Cache(Cache( 命中

8、率为命中率为100100) )情况下的情况下的CPICPI 为为2.02.0,时钟周期为,时钟周期为 2ns2ns,平均每条指令,平均每条指令 访存访存1.31.3次。次。 两种两种CacheCache容量均为容量均为64KB64KB,块大小都是,块大小都是 3232 字节。字节。例例5.35.35.2 Cache 基本知识第7页/共21页第八页,共22页。 图图5.105.10说明,在组相联说明,在组相联CacheCache中,我们必须增中,我们必须增 加一个加一个(y )(y )多路选择器,用于根据标识匹配结果多路选择器,用于根据标识匹配结果 从相应组的块中选择所需的数据。因为从相应组的块

9、中选择所需的数据。因为CPU CPU 的速度直接与的速度直接与CacheCache命中的速度紧密相关命中的速度紧密相关, ,所所 以对于组相联以对于组相联CacheCache,由于多路选择器的存,由于多路选择器的存 在而使在而使CPUCPU的时钟周期增加到原来的的时钟周期增加到原来的1.101.10倍。倍。 这两种结构这两种结构CacheCache的失效开销都是的失效开销都是70ns70ns。在。在 实际应用中,应取整为整数个时钟周期。实际应用中,应取整为整数个时钟周期。 命中时间为命中时间为1 1个时钟周期,个时钟周期,64KB64KB直接映象直接映象 Cache Cache的失效率为的失效

10、率为1.4%1.4%,相同容量的两路组,相同容量的两路组 相联相联CacheCache的失效率为的失效率为1.0%1.0%。5.2 Cache 基本知识第8页/共21页第九页,共22页。第9页/共21页第十页,共22页。由由: :平均平均(pngjn)(pngjn) 访存时间命中时间失效率访存时间命中时间失效率 失效开销失效开销得得: :平均平均(pngjn)(pngjn) 访存时间访存时间1 1路路2.02.0(0.01470)(0.01470) 2.98ns2.98ns平均平均(pngjn)(pngjn) 访存时间访存时间2 2路路2.01.102.01.10 (0.01070)(0.01

11、070) 2.90ns2.90ns由由: :CPU CPU 时间时间IC(CPIexeIC(CPIexe每条指令的平均存储器每条指令的平均存储器 停顿周期停顿周期(zhuq)(zhuq)数数)时钟周期时钟周期(zhuq)(zhuq)时间时间 IC (CPIexeIC (CPIexe时钟周期时钟周期(zhuq)(zhuq)时间时间 每条指令的平均存储器停顿时间每条指令的平均存储器停顿时间) )解:解:5.2 Cache 基本知识第10页/共21页第十一页,共22页。CPUCPU时间时间(shjin)1(shjin)1路路IC(2.02IC(2.02(1.30.01470)(1.30.01470)

12、 5.27IC5.27ICCPUCPU时间时间(shjin)2(shjin)2路路IC(2.021.10IC(2.021.10 (1.30.01070)(1.30.01070) 5.31IC5.31IC得:得:5.31IC5.31ICCPUCPU时间时间(shjin)1(shjin)1路路 1.011.015.27IC5.27ICCPUCPU时间时间(shjin)2(shjin)2 路路5.2 Cache 基本知识第11页/共21页第十二页,共22页。5.2.4 写策略(cl)1. “写”操作(cozu)所占的比例 Load指令:26 Store指令:9 “写”在所有访存操作(cozu)中所占

13、的比例: 9/(100269)7 “写”在访问Cache操作(cozu)中所占的比例: 9/(269)253“写”访问(fngwn)有可能导致Cache和主存内容的不一致2. “写”操作必须在确认是命中后才可进行5.2 Cache 基本知识第12页/共21页第十三页,共22页。例例3.5 3.5 假假设设某某指指令令序序列列中中2020的的指指令令是是LoadLoad指指令令,并并且且紧紧跟跟在在LoadLoad指指令令之之后后的的半半数数指指令令需需要要使使用用到到载载入入的的结结果果,如如果果这这种种数数据据相相关关将将产产生生一一个个时时钟钟周周期期的的延延迟迟。理理想想流流水水线线(没

14、没有有任任何何延延迟迟,CPICPI为为1 1)的的指指令令执执行行速速度要比这种真实流水线的快多少?度要比这种真实流水线的快多少?解解:我我们们可可以以利利用用(lyng)CPI(lyng)CPI作作为为衡衡量量标标准准。对对于于真真实实的的流流水水线线而而言言,由由于于LoadLoad指指令令之之后后的的半半数数指指令令需需要要暂暂停停,所所以以这这些些被被暂暂停停指指令令的的CPICPI是是2 2。又又知知LoadLoad指指令令占占全全部部指指令令的的2020,所所以以真真实实流流水水线线的的实实际际CPICPI为为:(0.91+0.12)=1.1(0.91+0.12)=1.1,这这表

15、表示示理理想想流流水水线线的的指指令令执执行行速度是其执行速度的速度是其执行速度的1.11.1倍。倍。 3.3 流水线中的相关(xinggun)第13页/共21页第十四页,共22页。 并行查找的实现(shxin)方法:5.2 Cache 基本知识举例举例(j l)(j l): 路组相联并行标识比较路组相联并行标识比较 (比较器的个数及位数)(比较器的个数及位数)l 相联存储器相联存储器l 单体单体(dn t)(dn t)多字存储器比较器多字存储器比较器 第14页/共21页第十五页,共22页。第15页/共21页第十六页,共22页。 路组相联Cache的查找(ch zho)过程第16页/共21页第

16、十七页,共22页。 直接映象Cache的查找(ch zho)过程第17页/共21页第十八页,共22页。5.2.2 查找(ch zho)方法1. 如何确定(qudng)Cache中是否有所要访问的块? 若有的话如何确定(qudng)其位置? 答案5.2 Cache 基本知识第18页/共21页第十九页,共22页。 目录(ml)表的结构第19页/共21页第二十页,共22页。 只需查找候选位置(wi zhi)所对应的目录表项第20页/共21页第二十一页,共22页。内容(nirng)总结会计学。根据表54,容量为32KB的混合Cache的失效率略低一些,只有1.99%.。平均访存时间公式可以分为指令访问和数据访问两部分(b fen):。CPI2.0+501.3368.5。由:平均访存时间命中时间失效率失效开销。9/(269)25。理想流水线(没有任何延迟,CPI为1)的指令执行速度要比这种真实流水线的快多少。 只需查找候选位置所对应的目录表项第二十二页,共22页。

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 研究生课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号