cache的性能分析及改进方法

上传人:博****1 文档编号:571156880 上传时间:2024-08-09 格式:PPT 页数:21 大小:10.36MB
返回 下载 相关 举报
cache的性能分析及改进方法_第1页
第1页 / 共21页
cache的性能分析及改进方法_第2页
第2页 / 共21页
cache的性能分析及改进方法_第3页
第3页 / 共21页
cache的性能分析及改进方法_第4页
第4页 / 共21页
cache的性能分析及改进方法_第5页
第5页 / 共21页
点击查看更多>>
资源描述

《cache的性能分析及改进方法》由会员分享,可在线阅读,更多相关《cache的性能分析及改进方法(21页珍藏版)》请在金锄头文库上搜索。

1、cachecache的性能分析及改进的性能分析及改进方法方法目录1234关于Cache的基本知识Cache的性能分析Cache的性能改进方法致谢搜集整理1Cache的基本知识Cache12341234对Cache的认识Cache的工作原理Cache的地址映射方式替换算法搜集整理什么是Cache?Cache系统Cache的作用123对Cache的认识Cache又称高速缓冲存储器,位于CPU和内存之间,是一种特殊的子存储系统Cache系统通常由一级高速缓存L1 Cache和二级高速缓存L2 Cache组成。L1 Cache通常分别用来存放数据和指令。Cache的产生就是为了提高CPU对存储器的访问

2、速度。Cache的工作原理u程序访问的局部性:程序访问的局部性:对大量典型程序运行情况的分析结果表明,在一个较短的时间间隔内,由程序产生的地址往往集中在存储器逻辑地址空间的很小范围内。指令地址的分布本来就是连续的,再加上循环程序段和子程序段要重复执行多次。因此,对这些地址的访问就自然地具有时间上集中分布的倾向。 数据分布的这种集中倾向不如指令明显,但对数组的存储和访问以及工作单元的选择都可以使存储器地址相对集中。这种对局部范围的存储器地址频繁访问,而对此范围以外的地址则访问甚少的现象,就称为程序访问的局部性。 CacheCache的工作原理的工作原理 Cache的工作原理是基于程序的访问局部性

3、。在主存和CPU通用寄存器之间设置一个高速的容量相对较小的存储器,把正在执行的指令地址附近的一部分指令或数据从主存调入这个存储器,供CPU在一段时间内使用。Cache结构和工作原理图结构和工作原理图Cache的地址映射方式v全相联映射方式:全相联映射方式:主存的任意一块可以映射到Cache中的任意一块优点:优点:命中率比较高,Cache存储空间利用率高缺点:缺点:访问相关存储器时,每次都要与全部内容比较,速度低,成本高,因而应用少Cache的地址映射方式v直接相联映射方式:直接相联映射方式:主存储器中的一块只可以映射到Cache特定的一个块中优点:优点:地址映射方式简单,数据访问时只需检查区号

4、是否相等,因而可以得到比较快的访问速度,硬件设备简单缺点:缺点:替换操作频繁,命中率较低Cache的地址映射方式v组相联映射方式:组相联映射方式:主存储器中的每一块可以被放置到Cache唯一的一个组中的任何一个位置优点:优点:块的冲突概率比较低,块的利用率大幅提高,块失效率明显降低缺点:缺点:实现难度和造价要比直接相联映射方式高替换算法替换算法Cache可以采用的替换算法主要有以下几种:l随机替换(随机替换(RAND)算法)算法 随机确定替换的块,方法简单易于实现,但命中率低l先入先出(先入先出(FIFO)算法)算法替换最先调入的块,不符合局部性规律l近期最少使用(近期最少使用(LRU)算法)

5、算法 选择替换最近最少使用的块,命中率高,符合程序局部性原理Cache性能分析12CPU执行时间执行时间平均访问存储器时间(平均访问存储器时间(AMAT)CPU执行时间例子问:问:假定有一台计算机,当所有存储器访问操作都能在Cache中命中时,CPI为1.0;数据访问只有load和store指令,这些指令占全部指令的50%;缺失代价为25个时钟周期,缺失率为2%。问当所有指令都在Cache中命中时,计算机性能能提高多少?答:答:Cache始终命中时的计算机性能为:例子实际Cache的计算机性能为:两者的性能比为:结论:结论:不发生Cache缺失时计算机性能是原来的1.75倍平均访存时间l设H为

6、命中率,平均访存时间(AMAT)可定义为:l在多级存储系统中,平均访存时间(AMAT)可定义为:Cache性能改进方法通过对cache的性能分析,可知失效开销,命中时间和失效率是衡量cache的重要指标。搜集整理减少失效开销减少失效开销减少命中时间减少命中时间降低失效率降低失效率减少失效开销l使读失效优于写使读失效优于写 写缓冲器导致对存储器的访问复杂化,而且写缓冲器是滞后的,所以推迟对读失效的处理。l写缓冲合并写缓冲合并 如果写缓冲器中已经有了待写入的数据,则进行地址匹配,若存在匹配的地址并且缓冲器中位置空闲,就进行写缓冲合并。l请求字处理技术请求字处理技术 尽早将请求字发送到CPUl非阻塞

7、非阻塞cachecache技术技术 Cache失效时仍允许CPU对其进行其他命中访问l采用两级采用两级cachecache 第一级Cache(L1)小而快,第二级Cache(L2)容量大减少命中时间 命中时间直接影响着处理器的时钟频率。目前的计算机Cache的访问时间限制了处理器的时钟频率。l采用容量小,结构简单的采用容量小,结构简单的Cache 硬件越简单,速度越快;便于与CPU放在一块芯片上l虚拟虚拟Cache 访问Cache的索引以及Cache中的标识都使用虚拟地址lCache访问流水化访问流水化 对第一级Cache的访问按流水方式访问lTraceCache 存放CPU所执行的动态指令降

8、低失效率l强制性失效强制性失效:当第一次访问一个块时,该块不在Cache 中,需从下一级存储器中调入Cache。方法:增加块的大小,预取Cachel容量失效:容量失效:如果程序执行时所需的块不能全部调Cache 中,则某些块被替换后又重新被访问。方法:增加容量l冲突失效:冲突失效:在组相联或直接相联映射中,若太多的块到 同一组或块中,则会出现该组或块中某个 块被替换,然后又重新访问的情况。方法:提高相联度谢谢您的聆听进入夏天,少不了一个热字当头,电扇空调陆续登场,每逢此时,总会想起进入夏天,少不了一个热字当头,电扇空调陆续登场,每逢此时,总会想起那一把蒲扇。蒲扇,是记忆中的农村,夏季经常用的一

9、件物品。记忆中的故那一把蒲扇。蒲扇,是记忆中的农村,夏季经常用的一件物品。记忆中的故乡,每逢进入夏天,集市上最常见的便是蒲扇、凉席,不论男女老少,个个手持乡,每逢进入夏天,集市上最常见的便是蒲扇、凉席,不论男女老少,个个手持一把,忽闪忽闪个不停,嘴里叨叨着一把,忽闪忽闪个不停,嘴里叨叨着“怎么这么热怎么这么热”,于是三五成群,聚在大树,于是三五成群,聚在大树下,或站着,或随即坐在石头上,手持那把扇子,边唠嗑边乘凉。孩子们却在周下,或站着,或随即坐在石头上,手持那把扇子,边唠嗑边乘凉。孩子们却在周围跑跑跳跳,热得满头大汗,不时听到围跑跑跳跳,热得满头大汗,不时听到“强子,别跑了,快来我给你扇扇强

10、子,别跑了,快来我给你扇扇”。孩。孩子们才不听这一套,跑个没完,直到累气喘吁吁,这才一跑一踮地围过了,这时子们才不听这一套,跑个没完,直到累气喘吁吁,这才一跑一踮地围过了,这时母亲总是,好似生气的样子,边扇边训,母亲总是,好似生气的样子,边扇边训,“你看热的,跑什么?你看热的,跑什么?”此时这把蒲扇,此时这把蒲扇,是那么凉快,那么的温馨幸福,有母亲的味道!蒲扇是中国传统工艺品,在是那么凉快,那么的温馨幸福,有母亲的味道!蒲扇是中国传统工艺品,在我国已有三千年多年的历史。取材于棕榈树,制作简单,方便携带,且蒲扇的表我国已有三千年多年的历史。取材于棕榈树,制作简单,方便携带,且蒲扇的表面光滑,因而,古人常会在上面作画。古有棕扇、葵扇、蒲扇、蕉扇诸名,实即面光滑,因而,古人常会在上面作画。古有棕扇、葵扇、蒲扇、蕉扇诸名,实即今日的蒲扇,江浙称之为芭蕉扇。六七十年代,人们最常用的就是这种,似圆非今日的蒲扇,江浙称之为芭蕉扇。六七十年代,人们最常用的就是这种,似圆非圆,轻巧又便宜的蒲扇。蒲扇流传至今,我的记忆中,它跨越了半个世纪,圆,轻巧又便宜的蒲扇。蒲扇流传至今,我的记忆中,它跨越了半个世纪,也走过了我们的半个人生的轨迹,携带着特有的念想,一年年,一天天,流向长也走过了我们的半个人生的轨迹,携带着特有的念想,一年年,一天天,流向长长的时间隧道,袅长的时间隧道,袅结束

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 建筑/环境 > 施工组织

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号