存储系统性能---带宽计算

上传人:工**** 文档编号:510039954 上传时间:2022-12-12 格式:DOCX 页数:13 大小:335.05KB
返回 下载 相关 举报
存储系统性能---带宽计算_第1页
第1页 / 共13页
存储系统性能---带宽计算_第2页
第2页 / 共13页
存储系统性能---带宽计算_第3页
第3页 / 共13页
存储系统性能---带宽计算_第4页
第4页 / 共13页
存储系统性能---带宽计算_第5页
第5页 / 共13页
点击查看更多>>
资源描述

《存储系统性能---带宽计算》由会员分享,可在线阅读,更多相关《存储系统性能---带宽计算(13页珍藏版)》请在金锄头文库上搜索。

1、1、 IOP和带宽对存储性能的影响?说 起存储产品的评价,性能永远是第一重要的问题。有关性能的多种指标实在五花八门:带宽(Bandwidth)、IOPS、顺序(Squntil)读写、随机(Rdom)读写、持续吞吐(Sutaine Thughpu)、突发解决能力(rst I/O)等等看似甚为专业的名词充斥着解决方案和技术分析报告。存储产品的性能似乎被量化得格外清晰,作为顾客,只需要简朴的比较两个数字,就可以清晰的 得出孰优孰劣的结论。然而,事实果真如此吗?就让我们走进那些五花八门的指数背后,去看看性能的真实面目。1、带宽与I/O这是两个衡量存储设备性能最基本的概念,明确的辨别两者也是对存储产品性

2、能理解的第一步。如 果我们把存储设备比做一间会议室,被存取的数据就是前来参与会议或从会议中离开的人,那么带宽性能就是指这间会议室大门的宽度,大门越宽,可以同步进出的 人也就越多,而I/O性能是指房门开合的频繁限度,迎来一批前来参与会议的人,就需要打开一次大门,送走一批人也是同样,哪怕这“一批人”其实只是一种 人。由此可见,当我们考察会议室的门设计得与否合理时,必须结合会议自身的性质。对纪律严明的会议来 说,与会者容易不会凌乱的进出会场,人们在会议开始时统一进入,结束时再统一离开。对这种状况,门的宽度就十分重要,而与否易于开合则显得不那么核心,反 正这扇门在整个会议中只需要开合两次而已。相反的,

3、对于联欢性质的约会而言,门设计得太宽除了显得气派之外,并没有什么实际的意义,但是门开合的频率却很 重要,由于会有客人频繁的进进出出。相应到存储设备上,道理也是同样。大文献持续传播型的应用需要的是充足的带宽性能,而小文献随机读写的应用则规定足够的I/能力。那 么多大的文献算“大文献”呢?一般而言,超过1MB大小的文献就可以算做“大文献”了。如果您的应用系统解决的资料中,最小的文献也有45MB甚至几十 B,就需要重点考察存储系统的带宽性能了。如果您的应用是数据库形式,或是电子邮件系统,系统中有大量B级大小的文献,那么就可以忽视掉产品简介中 x MB/s的字样,重点关怀x IOP就可以了。2、影响性

4、能的因素固然,仅看产品彩页中的简朴数字还是远远不够的。存储设备的标称指数只是其最最抱负状况下的体现,而实际应用中,存储设备体现出的解决能力往往与其标称指数相去甚远。为了反映更多的细节,会议室的比方局限性以阐明问题。因此我们前面的例子再改善一下,把存储设备看作一栋有诸多房间的大厦。人们从门口进入大厦,先来到大堂,通过走廊,最后达到房间。人们进大厦的方式也分为两种:一种是所有人按房间号码顺序排好队,一起进入大厦,我们称之为“顺序进入”;另一种是她们无规律的自由进入,我们称为“随后进入”。显而易见,“顺序进 入”的效率要大大高于“随后进入”。这就阐明,一般状况下,顺序读写的性能要远高于随后读写的性能

5、。尚有一种结论也不难得出,一种宽阔的大堂更有助于偶尔 性较大的“随机进入”,而对“顺序进入”的人群而言,通过大堂基本属于挥霍时间。存储设备中的“大堂”就是高速缓存。也就是说,大容量高速缓存可以提高随机读写性能,而对顺序读写的性能改善则不明显。还记得前面讨论的带宽 和I/O的差别吗?带宽考察的是单位时间进入大厦的人数,而I/关怀的是单位时间进出大厦的批次。从次可见,如果走廊没有任何变化,那么大堂只要不是太 小,就不会影响带宽性能。相对的,对IO性能而言,大堂显然是越大越好。总之,影响带宽的因素重要是前端控制器(大门)和后端磁盘通道(走廊)的带宽; 而影响I的因素重要是控制器(大门)解决能力和高速

6、缓存(大堂)容量。固然,前面的讨论都基于一种假设前提:磁盘(房间)足够多。如若只配备寥寥几种磁盘,它们就会成为整个系统的性能瓶颈。任凭其她配备如何奢华,也于事无补。那么,“足够多”又是多少呢?对光纤通道存储设备来说,每个光纤通道上的磁盘数量达到060个的时候性能达到最佳。因此一般中高品位存储设备都把每通道5060个磁盘设计为扩展极限,而不是光纤通道技术规定的126个。图1 磁盘数量影响光纤环路性能这样设计存储产品,可以让系统的性能随着容量的增长而增长。但是同步,顾客必须明白,在容量没有配备到最大值的时候,性能就无法达到厂商所宣称的指标。某些 厂商还声明其产品的性能可以随着容量的增长而线性增长,

7、按这样讲,当你的存储设备只配备了最大容量的一半时,你得到的性能也只有系统最佳性能的一半。3、性能曲线这里所说的“最佳性能”就是厂商所宣称的指数吗?很遗憾,答案是不一定,一般都不是,并且也许会相差很远!我已经听到有人在叫“天啊!那厂商发布的数字究竟有什么意义啊。”别急,看到下面两个图示就清晰了。图2 IPS性能曲线示例图3. 带宽性能示例这 两个图示是典型的存储设备性能实测曲线,所有曲线来自同一种存储设备的同一种配备。不同产品在纵向指标上体现各异,但曲线的形状都大体相似。从图上可以看出,顾客环境中存储设备的性能体现严重依赖数据块的大小。以顺序读取操作为例,如果应用产生的数据块大小在8KB左右,那

8、么带宽性能和/O性能最多也只 能达到峰值性能的一半左右。如果但愿得到更好的I/O性能,就需要尽量将数据块调节得更小。但不幸的是,如果但愿带宽性能更好,就需要想措施把数据块设立得更大。看来,带宽与I/O性能是鱼与熊掌,难以兼得啦。不 过没关系,如我们前面提到的,幸好大多数顾客其实只需要其中一种性能。要么是大文献类型的应用,需要带宽性能;抑或是小文献类型应用,需要/能力。需 要带宽的顾客相对容易得到满足。从图3可以看出,只要数据块不小于18K,顺序读的性能就基本可以达到系统饱和值。对顺序写,饱和数据块略大某些,但 256KB也不算难以达到的尺寸。得 到最佳的IO性能似乎就没那么容易了。从图2的曲线

9、来看,I/O性能并没有一种饱和状态,这就规定数据块无穷尽的尽量小。然而所有应用都不也许支持无穷小的数据块。事实上,大多数的数据库应用产生的数据块都在2KB或4B左右。在这个尺度上,应用得到的性能距离最高性能尚有至少030%的空间呢。4、持续和突发回到我们那个有关大厦 的例子。如果大厦临时发生紧急状况,例如火灾,人们争先恐后的蜂拥在门口,景象一定是一片混乱。在实际应用中,存储系统也也许遭遇类似的状况,一时间大量 数据同步被访问,导致系统严重堵塞。这就像存储系统内的交通高峰,往往需要类似交通管制的手段才干提高系统效率。某些厂商会宣称她们的产品在这种状况下的 “交通管制”能力有多强,以致可以沉着应付

10、大规模的突发访问。诸如“全互换构造”、“直接矩阵构造”等技术均属此类。究其本质,这些“交通管制”都是在大堂(高速缓存)的设计上做文章,将原本一种公共大堂的构造变成若干独立大堂的构造。以此来避免火灾发生时,所有人都拥挤到一种大堂里。这样设计的确可在访问忽然爆发时缓和系统压力,但是需要注意,这样设计的大厦内部一定布满了多种批示牌和路标,对任何一种进入大厦的人而言,进入房间的过程都将变得更复杂。其成果就是,非突发状态下,系统的持续读写能力往往还不犹如等计算能力的简朴构造存储。5、其她影响除了前面所谈到诸多方 面外,尚有诸多因素都会影响到存储设备在实际运营中的性能。例如RAID级别的设立、磁盘类型甚至

11、型号批次的匹配、缓存的镜像、SCI指令队列深度的设 置,这些方面都与性能成果直接有关。并且,为了可以得到最佳的性能指数,几乎所有的厂商在测试自己产品性能的时候都会采用无冗余的RID0、选用15k rpm的高速磁盘、将写缓存镜像保护关闭或者干脆关闭写缓存、将指令队列深度设立为最大。如此配备方式相信不是每个顾客都可以接受的。此外,所有存储设备在运营快照或远程镜像等附加功能之后,性能都会明显下降,有些状况甚至会下降60%之多。如果顾客的应用碰巧需要这些附加功能,就需要在选用存储设备之前认真的实地测量一下真实性能。免得满怀但愿的买回家,使用起来却失望至极。结论和建议想要懂得梨子的滋味,最佳的措施就是亲

12、自尝一尝。对存储设备,这个道理特别重要。只有在顾客需要的配备方式下,在实际的应用系统中,实实在在的运营之后,顾客才干真正清晰的感知存储设备的真实性能体现。纸上谈兵只怕会使顾客在多种数据中迷失方向,难以做出对的结论。2、 存储设备的带宽计算计算公式: Relorld est nmial * 70%- 我所标称的数据都是*70%以尽量接近实际数据,但如果此外提供了由资料获得的更为精确的数据,则以其为准 widt = frequebit-wdt QPI带宽:假设QPI频率=2.8 Ghz bits/Hz(double dat rae) 20 (QP lnk ith) (4/0) (data bits

13、/flit its) 2 (nidirectol sd a receive patig smltanouy) 8 (bs/byte) 22. GB/s术语: Wesme - ntel CU微架构的名称 GB/ -每秒传播的byte数量 Gb/s - 每秒传播的bt数量 GHz-根据具体操作而言,可以是单位时间内运算的次数、单位时间内传播的次数 (也可以是GT/s) 1byte =8ts O - / ub,处在老式北桥的位置,是一种桥接芯片。 QIQuicth Interconnc,ntel前端总线(B)的替代者,可以觉得是A Hytrnspor的竞争对手 MH - Memory Control

14、leHb,内置于U中的内存控制器,与内存直接通信 CI Expes(riphrl Componet tonnec Exrs, PCIe) 一种计算机扩展总线(Exsionbus),容许外围设备与计算机系统内部硬件(涉及CPU和AM)之间的数据传播。 Ovrprovsonig-例如48*1Gbacces pt互换机,一般只有*1Gp ulnk,那么ovrprovisng比= 2:1 PCI-E2.0每条lane的理论带宽是5MB/s 58 相称于老式的北桥,只但是不再带有内存控制器,oe ne yesbug Ulrpint-VN/LARiON后端LC(ik control cr)的互换拓扑,实目前一种DA内点到点的链接,而非FCL总线构造 Uraflx - EMCI/模块(IC)的 Inerconnect - PIe设备通过一条逻辑连接(interonnc)进行通信,该连接也称为Lin。两个PCIe设备之间的link是一条点到点的通道,用于收发PC祈求。从物理层面看,一种link由一条或多条ne构成。低速设备使用sil-lane ln,高速设备使用更宽的6lane lin。 ae - 一条lane由一对发送接受差分线(differetillne)构成,共4根线,全双工双向字节传播。一种

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 解决方案

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号