在荆棘中挣扎前进的NetApp路在何方?

上传人:飞*** 文档编号:53308813 上传时间:2018-08-29 格式:PDF 页数:5 大小:13.80KB
返回 下载 相关 举报
在荆棘中挣扎前进的NetApp路在何方?_第1页
第1页 / 共5页
在荆棘中挣扎前进的NetApp路在何方?_第2页
第2页 / 共5页
在荆棘中挣扎前进的NetApp路在何方?_第3页
第3页 / 共5页
在荆棘中挣扎前进的NetApp路在何方?_第4页
第4页 / 共5页
在荆棘中挣扎前进的NetApp路在何方?_第5页
第5页 / 共5页
亲,该文档总共5页,全部预览完了,如果喜欢就下载吧!
资源描述

《在荆棘中挣扎前进的NetApp路在何方?》由会员分享,可在线阅读,更多相关《在荆棘中挣扎前进的NetApp路在何方?(5页珍藏版)》请在金锄头文库上搜索。

1、在荆棘中挣扎前进的NetApp 路在何方?【文章摘要】 NetApp 这次在硬件方面做了很大的创新,即可以在同一个柜子中插入两个控制器,或者插入一个控制器和一个IO 扩展模块,两种模式任选一种。而且我估计,如果初始购置时选择了一柜双控制器的模式,后期如果想扩充,那么可以做到不停业务扩充,再上一个柜子,移出其中一个控制器,插入IO 扩展模块,不过这个动作也是非常繁琐和复杂的了。NetApp 最近推出了 FAS3200和 FAS6200新一代产品。这一代产品相对上一 代 FAS3100以及 FAS6000有什么区别?发生变化的形态背后有何隐情?NetApp 为何迟迟不推出真正Scale-Out的集

2、群或者分布式NAS ?NetApp 在固态存储方面 的行为为何如此另类?本文将会解开一个个谜团。怪诞之一:昙花一现FAS3100系列才出来没多久,就被FAS3200 替了。我记得那时候,其他厂商 同档的存储系统基本都已经用了DDR2 667 的内存以及 PCI-E的总线,但是那时 FAS3000系列依然使用 PCI-X总线以及 DDR2 400 内存。终于在 09 年 FAS3100升 级到了 DDR2 667以及 PCI-E 总线, 同时硬件也做了改动, 把 NVRAM集成到主板, 并且使用背板来连接两边NVRAM,消除了物理线缆。但是好像为时已晚,在 NetApp 从内存和总线方面追赶上别

3、人之后,PCIE2.0 、SAS2.0 、8G FC时代都到来 了,所以 NetApp 决定痛改前非,一次到位,推出FASx200 ,用新 CPU 、新总线、 新接口、新硬件打造新一代硬件平台, FAS3100只能是昙花一现了。 对此 NetApp 一定非常难受,阵痛隐隐。怪诞之二:形态回退,接口转变FAS3100是把 NVRAM集成到了主板,并且双控各自的 NVRAM之间的连线已 经被固化到背板中去了, 通过这种手段降低接触不良等造成的故障。但是 FASx200 系列好像又回来了,还是通过外置接口和连线来连接两边的NVRAM,不过这次 不用 Infiniband 了,而就用最普通的10GbE

4、,看来 NetApp 这次也随波逐流了。 之前用 10Gb的 Infiniband 来作为两边 NVRAM同步的链路,看好的就是其低延迟, Infiniband 我印象中应该是每Frame. 512Bytes ,具体不记得了, 总之比一般 FC与 以太网的帧要短, 这样,在传输小 message的时候可以获得更低的延迟, 有利于 NVRAM 之间的纤细日志的同步,但是我一直也想不明白的一件事,帧短了,再 传大数据块时候的开销也就增加了,被更多的EOF ,SOF等占用带宽,这样岂不 是降低了效率么?所以Infiniband 有用 40Gb 版本的,比如 Isilon 等,用高速率来 弥补大数据块

5、时的低效率。 那么对于 FAS , 是否有必要用 Infiniband, 从这次 NetApp 的策略来看,不管是从技术角度还是产品、商务角度,用个10Gb 的 Infiniband 相比以太网来讲确实有点得不偿失。但是为何他又回到外置连线形态了呢?我就很纳闷,怎么回事?一会东一会西的。但是仔细一看才知道个中辛酸啊。欲知详情,往下看。怪诞之三:大胆创新 IO 扩展模块的出现IO 扩展模块,这东西说实话,在中端存储里面还没有哪个厂商这么搞,基 本上都是 “IO 扩展卡 ” 的方式,而不是一整个模块。 在高端存储里则屡见不鲜, 比 如 IBM 的 DS8000里的 IO扩展柜。而如今NetApp

6、在中端里用了 IO 扩展模块, 我就在想, 是创新,还是迫不得已?但是仔细想来,确实没有什么迫不得已的地 方,为什么呢?大家可以发现, NetApp 这次在硬件方面做了很大的创新,即可以在同一个 柜子中插入两个控制器,或者插入一个控制器和一个IO 扩展模块,两种模式任 选一种。而且我估计, 如果初始购置时选择了一柜双控制器的模式,后期如果想 扩充,那么可以做到不停业务扩充,再上一个柜子,移出其中一个控制器,插入 IO 扩展模块,不过这个动作也是非常繁琐和复杂的了。这样做可以极大降低初 始购置成本,不用预留任何空槽位。但是这样做也是有代价的,不言而喻,双控 制器可能会不在同一个柜子中,那么NVR

7、AM背板连接模式就不可能了。可灵活 扩展的 IO 模块与 NVRAM背板连接,要哪个?在FASx200这一代产品, NetApp 不得不将双控的 NVRAM再次用外接连线的方式来连接。不过这里澄清一下,如 果采用一柜双控的模式,也就是NetApp 所谓的 “CC ”模式,即两个 Controller,那 么可以不用在外面连线, 背板上自动导通连线, 而外面的接口自动被屏蔽, 但是 如果采用 CI模式,即 Controller-IO 扩展模块模式, 那么双控之间就必须从外置接 口连接了。这是不是又很难受呢?可以想象到NetApp 的相关设计人员当初做出这个决 定之后,他们的产品团队、市场团队、销

8、售团队,是否一定也经历了阵痛去接受 这个事实?如何向用户和市场去交代?不过说实话,可扩展的IO 模块,这确实 是个巨大创新了。 在硬件方面创新, 这对于一个软件公司来讲是很不容易的,不 知道本次产品是否依然由Xyratex 供货,硬件设计究竟是由NetApp 主导还是 Xyratex主导,这个我无从考证,但是不管怎么样,不容易! 怪诞之四: USB接口包括 IBM 的 Storwize V7000 以及 NetApp 这次的 FASx200 系列,都留了 USB 口。理论上讲, 所有厂商基本上都会留有后门来管理整个存储系统,这些特殊的 接口和命令,用户不会知道。但是管理口也可以开后门,没必要用

9、USB ,我推测 USB口被引入存储系统,可能与x86 以及 Linux Based操作系统在阵列系统中越 来越普及有关,有一个USB ,后续对 OS的升级等会方便很多,根据资料显示, 这次 FASx200 系列确实可以从外置USB驱动器来启动,用于紧急修复损坏的OS 。 其内部其实也是用一块USB接口的 U 盘来存放 OS内核影像的。怪诞之五: SSD和 PAM卡,疯狂的 Cache帝!很早的时候 NetApp 就对 SSD抱有疑虑,我记得当时其他厂商已经在着手开 发动态数据分级了,而NetApp 却犹豫的很,最终推出一块叫做Performance Acceleration Module(P

10、AM)的 PCI-E接口卡,专用于 FAS3100系列。一开始其上 是插 DDR SDRAM 内存条的。WAFL虽然是个很有特色的文件系统, 但是其所存在 的问题也是不可小视的,也就是经典的Sequential Read After Random Write的问 题,也就是本来逻辑上连续的块,被WAFL处理之后底层却变得不连续了,这样 在连续地址读 IO 的情况下,底层却表现为随机IO 的行为,从而影响性能。 PAM 卡的推出可能也有这方面原因。那么究竟为何 NetApp 不使用 SSD来解决性能问题,或者自己也开发自动分 级存储模块呢?我猜测,这与其WAFL的原理有很大关系。 SSD这东西,

11、所有人 看到它的表现,一定都是竖起大拇指的,但是我估摸着唯独NetApp 对 SSD具有 那么一点点排斥心理,为何呢?首先, SSD的出现,让 WAFL的那一套写加速算法颜面尽失,包括全重定向 写、尽力整条写等针对机械磁盘所作的大量优化,随着 SSD的出现,一切都解决 了,那么 WAFL这一套势必在 SSD面前就显得白费了,这一定让NetApp 很难受 的,其实 NetApp 一直都难受,即便是使用机械盘,WAFL依然面临着 Sequential Read After Random Write(SRARW )问题,早就在研究新架构的WAFL了,比如 知否可以支持 Raid5而不是 Raid4,

12、 是否可以不再重定向写了等等。 但是对于 WAFL 这样一个复杂而庞大的架构来讲,牵一发会动全身,不是那么好改革的了。第二, WAFL的重定向写措施,会迅速耗尽SSD上的空余空间,懂点SSD的 人都知道, SSD自己内部会去记录哪些page 存有数据,哪些没有,这么做是为 了损耗平衡算法, SSD内部也会有大量的重定向写操作,其做法与WAFL类似, 但是 WAFL这么做是为了方便的快照与整条写, SSD这么做纯粹是为了损耗平衡, 不管怎么样,这两者是重复和部分冲突了,另外,WAFL不断的写到空余位置, 那么 SSD上的“ 曾经写过多少 ” 这个高水位线就会迅速达到顶峰,SSD内部空余空 间迅速

13、降低到最低值,严重影响SSD的性能,而 WAFL的作用原理又不可能实时 的将 SSD中的“ 垃圾” 块回收回来,因为WAFL从本质上讲可以认为是无时无刻不 在产生垃圾 (重定向写之后, 以前的块便是空闲块了, 但是 SSD却无法感知文件 系统层面的空闲块,依然认为是有用块) ,它根本来不及回收的,况且WAFL内 部的两层 FS之间已经为了忙活着回收空间而做了大量复杂流程了。如果说SSD 让 WAFL的优化变得价值全无,这一点还可以容忍,但是如果WAFL想用 SSD而 眼看着效果不好,那么就真的没治了。第三,我们退一步讲,就算WAFL会很快耗尽 SSD的空余空间到最低值(也 就是 SSD厂商隐藏

14、的那部分为了保证性能而预留的空余空间,比如 100GB的 SSD 其实是有128GB 物理空间的),效果再不好,但是也比机械硬盘要快的,所以 NetApp 只能退而求其次将就着上SSD了。还有最重要的一点,别忘了,SSD目 前的容量还太小,如果上SSD ,会有两种用法,一种就是直接将SSD当做普通盘 来用, 做 Raid, 做 Aggregate , 做 WAFL , 然后做 Volume, 做 Lun或者目录的 Exports。 但是这种做法适用的场景很少, 比如一部分小容量的数据却要求极高的访问速度, 那么没有问题,这种做法可以满足。但是如果遇到短尾型应用的数据访问场景, 大量的数据却只有

15、一部分为热点,那么此时你将所有数据都放到SSD上,显然是 得不偿失,此时自然就需要有一种动态的细粒度的热点数据分级解决方案了,这也是目前几乎所有存储厂商都在搞的技术,而且主流厂商也都推出了各自的产品 了。而我们回来看NetApp,她何尝不想推出自己的动态分级方案?她很难受, 为什么呢? WAFL如果是老虎,那么NetApp 可以说已经骑虎难下了。想在WAFL 上引入动态分级子模块, 不是那么容易的。动态分级子模块包含至少两个亚模块, 一个是热点数据监控、统计模块,另一个是数据迁移模块。监控和统计子模块, 可以作为一个旁路模块存在, 不会对现有的任何 FS架构产生太大影响,这个 WAFL 做起来

16、没有问题,但是数据迁移亚模块,这对WAFL 来讲,又很难受了, WAFL 不按常理出牌,与其他传统FS不同,总是去重定向写,改一改就动全身,所以 从技术上讲,实现动态分级还是太费劲,风险也很大,需要测试很长时间,所以 我推测这也是 NetApp 迟迟没有推出动态分级的可能原因之一吧。所以我估计, NetApp 一开始就定下了基调, SSD目前来讲就作为大缓存的 角色而存在。可以看到本次FASx200系列,最高规格的FAS6280已经可以使用 8TB FLASH的 PAM卡了,当然,需要插多块PAM卡来堆叠成这么高的容量,而 且两个控制器上的PAM 卡规格必须对称,成双成对出现,而不能够只插一组卡 让全局使用。但是后续如果 NetApp 真的推出了动态分级功能,那么势必等于抽了自己一 嘴巴。除非有很好的说辞,至于说辞,编造起来比技术要容易的多了,这个我们 就不必担心了。但是总归还是很难受的。在今年年初,NetApp 的 Tom Georgens 提出“ 分级存储终将走向死亡 ” 的论断,我认为,这句话绝对是正确的,不过时间 是个问题,当 SSD成本不断降低,技术不断提高,容量逐渐变大

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号