存储维护管理.ppt

上传人:飞****9 文档编号:137602932 上传时间:2020-07-10 格式:PPT 页数:41 大小:648KB
返回 下载 相关 举报
存储维护管理.ppt_第1页
第1页 / 共41页
存储维护管理.ppt_第2页
第2页 / 共41页
存储维护管理.ppt_第3页
第3页 / 共41页
存储维护管理.ppt_第4页
第4页 / 共41页
存储维护管理.ppt_第5页
第5页 / 共41页
点击查看更多>>
资源描述

《存储维护管理.ppt》由会员分享,可在线阅读,更多相关《存储维护管理.ppt(41页珍藏版)》请在金锄头文库上搜索。

1、DELL 存储,常见存储管理、故障处理和注意事项,常见故障原因,经验表明,造成客户存储故障的外部原因主要有以下几种: 存储内部错误的开关机顺序。 机头或扩展柜的速率开关处于错误的位置。 不规范的软硬件升级。 对存储子系统进行破坏性操作。 不规范的故障修复操作。 维护过程中触发了相关的隐患。 存储系统没有冗余的配置方案。,开关机步骤,开机: SAN交换机EXP磁盘扩展柜主控柜主机 关机: 主机主控柜EXP磁盘扩展柜SAN交换机 不正确的开关机顺序可能会导致部分硬盘离线以及数据无法访问。 注意:在DS5000按下电源按钮关机后,在控制器代码和所有电源灯熄灭前绝对不能进行任何操作!,管理软件,Sto

2、rage Manager客户端管理软件 连接方式如下: 将装有Storage Manager Client客户端软件的工作站,通过以太网Hub或Switch,同时连接到DS4000/DS5000的两个控制器。 打开Storage Manager Client客户端软件 控制器有一个出厂默认的IP地址:控制器A/B:192.168.128.101/102 (控制器A/B:192.168.129.101/102 ),存储子系统状态标识,管理界面-企业主管理界面,管理界面子系统管理界面,子系统部件标识,故障检测按钮,使用“Recovery Guru” 故障检测按钮检查DS4000/DS5000子系统

3、的整体状态 “听诊器”,故障检测按钮,正常 故障,控制器和扩展柜的硬件状态,点击物理硬盘右侧的状态检查按钮,可以打开查看具体部件的硬件工作状态,查看控制器信息,选择“Storage Subsystem Menu” “View” “ Profile”,故障数据收集,收集 All Support Data 菜单:Advanced-Troubleshooting-Collect All Support Data .,故障数据收集,查看Major Event Log 菜单:Advanced-Troubleshooting-View Event Log,故障数据收集,查看链路信号噪音检测报告 菜单:Ad

4、vanced-Troubleshooting-Run Diagnostics-Read Link Status ,电池和缓存,电池和缓存的设计原理 为了保证写缓存数据的安全性,DS4000/DS5000系统中,只要电池发生故障(处于Failed状态)或者超过微码所规定的设计寿命,那么写缓存就会被自动禁用 为了保证写缓存数据的安全性,默认两个控制器的Cache Mirroring写缓存镜像功能是打开的。因此当一个控制器的写缓存被禁用之后,另外一个控制器的写缓存也不能使用了。,电池和缓存,写缓存禁用之后的故障现象 主机端应用程序响应变慢,从topas检查主机性能指标,I/O waiting显著增加

5、,每个逻辑盘的busy接近100%,但是IO吞吐量很小,每秒只有几十K到1M不等:,电池和缓存,电池的更换策略 如果电池当前是处于“Failed”或“Removed”状态 如果电池当前状态正常,只是接近或已超过告警寿命,在AIX上使用MPIO的一些注意事项,AIX版本5.2以上,除了原有的集成的RDAC功能以外,操作系统还新增了MPIO的功能来实现外部磁盘的多通路访问。AIX 5.2/5.3默认是使用RDAC,而AIX6.1默认是使用MPIO。 RDAC和MPIO的兼容性 DS3000: 只支持 MPIO DS4000: 支持方式:RDAC, MPIO DS5000: 支持方式:MPIO (D

6、S5000在AIX上不再支持RDAC),在AIX上使用MPIO的一些注意事项,如何在AIX上确认当前正在使用MPIO还是RDAC 在AIX中执行“manage_disk_drivers” 以下是一个当前使用MPIO的例子: #manage_disk_drivers 1: DS4300: currently MPIO; supported: RDAC/fcparray, MPIO 2: DS4500: currently MPIO; supported: RDAC/fcparray, MPIO 3: DS4700/DS4200: currently MPIO; supported: RDAC/f

7、cparray, MPIO 4: DS4800: currently MPIO; supported: RDAC/fcparray, MPIO 以下是一个当前使用RDAC的例子: 1: DS4300: currently RDAC/fcparray; supported: RDAC/fcparray, MPIO 2: DS4500: currently RDAC/fcparray; supported: RDAC/fcparray, MPIO 3: DS4700/DS4200: currently RDAC/fcparray; supported: RDAC/fcparray, MPIO 4:

8、 DS4800: currently RDAC/fcparray; supported: RDAC/fcparray, MPIO,在AIX上使用MPIO的一些注意事项,如何检查当前磁盘的工作路径 RDAC:fget_config -Av MPIO: mpio_get_config -Av,常见故障处理和注意事项,控制器微码是不是有重大隐患的版本? 06.23.05.00: 隐患一:当某个控制器内存校验出错时,故障控制器无法正确的被隔离offline,从而导致逻辑盘LUN不能切换到好的控制器上,主机访问中断。 隐患二:DS4800写缓存被禁用,主机写性能大幅度下降,从而影响业务。 07.10.2

9、3.00: 隐患一:更换故障硬盘后,之前已经接管的热备盘无法CopyBack 隐患二:Media Scan被自动禁用,常见故障处理和注意事项,EXP扩展柜的ESM微码版本有没有重大隐患? EXP710的ESM的微码隐患(9681以下版本) 当一块硬盘故障时,MEL里面显示Fiber Channel Link up和Link down的Event,发生大面积的多块硬盘的同时故障,客户数据访问中断。 EXP810和EXP420的ESM的微码隐患(98D0以下版本) 当一块硬盘故障时,MEL里面显示Fiber Channel Link up和Link down的Event,发生大面积的多块硬盘的同时

10、故障,客户数据访问中断。,常见故障处理和注意事项,要特别注意前面板右下方的(2GB/4GB)速率开关,是否处于正确的位置。速率开关处于4GB位置时,2Gbps的硬盘将不能被识别;相反速率开关处于2GB位置时,4Gbps的硬盘是可以使用的,但是性能将会下降。这种情况比较容易被忽视。速率开关的更改需要关机下电。注意:所有3Gbps的SATA硬盘,都推荐运行在4Gbps。,常见故障处理和注意事项,磁盘扩展柜的光纤连线符合IBM的规范。 在控制器有冗余的光模块条件下,建议将多个扩展柜连接在多个冗余环路上,尽量不要将所有的扩展柜串联在一个环路里。,常见故障处理和注意事项,只要使用了光纤交换机,做Zone

11、是强制要求。每一个Zone必须只包含两个成员,一个对应主机的一张光纤卡的一个端口,另一个对应DS4000/DS5000的一个控制器的一个端口。,常见故障处理和注意事项,逻辑盘不在最优路径“Logical Drive Not On Preferred Path” 。这个问题指的是DS4000/DS5000的逻辑盘(LUN)没有挂在原本所属的控制器下。,常见故障处理和注意事项,原因分析:(主要有6点) 从主机的光纤卡到Logical Drive的光纤物理链路有问题。 P-Series主机的dar0的虚拟设备配置有问题 光纤交换机fabric1的Zone设置有问题。 主机光纤卡HBA和DS4000/

12、DS5000控制器的主机端口Host Port之间的光纤连线方式不正确,没有符合IBM的规范。 控制器发生过重启,或者控制器已经Offline(离线),常见故障处理和注意事项,检查的确认方法:(主要有8点) 确认从主机的光纤卡到逻辑盘Logical Drive的物理链路是完全正常的。 查看光纤交换机相应的主机光纤卡端口和DS4000/DS5000控制器端口的状态灯 登陆主机,运行“fget_config -Av”确认dar的虚拟设备配置正常 确认光纤交换机的Zone设置没有问题。 确认主机光纤卡HBA和DS4000/DS5000控制器的主机端口Host Port之间的光纤连线方式是正确。 在S

13、M客户端管理软件里面确认DS4000/DS5000的控制器状态正常 检查DS4000/DS5000内部的Mapping是否正确 确认 Linux主机的host type是否正确。,常见故障处理和注意事项,恢复方法 在Storage Manager客户端管理软件里面运行: Advanced Recovery Redistribute Logical Drives 在Storage Manager客户端管理软件里面,更改每一个逻辑盘Logical Drive的所属控制器 菜单:Logical DriveChangeOwnership/Preferred Path 注意:在恢复之前,一定要确认从主机

14、的光纤卡到Logical Drive的通道是完全正常的,只有在完全确认上述几种故障都已经解决之后,才能实施恢复。否则后果一定是灾难性的!,常见故障处理和注意事项,Storage Manager客户端软件不能连接和访问DS4000/DS5000的控制器 首先排除网络方面的问题 看看控制器的两位数字LED的显示是否正常 如果控制器的两位数字LED的显示在循环变化,或者Ping的时通时断,这时候可以通过串口连上控制器,观察并捕获屏幕的输出。 控制器能Ping通但是Storage Manager连不上 如果能安排停机时间,重启机头是最有效的解决方法。,常见故障处理和注意事项,拔除DS4000/DS50

15、00系统中所有未使用(没有光纤连接)的光电转换模块SFP 会导致光纤链路的不稳定 在MEL Event Log中,会发现有大量的“Fibre Channel Link Down”和“Fibre Channel Link Up”的提示信息。,常见故障处理和注意事项,特别注意:不规范的实施DS4000/DS5000系统EXP扩展柜和物理硬盘的升级和迁移,可能会造成客户数据丢失! DS4000/DS5000系统增加新的EXP扩展柜(升级) DS4000/DS5000系统增加新的物理硬盘(升级) 将一个或多个EXP扩展柜,从一个现有的DS4000/DS5000系统迁移到另一个DS4000/DS5000

16、系统(迁移) 将一块或多块硬盘,从一个现有的DS4000/DS5000系统迁移到另一个DS4000/DS5000系统(迁移) 以上工作必须严格按照最新版的IBM官方文档里面所规定的步骤进行。,常见故障处理和注意事项,注意定期保存DS4000/DS5000系统的All Support Data(ASD) DS4000/DS5000的All Support Data里面记录了所有Array的配置信息和主机Mapping的信息,在关键时刻对于客户的数据恢复有着非常重要的作用。,常见故障处理和注意事项,寻找DS4000/DS5000的Recovery Profile SM客户端软件的一个功能 记录了DS4000的Array和LUN的基本信息,常见故障处理和注意事项,不能对处于“Degraded”状态的Array的故障硬盘使用Revive操作! 当Array变成Degraded状态时,主机的访问将会恢复。 故障硬盘仍然处于被隔离的静止状态 造成数据丢失!,常见故障处理和注意事项,故障误报 微码和旧版的不兼容 通过升级微码解决 通过重启机头解决,常见故障处理和注意事项,绝

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 商业/管理/HR > 经营企划

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号