存储维护管理稻谷书屋

上传人:壹****1 文档编号:575617716 上传时间:2024-08-18 格式:PPT 页数:41 大小:1.26MB
返回 下载 相关 举报
存储维护管理稻谷书屋_第1页
第1页 / 共41页
存储维护管理稻谷书屋_第2页
第2页 / 共41页
存储维护管理稻谷书屋_第3页
第3页 / 共41页
存储维护管理稻谷书屋_第4页
第4页 / 共41页
存储维护管理稻谷书屋_第5页
第5页 / 共41页
点击查看更多>>
资源描述

《存储维护管理稻谷书屋》由会员分享,可在线阅读,更多相关《存储维护管理稻谷书屋(41页珍藏版)》请在金锄头文库上搜索。

1、DELL 存储常见存储管理、故障处理和注意事项1参考幻灯常见故障原因经验表明,造成客户存储故障的外部原因主要有以下几种:l存储内部错误的开关机顺序。l机头或扩展柜的速率开关处于错误的位置。l不规范的软硬件升级。l对存储子系统进行破坏性操作。l不规范的故障修复操作。l维护过程中触发了相关的隐患。l存储系统没有冗余的配置方案。2参考幻灯开关机步骤开机:lSAN交换机EXP磁盘扩展柜主控柜主机 关机:l主机主控柜EXP磁盘扩展柜SAN交换机 不正确的开关机顺序可能会导致部分硬盘离线以及数据无法访问。l注意:在DS5000按下电源按钮关机后,在控制器代码和所有电源灯熄灭前绝对不能进行任何操作! 3参考

2、幻灯管理软件Storage Manager客户端管理软件连接方式如下: l将装有Storage Manager Client客户端软件的工作站,通过以太网Hub或Switch,同时连接到DS4000/DS5000的两个控制器。l打开Storage Manager Client客户端软件l 控制器有一个出厂默认的IP地址:控制器A/B:192.168.128.101/102 (控制器A/B:192.168.129.101/102 )4参考幻灯存储子系统状态标识5参考幻灯管理界面-企业主管理界面6参考幻灯管理界面子系统管理界面7参考幻灯子系统部件标识8参考幻灯故障检测按钮使用“Recovery G

3、uru” 故障检测按钮检查DS4000/DS5000子系统的整体状态 “听诊器”9参考幻灯故障检测按钮正常故障10参考幻灯控制器和扩展柜的硬件状态 点击物理硬盘右侧的状态检查按钮,可以打开查看具体部件的硬件工作状态11参考幻灯查看控制器信息 选择“Storage Subsystem Menu” “View” “ Profile” 12参考幻灯故障数据收集收集 All Support Datal菜单:Advanced-Troubleshooting-Collect All Support Data . 13参考幻灯故障数据收集查看Major Event Log l菜单:Advanced-Trou

4、bleshooting-View Event Log 14参考幻灯故障数据收集查看链路信号噪音检测报告 l菜单:Advanced-Troubleshooting-Run Diagnostics-Read Link Status 15参考幻灯电池和缓存电池和缓存的设计原理l为了保证写缓存数据的安全性,DS4000/DS5000系统中,只要电池发生故障(处于Failed状态)或者超过微码所规定的设计寿命,那么写缓存就会被自动禁用l为了保证写缓存数据的安全性,默认两个控制器的Cache Mirroring写缓存镜像功能是打开的。因此当一个控制器的写缓存被禁用之后,另外一个控制器的写缓存也不能使用了。

5、16参考幻灯电池和缓存写缓存禁用之后的故障现象l主机端应用程序响应变慢,从topas检查主机性能指标,I/O waiting显著增加,每个逻辑盘的busy接近100%,但是IO吞吐量很小,每秒只有几十K到1M不等: 17参考幻灯电池和缓存电池的更换策略l如果电池当前是处于“Failed”或“Removed”状态l如果电池当前状态正常,只是接近或已超过告警寿命18参考幻灯在AIX上使用MPIO的一些注意事项AIX版本5.2以上,除了原有的集成的RDAC功能以外,操作系统还新增了MPIO的功能来实现外部磁盘的多通路访问。AIX 5.2/5.3默认是使用RDAC,而AIX6.1默认是使用MPIO。

6、RDAC和MPIO的兼容性lDS3000: 只支持 MPIO lDS4000: 支持方式:RDAC, MPIOlDS5000: 支持方式:MPIO (DS5000在AIX上不再支持RDAC) 19参考幻灯在AIX上使用MPIO的一些注意事项如何在AIX上确认当前正在使用MPIO还是RDAC l在AIX中执行“manage_disk_drivers” l以下是一个当前使用MPIO的例子: l#manage_disk_drivers 1: DS4300: currently MPIO; supported: RDAC/fcparray, MPIO 2: DS4500: currently MPIO

7、; supported: RDAC/fcparray, MPIO 3: DS4700/DS4200: currently MPIO; supported: RDAC/fcparray, MPIO 4: DS4800: currently MPIO; supported: RDAC/fcparray, MPIO l以下是一个当前使用RDAC的例子: 1: DS4300: currently RDAC/fcparray; supported: RDAC/fcparray, MPIO 2: DS4500: currently RDAC/fcparray; supported: RDAC/fcparr

8、ay, MPIO 3: DS4700/DS4200: currently RDAC/fcparray; supported: RDAC/fcparray, MPIO 4: DS4800: currently RDAC/fcparray; supported: RDAC/fcparray, MPIO 20参考幻灯在AIX上使用MPIO的一些注意事项如何检查当前磁盘的工作路径lRDAC:fget_config -Av lMPIO: mpio_get_config -Av 21参考幻灯常见故障处理和注意事项控制器微码是不是有重大隐患的版本? l06.23.05.00: 隐患一:当某个控制器内存校验出

9、错时,故障控制器无法正确的被隔离offline,从而导致逻辑盘LUN不能切换到好的控制器上,主机访问中断。 隐患二:DS4800写缓存被禁用,主机写性能大幅度下降,从而影响业务。 l07.10.23.00: 隐患一:更换故障硬盘后,之前已经接管的热备盘无法CopyBack 隐患二:Media Scan被自动禁用 22参考幻灯常见故障处理和注意事项EXP扩展柜的ESM微码版本有没有重大隐患? lEXP710的ESM的微码隐患(9681以下版本) 当一块硬盘故障时,MEL里面显示Fiber Channel Link up和Link down的Event,发生大面积的多块硬盘的同时故障,客户数据访问

10、中断。 lEXP810和EXP420的ESM的微码隐患(98D0以下版本) 当一块硬盘故障时,MEL里面显示Fiber Channel Link up和Link down的Event,发生大面积的多块硬盘的同时故障,客户数据访问中断。 23参考幻灯常见故障处理和注意事项要特别注意前面板右下方的(2GB/4GB)速率开关,是否处于正确的位置。速率开关处于4GB位置时,2Gbps的硬盘将不能被识别;相反速率开关处于2GB位置时,4Gbps的硬盘是可以使用的,但是性能将会下降。这种情况比较容易被忽视。速率开关的更改需要关机下电。注意:所有3Gbps的SATA硬盘,都推荐运行在4Gbps。24参考幻灯

11、常见故障处理和注意事项磁盘扩展柜的光纤连线符合IBM的规范。在控制器有冗余的光模块光模块条件下,建议将多个扩展柜连接在多个冗余环路上,尽量不要将所有的扩展柜串联在一个环路里。 25参考幻灯常见故障处理和注意事项只要使用了光纤交换机,做Zone是强制要求。每一个Zone必须只包含两个成员,一个对应主机的一张光纤卡的一个端口,另一个对应DS4000/DS5000的一个控制器的一个端口。 26参考幻灯常见故障处理和注意事项逻辑盘不在最优路径“Logical Drive Not On Preferred Path” l。这个问题指的是DS4000/DS5000的逻辑盘(LUN)没有挂在原本所属的控制器

12、下。27参考幻灯常见故障处理和注意事项原因分析:(主要有6点) l从主机的光纤卡到Logical Drive的光纤物理链路有问题。lP-Series主机的dar0的虚拟设备配置有问题l光纤交换机fabric1的Zone设置有问题。l主机光纤卡HBA和DS4000/DS5000控制器的主机端口Host Port之间的光纤连线方式不正确,没有符合IBM的规范。l控制器发生过重启,或者控制器已经Offline(离线) 28参考幻灯常见故障处理和注意事项检查的确认方法:(主要有8点) l确认从主机的光纤卡到逻辑盘Logical Drive的物理链路是完全正常的。l查看光纤交换机相应的主机光纤卡端口和D

13、S4000/DS5000控制器端口的状态灯l登陆主机,运行“fget_config -Av”确认dar的虚拟设备配置正常l确认光纤交换机的Zone设置没有问题。l确认主机光纤卡HBA和DS4000/DS5000控制器的主机端口Host Port之间的光纤连线方式是正确。l在SM客户端管理软件里面确认DS4000/DS5000的控制器状态正常l检查DS4000/DS5000内部的Mapping是否正确l确认 Linux主机的host type是否正确。 29参考幻灯常见故障处理和注意事项恢复方法 l在Storage Manager客户端管理软件里面运行: Advanced Recovery Re

14、distribute Logical Drives l在Storage Manager客户端管理软件里面,更改每一个逻辑盘Logical Drive的所属控制器 菜单:Logical DriveChangeOwnership/Preferred Path l注意:在恢复之前,一定要确认从主机的光纤卡到Logical Drive的通道是完全正常的,只有在完全确认上述几种故障都已经解决之后,才能实施恢复。否则后果一定是灾难性的! 30参考幻灯常见故障处理和注意事项Storage Manager客户端软件不能连接和访问DS4000/DS5000的控制器 l首先排除网络方面的问题l看看控制器的两位数字

15、LED的显示是否正常l如果控制器的两位数字LED的显示在循环变化,或者Ping的时通时断,这时候可以通过串口连上控制器,观察并捕获屏幕的输出。l控制器能Ping通但是Storage Manager连不上l如果能安排停机时间,重启机头是最有效的解决方法。 31参考幻灯常见故障处理和注意事项拔除DS4000/DS5000系统中所有未使用(没有光纤连接)的光电转换模块SFP l会导致光纤链路的不稳定l在MEL Event Log中,会发现有大量的“Fibre Channel Link Down”和“Fibre Channel Link Up”的提示信息。 32参考幻灯常见故障处理和注意事项特别注意:

16、不规范的实施DS4000/DS5000系统EXP扩展柜和物理硬盘的升级和迁移,可能会造成客户数据丢失! lDS4000/DS5000系统增加新的EXP扩展柜(升级)lDS4000/DS5000系统增加新的物理硬盘(升级) l 将一个或多个EXP扩展柜,从一个现有的DS4000/DS5000系统迁移到另一个DS4000/DS5000系统(迁移) l将一块或多块硬盘,从一个现有的DS4000/DS5000系统迁移到另一个DS4000/DS5000系统(迁移) l以上工作必须严格按照最新版的IBM官方文档里面所规定的步骤进行。33参考幻灯常见故障处理和注意事项注意定期保存DS4000/DS5000系

17、统的All Support Data(ASD) lDS4000/DS5000的All Support Data里面记录了所有Array的配置信息和主机Mapping的信息,在关键时刻对于客户的数据恢复有着非常重要的作用。34参考幻灯常见故障处理和注意事项寻找DS4000/DS5000的Recovery Profile lSM客户端软件的一个功能l记录了DS4000的Array和LUN的基本信息35参考幻灯常见故障处理和注意事项不能对处于“Degraded”状态的Array的故障硬盘使用Revive操作! l当Array变成Degraded状态时,主机的访问将会恢复。l故障硬盘仍然处于被隔离的静

18、止状态l造成数据丢失! 36参考幻灯常见故障处理和注意事项 故障误报l微码和旧版的不兼容l通过升级微码解决l通过重启机头解决37参考幻灯常见故障处理和注意事项绝对不能在生产系统使用SM客户端管理软件的“Reset Configuration”功能l删除DS4000/DS5000系统里面所有的Array/Lun信息l将所有配置恢复成出厂设置值38参考幻灯常见故障处理和注意事项DS5000维护注意事项 lDS5000的关机流程和DS4000是不一样的: l关闭两个电源的开关 - 控制器缓存(Cache)中的数据自动备份到控制器内部的闪存(USB Flash)中,控制器的LED 交错的显示 “os”和“bb” - 控制器电源在数据备份完成后才会关闭l因为这个差异,DS5000的关机过程耗时比较长, 大概5-10分钟(控制器的LED会交错的显示“os”和“bb”),关机后,控制器的代码和电源灯会熄灭。 l在DS5000按下电源按钮关机后,在代码熄灭和所有电源灯熄灭前绝对不能进行任何操作!39参考幻灯常见故障处理和注意事项40参考幻灯常见故障处理和注意事项41参考幻灯

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 医学/心理学 > 基础医学

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号