银行基础设施及物理环境异常处置流程和应急措施

上传人:公**** 文档编号:429865837 上传时间:2023-06-08 格式:DOCX 页数:13 大小:88.70KB
返回 下载 相关 举报
银行基础设施及物理环境异常处置流程和应急措施_第1页
第1页 / 共13页
银行基础设施及物理环境异常处置流程和应急措施_第2页
第2页 / 共13页
银行基础设施及物理环境异常处置流程和应急措施_第3页
第3页 / 共13页
银行基础设施及物理环境异常处置流程和应急措施_第4页
第4页 / 共13页
银行基础设施及物理环境异常处置流程和应急措施_第5页
第5页 / 共13页
点击查看更多>>
资源描述

《银行基础设施及物理环境异常处置流程和应急措施》由会员分享,可在线阅读,更多相关《银行基础设施及物理环境异常处置流程和应急措施(13页珍藏版)》请在金锄头文库上搜索。

1、流程和应急措施随着金融行业电子化建设体系架构由分散模式发展为数据 集中模式,相应风险集中到总行数据汇聚中心。数据中心的安全、 稳定将影响到金融行业所有前台网点业务的正常开展。建立健全 有效的基础设施及物理环境异常处置流程和应急措施,最大限度 的减小突发事件所造成的损失和影响,结合*银行应急方案 现形成基础设施及物理环境异常处置流程和应急措施。第一章 机柜断电异常处置流程及应急措施(一)排查机柜停电故障原因1、查看机柜服务器电源部分不亮或全部不亮,服务器部分 停机或全部停机;2、查看电源列头柜中此柜的空气开关是否已经跳闸(整柜 或单路全断的情况一般都是控制此机柜的空开跳闸了);3、逐台查看机柜服

2、务器,主要查看是否有异味及烧焦的情 况发生,机柜停电的原因主要是某台服务器电源模块故障导致短 路,从而造成电流过高跳闸,表现为发黑、有烧焦味;4、在得到相关领导批准的情况下,拔下已经停电的所有服 务器电源插头;5、使用测电仪器对机柜内断电的所有设备进行短路、断路测量;6、使用墙边电源对每台服务器进行加电测试。(二)恢复机柜供电1、排除有异味、烧焦味、短路、断路的服务器;2、使用测电仪器对机柜电源插排进行短路、断路检查,确 定供电电源有无问题,请交由专业人士操作;3、有以下情况的,不允许再次接入机柜:3.1、发现无法开机的;3.2、导致排插跳闸的;3.3、测电各项指标(如 13次电流谐波)不通过

3、的;3.4、电流极其不稳定的;3.5、服务器电源指示灯异常的(由机房管理员联系各品牌 服务器厂商判断)4、列头柜空气开关合闸,对测电通过的服务器放入机柜后 逐一恢复供电;5、机房管理员逐台启动服务器;6、对有问题的服务器进行记录,故障服务器在维修完毕后 需要通过测电才能再次接入机柜。(三)其他故障以上是常见的故障,但也有极少数情况是本身机柜的供电问 题,请联系专业电工使用万用表,由下到上逐步测试电源端子或 电源接口是否有电,有无虚接,从机柜的电源到列头柜的空开电 源等。第二章 空调异常处置流程及应急措施(一)空调系统故障导致机房温度升高处理措施1、正常情况下:机房内保持平均23土LC,湿度45

4、土5%,当机 房因空调故障平均温度上升到28C以上,就可能造成机房内服务器 应高温引起宕机事故。2、机房温度升高,首先查看故障空调的位置和现象。3、如果故障较为严重,影响范围较大,则立即向上级汇报。4、启用备用空调、风扇、降低机房内温度,并打开机房门,以 便设备散热和空气流通。5、机房管理人员要密切注意各设备的运行状况,如出现告警, 查看日志了解情及时联系维保公司维修。6、机房管理人员要密切注意机房内服务器运行状态,如已影响 到系统和业务的正常运行,尤其是一些重要业务,应立即向上级汇报。7、待机房内温、湿度恢复正常并监控一段时间后无异常情况, 将备用空调、风扇关闭并放回原位,保持机房卫生和整洁

5、。8、机房管理人员对此次故障做出总结和汇报,以文档形式上交 负责人,并存入文档。(二)机房空调系统常见故障处理1、单台空调故障 故障描述:(1)空调制冷效率下降、有异常响声、有报警信息、(2)处置措施:机房内都有备份空调,单台空调故障不会影响机房正常运行。关 闭故障空调,开启机房内备用空调。拨打维保公司电话,通知上门维 修,注意故障描述要准确无误。2、机房跑水故障描述:(1)机房空调加湿跑水,机房空调循环水跑水。(2)处置措施: 加水用水管径较小,短时间关闭加湿用水,对机房危害较小。 加湿用水空调端漏水,关闭该台空调,同时关闭加湿用水阀门,并用 拖布把水拖干。(机房内加湿用水总阀门在空调冷却水

6、供回水水管旁) 加湿用水主管路漏水,应关闭加湿用水主阀门,位置在本层 新风机房,软化树脂罐上阀门。 空调循环水跑水,空调端冷却水跑水,关闭该台空调冷却水 供回水阀门.(位置在该台空调旁供回水立管上) 空调循环水主管路跑水,对机房危害较大,严重影响机房正 常运行。发主管路漏水应关闭冷却水供回水阀门,位置在本层管道井 内。3、空调循环水故障故障描述:(1)水压异常,或无水压,回水温度高处理措施:(2)水压异常是循环泵未开,或系统缺水,通知后勤服务中 心查看循环泵是否正常,并按机房高温措施处理。第三章 不间断电源异常处置流程及应急措施(一)市电中断应急处理流程1. 市电供应中断分为计划内事件和计划外

7、事件。2. 发生计划外事件时,应当立即联系后勤服务中心或电力公 司询问断电原因以及预计断电持续时间。预计停电时间超 过 30 分钟或预计停电时间未知的情况下应当做好启动发 电机的准备。3. 接到计划内的停电通知时,需要确认停电时间、持续时间 后勤服务中心值班人员联系方式、能否顺利启动发电机。4. 打开一楼外发电机房房门,打开发电机控制器电源。按按 键“ AUTO ”使发电机处于自动启动状态。5. 合上发电机的断路开关。正常情况下发电机房市电与发电 机切换的ATS开关已置于自动状态。此时发电机自动启动 发电。6. 观察并记录中心机房各用电设备及UPS主机在切换过程中 状态。7. 发电机发电后,正

8、常状态下配电控制柜由“I”路切换到“II 路,并且II路对应指示灯全部点亮;同时发电机控制器液 晶面板显示有电压值(400V左右)和电流值,频率在50Hz 左右。环境监控系统电话告警提示电量仪电压已恢复。(二)市电回切恢复步骤1. 开启机房电路系统空开,机房配电柜ATS自动切换至机房 市电供电线路,发电机自动关闭。2. 观察并记录配电柜、UPS的状态。第四章 机房消防异常处置流程及应对措施机房突发火灾应急处理预案1、“先断电,后灭火”是扑灭电气火灾的基本原则,在切断电 源时要根据现场火势、着火设备进行判断,考虑重要负荷、消防电源 的影响以及配电系统回路的分布,防止火灾未救,人员先被电击或灼 伤

9、。2、如果发现机柜内设备出现内部打火、冒烟但没有明火出现时, 要立即拔掉该设备的电源插头,并把该设备拿离机柜,防止危害其他 设备;发现局部轻微着火不危机其他设备的情况下,要立即断开该设 备电源,并组织人员利用就近消防器材进行灭火,防止火势蔓延扩大, 并向领导报告;发现设备火势大危机整个机柜但不危机人员生命还能 控制时,立即对应机柜编号,断开整个机柜电源,并组织人员使用气 体灭火器进行扑火,发现 UPS 电池组着火时先断开电池组箱体上的控 制开关,必要时再断开电源室控制 UPS 的总断路器,用气体灭火器灭 火,如果火势大不能控制应立即向负责人汇报、拨打119 报警,根据 情况切断机房总电源再进行

10、组织灭火。3、在消防车来之前,先尽力使用现有消防设备将火势控制在最 小范围。消防车来之后,值班人员配合消防专业人员扑救或作好辅助 工作。 迅速组织人员逃生,原则是“先救人,后救物”, 及时安 全地疏散人员和财产转移。火势大时可用灭火器边喷边撤退,确保人 员安全。第五章通信网络异常处置流程及应对措施(一)发生网络故障时,首先检查机房设备情况,确定网络故障 的原因。通过telnet或console 口进入网络设备,用命令dis ip int brief查看网络设备各端口是否正常,如果个端口的物理连路及协议 都是up状态,则能够判断线路是正常的。(二)确认原因后,首先启动备用线路和设备,保证网络的正

11、常 运行。然后联系网络维护人员,及时处理和排除故障。(三)通过命令dis ip int brief查看出端口 down的情况下, 还需网络管理员进一步判断是否是本地故障,检查光端机状态是否正 常。如果不是本地故障,立即联系运营商联系,及时处理故障。当确 认原因为短时间无法恢复,应该及时向负责领导汇报。并且每过 10 分钟电话跟踪一次故障状态。(四)当人为或病毒破坏的故障发生时,具体按以下顺序进行: 判断破坏的来源及性质,断开影响安全与稳定的信息网络设备,断开 与破坏来源的物理网络连接,跟踪并锁定破坏的来源和其他网络用户 信息,修复被破坏的信息,恢复系统。(五)通信网络故障恢复以后,验证交易状态

12、是否正常。第六章网络设备故障异常处置流程及应对措施(一)网络设备的排错流程 下面流程图是网络维护人员所应采取的排错模型,当发生网络故 障时应按照此流程快速进行定位、排除故障。1、网络系统故障突发事件分级故障等级故障现象1级网络完全拥塞或设备宕机网络或设备处理能力严重受影响,对最终客户端的业务运作有严重影 响网络或设备故障对重要的程序造成严重影响2级网络或设备的性能严重下降,对最终客户端的业务运作产生重要影响部分区域网络故障一般网络节点发生故障大部分客户端的网络通讯质量下降3级网络或设备性能受损,但最终客户端大部分业务仍可正常工作报警出错和操作命令反常4级其它一般的故障,不影响系统的整体运行,不

13、影响大部分客户端的使 用(二)应急措施1、黑客攻击时的紧急处置措施A、网络管理员当发现网页内容被篡改、Internet接入路由器有 未知用户登录或通过其他方式发现有黑客正在进行攻击时,应立即向 科技信息部相关人员通报情况;B、立即备份当时的log日志并采用端口限制方式阻断外部的入 侵,观察被攻击的服务器等设备状态,同时向部门负责人和分管领导 汇报情况;C、协调相关应用部门,与科技信息部有关技术人员一同负责被破坏系统的恢复与重建工作;D、有关部门配合共同追查非法信息来源;E、情况严重的,根据突发事件级别应及时向有关上级部门汇报。2、病毒安全紧急处置措施A、当发现计算机感染有病毒后,应立即将该机从

14、网络上隔离出来;通知维护人员对该设备的硬盘进行数据备份;C、启用杀病毒软件对该机进行杀毒处理,同时进行病毒检测软件对其他机器进行病毒扫描和清除工作;D、如发现杀病毒软件无法清除该病毒,应立即向部门负责人报 告,维护人员确认无法查杀该病毒后,采取格式化硬盘,作好相关记 录;E、机器恢复后重新开启网络设备的相应端口;F、认为情况极为严重,根据突发事件级别应及时向有关上级部门汇报。3、网络设备紧急处置措施A、如属路由器、交换机等网络设备(光模块)故障,应立即查 找是否有相关备件可以替换,或与设备提供商联系更换设备,并调试 畅通;B、如属路由器、交换机配置文件破坏,应迅速按照备份配置文 件重新配置,并

15、调试畅通;如遇无法解决的技术问题,立即向有关厂 商请求支援;C、检查主机网络连接情况1)2)3)检查连通性; 检查是否有 IP 地址冲突;检查端口状态:包括检查端口状态、端口协议、CRC错误D、核心交换机/路由器替换应急处置步骤(1)将原有设备关机,彻底取消它可能的影响(2)设备到位,将设备放在原有设备附近上电,紧急情况无需 上架(3)配置每个 vlan 或端口的网关地址(4)配置关键路由.启动VRRP路由协议(如有),划分相关端 口到对应vlan (交换机)(5)按照网线端口切换表,将原有连接在交换机/路由器上的 端口,移至新设备上。(预期 15分钟,可以和3-6步骤同时进行)(6)接线方法:连接原则是端口位置不变,如果重合则另选空闲端口。E、情况严重的,根据突发事件级别应及时向有关上级部门汇报。4、网络突发事件记录文档第七章 服务器异常处置流程及应对措施(一)排错流程(二)应急处置具体措施1、服务器设备损坏应急处置措施A、关键应用系统所在服务器设备损坏后,应立即查明原因,使用备份服务器替换损坏设备,并立即恢复应用系统正常使用;B、立

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 机械/制造/汽车 > 综合/其它

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号