2022年数据中心机房应急预案

上传人:cn****1 文档编号:567387150 上传时间:2024-07-20 格式:PDF 页数:7 大小:59.75KB
返回 下载 相关 举报
2022年数据中心机房应急预案_第1页
第1页 / 共7页
2022年数据中心机房应急预案_第2页
第2页 / 共7页
2022年数据中心机房应急预案_第3页
第3页 / 共7页
2022年数据中心机房应急预案_第4页
第4页 / 共7页
2022年数据中心机房应急预案_第5页
第5页 / 共7页
点击查看更多>>
资源描述

《2022年数据中心机房应急预案》由会员分享,可在线阅读,更多相关《2022年数据中心机房应急预案(7页珍藏版)》请在金锄头文库上搜索。

1、中心机房应急预案及管理办法第一章 总则第一条为规范我所网络中心机房设备管理,提高处理机房突发事件的能力,形成科学、有效、反应迅速的应急工作机制,确保重要计算机信息系统的实体安全、运行安全和数据安全,最大限度地减少突发事件造成的危害,根据中华人民共和国计算机信息系统安全保护条例 、 信息化建设员工遵循守则及企业信息安全管理制度等相关管理规定等,制定网络中心机房应急预案及管理办法(以下简称管理办法) 。第二条本文件适用于有计划性、有预防性地管理我所的网络中心机房以及发生和可能发生的与机房有关的突发事件。第三条信管部负责编制、 修订网络中心机房管理办法及所辖范围内突发机房事件应急预案。周期性或即时性

2、地向局域网用户发布系统安全警示;对异常流量来源进行监控,并妥善处理各种异常情况。 及时组织专业技术人员对所辖范围内机房突发事件进行应急处置;负责调查和处理机房突发事件,及时上报并按照相关规定作好善后工作。第二章中心机房管理办法第四条机房内的所有设备需要定期保养,应指定人员做维护、清洁工作, 做到两天一收拾,一周一打扫;严禁将各种食物、饮用品带入机房,在机房内禁止吸烟。第五条计算机设备维修工作由专门人员进行,管理人员应把设备的检修情况记录在相应的设备卡上, 以便统一归档管理。如发现机房设备故障应及时向上级领导报告,并负责计算机及外设的日常维护与排除故障,在遇到设备保修范围内的故障时,应及时催促供

3、应单位上门或将机器送修;第六条系统管理人员必须严格遵守有关机房、设备及系统运行管理规定,不得在机房内从事与系统管理、运行维护、系统安装和调测等无关的工作;第七条如其他人员需使用机房内设备应向机房负责人提交申请,经主管人员审核签字后,将书面申请提交信管部存档后方可借用机房内的设备;第八条做好防火、防雨、防湿、防盗工作,注意用电安全;机房内的环境要每周检查温度、名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 1 页,共 7 页 - - - - - - - - - 2 湿度、电力系统、是否

4、满足机房相关的标准要求;第九条系统管理人员应定时对机房供电系统及其他运行中的系统、设备进行巡视和检查,建立档案, 做好系统日志。 要对发生的故障以及排除故障情况做好详细记录;机房管理人员每日检查UPS 电源的状态,确保在突发停电时,UPS 电源能自动供应机房设备正常工作半个小时,保证机房设备的数据及时保存。第十条要统一管理机房内的设备,计算机及其相关设备的驱动程序、保修卡等随机文件与资料要保存完整。要明确专人负责计算机文档、信息化等资料的保管,要做到资料齐全,存放安全;第十一条机房内的交换机和服务器系办公自动化的关键设备,任何人不得自行配置或更改系统参数;第十二条要做好机房的安全工作,对服务器

5、的各种帐户、密码严格保密。对网络运行做好监控、做好记录;第十三条应及时做好数据的备份工作,保证在系统发生故障时,数据能够快速、安全的恢复。所有备份数据不得更改,并要求做到本地和异地分别备份保存。第十四条为了更好的为所里的业务服务,确保我所网络正常运行,每日常规工作内容主要由两部分组成,每日早上9:00 开始对机房进行巡查,每日晚上17:00 对机房进行简单的清扫及巡查, 对机房内的设备进行一般性的巡视,主要着重于服务器及网络设备运行正常与否。1)对机房里的温度进行调节,如室内温度过高,调节空调对机房进行有效的通风。2)查看交换机与防火墙及接入设备的工作状态,如发生异常,对其进行及时有效的维护。

6、3)监测网络运行状况,做好工作记录及系统日志。4)查看当日杀毒软件的工作日志;5)对机房进行清洁工作,做好机房的防尘工作;6)下班后关好门窗,检查机房的门是否上锁。第三章机房出入管理规定第十五条除经授权的系统管理、机房值班和保安巡视人员外,其他人员进入机房需经信管部负责人批准,并在机房管理人员陪同下进入机房。第十六条严禁带外单位人员或无关人员进入机房,确因工作需要,如:系统故障诊断和处名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 2 页,共 7 页 - - - - - - - -

7、- 3 理,设备维修维护、 系统或设备安装等进入机房,必须由机房管理人员陪同进入,做好登记,并配合项目的实施。第十七条进入机房的设备应在进入机房前拆除外包装,以保证机房环境的清洁和安全。第十八条严禁携带易燃、易爆、易腐蚀等危险性物品进入机房。第四章机房用电管理规定第十九条机房内提供的UPS 电源只允许为主机、服务器、网络及存储等核心设备供电,严禁安插其他设备,增加UPS 电源供电负荷。第二十条严禁擅自切断供电系统,确因工作需要断电时,首先应做好相应准备工作,经部门领导批准,然后给所有部门发放断电通知,最后方可实施。第二十一条机房内安装用电设备或有用电需求的项目时,必须经过专业人员或设备提供商的

8、安装工程师进行现场勘查,经确认在满足或符合要求后工程才能实施。第五章机房施工管理规定第二十二条任何进入机房的施工,施工单位必须指明施工管理人员。第二十三条施工人员进入机房,必须遵守机房有关管理规定,不得携带与施工无关的物品进入机房,并自觉接受保安人员或机房管理人员的管理、监督和检查。第二十四条施工人员未经许可不得进入非指定工作区域,施工前须布置适当的防护设施;施工人员在现场严禁吸烟,不得在机房的任何地方坐卧,饮食,或从事与施工无关的事情。第二十五条施工人员在施工过程中不得擅自动用机房设施和设备,如因施工管理不善造成机房设施、财产及其他一切经济损失,施工单位必须承担责任并负责赔偿。第六章机房安全

9、管理规定第二十六条进入机房的人员必须遵守机房出入管理规定以及有关规章制度。第二十七条机房内的设备、工具及相关资料应存放在指定地点,未经许可不得私自带出机房。第二十八条机房内严禁吸烟,严禁存放易燃、易爆、易腐蚀等危险性物品,严禁动用明火;名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 3 页,共 7 页 - - - - - - - - - 4 禁止在电器设备上放置纸张等其它杂物;不得存放与系统运行维护和管理无关的设备、物品和资料。第二十九条机房管理人员或保安巡检员应熟悉机房环境以及安全

10、通道的位置,应懂得防火知识,灭火常识,熟悉机房消防设施的使用方法,具有及时发现火灾隐患的能力。第三十条未经批准,不得擅自对网路拓扑结构、连接方式进行修改或拆接,如需作拆接或修改,需经信管部经理同意后方可进行,并把修改情况记录在案,未经允许, 机房管理人员、保安人员不得动用机房内的计算机网络设备,线路等。第七章 中心机房突发事件应急预案第三十一条机房突发事件包括网络设备或服务器故障、自然灾害(水、火、电等)造成的物理破坏、人为失误造成的安全事件等等。针对突发事件的预防措施如下:1、建立安全、可靠、稳定运行的机房环境,防火、防盗、防雷电、防水、防静电、防尘;建立备份电源系统;加强所有人员防火、防盗

11、等基本技能培训。2、服务器采用可靠、稳定的硬件设备,落实数据备份机制,安装有效的防病毒软件,及时更新升级扫描引擎;加强对局域网内所有用户和信息系统管理员的安全技术培训。第三十二条机房漏水应急预案如下:1、发生机房漏水时,第一目击者应立即通知机房管理人员。2、若空调系统出现渗漏水,机房管理人员应立即安排停用故障空调,清除机房积水,并及时联系设备供应方处理,同时启动备用空调,必要情况下可临时用电扇对服务器进行降温。3、若为墙体或窗户渗漏水,机房管理人员应立即采取有效措施确保机房安全,同时安排通知办公室,及时清除积水,维修墙体或窗户,消除渗漏水隐患。第三十三条机房火灾应急预案如下:1、完善机房环境,

12、确保机房FM200 自动灭火系统工作正常,设置为灭火系统为自动状态。禁止携带易燃易爆物品进入机房。2、机房管理人员应熟悉机房内部消防系统安全操作和规则,了解机房内FM200 灭火消防设备操作原理,掌握消防应急处理步骤、措施和要领,懂得灭火的方法,会扑救初起火灾,并定期组织灭火演习。3、一旦发生火情, 要迅速切断电源 (电源已和消防系统联动),利用机房专用灭火系统灭火,使用气体灭火系统,要保证机房内所有人员全部撤离现场,方可放气灭火 (紧急情况采用手名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - -

13、- - 第 4 页,共 7 页 - - - - - - - - - 5 动启动,见气体灭火系统操作手册);如机房气体灭火系统失效,在保证人员安全的情况下要立即使用备用手持式灭火器手动灭火,同时以最快的方式向主管领导汇报,尽快增加援助人员协力救火,并迅速拨打物业管理和119 火警电话。4、等待消防车到来期间,应组织物业保安或工作人员在保证安全的前提下灭火,应急领导小组应在第一时间内集中所有可用灭火器,抓住时机,尽可能的把火扑灭。5、配合消防部门调查事故原因,对造成的损失和起火原因做好记录,以便进行灾后总结。第三十四条雷击事故应急预案如下:1、遇雷暴天气,机房管理人员在下班后应及时关闭所有服务器,

14、切断电源,暂停内部计算机网络工作。2、雷暴天气结束后,机房管理人员应及时开通服务器,恢复内部计算机网络工作,对设备和数据进行检查。出现故障的,事发部门应将故障情况及时报告信管部。3、因雷击造成损失的,机房管理人员应会同相关部门进行核实、报损,并在调查工作结束后一日内书面报告领导。第三十五条设备防盗被盗或人为损害应急预案如下:1、机房管理人员每日查看、清点设备并锁好机房大门。2、机房管理人员每日检查录像监控服务器状态,确保监控画面正常,并检查每日录像正常性、完整性。3、发生设备被盗或人为损害设备情况时,使用者或管理者应立即报告信管部负责人,同时保护好现场。4、信管部接报后,通知保安及公安部门,一

15、同核实审定现场情况,清点被盗物资或盘查人为损害情况,做好必要的影像记录和文字记录。5、事发单位和当事人应积极配合公安部门进行调查,并将有关情况向信管部汇报。第三十六条机房停电应急预案如下:接到停电通知后,信管部应及时通过办公系统、电话等发布相关信息,部署应对具体措施,要求涉及到的工作人员在停电前停止业务、保存数据。1、确认电力可能恢复的时间,立即通知中心机房电源维护负责人和中心机房各设备的负责人到达现场,做好各机房停电准备。如果确认机房停电的时间为短时间停电,立即可以恢复供电的情况(如15 分钟以内,根据 UPS 电池使用周期和寿命,电池后备时间将会减少,应根据现场实际情况,留出机房设备正常关

16、机时间),可以在UPS 正常供电的时间内,应密切观察UPS 带负载时名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 5 页,共 7 页 - - - - - - - - - 6 间,等到电力恢复,期间如UPS 剩余时间低于50%(应满足机房设备正常关机时间),机房负责人应立即严格按操作手册停掉机房内的所有设备(包括各应用服务器、存储、核心交换机和路由期等设备的电源,以及机房辅助设备的电源,最后关闭 UPS(见 UPS操作手册),等待电力恢复,电力恢复供电后转第七条执行。如果不能确认恢复

17、供电时间,立即汇报给机房电源维护负责人和中心机房各设备的负责任到达现场。 做好各设备的电源停电准备,严格按操作手册停掉机房内的所有设备(包括各应用服务器、 存储、核心交换机和路由期等设备的电源,以及机房辅助设备的电源,最后关闭 UPS(见 UPS 操作手册),等待电力恢复,电力恢复供电后转第4 条执行。2、机房维护负责人将停电的电源柜总空开和分空开的状态处于断开状态,关闭顺序应为,先关闭回路小开关,再关闭总开关 (UPS 关闭后, 应先关闭 UPS 输出回路开关, 再关闭 UPS输出总开关,接着关闭UPS 输入开关)并向主管领导汇报。3、将掉电的所有的设备电源状态处于下电状态,以防止电源柜加电

18、对设备的冲击。4、电力室恢复供电后,先不要急于给电源柜加电,等待10-20 分钟后,再开始给电源柜加电,以防止供电不稳或再次掉电。5、供电正常后,确定设备处于下电状态后,打开电力柜的总控开,开启UPS 的市电输入开关,开启 UPS(见 UPS 操作) 。6、根据设备加电顺序,启动分路空开。7、设备加电顺序,网络设备正常后再给服务器、存储等设备加电开机。(以上各设备务必按操作手册的启动顺序上电)。8、设备启动正常后,开始启动数据库。9、数据库启动正常后,开始启动中间件服务器。10、中间件服务器正常后,启动应用程序。第三十七条通信网络故障应急预案如下:1、发生通信线路中断、流量异常等故障后,员工应

19、及时通知信管部人员。2、信管部在接到报告后,迅速组织相关技术人员检测故障区域,并作相关故障处理,必要时通知通信网络运营商查清原因;逐步恢复故障区与服务器的网络联接,恢复通信网络, 保证正常运转。3、应急处理结束后,信管部应在一日之内提交故障分析报告,以便备案。第三十八条服务器故障应急预案如下:1、机房管理人员每日检查机房设备工作状态,确保系统运行的完善。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 6 页,共 7 页 - - - - - - - - - 7 2、机房管理人员定期备份

20、数据和资料,并将备份资料刻录成光盘或拷贝到移动硬盘。第三十九条发生机房突发事件后,信管部应采取有效措施开展先期处置,恢复信息网络正常状态。应急处置工作结束后,信管部对事件发生原因、性质、影响、后果、责任及应急处置能力、 恢复重建等问题进行全面调查评估,根据应急处置中暴露出的管理、协调和技术问题,改进和完善预案,实施针对性演练,总结经验教训,整改存在隐患,组织恢复正常工作秩序。第八章 附则第四十条信管部会结合信息网络快速发展和经济社会发展状况,配合相关法律法规的制定、修改和完善,适时修订管理办法。第四十一条本文件由信息管理部制定并负责解释。第四十二条本文件经批准后发布实施。2017 年 05 月 10 日上海市 *信管部名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 7 页,共 7 页 - - - - - - - - -

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 建筑/环境 > 施工组织

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号