《数据中心运维服务方案.doc》由会员分享,可在线阅读,更多相关《数据中心运维服务方案.doc(20页珍藏版)》请在金锄头文库上搜索。
1、1 数据中心机房及信息化终端设备维护方案一、概况xxx客户数据中心机房于 XX年投入使用 ,目前即将过保和需要续保运维的设备清单如下 :序号设备材料名称规格型号品牌数量单位1. 2 3 4 5 6 7 8 9 10 11 12 13 14 15 2 16 17 18 19 20 21 22 另外,全院网络交换机设备使用年限较长,已全部过保 ,存在一定的安全隐患。二、维保的意义通过机房设备维护保养可以提高设备的使用寿命,降低设备出现故障的概率,避免重特大事故发生 ,避免不必要的经济损失 。设备故障时 ,可提供快速的备件供应 ,技术支持 ,故障处理等服务 。通过系统的维护可以提前发现问题,并解决问
2、题 。将故障消灭在萌芽状态 ,提高系统的安全性 ,做到为客户排忧解难 ,减少客户人力 、物力投入的成本 。为机房内各系统及设备的正常运行提供安全保障。可延迟客户设备的淘汰时间,使可用价值最大化 。通过引入专业的维护公司,可以将客户管理人员从日常需要完成专业性很强的维护保养工作中解放出来,提升客户的工作效率 ,更好的发挥信息或科技部门的自身职能 。通过专业的维护 ,将机房内各设备的运行数据进行整理,进行数据分析 ,给3 客户的机房基础设施建设 、管理和投入提供依据 。三、维护范围1、数据中心供配电系统2、数据中心信息化系统3、全院信息化终端设备4、数据库及虚拟化系统四、提供的服务为更好的服务好客
3、户 ,确实按质按量的对设备进行维护;我公司根据国家相关标准及厂商维护标准 ,结合自身多年经验积累和客户需求,制定了一套自有的服务内容 :1、 我公司在本地储备相应设备的备品备件,确保在系统出现故障时 ,及时免费更换新的器件 ,保障设备使用安全 。2.我公司和客户建立 24小时联络机制 ,同时指定一名负责人与使用方保持沟通,确保7*24小时都可靠联系到工程技术人员,所有节日都照此标准执行。3.快速进行故障抢修 :故障服务响应时间不多于 30分钟,2小时内至少 2人以上携带相关工具 、仪器到达故障现场 ,直到设备恢复正常运行 。4.我公司对维修维护的设施设备的使用性能负责,在维修维护过程中严格执行
4、技术规范 ,保证设施设备的性能符合相关技术标准要求。在维修维护间 ,我方应对设施设备可能存在的故障隐患做出评估,并进行恰当的预防性处理 ,以保证设4 施设备的安全运行 。若故障隐患超出维修维护范围的,及时书面通知客户 ,并提出消除隐患建议 。5.维护巡检中我公司提供设备系统图或使用说明书:将机房内设备的整个系统等汇编成资料 ,由维护人员进行统一放置 ,便于应急查询 。6.巡检次数每年不少于四次,每次巡检后 ,由维修维护方提供巡检报告,并由使用方签字确认 。每月由我公司客户服务人员定期进行回访,听取客户意见反馈,搭建起双方的沟通渠道 。7.提供系统应急方案 :设备在 12小时内还无法修复的应有备
5、份应急处理方案。如提供适合负载功率的备机、备用空调等 。8.培训:提供专业理论知识培训和操作培训,维修维护培训 ,简单故障处理培训,培训文档由我公司整理 。9.人员配置 :全年(包括所有的节假日期间 )提供不少于 2名工程师在常住昆明本地 ,确保满足响应时间要求 ;到现场的维护维修工程师至少一名是能完全解决故障并有丰富从业经验的。10.我公司每次巡检完毕后提供维护报告,同进还提供全年维护报告、每次维修事故报告等资料 ,根据事故提出相应的整体解决方案等管理规划层面的内容。11、数据分析 :我公司将每次巡检 、维修等数据进行整理 ,对设备运行的数据变化量进行测数 ,给客户提供一份报告 ,系统性的介
6、绍机房发生的变化,给客户后期系统建设 、投资提供参考依据 。12、提供系统相关的技术服务 :设备搬迁 、系统现场保障 、突发或特殊应急处置。13. 我公司对客户的服务采用自有的软件进行管理,实现包括资产管理 、数5 据管理 、合同执行管理等内容 ;所有事件有迹可查 ,管理流程化 。此软件中的数据对客户开放 。五、服务内容(一)UPS供配电系统 :(全包备件 )1、供配电 : (1) 输入输出配电柜及线缆:测量输入输出开关、线缆载流量的实际值和UPS显示值的区别。 线缆外观有无破损,线缆交叉的情况,连接点的温度是否正常。(2) 线缆是否存在局部过热, 通风是否良好。2、UPS主机 :( 全包备件
7、 )(1)全包备件保修方式(保修期内设备的维护保养、 故障维修所需的备件均免费维修更换)。(2)每 3个月进行一次保养维护检查,内容如下 :1)外观检查 :面板显示 、案件 、指示灯 、风扇运行是否正常;2)设备内部电感、电解电容和功率线的外观检查;3)设备内部各功率部件及电路板信号线的物理连接检查;4)检查模块 、电路板 、 轨导 、连接端子的键是否出现氧化;5)检查设备清洁程度, 特别是设备内部的积尘及其他物质;6)设备绝缘检查;7)设备运行环境检查: 设备通风及散热是否良好、环境温度 、设备有无水患可能;8)UPS运行参数的检查:整流器 、逆变器 、 静态旁路 、负载运行参数是否正常、检
8、测值与实际测量值是否有偏差(不超过 5%)。6 9)检查所有的电源保险丝、隔离开关的完好程度及是否安装牢固。10) 每季度定期检测UPS输入线电压 、输入频率 、输入电流谐波成分、输入功率因数、效率 、输出相电压 、 输出频率 、输出火线 -零线波形 、蓄电池充电电流等参数, 应符合相关国家要求。11) 对每台 UPS电池组进行不低于电池容量50% 的放电测试 ,并对每台 UPS电池组电池内阻进行检测,查看直流熔断器和蓄电池连接条的压降或温升是否有异常变化。(4)每年定期用真空吸尘器清扫UPS主机内的各部件或用提供低压空气流吹风机来清除外来的残渣和灰尘。(5)对UPS主机风扇定期进行逐步更换,
9、每年更换量不少于总量的20%。运行 5年以后逐步更换滤波电容。定期巡检尽量以观察、测量为主 ,减少停机 。(6)提供 客户现场服务报告, 报告需要客户签字认可。3、蓄电池维护 (不包配件 ):(1)电池目检项目电池外观检查:外观是否变形、渗漏 ,安全阀周围有无液体;电池端柱是否有腐蚀、爬酸现象或有过热痕迹;电池槽和盖的损坏;电池绝缘检查;电池寿命 :当电池达到使用年限时,提前通知用户;电池电压测量:检查充电电压是否和电池数量相匹配;电池端子连接是否稳固。视情况进行电池表灰尘处理。(2)仪器测量7 测量和记录电池系统的直流浮充电压, 此时也可选择测量和记录交流皱波电压测量每一个电池端柱与接地间的
10、直流电压以发现不正常的接地测量和记录取样电池的温度测量和记录每个电池的浮充电压测量和记录系统均衡充电电压(3)UPS主机内部进行电池自检电池接触器闭合;电池处于浮充状态;整流 、 逆变通讯正常 ;电池状态正常 ;整流器工作正常;市电电压正常 ;逆变器正供电 ;负载功率大于指定的电池曲线设定的电池自检功率;UPS不处于联合供电状态。以上条件都满足时方可进行电池自检。如果在自检过程中,出现上述允许条件任意一条不满足 ,系统将退出自检,转入均充状态。按停止手动自检,可以中止自检过程,电池转均充 。 电池自检结束转均充。(二)机房空调系统 : (全包备件 )(1)全包备件保修方式(保修期内设备的维护保
11、养、 故障维修所需的备件均免费维修更换。 包含免费更换过滤网、皮带 、 风机 、压缩机 、电路板 、室外电机 、室外调速器 、氟利昂等)。 过滤网视情况进行更换,但每年提供不少于更换四次。皮带每年进行一次更换。8 (2)每 3个月进行一次保养维护检查,巡检内容如下 :1)、 制冷系统 :?检查压缩机工作声音是否正常;油镜油位是否正常;?检查压缩机吸气排气压力是否正常:?制冷管路阀门 ( 液管 、气管 、压缩机吸入及排出口阀门)是否打开 ;?热力膨胀阀开启是否正常;?压缩机转向 ;供电相序是否反相;?检查吸气管路 、 排气管路 、回液管路和压缩机机体温度是否正常;?干燥过滤器前后端有无温差;?管
12、路 (含储液罐 )有否漏油痕迹 ;?视液镜水分指示是否正常;?蒸发器盘管是否脏污;?冷凝器翅片是否脏污;?检查冷凝器风机工作是否正常;?检查冷凝器压力开关/风机调速设置是否正确;2)、 送风系统 :?检查风机皮带轮和电机皮带轮的平面度;?检查室内风机皮带张紧度;?检查室内风机轴承工作是否正常;声音有无异常;?检查室内风机叶轮转动是否正常;?检查室内风压开关、过滤网压差开关设定值是否正确;?清洁风机 ;9 ?检查空气过滤网是否脏污;?检查所有门板是否可靠;3)、 电气系统?每半年紧所有接线端子;?检查各交流接触器吸合、分断是否正常;?检查所有过流保护是否正常;整定值是否正常;?检查主电源线电压、
13、相电压 、各相电流 ;?手动启动制冷 /除湿 、加热 、加湿功能 ,检查电流是否正常;4)、 控制系统 :?检查控制器初始设置是否正常;?检查温湿度探头是否偏差;?检查显示器工作是否正常;?检查所有数据及模拟输入、输出是否正常 ;5)、 加湿系统?检查加湿器进水电磁阀和排水电磁阀动作;?检查加湿器的蒸气排出管是否畅通;?检查蒸汽凝结水排水是否正常;?检查加湿罐结垢情况,清洗或更换 ;?检查加湿器的进水过滤器;?检查加湿器的溢水、排水盘 ;?检查加湿器排水是否泄漏;?检查冷凝排水是否泄漏;10 6)、 管路系统?检查制冷管道保温和包扎是否完好;?检查所有管路定位是否完好;?检查室内外机连接电缆老
14、化情况是否满足空调运行需要;?检查空调送风和回风管路/通道是否通畅 ;7)、 给水 、排水系统?检查给水系统是否正常;加湿进水电磁阀的进水过滤网是否脏堵;?检查排水是否通畅。最后出具维护报告,记录各项技术数据,并提出意见和建议,提供运行数据分析报告。报告需要客户签字认可。(三)服务器运维 (全包备件 )我公司提供主动服务模式,做好服务规划,提前发现和解决问题,确保系统 24*7 运行 , 具体服务内容包括 :系统故障定位和排错Windows 、Linux 操作系统安装 、升级操作系统补丁的更新服务器微码升级系统备份和系统恢复数据备份和数据恢复CPU、内存升级扩容替换故障硬盘 、RAID 重建更
15、换电源 、风扇等易损件11 更换主板和其他故障板卡更换小型机和磁盘阵列中的各类到期电池系统参数的调整优化系统日志的检查和清除系统盘的镜像检查双机软件的状态检测系统目录空间状态使用的监测系统运行状态的监测安装新版本Linux 系统在新版本Linux 系统上调试系统配置对已安装的新版本Linux 系统进行测维保设备 (软件 )范围内其它软件的升级服务提供服务器年度维护服务,提供一年24 次定期上门设备巡检,提前发现故障隐患,减少故障造成的宕机时间。在服务期间 , 机器硬件的损坏由我公司提供免费更换,客户不再支付任何其它费用 。我公司提供主动服务模式,做好服务规划 ,提前发现和解决问题,确保系统24
16、*7 运行 ,具体服务内容包括 :协助客户进行受支持的软件产品的基本的日常维护和管理。协助客户对所报告的问题进行定义及指导客户相关技术人员完成解决问题所需要的相关信息的收集工作。我公司将帮助客户对所报告的问题进行问题根源的分析和诊断。对于软件本身的问题,我公司将根据需要向客户免费提供相关的修正性软件。12 对客户所报告的有关受支持软件产品的问题,我公司将根据需要使用标准系统进行记录和跟踪 ,并根据实际情形对问题的严重程度和优先级别进行设定和更新。我公司将在应用软件安装完毕后应进行基本系统测试(四)存储系统运维 (全包备件 )针对上述的中心数据机房存储系统相关设备维保服务,我公司提供主动服务模式
17、,做好服务规划 ,提前发现和解决问题,确保系统24*7 运行 ,具体服务内容包括:设备故障定位和排错设备软件版本升级配置状态检测更换电源 、风扇等易损构件系统使用状态检测系统日志分析和监控为信息中心的存储设备产品提供日常维修、维护服务 。应急保障方案 。综合分析xxx 客户数据中心服务器的软硬件配置,应用情况 ,在第一次巡检后向局方提供安全、可靠 、切实可行的应急方案。为 xxx 客户的存储管理软件配置、备份策略审核等提供技术支持服务。帮助 xxx 客户对存储系统进行性能分析:磁盘读写性能、数据存储备份安全性、I/O 性能、解决数据存储性能故障、提高存储系统性能、提升 xxx 客户 IT 系统
18、整体性能 。根据 xxx 客户信息系统发展需求,规划新的存储备份系统、 容灾系统等 ,解决用户IT 数据安全 、高速增长需要 。为 xxx 客户提供存储信息生命周期整体规划,保障用户数据的生命力。主机存储系统基本服务内容:13 序号服务模块内容描述提供方1 现场备件安装配合用户进行。 按备件到达现场时间工程师到达现场金隆伟业2 补丁服务消除软件漏洞给系统带来的安全隐患,并对安装补丁所引起的系统连锁反应进行合理的平衡。设备厂商3 升级服务对系统进行软件或硬件的升级, 以改进 、 完善现有系统或消除现有系统的漏洞。设备厂商4 现场故障诊断按服务级别 : 7 24 小时金隆伟业5 电话远程技术支持7
19、 24 小时金隆伟业6 问题管理系统对遇到的问题进行汇总和发布设备厂商7 系统优化对客户系统的括主机、 存储设备 、 操作系统 、提供优化服务 。金隆伟业(五)虚拟化平台运维主要的内容如下:系统服务备注服务覆盖范围Fusion Sphere软件系统基本维护Fusion Sphere系统调优 、升级 、数据迁移虚拟机操作系统的病毒防护、调优与基本维护不包含杀毒软件费用服务器 、存储阵列硬件维护不包含配件更换产生的费用服务器 、存储阵列软件维护包含服务器及存储阵列的软件升级、配置 、 调试 、优化等14 网络系统维护包括网络的规划、调优 、配置等 ,不包含配件更换产生的费用。硬件微码升级服务响应电
20、话覆盖时间724 小时电话响应时间10 分钟到达客户现场时间2 小时内重要时刻到达客户现场的紧急时间系统崩溃 、业务停机等严重故障时问题诊断时间30 分钟问题解决时间1-8 小时服务报告提交服务结束次日定期巡检与预防性维护系统定期巡检维护2 次/ 月健康性检查2 次/ 月专家巡检1 次/ 月系统及应用备份免费提供Fusion Sphere备份软件及安装部署系统软件恢复系统检查及服务报告远程诊断系统分析根据客户要求确定是否开启远程服务远程故障解决根据客户要求确定是否开启远程服务远程系统性能监控根据客户要求确定是否开启远程服务15 (六)数据库系统运维1、Oracle 数据库维保服务健康巡检 :提
21、供每季度一次的健康巡检,包括 :系统和数据库的可用性、完整性的检查 ;系统 、数据库和应用性能的检查;系统的结构 、恢复步骤 、安装 、安全扫描等相关问题的检查;对系统错误日志检查与分析,根据操作系统及Oracle 的报错信息 ,发现系统潜在问题 ,尽早采取措施 ,排除故障隐患和安全漏洞。要求巡检后提交完整的检查报告和相关的改进建议报告 。备份恢复 :根据采购人数据库系统实际情况,规划实施符合采购人工作要求的完善的备份恢复方案,以确保采购人数据库系统的安全可靠运行。在进行数据库备份恢复的规划实施过程中,服务方技术人员应对采购人的技术人员进行现场培训,确保采购人的技术人员可以独立完成相关备份工作
22、 ;在数据库出现故障时,服务方应尽快安排技术人员到采购人现场 ,恢复客户系统 ,减少采购人停机时间 。故障处理 :在数据库出现故障 ,导致数据库不能正常工作时,服务方安排技术人员2 小时内到现场解决问题并保证问题完全解决。如果不能解决问题 ,服务方需自行请专家或其他高级技术人员对采购人系统情况进行分析 ,直至解决问题 。远程技术支持 :服务方在接到采购人通知后的30 分钟内响应 ,确认相关情况,进行电话 、拨号等技术支持 ,如需现场协调现场进行处理。性能调优 :根据客户的需求和操作系统数据库系统的实际情况,定期分16 析用户的应用类型和用户行为、评价客户数据库的参数设置、数据分布、硬件和系统资
23、源的使用情况等,并提出相关调整建议,必要时可以随时在规定的时间内派技术专家到达客户现场,处理客户系统性能问题,确保客户系统的高效运转 。紧急故障处理 :因硬件、软件或人为操作等各种不同原因,引起的采购人数据库系统完全不能正常工作、严重影响业务系统正常运作的故障时。能提够全年7 24 小时(365*7*24 )技术支持 ,在接到采购人请求后,0.5 小时内安排技术人员给采购人技术人员回电,并在 1 小时内向用户提供处理方法 。如果远程不能处理的紧急故障,服务方技术人员应在3 小时内赶赴客户现场 ,搜集各种故障信息 ,诊断故障发生的原因 ,在 4小时之内排除故障 。需求响应 :当客户有主机及数据库
24、部署、调整 、优化等需求时 ,及时响应客户需求 ,给出客户最佳解决方案 ,经客户认可同意后 ,实施方案2、Oracle 透明网关服务异构模式下实现 Oracle 数据库与 SQL Server 数据库联通 ,在 SQL Server 数据库下可以正常查询Oracle 数据库数据17 (七)全院网络交换设备运维 (全包备件 )网络巡检服务在维护服务期间,与主机和存储紧密配合,每个月一次 现场巡检服务。网络环境与设备物理状况巡检1) 环境检查巡检UPS 电源 、地线 、 空调 、散热 、物理安全性2) 物理状况巡检包括 :设备机体 、外观 、 及风扇 、风道及过滤器、状态指示灯 、电源 、VIP
25、模块 、广域网端口、 局域网端口等。硬件部分巡检检查? 设备连接状况检查;? 设备物理安全 (电源冗余 、机房环境 、线缆 );? 设备本身冗余性检查,包括引擎的冗余、电源的冗余 ;? 设备系统及板卡指示灯状态检查分析;? 端口描述 ,端口安全性 ,不使用的端口建议关闭,端口性能检查 ;? 电源稳定性和线路检查;? 设备有关的软件 、硬件和 BUG 信息收集 ;? 系统运行状态、性能检查和优化,包括CPU 利用率 、 Mem使用率 、 Buffer分配 、Crash 分析 ;? 设备扩容服务检查分析与支持;? 设备物理检查 (包括机体 、风扇 、风道及过滤器等)与清洁 ;18 ? 检查如发现损
26、坏的或有隐患的部件将及时更换;? 系统硬件运行情况综合分析。软件部分巡检检查? 网 络架构标准化、 可扩展性 、可用性 、 可靠性 、 高性能性 、 安全性及可管理性等检查;? 系统的使用管理支持及相关升级服务;? 检查系统日志分析报告(show Log) 以及其他的记录文件;? 安全性配置分析 ;? 管理性配置分析 :设备上 SNMP 、LOGGING 设置 ,NTP 配置 ;? 网络层 :路由分发配置、静态路由配置;? 网络系统通讯状态检查;? 路由协议学习管理、 质量服务 (QOS);? 检查网络流量 、通讯流量控制、网络访问安全 、通讯数据类型的转发、VLAN 划分等 。? 当前系统配
27、置采集及系统更改信息归档;? 将发现有隐患的系统问题及时排除;? 重要事件现场支持服务(例如割接 、设备搬迁 、 现网测试 、组网方案等 );? 结合系统软硬件的系统运行状况,进行网络整体拓扑结构化分析。网络设备维护服务在系统维护期间, 根据中心网络设备的情况与需求,与小型机紧密结合,提供 7*24 小时技术维护服务 ,服务内容如下:? 7*24 小时远程或现场故障诊断和排除服务;19 ? 系统在线连接信息咨询服务;? 系统微码的使用管理支持服务;? 软件补丁升级服务(操作系统 );? 配置文档备份与恢复服务;? 7*24 热线服务 ;? 重要事件现场支持服务(例如割接 、设备搬迁 、 现网测
28、试 、组网方案等 );? 定期的预防性维护;? 现场备件更换服务;? 技术培训服务 ;? 协助网络结构优化方案设计服务;? 协助网络安全设计及优化系统服务;? 配合中心网络地址空间规划与优化设计服务;? 配合网络系统性能优化设计服务等。20 六、维护报价名称内容服务级别数量报价1. 若不给自己设限,则人生中就没有限制你发挥的藩篱。2. 若不是心宽似海,哪有人生风平浪静。在纷杂的尘世里,为自己留下一片纯静的心灵空间,不管是潮起潮落,也不管是阴晴圆缺,你都可以免去浮躁,义无反顾,勇往直前,轻松自如地走好人生路上的每一步3. 花一些时间,总会看清一些事。用一些事情,总会看清一些人。有时候觉得自己像个神经病。既纠结了自己,又打扰了别人。努力过后,才知道许多事情,坚持坚持,就过来了。4. 岁月是无情的,假如你丢给它的是一片空白,它还给你的也是一片空白。岁月是有情的,假如你奉献给她的是一些色彩,它奉献给你的也是一些色彩。你必须努力,当有一天蓦然回首时,你的回忆里才会多一些色彩斑斓,少一些苍白无力。只有你自己才能把岁月描画成一幅难以忘怀的人生画卷。