《存储维护服务方案》由会员分享,可在线阅读,更多相关《存储维护服务方案(14页珍藏版)》请在金锄头文库上搜索。
1、存储维护服务方案1.1项目背景我关运行重要业务的存储设备CX系列四台,一直以来都直接购买 原厂商的硬件支持服务,但服务期的截止时间均不同,每年出现多次报 告申请的情况,工作效率较低,重复工作较多,如2009年9月份我科 通过HB方式申请一台CX500存储设备的保修,至今尚因其原厂商合 同不能满足我关的要求而无法签订,这期间一旦设备出现故障测维修的 时效性无法得到保障,必将严重影响我关的正常业务运作。另外原厂商提供的服务所需费用相对较多,一台CX500第五至第 六年两年关键部件保修就需要87000元,而且随着时间越久,价格也 越高。并且原厂商在保修过程中仅提供相应的关键备件,未能定期对存 储设备
2、进行安全检测和性能分析,这对于像黄埔海关业务处理量较大的 技术维护工作是远远不够的。1.2维护服务目的能够最大限度的节省和保护海关用户在硬件设备和软件设备上的投 资,高效快速的解决客户遇到的各种问题,为客户排忧解难。保证客户 系统的连续,稳定,高效运行。1.3维护范围和期限设备维保服务清单序 号厂 商型号数量原厂免费更换硬件保 修截至日期用途1DELLCX700 (编号 7HZWK61)12011-12-31风险管理平台2.0. 3.0.三期等2DELLCX500 (编号 4821291)12011-12-31运行网预订、统计3EMCCX320 (编号CK200070200149)12011-
3、7-11HB2004数据4DELLCX340 (编号 820MZB1)12012-1-25原有虚拟机、物流平台1.4维护期限维护期限均为2012年1月1日至2013年12月31Bo1.5维护服务内容提供原厂维保承诺函,即在维保期间,提供相当于原厂全天候7*24*4小时的现场技术支持服务,该服务已经包含续保期内所有配件 及服务费用,享有相当于原厂所规定的保内机器一切维修权益。并提供以 下技术增值服务如下:提供7x24小时的呼叫响应服务:在接到报障电话后立即响应,并 即刻安排值班工程师回应,并与用户确定维护方式;同时对所有的问题 按时逐级通知和汇报。本服务的次数不限。提供7x24小时的技术支持:工
4、程师根据对问题的判断,远程向用 户提供诊断、性能测试的手段。远程解决不了的问题将提供现场服务。本服务的次数不限。提供7x24X4小时的现场技术支持服务:若黄埔海关维保范围内存 储系统确定出现故障,原厂工程师在接到服务请求后立即响应,4小时 内携带配件抵达现场,24小时内解决保修范围内的所有问题,一旦预 计在规定时间内无法解决保修范围内的问题,承诺在48小时内提供相 应的备用设备,保证用户基本的使用需求。备件更换服务承诺:合同期间,将对黄埔海关已经确认出现故障的 设备坏件,提供原厂免费备件更换服务,用户无需承担任何额外费用。 巡检服务:每年进行四次预防性健康检查,包括硬件设备的检查、 清尘、调整
5、和坏件更换,运行环境、硬件配置的检查,以及对系统日志 的检查与分析,根据系统的报错信息,发现系统潜在问题,尽早采取措 施,排除故障隐患和安全漏洞。并且提供性能测试和调优服务,提交性 能测试报告及系统性能扩充和使用建议,以便保证系统性能不断改进并 运行在最佳状态并提供相应的书面报告。维护后提交完整的报告。1. 6系统规划与调整服务客户在其设备系统发生较大变化时包括:RAID groups ; LUN ; storage groups变更,为其提供技术支持服务;存储连接的主机的数量以及平台发生变化时,提供技术支持服 务;在多链路冗余环境中的软件支持服务;提供与主机系统的集成与调试服务。1. 7预防
6、性巡检维护服务定期对系统进行检查,发现并排除硬件和软件系统错误隐患,保证 设备正常稳定运行。1.7.1巡检内容检查设备运行状态,设备物理及环境状态,更换有故障的部件;检查系统日志文件、系统错误记录、以及系统资源使用率等, 分析系统存在的隐患;根据系统检查及分析结果,提出解决方案和措施,并对对系统 的参数进行调整;对设备进行清洁等例行工作;检查系统运行工作环境,并给予用户改进建议;在保障系统正常运行的基础上,提出对系统资源分配的合理优 化建议;1.7.2巡检周期与方式1.巡检周期:定期巡检:每年至少巡检维护卫次;不定期巡检:重大项目和时段、系统改造等重要操作日期前,增加对系统现场巡检支持服务。定
7、期走访:工程师定期走访,解答使用方技术疑难。注:具体项目的巡检周期可根据贵方的具体情况协商确定。2.巡检方式现场巡检:一般采取现场巡检方式,也就是工程师定期到客户现场对保修设备的硬件及系统软件进行预防性的检查维护。远程巡检:为增加巡检频度,由客户系统管理员按照我司制定 的巡检脚本和巡检步骤进行现场巡检,而工程师根据客户的巡检结 果进行分析,并做出巡检报告发给客户。1.7.3巡检流程知乙二谢込火込论I1.7.4巡检流程说明 1.巡检准备工程师提前一个工作日与客户确认巡检时间以及相关的服务 要求。工程师确认巡检设备的机型、序列号及服务内容,并根据技 术服务准备检查表的规定,逐项进行检查。2. 执行
8、巡检工程师按照设备巡检表要求的检查项目,对巡检设备逐一 进行检查,同时填写设备巡检表或数据库巡检表并由客 户签字确认。3. 问题处理针对巡检发现的故障或问题,工程师通过系统参数调整或更 换问题部件,及时给予排除,同时填写故障处理记录单” 并由客户签字确认。对于复杂疑难的故障或问题,工程师自己无法排除的,应及 时将故障或问题提交技术专家组诊断并处理。4. 巡检确认工程师检查所有保修设备配置与保修合同是否一致,对不同 的进行修改,同时填写”保修设备配置清单”并由客户签字 确认。工程师需了解每台保修设备所运行的应用、系统软件,以及 哪些是不允许业务中断的关键设备、哪些设备是单机运行、哪些设备存在单点
9、故障,哪些系统软件需要升级、哪些HA不能正常切换等,并填写首次巡检报告单”。对于巡检发现部件损坏的,工程师需经销售人员与客户确认 后进行更换,原则上若该故障发生在保修合同生效前,更换 部件所需的费用由客户承担。1. 8故障响应与修复承诺1.8.1故障级别走义服务级别:故障级别故障定义故障描述一级故障指设备在运行中出现系统瘫痪或服 务中断,导致设备的基本功能不能实 现或全面退化的故障,造成业务中断1 小时以上或导致关键业务数据丢失的 故障。业务中断1小时以上;业务数据丢失二级故障指设备在运行中出现的直接影响服 务,导致系统性能或服务部分退化的 故障;设备在运行中出现的故障具有 潜在的系统瘫痪或服
10、务中断的危险, 并可能导致设备的基本功能不能实现 或全面退化,如冗余设备单侧故障等; 系统设备或操作系统故障,造成业务 中断但不满1小时的,如系统复位等。冗余设备单侧故障三级故障指设备在运行中出现的,影响系统功 能和性能,但关键业务不受影响的故 障,如磁带机故障。业务不受故障影响四级故障产品功能、安装或配置方面需要信息或支持,对业务运作无影响。对业务运作无影响1.8.2服务响应与故障恢复时间服务响应分类:牛Hour Response 24x7指从周一到周日田可时间段内,工程师在接到服务请求后4小时内携带原厂备件到达客户现场;响应时间规定:故障级别电话响应时间现场响应时间故障解决时间备件到场时间
11、-级7*24*15min7*24*4h24小时4小时二级7*24*15min7*24*8h32小时12小时三级7*24*30min-四级7*24*30min-1.8.3流程说明1. 故障报告工程师接到故障报告后,记录故障及问题相关的信息。2、故障诊断工程师根据故障及问题状况进行诊断,并相应采取电话指导、或 现场服务、或专家支持、或整机替换进行处理。3. 电话指导对异地能够解决的软件故障,或能够使系统恢复正常运行的,工 程师可通过电话指导客户进行处理,同时填写”故障处理记录单”。4、现场服务对于电话指导不能解决的故障及问题,工程师应及时赶到客户现 场进行故障排除,同时填写故障处理记录单并由客户签
12、字确认。5. 专家支持对于复杂疑难故障及问题,工程师自己无法排除的,应及时 将故障及问题提交技术专家组诊断并处理;技术专家电话指导工程师或赶到客户现场进行故障排除,并 填写”技术支持记录单。6、部件替换对属于关键性故障,且不能使系统恢复正常运行的,工程师应为 客户提供备件”并做好故障部件的替换。1.8.4未解决故障或问题的承诺如果公司无能力维修的故障,或未能在承诺时间内恢复生产业务运 行,经双方协商,使用方有权请第三方权威机构和设备原厂商专家进行 解决处理,由此所产生的费用由公司承担。供货渠道服务产品相应的酉己件,均由EMC、DELL等原厂商提供。1. 9移机服务移机服务是指在规定的时间内,安
13、全、可靠地将客户保修设备从原 放置地点迁移至新放置地点。将提供专业的移机服务,并提交详细的移 机方案,说明人员安排、移机步骤、双方责任、风险防患等,并进行实 施。移机服务的主要内容如下:负责检查搬迁前设备的状况,并向客户提供设备状况报告;负责设备的拆卸、安装、调试,并保证主机操作系统在迁移后恢 复为迁移前的状态;在拆卸、安装过程中,如因工程师操作不当而造成部件的损坏, 由工程师免费进行备件更换;设备拆卸后,客户负责从迁移地到目的地的设备搬动、运输,并 确保运输的安全,如果在此期间发生设备的损坏,由客户负责, 由此产生的费用由客户承当;对于客户在设备搬动、运输过程中,我司工程师将提供技术指导,
14、并在设备到达目的地时检查设备的状况,告知客户;搬迁后不影响原来的任何保修条款,所有设备的保修服务仍然有 效。1. 10备件系统保障必须在广州市或深圳市存在备件库,具备此次保修服务承诺的相应 存储关键备件。工程师完成首次巡检后,或客户保修设备配置发生变化后,应填写保 修设备配置清单”和”首次巡检报告单”,作为我司为该客户准备备机备件 的依据。工程师完成每次的例行巡检、或故障(问题)处理、或技术支持后, 应相应填写设备(数据库)巡检表”、故障处理记录单”和技术支 持记录单”,并由客户签字确认。工程师在年度巡检结束后一周内,应向客户提供年度维护总结报 告”,详细陈述年度系统运行情况、服务统计、备件使
15、用总结、相关建 议等。1.11现场技术培训与交流在系统维护期间,根据管理员的需求提供现场技术交流与培训, 提高系统管理人员在存储系统维护操作方面的工作能力和技术素养及 日常常见故障的处理方法和经验。主要包括:进行系统登录熟悉设备的启动和关机 了解服务产品特性和运行机制掌握服务产品的日常使用、维护管理和配置方法掌握每个相关设备控制面板显示灯的意义执行系统故障期的应急处理程序、进行一线诊断和应采取的适 当措施;对每次的故障进行总结交流,提高故障的处理能力;对其它典型案例进行抛析,增加解决问题的经验。在维保期间,我们为保修设备建立服务档案。1.12文挡构成必须建立起一套与技术服务流程相对应的技术服务表单,从而构成一套科学、规范的服务文挡,主要文档包括如下:保修设备配置清