运维制度及流程

上传人:壹****1 文档编号:564783270 上传时间:2024-02-04 格式:DOCX 页数:7 大小:13.65KB
返回 下载 相关 举报
运维制度及流程_第1页
第1页 / 共7页
运维制度及流程_第2页
第2页 / 共7页
运维制度及流程_第3页
第3页 / 共7页
运维制度及流程_第4页
第4页 / 共7页
运维制度及流程_第5页
第5页 / 共7页
点击查看更多>>
资源描述

《运维制度及流程》由会员分享,可在线阅读,更多相关《运维制度及流程(7页珍藏版)》请在金锄头文库上搜索。

1、运维制度及流程【等办公协同服务系统的组建和维护。2.5、运维技术文档资料管理 公司生产服务器(外网)部署架构图、服务器软件安装清单、服务器密 码管理等。三、架构设计工作细则由于研发人员对数据库以及服务器架构方面不是很擅长,需要运维部DBA 和架构师协助进行产品研发初期或产品部署阶段的协助。主要工作要点如 下:3.1、数据库结构设计:数据库的分布式运算架构设计,例如:读写分离; 数据表的分割存储,存储引擎的择优;数据表字段的类型及数值格式择优3.2、服务器架构设计:常见的有服务器网络分布,服务角色合并等等。3.1、运维自动化工具开发:主要采用系统的Shell脚本或Python、C/C+ 语言,开

2、发常用的自动备份、监控警报等工具,减少人力成本,加强维护 监管的精准度。四、运行监控工作细则:4.1、运行监控工作需7_24小时不间断的对所有生产环境中的服务器、 路由器以用服务端软件进行监控。运维监控工作按每天24小时计算,由运维现有工程师每人轮班,假设为ABCDE五名员工,具体排班表见附件运维轮排表4.2、运维工作中监测到异常时需按以下流程来处理:1)记录详细的故障症状及相关输出信息运维部会开发一套运维工作日志系统,用于记录每次故障的详情,以便 日后对故障进行后续跟踪和职责过失判定。2)进行应急处理运维部与研发部双方会不断交涉更新汇总出一份常见故障应急处理方法 的手册,以B/S形式发放至每

3、一位运维工程师。当出现突发故障时,运维 工程师在记录下故障详情后,则按照该手册结合自己的技术经验来进行故 障修复。3)发布紧急维护通知(运营部=技术支持和商务部) 当故障在10分钟内无法恢复时,应属于紧急维护,需要对外发布维护公告。根据公司制度,运维工程师需先上报至运维部负责人(负责人再次判断 10分钟内是否能解决,能解决则直接解决),再由运维部负责人通知运营部 负责人发布通知。为了防止联系不上运维或运营部负责人以及公布发布专人,运营部需有 权用运营部拟定的维护公告模板来发布紧急维护公告,但是由运维部发布 的维护公告,需事后由运维及运营部负责人签字确认原因是有相关负责人 联系不上。4)运维部开

4、始进行后续技术处理直至问题解决 较复杂的故障处理工作在发布紧急维护公告之后,运维部负责人需组织运维工程师进行后续的故障排队工作直至问题解决4.3、运行监控中常出现的故障分为三个类别:硬件故障、软件故障、网 络故障。由于服务器等硬件在外地IDC机房,而网络故障大多出在IDC、ISP 环节,运维不能自行处理,需走对外的行政流程,因此对于运维工作的过失判断主要从软件故障上进行。如果是因产品程序负载能力引起的故障,不属于运维工作失职。因此每次出现故障之后都需要记录详情,以便跟研发人员一起找出故障原因。五、数据维护工作细则数据维护工作主要分为生产环境中的过期数据定时分割到公司内网的本 地数据仓库中进行备

5、份存储,以供后续进行数据挖掘分析。同时还需定时 备份生产环境中的线上数据以便出现意外情况时进行数据恢复。数据维护 工作主要分以下步骤:5.1、每周将线上实时数据按月进行分割备份,例如广告统计、认证上网 统计、访问统计等数据,把30天以前的数据从线上数据库中分割出来保存 到本地数据仓库(根据数据部需要选择性备份)。5.2、每周一03:00对线上数据库进行一次完整备份;5.3、每天03:00对线上数据库进行一次增量备份。(1)备份文件全部保存到机房内部的数据仓库服务器中,数据仓库服务 器使用至少三块硬盘组建RAID-5阵盘阵列,防止有硬盘损坏时出现数据丢 失的情况。(2)为防止数据仓库服务器的磁盘

6、阵列卡出现损坏的意外,数据仓库中 的文件会每三天复制一份到公司内网数据仓库中,做到本地一份和异地双 份的三重备份。5.4、运维同事需每天检查公网数据仓库及公司内网数据仓库备份的数据 是否正常。六、企业信息化建设工作细则企业信息化建设的工作重点在公司内部办公网络的行为管理、办公设备 异常处理。以下详细及规定:6.1、网络行为管理1)工作时间,每个员工的网络带宽最大为上传60KB/S,下行为100KB/S, 以免出现个别员工占用大量网络带宽影响其他员工的工作开展;2)工作时间,禁止访问部份与工作无关的娱乐性,以免影响工作效率;3)对办公网络问题处理以及办公电脑系统异常处理6.2、办公设备维护及资产

7、管理1)公司公用打印机、扫描仪、传真机、复印机等办公设备,统一使用权 限,以免出现滥用办公耗材的情况;2)公司办公电脑严禁自行拆卸或调换配件,如有切实需求,需向公司申 请按行政流程审批通过后,由运维工程师操作;3)公司所有内部办公及对外服务设备,每月进行一次清点检查,防止出 现配件被调换或丢失的情况(服务器需提供使用清单)。七、运维技术文档资料管理工作细则7.1、每月更新一次服务器部署架构图以及服务器配置清单表(e_cel), 存档到公司内网服务器,访问权限:运维部主管以及技术总监可访问。7.2、服务器软件安装清单(其中区分密码,整理后提交至feli_处(有 新增则增量提交至feli_处),根

8、据运维系统工程师等级开启相应操作权限 账户,如:运维经理、主管管理员权限(具体根据形势需要)。1工作前,检查泵体的防护设施是否完好。2 工作中发现设备异常时,应及时倒泵或停泵。机械、电气发生故障时,立即汇报,不得私自处理。3严禁触摸电气开关,擦操作台时要用干抹布。4油泵房和油库严禁烟火,防火设施必须齐全、完好、会用。5不得把水喷溅到电机及操作盘上。6在上、下旋流井及泵坑的梯子时应注意防滑。7经常检查各泵站、油站、空压站、旋流池的照明,保证照明完好;8操作前,要进行如下检查:1)水泵和电机各部位的润滑情况。2)水泵两端的盘根线是否漏水。3)对轮上各螺丝及皮垫是否有松动。4)泵房的管理,连逢头是否

9、畅通,要注意酸性腐蚀。5)接地线、电开关是否松动。6)各种仪表是否在正常位置。9拉隔离开关时,要拉绝缘柄,戴好绝缘手套,站在绝缘板上进行操作。10设备运转过程中,不得擅自离开工作岗位,不准睡觉。11 启动合闸后,当电机不转而发出声音时,应立即拉闸断电,以免烧坏电 机。12清理连逢头时,要站在安全地点,以防落水。13 开泵时要按顺序启动,先将水泵内的空气放干净,将引水注满,看水封 是否起作用,然后开排水阀门,后开电机,以压力表掌握输水高度。14 如水泵转速渐渐增加,而压力表柱不增加,则泵内有空气,必须停止注 水。15 在运转过程中,要注意电压,电流表的指示,电机、水泵的声音是否正 常。如发现故障

10、,必须停止运转,进行检查处理。16设备在正常运转的情况下,电流不得超过电机的额定电流。17浊环水系统因故导致水平衡失调时,应立即通知主操暂停出钢生产18净环水泵因故障或停电时,导致净环断水时,应立即启动事故紧急柴油 泵,并通知加热炉转换紧急事故水。为规范信息系统运行管理工作流程,保证系统及数据的稳定性、完整性 建立日常管理保障体系,特制定本制度。第一条本制度所说的信息系统是指相关业务的所有信息系统,包括应用 软件、操作系统平台及相关的硬件设备第二条本制度所说的数据库指信息系统后台所使用的数据库,包括生产 用数据库及测试用数据库。第三条作为系统管理员必须定期检测硬件设备的状态,认真填写系统 运行

11、日志并存档。对于硬件设备状态不正常的要及时通知上级主管并要 求硬件提供商进行维修或更换。第四条信息系统主机操作系统不允许系统管理员及数据库管理员之外的 人员随意登录。系统管理员要严格控制操作系统用户账号:要定期检查操 作系统访问日志,并将访问信息做记录。系统管理员要定期对操作系统按 备份方案做好备份。第五条系统管理员要定期收集操作系统错误日志。将日志信息、错误原 因、解决办法进行存档。及时修正错误。第六条系统管理员要定期收集操作系统的性能状况。将性能状况信息、 优化方案等资料进行存档。应用优化方案进行性能调整。第七条数据库管理员要定期对数据库运行状态及警告日志进行检查。将 状态信息、错误原因、

12、解决办法进行存档。及时修正错误。第八条数据库管理员要对数据库用户及用户权限进行有效的管理,保障 数据库的访问安全;定期对数据库的访问会话信息进行检查。并将访问会 话信息进行整理存档。第九条数据库管理员要定期按备份制度及备份计划对数据库做好备份。 并保证备份的有效性。第十条数据库管理员要定期收集数据库的性能状况。将性能状况信息、 优化方案等资料进行存档。应用优化方案进行性能调整。第十一条系统管理员要定期检查信息系统应用软件的运行状况及错误日 志。将状态信息、错误原因、解决办法进行存档。及时修正错误。保证系 统的持续、稳定运行。第十二条系统管理员要做到定期对系统应用软件代码进行备份。第十三条要保证业务批处理运行的有效性及稳定性。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文 > 其它学术论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号