《数据库运维作业指导书》由会员分享,可在线阅读,更多相关《数据库运维作业指导书(42页珍藏版)》请在金锄头文库上搜索。
1、.数据库运维作业指导书.前 言为进一步加强数据库运维管理,规范数据库运维管理作业过程,统一数据库管理策略,强化数据库标准化管理,保障应用系统的稳定运行及服务的持续性,减少故障停机时间,特制订本作业指导书本作业指导书由*提出。本作业指导书由*管理。本作业指导书由*负责解释。本作业指导书主要起草单位: * 本作业指导书主要起草人:*目 次 *数据库运维作业指导书11 总则12 适用范围13 规范性引用文件14 支持文件15 术语与定义16 安全及预控措施26.1 关闭数据库服务26.2 巡检26.3数据备份26.4 数据恢复26.5 数据库安全加固26.6 删除数据库用户账号26.7 定期维护36
2、.8 数据文件或日志文件的存放空间扩容37 作业准备38 作业周期39 工期定额410 作业流程510.1启动系统510.2停止系统610.3数据备份有效性检查指导710.4数据恢复810.5日常巡检910.6深度巡检1010.7周定期维护1110.8月定期运维1210.9其他定期维护1310.10安全基线配置1711 作业项目1811.1 Oracle数据库1811.2 SQL SERVER数据库2511.3 MY SQL2912 作业中异常现象及主要对策3312.1 ORACLE数据库3312.2 SQL SERVER数据库3512.3 MY SQL数据库3613 附录36*数据库运维作业
3、指导书1 总则为进一步加强数据库运维管理,规范数据库运维管理作业过程,统一数据库管理策略,强化数据库标准化管理,保障应用系统的稳定运行及服务的持续性,减少故障停机时间,特制订本作业指导书2 适用范围本作业指导书适用于*数据库管理系统(DBMS)运行管理及维护,指导对象包括*公司、*公司的数据库管理员。3 规范性引用文件-(*-2014)-(*-2014)-(*-2014)-(*-2014)-(*-2014)4 支持文件附件 SQL SERVER日常运维作业支持文件.docx*数据库运维作业系统环境表(含地址、用户名、密码)5 术语与定义5.1 数据库管理系统(DBMS)数据库管理系统(Data
4、base Management System)是一种操纵和管理数据库的大型软件,用于建立、使用和维护数据库。它对数据库进行统一的管理和控制,以保证数据库的安全性和完整性。用户通过DBMS访问数据库中的数据,数据库管理员也通过dbms进行数据库的维护工作。5.2 统计信息统计信息是一个数据库及数据库对象的详细集合,这些统计信息被用于优化器的使用,让其为每条SQL语句选择最佳的执行计划。5.3 热备份指在数据库正常运行情况下执行备份的备份方式。6 安全及预控措施6.1 关闭数据库服务6.1.1风险分析:没有严格按照流程关闭数据库服务,可能造成关闭耗时过长、数据丢失,甚至无法再次启动数据库。6.1.
5、2安全措施:严格按照流程执行数据库服务关闭操作。6.2 巡检6.2.1风险分析:某些巡检脚本可能会批量收集数据,执行时影响数据库性能。6.2.2安全措施:筛选出这样的巡检脚本,避免在业务高峰期执行批量数据收集。6.3数据备份6.3.1风险分析:执行数据备份时会降低数据库性能;同时也会占用大量存储空间,可能造成磁盘空间满导致备份失败。6.3.2安全措施:为系统制定针对性的数据备份策略,测试相应备份脚本,定期检查备份情况,做好备份恢复演练。6.4 数据恢复6.4.1风险分析:执行错误的数据恢复流程,造成数据恢复失败,数据损坏。6.4.2安全措施:针对不同的恢复场景制定正确的恢复流程,定期进行恢复演
6、练。6.5 数据库安全加固6.5.1风险分析:若数据库升级补丁失败,可能造成数据库服务无法正常启动。6.5.2安全措施:变更操作前按正确的步骤停止数据库服务,备份数据库数据及安装目录。6.6 删除数据库用户账号6.6.1风险分析:数据库管理员误删除用户账号导致某些业务操作无法执行,或导致数据丢失。6.6.2安全措施:当用户账户需要删除时,使用锁定账号方式实现拒绝用户访问效果,当发现该用户账户需使用时可快速恢复6.7 定期维护6.7.1风险分析:在业务高峰期执行一些消耗数据库性能的维护操作,导致数据库处理能力急剧下降,甚至造成数据库挂起。如碎片整理、统计信息收集等.6.7.2安全措施:避免在非业
7、务高峰期执行定期维护操作,合理设置执行时间。6.8 数据文件或日志文件的存放空间扩容6.8.1风险分析:(1)由于添加或扩展数据文件,导致磁盘空间使用率过高(接近100%),将会引起数据库服务不可用;(2)日志文件未能及时清理,累计到一定数量会导致磁盘空间满,从而导致数据库服务不可用。6.8.2安全措施:定期检查数据文件和日志文件存放的磁盘空间,避免由于磁盘空间满导致数据库服务异常。7 作业准备*数据库管理系统定期维护需要做好以下准备工作:序号名称数量备注1作业通知发布1作业包括计划或非计划2变更申请13远程运维审计系统(HAC)帐号14数据库服务器操作系统管理员帐号1每一台服务器对应1个账号
8、5数据库管理员账号1每一套数据库对应1个账号6笔记本电脑17安全扫描工具18人员要求23年运维工作经验以上8 作业周期序号名称作业周期备注1启动无固定周期2停止无固定周期3数据备份及有效性检查1按需进行4数据恢复1按需进行5日常巡检每工作日1次仅对大集中模式关键应用系统6深度巡检每周1次仅对大集中模式关键应用系统7周定期维护每周一次8月定期维护每月一次9其他定期维护按需进行根据不同应用系统的需要定制作业周期。10安全基线配置按需进行9 工期定额序号工作项定额时间备注1启动3小时2停止2小时3数据备份及有效性检查3小时4数据恢复1天5日常巡检1小时6深度巡检3小时7周定期维护2小时8月定期运维3
9、小时9其他定期维护3小时10安全基线配置1-24小时根据安全加固项来决定时长10 作业流程10.1启动系统(Q/*-L1).10.2停止系统(Q/*-L2)10.3数据备份有效性检查指导(Q/*-L3)10.4数据恢复(Q/*-L4)10.5日常巡检(Q/*-L5)10.6深度巡检(Q/*-L6)10.7周定期维护(Q/*-L7)10.8月定期运维(Q/*-L8)10.9其他定期维护(Q/*-L9)10.10安全基线配置(Q/*-L10).11 作业项目11.1 Oracle数据库序号工作内容工作内容及方法注意事项1单台服务器的数据库启动1. 启动操作系统2. 启动数据库监听程序AIX或lin
10、ux操作系统:#su - oracle$lsnrctl startWindows操作系统:使用cmd命令进入控制台输入lsnrctl start并回车3.启动数据库AIX或linux操作系统:$sqlplus / as sysdbaSQLstartupWindows操作系统:C: sqlplus / as sysdbaSQLstartup4. 检查实例状态SQLselect * from gv$instance;若正常启动,下列字段结果为:INST_ID 字段显示所有实例IDSTATUS字段的值等于OPENLOGINS字段的值等于ALLOWEDDATABASE_STATUS字段的值等于ACTI
11、VEACTIVE_STATE字段的值等于NORMAL2单台服务器的数据库停止1. 登录数据库实例并检查实例状态AIX或linux操作系统:#su - oracle$sqlplus / as sysdbaSQLselect * from gv$instance;Windows操作系统:C: sqlplus / as sysdbaSQLselect * from gv$instance;2. 停止监听SQLlsnrctl stop3.关闭数据库实例SQLshutdown immediate3数据库集群启动1. 启动操作系统略2. 启动数据库集群软件AIX或linux操作系统:#su - oracl
12、e(适用oracle10g)#su - grid (适用oracle 11g)$crsctl start crsWindows操作系统:C: crsctl start crs3. 启动数据库实例AIX或linux操作系统:#su - oracle (适用oracle10g)#su - grid (适用oracle10g $sqlplus / as sysdbaSQLstartupWindows操作系统:C: sqlplus / as sysdbaSQLstartup 4. 检查实例状态SQLselect * from gv$instance;若正常启动,下列字段结果为:INST_ID 字段显示所有实例IDSTATUS字段的值等于OPENLOGINS字段的值等于ALLOWEDDATABASE_STATUS字段的值等于ACTIVEACT