newstartha日常日志解读使用说明

上传人:第*** 文档编号:31080309 上传时间:2018-02-04 格式:DOC 页数:5 大小:76.50KB
返回 下载 相关 举报
newstartha日常日志解读使用说明_第1页
第1页 / 共5页
newstartha日常日志解读使用说明_第2页
第2页 / 共5页
newstartha日常日志解读使用说明_第3页
第3页 / 共5页
newstartha日常日志解读使用说明_第4页
第4页 / 共5页
newstartha日常日志解读使用说明_第5页
第5页 / 共5页
亲,该文档总共5页,全部预览完了,如果喜欢就下载吧!
资源描述

《newstartha日常日志解读使用说明》由会员分享,可在线阅读,更多相关《newstartha日常日志解读使用说明(5页珍藏版)》请在金锄头文库上搜索。

1、NewStartHA 日志解读使用说明定义日志级别:错误,警告,信息,调试。软件版本号 2.1c2970x 系列, NewStartHA 的进程包括newstartha、grm、nrmd、ccm、linkfail 以及脚本 IPaddr、Filesystem 等。日志案例解读1、 HA 刚启动的信息newstartha14165: 2010/09/22_02:38:06 info: Version 2.1c2970b版本号 2.1c2970b2、 HA 退出的信息newstartha14165: 2010/09/22_02:40:14 info: hb_initiate_shutdown()

2、called. #HA 开始退出newstartha14165: 2010/09/22_02:40:17 info: NewStartHA shutdown complete. #HA 退出完成3、 启动服务成功的例子nrmd14185: 2010/09/22_02:38:54 info: start service vmsvr.开始启动服务,服务名称叫 vmsvrnrmd14185: 2010/09/22_02:38:54 info: start resource vmsvr_ip_0开始启动服务的一个资源,资源名称叫 vmsvr_ip_0,从名称看应该是浮动 IP 资源nrmd14185:

3、 2010/09/22_02:41:04 info: service name: vmsvrnrmd14185: 2010/09/22_02:41:04 info: service status: running显示服务 vmsvr 的状态为运行,停止状态日志如下:nrmd14185: 2010/09/22_16:23:51 info: service status: stopped4、 启动服务失败的例子grm17753: 2010/12/17_14:40:41 info: service fake begin starting on node e133 # grm 通知 nrmd 开始在节

4、点 e133 启动服务 fakenrmd17752: 2010/12/17_14:40:41 info: start service fake.nrmd17752: 2010/12/17_14:40:41 info: start resource fake_ip_0nrmd17752: 2010/12/17_14:40:44 info: start resource fake_disk_0nrmd17752: 2010/12/17_14:40:44 info: start resource fake_disk_1nrmd17752: 2010/12/17_14:40:44 info: star

5、t resource fake_mount_0nrmd17752: 2010/12/17_14:40:44 info: start resource fake_mount_1nrmd17752: 2010/12/17_14:40:45 info: start resource fake_app_0nrmd17752: 2010/12/17_14:40:45 info: start resource fake_app_1nrmd17752: 2010/12/17_14:40:45 info: service fakes resource post-start check will be star

6、ted. #至此,启动服务步骤结束,下面进行启动后服务状态检查,如果服务状态正常就报告启动成功,否则一直检查到超时。nrmd17752: 2010/12/17_14:40:47 debug: check_srv_hook: checking service fake.nrmd17752: 2010/12/17_14:40:47 debug: resource post-start check, fake_ip_0 is running.nrmd17752: 2010/12/17_14:40:47 debug: resource post-start check, fake_disk_0 is

7、running.nrmd17752: 2010/12/17_14:40:47 debug: resource post-start check, fake_disk_1 is running.nrmd17752: 2010/12/17_14:40:48 debug: resource post-start check, fake_mount_0 is running.nrmd17752: 2010/12/17_14:40:48 debug: resource post-start check, fake_mount_1 is running.nrmd17752: 2010/12/17_14:4

8、0:48 debug: resource post-start check, fake_app_0 is NOT running. #有一个资源运行不正常nrmd17752: 2010/12/17_14:40:49 debug: resource post-start check, fake_app_1 is running.nrmd17752: 2010/12/17_14:41:43 ERROR: start service fake failed, stop it#只要有一个资源运行不正常,就认为启动服务失败,但是属于此服务的其他多个资源都启动了,所以需要把这些已经启动的资源全部停止。于是

9、开始停止服务:nrmd17752: 2010/12/17_14:41:43 info: stop service fake.nrmd17752: 2010/12/17_14:41:49 info: service name: fakenrmd17752: 2010/12/17_14:41:49 info: service status: stoppednrmd17752: 2010/12/17_14:41:49 debug: start service result: 2nrmd17752: 2010/12/17_14:41:49 debug: failed resource: 2#停止服务成

10、功,服务状态在节点 e133 显示为 stopped:str(A)。根据用户反馈,此问题出现较多,往往是脚本有问题,比如脚本中未加入必需的环境变量,调试方法:先用 cli 命令 check-script 检查脚本,确保各项都 pass。同时保证此服务的 starttimeout 值在 30s 或者以上。5、 检测应用失败导致服务停止的例子nrmd12349: 2010/12/16_16:25:03 debug: check_srv_hook: checking service fake22. nrmd12349: 2010/12/16_16:25:04 info: check resource

11、 fake22_app_0 status.stopped #应用资源停止了nrmd12349: 2010/12/16_16:25:04 debug: opsrv_temp-operateresult = 3, opsrv_temp-serverstatus = 1nrmd12349: 2010/12/16_16:25:04 ERROR: service fake22 is abnormal, stop itnrmd12349: 2010/12/16_16:25:04 info: stop service fake22. #开始停止服务服务状态在相应节点显示为 stopped:stu(A)。检测

12、浮动 IP 失败导致服务倒换,服务状态显示为 stopped:stu(I),检测挂载点失败导致服务倒换,服务状态显示为 stopped:stu(M),检测磁阵失败导致服务倒换,服务状态显示为 stopped:stu(S),它们的日志与以上类似,不再冗述。6、 启动挂载点资源失败的例子:挂载设备/dev/sdf1 到/mailstore/mp 失败nrmd14185: 2010/09/22_02:39:04 info: start resource vmsvr_mount_0nrmd14185: 2010/09/22_02:39:04 debug: start_resource:/etc/ha.

13、d/resource.d/Filesystem /dev/sdf1 /mailstore/mp ext3 rw root root 755 start #具体执行的挂载命令mount: /dev/sdf1 already mounted or /mailstore/mp busyFilesystem14437:2010/09/22_02:39:04 ERROR: Couldnt mount filesystem /dev/sdf1 on /mailstore/mp Filesystem14373:2010/09/22_02:39:04 ERROR: Filesystem Generic err

14、ornrmd14185: 2010/09/22_02:39:54 debug: check_srv_hook: checking service vmsvr. #检测服务 vmsvr 的状态,逐个检测此服务包含的资源的状态nrmd14185: 2010/09/22_02:39:54 info: resource post-start check, vmsvr_ip_0 is running. #资源 vmsvr_ip_0 处于运行状态nrmd14185: 2010/09/22_02:39:55 info: resource post-start check, vmsvr_mount_0 is

15、NOT running. #资源 vmsvr_mount_0 处于非运行状态nrmd14185: 2010/09/22_02:39:55 info: stop service vmsvr. #停止服务vmsvr 7、 检测到工作链路部分故障linkfail12027: 2010/09/15_10:48:03 WARN: interface eth2 status change: ACTIVE to INACTIVE linkfail12027: 2010/09/15_10:48:03 ERROR: Some Bonding Slave interfaces is BROKEN, CHECKIT

16、 !linkfail 检测到 eth2 变成 INACTIVE 状态,但是 bonding 的另外一个网卡可用。8、 工作链路断开导致服务停止的例子grm1114: 2010/09/13_13:05:11 info: node YNHT-GW1 worklink bond1 status update to INACTIVE # YNHT-GW1 工作链路断开 bond1 断开grm1114: 2010/09/13_13:05:11 info: service SYBASE select running on node YNHT-GW2 # 服务 sybase 在 YNHT-GW2 启动grm1114: 2010/09/13_13:05:11 info: node YNHT-GW2 worklink bond1

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 解决方案

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号