linux系统与程序监控工具atop教程

上传人:xzh****18 文档编号:34630394 上传时间:2018-02-26 格式:DOC 页数:8 大小:770KB
返回 下载 相关 举报
linux系统与程序监控工具atop教程_第1页
第1页 / 共8页
linux系统与程序监控工具atop教程_第2页
第2页 / 共8页
linux系统与程序监控工具atop教程_第3页
第3页 / 共8页
linux系统与程序监控工具atop教程_第4页
第4页 / 共8页
linux系统与程序监控工具atop教程_第5页
第5页 / 共8页
点击查看更多>>
资源描述

《linux系统与程序监控工具atop教程》由会员分享,可在线阅读,更多相关《linux系统与程序监控工具atop教程(8页珍藏版)》请在金锄头文库上搜索。

1、Linux 系统与程序监控工具 atop 教程 引言Linux 以其稳定性,越来越多地被用作服务器的操作系统(当然,有人会较真地说一句:Linux 只是操作系统内核:)。但使用了 Linux 作为底层的操作系统,是否我们就能保证我们的服务做到 7*24 地稳定呢?非也,要知道业务功能是由系统上跑的程序实现的,要实现业务功能的稳定性,选择 Linux 只是迈出的第一步,我们更多地工作是不让业务程序成为稳定性的短板。当我们的服务器出现问题的时候,外在的表现是业务功能不能正常提供,内在的原因,从程序的角度看,可能是业务程序的问题(程序自身的 bug),也可能是服务器上人为的误操作(不当地执行脚本或命

2、令);从系统资源的角度看,可能是 CPU 抢占、内存泄漏、磁盘IO 读写异常、网络异常等。出现问题后,面对各种各样可能的原因,我们应如何着手进行分析?我们有什么工具进行问题定位吗?atop 简介本文要介绍的 atop 就是一款用于监控 Linux 系统资源与进程的工具,它以一定的频率记录系统的运行状态,所采集的数据包含系统资源(CPU、内存、磁盘和网络 )使用情况和进程运行情况,并能以日志文件的方式保存在磁盘中,服务器出现问题后,我们可获取相应的atop 日志文件进行分析。 atop 是一款开源软件,我们可以从这里获得其源码和 rpm 安装包。atop 使用方法在安装 atop 之后,我们在命

3、令行下敲入”atop 命令即可看到系统当前的运行情况:系统资源监控字段含义上图中列出了不少字段以及数值,各字段的含义是什么?我们应该怎么看?以上每个字段的含义都是相对采样周期而言的,下面我们先来关注上图显示的上半部分。ATOP 列:该列显示了主机名、信息采样日期和时间点PRC 列:该列显示进程整体运行情况1. sys、usr 字段分别指示进程在内核态和用户态的运行时间 2. #proc 字段指示进程总数 3. #zombie 字段指示僵死进程的数量 4. #exit 字段指示 atop 采样周期期间退出的进程数量 CPU 列:该列显示 CPU 整体( 即多核 CPU 作为一个整体 CPU 资源

4、)的使用情况,我们知道 CPU 可被用于执行进程、处理中断,也可处于空闲状态( 空闲状态分两种,一种是活动进程等待磁盘 IO 导致 CPU 空闲,另一种是完全空闲 )1. sys、usr 字段指示 CPU 被用于处理进程时,进程在内核态、用户态所占 CPU 的时间比例 2. irq 字段指示 CPU 被用于处理中断的时间比例 3. idle 字段指示 CPU 处在完全空闲状态的时间比例 4. wait 字段指示 CPU 处在“进程等待磁盘 IO 导致 CPU 空闲”状态的时间比例 CPU 列各个字段指示值相加结果为 N00%,其中 N 为 cpu 核数。cpu 列:该列显示某一核 cpu 的使

5、用情况,各字段含义可参照 CPU 列,各字段值相加结果为 100%CPL 列:该列显示 CPU 负载情况1. avg1、avg5 和 avg15 字段:过去 1 分钟、5 分钟和 15 分钟内运行队列中的平均进程数量 2. csw 字段指示上下文交换次数 3. intr 字段指示中断发生次数 MEM 列:该列指示内存的使用情况1. tot 字段指示物理内存总量 2. free 字段指示空闲内存的大小 3. cache 字段指示用于页缓存的内存大小 4. buff 字段指示用于文件缓存的内存大小 5. slab 字段指示系统内核占用的内存大小 SWP 列:该列指示交换空间的使用情况1. tot

6、字段指示交换区总量 2. free 字段指示空闲交换空间大小 PAG 列:该列指示虚拟内存分页情况swin、swout 字段:换入和换出内存页数DSK 列:该列指示磁盘使用情况,每一个磁盘设备对应一列,如果有 sdb 设备,那么增多一列 DSK 信息1. sda 字段:磁盘设备标识 2. busy 字段:磁盘忙时比例 3. read、write 字段:读、写请求数量 NET 列:多列 NET 展示了网络状况,包括传输层(TCP 和 UDP)、IP 层以及各活动的网口信息1. XXXi 字段指示各层或活动网口收包数目 2. XXXo 字段指示各层或活动网口发包数目 进程视图为了更全面地展示进程信

7、息,atop 提供了多种进程视图。默认视图(Generic information)进入 atop 信息界面,我们看到的就是进程信息的默认视图(上图下半部分) ,按 g 键可以从其他视图跳到默认视图。从上图中,我们可以看到 PID 为 3061 的 find 进程在退出前在内核模式下占用了 3.43 秒CPU 时间,在用户模式下占用了 0.96 秒 CPU 时间,共使用 CPU 时间为 4.39 秒,相对10 分钟采样周期,CPU 时间占用比例为 1%,ST 列表示进程状态, N 表示该进程是前一个采样周期新生成的进程,E 表示该进程已退出,EXC 列指示进程的退出码。从进程名在“”符号中,我

8、们亦可知该进程已退出。内存视图(Memory consumption)内存视图展示了进程使用内存情况,按 m 键可进入内存视图。上图下半部分展示了每个进程占用的虚拟内存空间(VSIZE) 、内存空间(RSIZE) 大小,以及在上一个采样周期中虚拟内存和物理内存增长大小(VGROW、RGROW) ,MEM 列指示进程所占物理内存大小。从上图的 PAG 列的信息,我们可以知道此时系统内存负载较高,出现页换出情况,从进程视图中 VGROW 和 RGROW 列可看出 VirtualBox 进程占用内存量大量增长,部分进程占用的内存减少(VGROW 或 RGROW 字段为负值),为 VirtualBox

9、 进程腾出空间。命令视图(Command line)按 c 键我们可以进入命令视图,该视图展示了与每个进程相对应的命令。有时我们某位“马大哈”同事执行了某个脚本或命令,使得系统资源占用率异常飙高,这时,我们可以很容易地通过 atop 的命令视图找到导致异常的命令。atop 日志每个时间点采样页面组合起来就形成了一个 atop 日志文件,我们可以使用atop -r XXX命令对日志文件进行查看。那以什么形式保存 atop 日志文件呢?对于 atop 日志文件的保存方式,我们可以这样:1. 每天保存一个 atop 日志文件,该日志文件记录当天信息 2. 日志文件以atop_YYYYMMDD的方式命

10、名 3. 设定日志失效期限,自动删除一段时间前的日志文件 其实 atop 开发者已经提供了以上日志保存方式,相应的 atop.daily 脚本可以在源码目录下找到。在 atop.daily 脚本中,我们可以通过修改 INTERVAL 变量改变 atop 信息采样周期(默认为 10 分钟 );通过修改以下命令中的数值改变日志保存天数(默认为 28 天):(sleep 3; find $LOGPATH -name atop_* -mtime +28 -exec rm ; )&最后,我们修改 cron 文件,每天凌晨执行 atop.daily 脚本:0 0 * * * root /etc/cron.daily/atop.daily小结本文对 Linux 系统资源及进程监控工具 atop 进行了介绍,对 atop 所记录信息中的部分字段的含义以及进程视图进行了分析,最后讲述了 atop 日志文件的保存方式。atop 工具会根据终端界面的大小调整所显示的字段,因此你使用 atop 时看到的部分字段可能与以上截图不相同。若想更深入地了解 atop 工具中字段含义和各种进程视图,请猛击Reference 链接。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号