sun设备日常维护手册

上传人:第*** 文档编号:34013962 上传时间:2018-02-20 格式:DOC 页数:27 大小:227.50KB
返回 下载 相关 举报
sun设备日常维护手册_第1页
第1页 / 共27页
sun设备日常维护手册_第2页
第2页 / 共27页
sun设备日常维护手册_第3页
第3页 / 共27页
sun设备日常维护手册_第4页
第4页 / 共27页
sun设备日常维护手册_第5页
第5页 / 共27页
点击查看更多>>
资源描述

《sun设备日常维护手册》由会员分享,可在线阅读,更多相关《sun设备日常维护手册(27页珍藏版)》请在金锄头文库上搜索。

1、SUN 设备日常维护手册版本 1.0北京华胜天成科技股份有限公司2002.05.10Hotline: 800-810-0584 Date:2002-05-10 2SUN 设备日常维护手册一. 维护目的1. 检查设备软硬件工作状态,及时发现出现的各种问题,消除故障,使设备恢复正常工作状态。2. 预防各种可能出现的问题,分析系统信息或日志,调整软硬件配置、优化系统,使设备保持最佳的运营状态。3. 保存原始数据和系统记录,以便于查询、恢复和分析。日常维护内容应针对不同机型、应用、软件做不同要求的检查,下面维护检查内容是所有机器在维护过程中都应检查的内容。二. 系统启动和终止1. 检查机房环境。SUN

2、 设备对环境温度、湿度要求较高,为了保证机器的稳定性和性能,因此在决定开机之前必须看一下机房的温度表和湿度表,确保环境是机器允许的范围内;据统计,温度每升高 10计算机的可靠性就下降 25。2. 检查 UPS 系统。非正常掉电对 SUN 服务器的损害是非常大。为避免这种情况,请为系统中基本都配置了 UPS 系统。在启动机器之前应对 UPS 系统进行一次常规检查。3. 严守加电规则。设备的加电启动过程是有顺序的,要求必须按照操作手册的规定来操作。否则,很有可能造成对系统的损坏。使用UNIX 操作系统的计算机其开关机过程不同于一般的个人 PC 机。开机过程1) 先启动外部设备的电源如外置式硬盘磁带

3、机CD-ROM 驱动器等。2) 启动主机电源。关机过程1) 进入系统根用户帐号root。2) 确认没有运行不可中断的任务后执行下列命令中的任一个均可。 shutdown 使系统在60 秒后进入0 运行级即ok 状态延时可用参数-g 调整 init 0 使系统立即进入0 运行级即ok 状态 init5 使系统立即进入0 运行级并自动关闭主机电源注意应避免使用halt 命令它不是关机的好方法三. 外围检查范围1. 显示器:显示正常、没有模糊、色彩不正、调节失效等不正常现象。2. 键盘:操作各键反应灵敏,没有按下不弹起或没有反应等现象。3. 鼠标:操作灵活、推动鼠标光标反应灵敏。4. 软驱:用命令对

4、磁盘读、写操作正常,写操作后的磁盘在其它设备上可正常读出。5. 光驱:用命令对光盘做读、弹出等操作。6. 磁带机:用命令对磁带做读、写、各种倒带操作,确保所有操作工作正常。7. 主机面板灯:查看电源、硬件、硬盘、运行等状态灯显示是否正常。8. 其它显示灯:电源模块等状态灯。9. 电源线:电源线插头与插座插接可靠,没有松动;电源线摆放位置合适,不会被误碰Hotline: 800-810-0584 Date:2002-05-10 3掉。10. 网线连接:网线连接可靠,摆放规整。11. 温度、湿度:检查温、湿度数、确保温、湿度在设备要求的范围内。温度应保持在2023,湿度应保持在 5055%12.

5、灰尘:检查设备表面灰尘,定期保持清洁;可利用机器停机时间,及时对机器内部做灰尘清洁。13. 漏电保护:确保机器具有可靠接地保护,防止静电放电,造成损坏硬件。14. 机器噪音:检查机器是否有异常声音,持续时间。四. 系统性能检查和优化1. 监视 Sun 系统的性能 Rule and TuningCPUMemoryNetworkDisk2. 影响系统性能的因素 低性能可能来源于下面几个层次之一:应用程序网络核心层系统配置3. 搜集信息内容问自己下面简单的 12 个小问题: Q1:系统用来作什么? ( 对系统性能的要求有多高)系统用来作什么? 它上面的基本应用是什么? 是文件服务器?数据库服务器?终

6、端用户的 CAD 工作站?Internet 服务器?还是伺服控制系统? Q2: 谁是用户?用户在哪?有多少用户? 他们怎样使用系统? 他们可能是一教室的 学生, 在家上网浏览 Internet 的人, 数据录入人员, 开发工程师, 实时数据流入, 批处理任务最终用户是否直接相连? 通过什么设备相连? Q3: 谁反应系统存在性能问题? 什么速度比较慢? (性能 问题是客观存在的还是主观想法)Hotline: 800-810-0584 Date:2002-05-10 4最终用户抱怨客观测试 Q4: 系统的配置如何? ( 系统配置是否已经足够高)CPU, 内存、网络、硬盘Solaris 的版本安装了

7、哪些相关 patch? Q5: 使用了什么应用软件?(性能问题有没有可能是由于 软件引起的, 其它用户对这些软件的反应如何)NFS server: NFS V2 or NFS V3 Web server:SWS, Netscape or ApacheDatabase server Oracle, Informix or Sybase database tables running on raw disk or in file system tables? Q6: 系统中比较忙的进程在做什么?(性能问题是否由于某些或某个 进程引起) 哪个进程忙谁启动的该进程他们占用了多少 CPU他们占用了多少内

8、存他们运行了多长时间 Q7: CPU 的利用率有多少?CPU 的整体忙 闲程度如何?用户进程和系统进程占用 CPU 的比例怎样? Q8:磁盘的利用率有多少? 什么使磁盘忙? 如果整个磁盘系统 idle, 跳过此问题磁盘有多忙?哪个磁盘的负载最重?单个进程的数据并不反应进程在使用哪块硬盘 Q9: 网络配置的是什么名字服务? 很多性能问题都是由于名字服务配置不合适所致 Q10: 网络活动状态如何?每个网口上包的传输率NFS client 和 server 的操作频率TCP 连接, 吞吐量, 重传率 Q11: 物理内存够不够? Hotline: 800-810-0584 Date:2002-05-1

9、0 5如果没有内存扫描(scan rate),说明内存足够如果内存扫描率很高,并且 swap 所在磁盘忙, 说明需要更多内存。 Q12: 最近对系统做了那些修改? 总是了解自己对系统所做的修改很重要 添加了更多的用户 某些事件会导致较高的用户行为 升级应用程序或安装新的版本 网络上增加了其它机器 硬件配置改变或升级4. 监视 Sun 系统的性能 监视系统资源 检查 Solaris 日志和文件,看是否能发现问题 利用系统资源监视脚本发现系统瓶颈1) 监视系统资源 CPU - vmstat, mpstat Memory - vmstat Disk - iostat Networks - netst

10、at process - ps Other command - sar, nfsstat, swap, prtconf, prtdiag, pkginfo, showrev(patchadd)用 mpstat 监视 CPU mpstat 以表格形式报告每一个 CPU 的统计数据example% mpstat 5CPU minf mjf xcal intr ithr csw icsw migr smtx srw syscl usr sys wt idl0 0 0 0 104 3 20 7 0 0 0 73 55 3 0 411 0 1 0 71 67 20 4 2 0 0 62 38 4 0 5

11、8CPU minf mjf xcal intr ithr csw icsw migr smtx srw syscl usr sys wt idl0 0 0 0 105 4 51 6 6 1 0 118 41 7 0 511 0 0 0 108 97 31 11 4 3 0 79 50 9 0 41用 mpstat 监视 CPU(cont.) 主要输出参数说明: CPU: CPU 编号,举例系统中有 2 个 CPU smtx:锁没有在第一次请求时获得 usr:用户进程占用 CPU 的比例Hotline: 800-810-0584 Date:2002-05-10 6 sys:系统进程占用 CPU

12、的比例 wt:CPU 等待的时间的比例 id:CPU 空闲的比例 用 vmstat 查看 CPU 和内存状 态 vmstat 报告虚拟内存,磁盘,陷阱和 CPU 活动的统计数字example% vmstat 5procs memory page disk faults cpur b w swap free re mf pi po fr de sr s0 s1 s2 s3 in sy cs us sy id0 0 0 11456 4120 1 41 19 1 3 0 2 0 4 0 0 48 112 130 4 14 821 1 1 10132 5496 0 0 5 0 0 0 0 0 23 0

13、 0 183 192 134 1 20 791 0 1 10132 5564 0 0 25 0 0 0 0 0 18 0 0 131 231 116 4 34 621 0 1 10124 5412 0 0 37 0 0 0 0 0 22 0 0 166 179 118 1 33 67用 vmstat 查看 CPU 和内存状 态(cont.) 主要输出参数说明 r:运行队列中进程个数(已经准备好数据等待运行的进程 )。数值大表示 CPU 忙。 swap:当前可用的交换区空间,单位 Kbytes。 sr:页扫描的次数。数值大表示物理内存不够。 us:用户进程占用 CPU 的比例 sy:系统进程占用 CPU 的比例 id:CPU 空闲的比例用 iostat 查看 I/O 资源 iostat反复报告终端,磁盘,磁带机的 I/O 活动和 CPU 的利用率 . 使用 iostat 查看各控制器和磁盘 的负载. 如果磁盘负载不均衡, 考虑 移走一部分 消耗 I/O 多的行为 ( 例如, 虚拟内存) 到另外的磁 盘或控制器上, 或增加一些磁 盘、控制器等。用 iostat 查看 I/O 资源(c

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 解决方案

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号