硬盘SMART检测参数详解

上传人:博****1 文档编号:457244915 上传时间:2022-11-10 格式:DOCX 页数:23 大小:46.35KB
返回 下载 相关 举报
硬盘SMART检测参数详解_第1页
第1页 / 共23页
硬盘SMART检测参数详解_第2页
第2页 / 共23页
硬盘SMART检测参数详解_第3页
第3页 / 共23页
硬盘SMART检测参数详解_第4页
第4页 / 共23页
硬盘SMART检测参数详解_第5页
第5页 / 共23页
点击查看更多>>
资源描述

《硬盘SMART检测参数详解》由会员分享,可在线阅读,更多相关《硬盘SMART检测参数详解(23页珍藏版)》请在金锄头文库上搜索。

1、硬盘SMART检测参数详解转、SMART概述要说Linux用户最不愿意看到的事情,莫过于在毫无警告的情况下发现硬盘崩溃了。诸 如RAID的备份和存储技术可以在任何时候帮用户恢复数据,但为预防硬件崩溃造成数据丢 失所花费的代价却是相当可观的,特别是在用户从来没有提前考虑过在这些情况下的应对措 施时。硬盘的故障一般分为两种:可预测的(predictable)和不可预测的(unpredictable)。后者偶 而会发生,也没有办法去预防它,例如芯片突然失效,机械撞击等。但像电机轴承磨损、盘 片磁介质性能下降等都属于可预测的情况,可以在在几天甚至几星期前就发现这种不正常的 现象。对于可预测的情况,如果

2、能通过磁盘监控技术,通过测量硬盘的几个重要的安全参数和 评估他们的情况,然后由监控软件得出两种结果:“硬盘安全”或“不久后会发生故障”。那么 在发生故障前,至少有足够的时间让使用者把重要资料转移到其它储存设备上。最早期的硬盘监控技术起源于1992年,IBM在AS/400计算机的IBM 0662 SCSI 2代硬盘驱 动器中使用了后来被命名为Predictive Failure Analysis (故障预警分析技术)的监控技术,它 是通过在固件中测量几个重要的硬盘安全参数和评估他们的情况,然后由监控软件得出两种 结果:“硬盘安全”或“不久后会发生故障”。不久,当时的微机制造商康柏和硬盘制造商希捷

3、、昆腾以及康纳共同提出了名为IntelliSafe 的类似技术。通过该技术,硬盘可以测量自身的的健康指标并将参量值传送给操作系统和用 户的监控软件中,每个硬盘生产商有权决定哪些指标需要被监控以及设定它们的安全阈值。1995年,康柏公司将该技术方案提交到Small Form Factor(SFF)委员会进行标准化,该方案得 到IBM、希捷、昆腾、康纳和西部数据的支持,1996年6月进行了 1.3版的修正,正式更名 为 S.M.A.R.T. (Self-Monitoring Analysis And Reporting Technology),全称就是“自我检测分 析与报告技术”,成为一种自动监控

4、硬盘驱动器完好状况和报告潜在问题的技术标准。SMART的目的是监控硬盘的可靠性、预测磁盘故障和执行各种类型的磁盘自检。如今大部 分的ATA/SATA、SCSI/SAS和固态硬盘都搭载内置的SMART系统。作为行业规范,SMART 规定了硬盘制造厂商应遵循的标准,满足SMART标准的条件主要包括:1)在设备制造期间完成SMART需要的各项参数、属性的设定;2)在特定系统平台下,能够正常使用SMART;通过BIOS检测,能够识别设备是否支持SMART并可显示相关信息,而且能辨别有效和失效的SMART信息;3)允许用户自由开启和关闭SMART功能;4)在用户使用过程中,能提供SMART的各项有效信息

5、,确定设备的工作状态,并能发出 相应的修正指令或警告。在硬盘及操作系统都支持SMART技术并且开启的情况下,若硬盘 状态不良,SMART功能会在开机时响起警报,SMART技术能够在屏幕上显示英文警告信息:“WARNING IMMEDIATLY BACKUP YOUR DATA AND REPLACE YOUR HARD DISK DRIVE,A FAILURE MAY BE IMMINENT. ”(警告:立刻备份你的数据并更换硬盘,硬盘 可能失效。)SMART功能不断从硬盘上的各个传感器收集信息,并把信息保存在硬盘的系统保留区 (service area)内,这个区域一般位于硬盘0物理面的最前

6、面几十个物理磁道,由厂商写入相 关的内部管理程序。这里除了 SMART信息表外还包括低级格式化程序、加密解密程序、自 监控程序、自动修复程序等。用户使用的监测软件通过名为4SMART Return Status”的命令(命 令代码为:B0h)对SMART信息进行读取,且不允许最终用户对信息进行修改。smartmontools是smart的的软件包程序,由smartctl和smartd两部分工具程序组成,它们一 起为Linux平台提供对磁盘退化和故障的高级警告。二、smart信息解读root# smartctl -A /v/2dasmartctl 6.2 2013-07-26 r334 1 x.

7、B6_64-linux-3.1 C. 0-22S . el7 . x.Si6_64 (local b Copyright C)20Cb2-13r Bruce AUerij Christian ZFranks5 www . smartmontools . org1二二二 START OF READ SMART DATA SECTION 二二二SMART Attrihu.tes Data Structure revision nxunbex:10Vendor Specific SMART AttrilDutes with Tliresholds :ID#ATTRIBUTE NAMEFLAGVALU

8、EWORSTTKRESHTYPEUPDATED1Raw Read Error RateQxOOOf11?Q99006Pre-failAlways3Spin_Up_Time0x0003097097 oaPre-failAlways目S tarop_C aunt0x003210010002 aOldgeAlways5Reallocated Sector Ct0x003310010003 6Pre-failAlways7Seek Error RateOxOOOf081 6003 0Pr&-failAlways5Power On Hours0x00320S50B9ooaOld ageAlways10S

9、pin_Retry_Count0x0013100100097Pre-failAlways12Power Cycle Corm 七0x003210010002 0Old ageAlways133Rrm t i me_B a d_B 丄 ocz Jc0x0032100100ooaOld_ageAlways194End-to-End Error0x0032100100099Old ageAlways197Reported Uncorrect0x003210 0100000Old ageAlwaysiaaC amma nd_ T ime outQx0032100100OOQOld_ageAlways1

10、99High Fly Writes0x0 0-3h100100000Old ageAlways190Airf low_rreimperatu.re_Cel0x0022063asaD4 5Old_ageAlways191G-Sense Error Rate0x0032100100000Old ageAlways1?2Power-Of f_Retract_Count0x003210 0100ooaOld_ageAlways153Load Cyc丄口 Count0x003200101000Old ageAlways194Temperature Celsius0x002203 74200aOld ag

11、eAlways197Current_ Pendi口9_巳匚tur0x0012100100doqOld_ageAlways199Offline Uncorrectable0x0010100100000Old ageOffline1?9UDMA CRC Et:工 or C ountQxOO-3e20020000aAlways240Head Flying Hours0x000010025300aOld ageOffline241Total LBAs Wri七七巳m.QxOOOO10025300aOld ageOffline2 42Total LBAs Read0x0000100253dooOld a

12、geOfflineID属性ID,通常是一个1到255之间的十进制或十六进制的数字。硬盘SMART检测的ID代 码以两位十六进制数表示(括号里对应的是十进制数)硬盘的各项检测参数。目前,各硬盘 制造商的绝大部分SMART ID代码所代表的参数含义是一致的,但厂商也可以根据需要使用 不同的ID代码,或者根据检测项目的多少增减ID代码。一般来说,以下这些检测项是必需 的:01 (001) Raw_Read_Error_Rate底层数据读取错误率04 (004) St ar t_S to p_Count 启动/停止计数05 (005) Reallocated_Sector_Ct 重映射扇区数09 (0

13、09) Power_0n_Hours通电时间累计,出厂后通电的总时间,一般磁盘寿命三万小时0A (010) Spin_Retry_Count主轴起旋重试次数(即硬盘主轴电机启动重试次数)0B (011) Calibration_Retry_Count 磁盘校准重试次数0C (012) Power_Cycle_Count 磁盘通电次数C2 (194)Temperature_Celsius 温度C7(199) UDMA_CRC_Error_Count 奇偶校验错误率C8 (200) Write_Error_Rate:写错误率F1(241) Total_LBAs_Written:表示磁盘自出厂总共写

14、入的的数据,单位是LBAS=512ByteF2(242) Total_LBAs_Read:表示磁盘自出厂总共读取的数据,单位是LBAS=512ByteATTRIBUTE_NAME硬盘制造商定义的属性名。,即某一检测项目的名称,是ID代码的文字解释。FLAG属性操作标志(可以忽略)当前值(value)当前值是各ID项在硬盘运行时根据实测原始数据(Raw value)通过公式计算的结果,1到 253之间。253意味着最好情况,1意味着最坏情况。计算公式由硬盘厂家自定。硬盘出厂时各ID项目都有一个预设的最大正常值,也即出厂值,这个预设的依据及计算方 法为硬盘厂家保密,不同型号的硬盘都不同,最大正常值通常为100或200或253,新硬盘 刚开始使用时显示的当前值可以认为是预设的最大正常值(有些ID项如温度等除外)。随 着使用损耗或出现错误,当前值会根据实测数据而不断刷新并逐渐减小。因此,当前值接近 临界值就意味着硬盘寿命的减少,发生故障的可能性增大,所以当前值也是判定硬盘健康状 态或推测寿命的依据之一。最差值(Worst)最差值是硬盘运行时各ID项曾出现过的最小的value。最差值是对硬盘运行中某项数据变劣的峰值统计,该数值也会不断刷新。通常,最差值与当 前值是相等的,如果最差值出现较大的波动(小于当前值),表明硬盘曾出现错误或曾经历 过恶劣的工作环境

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文 > 其它学术论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号