计算机状态监测和预测故障研究

上传人:豆浆 文档编号:751119 上传时间:2017-05-13 格式:DOC 页数:3 大小:57.50KB
返回 下载 相关 举报
计算机状态监测和预测故障研究_第1页
第1页 / 共3页
计算机状态监测和预测故障研究_第2页
第2页 / 共3页
计算机状态监测和预测故障研究_第3页
第3页 / 共3页
亲,该文档总共3页,全部预览完了,如果喜欢就下载吧!
资源描述

《计算机状态监测和预测故障研究》由会员分享,可在线阅读,更多相关《计算机状态监测和预测故障研究(3页珍藏版)》请在金锄头文库上搜索。

1、计算机状态监测和预测故障研究Clementine 作为一个数据挖掘软件,给运营商创造了很好的数据处理应用平台,在此平台下,运营商可以有效的使用一些商业技术准确的、快捷的建立预测模型,而后在将此模型生成的数据使用在商业领域。现代化工业系统结构复杂、集成度高,对设备的安全性、可靠性提出了更高的要求。随着计算机的迅猛发展和信息化的深入,随着计算机的运行,信息系统数据库中将产生大量的数据,通过这些数据为基于数据的状态监测提供了良好的平台。随着计算机的运行,计算机将产生两种状态,一种是计算机处于正常的运行情况,另一种则是显示错误的状态,而这种错误状态又可以分为 101 错误、202 错误和 303 错误

2、三种错误状态。计算机已经成为人们交际、办公和学习不可缺少的日用工具,因而计算机的状态监测和预测故障变得越来越重要,可提高企业的工作效率和经济效益,也可以减少网络因故障而造成的经济损失。神经网络(Neural Networks)起源于人们对生物神经元的研究,可以分为生物神经网络(Biological Neural Networks)和人工神经网络(Artificial NeuralNetworks,简写为 ANNs) 1。神经网络是模拟人类实际的神经网络,神经网络在系统识别、模式识别和智能控制等领域有着广泛而吸引人的前景,特别在智能控制中,随着智慧城市渗透到人们生活的各个方面,因而智能控制的应用

3、特别广泛 1。C5.0 是 Clementine 决策树模型中的算法。使用 C5.0 算法可以生成决策树和规则集,C5.0 模型比一些其他类型的模型易于理解,模型推出的规则有非常直观的解释,也可以自动删除没意义的输入字段,主要根据结果变量值对数据按输入字段进行细分。决策树是对由算法建立的分割的简单描述,每个终端(或“叶” )节点可描述训练数据的特定子集,而训练数据中的每个观测值都完全属于树中的某个终端节点 1。C5.0 规则集则是尝试对单个记录进行预测的一组规则,规则集源自决策树,并且在某种程度上表示在决策树中建立的经简化或提取的信息版本。 对于所存在的问题,例如缺失数据和大量输入字段,C5.

4、0 模型十分稳健,通常不需要花费很长的训练时间用于估计 ,同时 C5.0 模型与其他模型类型相比更容易理解,解释起来更简明易懂 6。神经网络和 C5.0 算法都可以用来监督模型和预测模型,他是有目标的去关注风险状况。1 建立模型本文应用 SPSS 公司的商业智能分析软件 Clementine 来分别构建神经网络模型和 C5.0 决策树模型,本文的数据是通过虚构模拟创建得到并包括大量按时间测量的连续序列。对其结果进行分析建模并预测。1.1 商业理解现代化的工业结构复杂、集成度高,因而对设备的安全性和可靠性也提出了更高的要求,随着计算机检测技术的进步,计算机在运行过程将产生大量的数据,本文就是通过

5、这些数据来建立模型,为基于数据的计算机状态监测提供良好的平台,用以监测计算机的状态,从而减少因计算机运行状况不良所导致的损失。而这种因故障而导致的对企业来说的损失更是无法估量的。因此对计算机的状态信息进行检测以及识别和预测故障,则显得越来越重要。所谓状态信息是指包含各种各样的属性,这些属性描述你的空间状态、活动、联系信息、日程和备注等信息 2。而计算机的状态信息则是包含计算机所拥有的各种时候所处的状态信息。计算机正常运行状态会产生的大量的信息数据,我们可以运用 SPSS 公司的商业智能软件 Clementine 对数据进行选择,清理和重构,对计算机所产生的时间序列数据进行训练,生成相应的神经网

6、络模型节点和 C5.0 规则集模型节点。再利用数据来检测这个模型,若是模型检测成功,则可以运用这个模型去检测未来的计算机的状态,从而避免和减少计算机所产生的故障。1.2 检查数据检查数据用以确定哪些属性可能与相关状态的预测或识别有关。本文数据是虚拟构建的时间序列数据,而对于每个时间序列,都会对应一列正常运行期间产生的记录,后跟一列非正常的期间产生的故障记录。这些记录包括时间、功率、温度、压力、正常工作时间、状态、结果。将这些数据运用于 Clementine 得知如果温度和功率的时间序列中包括可见特性曲线,则可以识别即将发生的错误状态。对于温度和功率下面的流可绘制与单独图形中的三个不同错误代码相

7、关联的时间序列,下面是不同错误代码的温度和功率的曲线图,如图中的曲线清楚的显示 202 错误与 101 错误和 303 错误区分开来的特性曲线。202 错误显示了随着时间的推移温度不断上升且功率发生波动。而其他两个错误则未显示,但是用于区分 101 和 303 错误的特性曲线却不是很清晰,这两个错误图都显示了平滑的温度曲线和功率的选择数据。本文的数据是通过虚拟构建的时间序列数据,影响计算机状态监下降,但 303 的功率下降显得更加急剧一些。从而可以得出温度和功率的变化和变化率以及波动存在和波动程度,都与预测和区别故障有关。因此应将这些属性添加到数据,然后在应用学习系统。1.3 数据准备(1)测

8、的变量有时间、功率、温度、压力(0 表示正常,1 表示瞬时压力报警) 、正常工作时间(上次运行时间) 、状态(其中 0 表示正常情况,发生错误是的错误代码为 101、202 和 303) 、结果。然后将这些数据导入到具有强大数据统计分析的 SPSS 数据文件COND1n 中,作为数据挖掘的数据源。(2)数据重构。在流中使用大量的导出节点,生成新的变量 TempInc、PowerInc、PowerFlux、PowerState、PowerChange、TempChange 等。并丢弃每个时间序列的第一个记录,以避免在功率和温度的边界处出现大的或者不正确的跳跃。且过滤掉字段,只保留正常工作时间、状

9、态、结果、压力报警、PowerState、 PowerChange 和 TempChange 等字段。(3)格式化数据。数据转换是应用简单的数学公式或学习曲线变换度量方法,将数据转换到统一的度量范围内,达到数据分析的目的,本文运用神经网络和 C5.0 算法来构建模型,因此数据处理应该适应这两种算法的数据类型。数据准备的过程如下图 2 所示。1.4 学习对 COND1n 数据文件中的数据进行 C5.0 规则和神经网络训练。所谓神经网络的训练是指通过一定的算法调整网络的结构(主要是调节权值) ,使网络的输出与预期值相符这样的过程就是神经网络的训练过程,训练网络可需要一段时间,但可以早些中断训练以保

10、存生产合理的结果的网络,学习完成后则生成两个节点,一个节点表示神经网络,另一个节点表示规则下面两个图 4 是分别是神经网络变量重要性的结果图,C5.0 规则变量重要性的结果图。如图 4 所示:图 4 模型结果条形图1.5 测试使用独立测试数据测试经过训练的系统。将 COND1n 数据文件生成的模型节点添加到现有的流后,插入类型节点并将其连接到生成的神经网络,再将网络连接到生成的规则,然后讲规则连接到一个新的分析节点,最后编辑原始源节点读取 COND1n 文件。如下图5 所示。执行分析节点将生成可反映经过训练的网络和规则的准执行数据流由神经网络得到的 C5.0 规则集如图 6 所示,神经网络的预

11、测结果与实际的结果相比较正确率是 99.46%,而 C5.0 算法的预测结果与实际结果的正确率为 99.68%,得出神经网络算法和 C5.0 算法的预测结果的准确度都比较高。神经网络的预测结果与C5.0 决策树的预测结果相比较,他们的一致性为 99.85%,总体与结果的一致性为 99.76%,所以 C5.0 算法的预测结果的准确性要比神经网络预测结果的准确性高。由于本时间序列数据在训练时忽略了影响因素较小的变量,因此得到的准确性较高。2 状态监测的结果分析从 C5.0 规则集模型中可知,主要影响计算机状态监测的变量有 TempChange、PowerChange、PowerState 和 Up

12、time 四个变量,有IF-THEN 规则图知:(1)当功率瞬时变化率的平均值大于-0.2,功率的波动状态为稳定状态且温度瞬时变化率的平均值不大于 0 时,计算机的状态为正常情况。(2)当功率瞬时变化率的平均值不大于-0.2,功率的波动状态为稳定状态且温度瞬时变化率的平均值不大于 0 时,计算机的状态为101 错误。(3)当功率的波动状态为不温度状态时,计算机的状态为 202 错误。(4)当功率瞬时变化率的平均值不大于-0.2,正常工作时间大于 284 时,计算机的状态为 303 错误。3 结束语本文采用神经网络算法和 C5.O 算法来建立相应的神经网络节点模型和 C5.0 规则集节点击模型来

13、检测计算机状态及识别和预测计算机的故障,能够识别和预测哪些变量的变化能够引起计算机的哪些错误状态。C5.0 算法与神经网络算法相比结果更容易解释,且可以自动删除无意义的输入字段,它主要是根据结构变量值对数据按输入进行细分,具有决策树和规则集两种结果形式。通过以上的模型建立,得到了一个效率较高识别和预测故障的规则,可以帮助计算机的使用者提高使用效率,避免因故障而造成的精神和经济等方面的损失。同时也说明了神经网络算法和 C5.0 算法的预测结果的准确性,易用性和优越性。参考文献1 Jiawei Han, Micheline Kamber.数据挖掘概念与技术M.范明,孟晓峰,译.北京:机械工业出版社,2008:189195.2 百度百科,状态监测CP/OL.http:/ 赵伦,侯波,颜昌沁.利用 ClementineC5.0 模型预测 CDMA 客户流失J.电脑知识与科技,2011(7).4 刘继伟.基于大数据的多尺度状态检测方法及应用D.华北电力大学,2013(6). 5 李瑞欣.基于网络喝状态监测的设备管理理论与方法研究D.天津大学,2004(12).6 数据挖掘与 Clementine 使用培训R.北京瑞斯泰得数据技术开发有限公司.2014(5).7 李欣.基于神经网络的数据挖掘方法研究J.大庆石油学院.2003(2)

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号