一种基于数据挖掘分析的设备状态评价方法

上传人:小** 文档编号:34088991 上传时间:2018-02-20 格式:DOC 页数:8 大小:114.50KB
返回 下载 相关 举报
一种基于数据挖掘分析的设备状态评价方法_第1页
第1页 / 共8页
一种基于数据挖掘分析的设备状态评价方法_第2页
第2页 / 共8页
一种基于数据挖掘分析的设备状态评价方法_第3页
第3页 / 共8页
一种基于数据挖掘分析的设备状态评价方法_第4页
第4页 / 共8页
一种基于数据挖掘分析的设备状态评价方法_第5页
第5页 / 共8页
点击查看更多>>
资源描述

《一种基于数据挖掘分析的设备状态评价方法》由会员分享,可在线阅读,更多相关《一种基于数据挖掘分析的设备状态评价方法(8页珍藏版)》请在金锄头文库上搜索。

1、一种基于数据挖掘分析的设备状态评价方法 李金 高寿 中国南方电网电力调度控制中心 南瑞集团公司(国网电力科学研究院) 摘 要: 为提高电力设备状态评估的准确性和效率, 提出了一种将数据挖掘方法应用到设备状态评价中的思路和方法。介绍了基于数据挖掘方法的状态评价模型, 从大量设备历史数据库中采集电力设备的台账信息、在线监测信息、运行信息等作为设备评价的基础参量, 将这些历史数据分别归类为不同状态的数据集, 然后对每个数据集提取其主要特征向量, 以此作为设备状态评价分类依据。该方法为设备状态评估提供了新的思路。关键词: 数据挖掘; 主成分分析; 电力设备状态评价; 作者简介:李金 (1979-) ,

2、 男, 硕士, 高级工程师, 主要研究方向:电力系统自动化。作者简介:高寿 (1982-) , 男, 硕士, 工程师, 主要研究方向:电力系统自动化。收稿日期:2017-05-19A method of power equipment state assessment based on data mining techniqueLi Jin Gao Shou Power Dispatching and Communication Center of CSG; NARI Group Corporation (State Grid Electric Power Research Institute

3、) ; Abstract: To improve the accuracy and efficiency of the power equipment condition assessment, a method of power equipment state assessment based on data mining technique is proposed in this paper. The state evaluation model based on data mining is introduced. In this method, the power equipment

4、on-line monitoring information, inventory information, and operation information are collected from equipment history database as the basis of evaluation of equipment parameters. These historical data are classified into different data sets for each data set, then the feature vector is extracted. Th

5、e data mining technique is used to extract main feature vector as classification of equipment state evaluation. The method provides a new way of thinking for the equipment state evaluation.Keyword: data mining; principal component analysis; power equipment condition assessment; Received: 2017-05-190

6、 引言随着社会发展和经济的不断进步, 社会各行业对电力设备安全、稳定、可靠地运行提出了越来越高的要求, 电力行业传统的按固定周期对所有电力设备进行监测诊断的方法难以有效地对电力设备的状态进行有效评估和分析, 预测设备故障状态, 存在工作量大、维修滞后、检修过剩等问题1-3。而设备的状态评价技术是实施状态检修的核心, 只有在准确评价设备的实时运行状态的基础上, 才能合理安排设备检修的项目和时间。本文将数据挖掘分析算法应用到设备状态评价中, 通过对大量设备历史运行数据进行特征提取和降维处理, 提取出能够表征设备运行状态的特征信息, 然后结合设备当前运行情况, 对设备状态进行评估, 为设备状态检修工

7、作安排提供数据基础。1 基于数据挖掘分析的评价模型描述在传统的有限数据设备状态评价系统中, 状态量的选取往往是单一的, 故障/缺陷情况也是单一的, 两者对应的关联规律性较弱。采用数据挖掘的方法对设备状态进行评价, 重点要获取设备状态量与设备状态之间的关联关系4。而在大数据环境下, 所采集的设备状态量数量较多, 无疑会增加分析问题的难度和复杂性, 因此本文对设备状态量集合采用降维方法, 去除冗余设备装态量, 提取出设备状态量与设备状态之间的关联关系。目前在降维领域应用较为广泛的方法有:主成分分析法5、因子分析6、局部线性嵌入 (Locally Linear Embedding, LLE) 、等距

8、映射 (Isometric Mapping, ISOMAP) 7等。LLE、ISOMAP 等方法适合连续时间信号的降维处理8, 而设备状态量信息中的设备台账信息、运行信息等多为离散信息量, 因此本文采用主成分分析方法对设备状态量进行降维操作, 提取表征设备状态的关键信息。本文设计的设备状态评价模型包括:提取大量设备历史运行信息, 将这些运行信息分类成不同状态的信息集;采用主成分分析法提取各个状态信息集的特征信号;对于待评价设备的当前运行情况, 将该运行信息投影到状态信息集的特征空间进行设备状态评价。1.1 主成分分析算法介绍主成分分析 (Principal Component Analysis

9、, PCA) 是多元统计过程控制的常用方法之一, 通过一组标准正交变换, 将原始数据集线性变换为一组包含原始数据的大部分信息的主成分集合, 可基本表征原始数据, 实现数据从高维到低维的变换9-10。PCA 法已应用于电力系统的短期负荷预测、暂态稳定评估、汽轮机故障诊断等方面11-15。PCA 算法步骤可以描述为:假设训练样本集为 X=x1, x2, , xn。该样本的平均向量为:构造样本集的协方差矩阵为:计算出协方差矩阵的特征向量 i和对应的特征值 i。这些特征向量组成的矩阵 A 就是训练样本集的正交基底, 将协方差矩阵的特征值按大到小排序: 1 2 k0, 可将主成分构成的变换矩阵记为:A=

10、 ( 1, 2, , k) 。有了这样一个降维的子空间, 任何一个测试样本都可以向其作投影 =Ay, 即并获得一组坐标系数, 即低维向量 。1.2 设备状态评价模型步骤整个过程可以分为以下 3 个阶段:(1) 提取设备历史运行信息, 并将这些历史运行信息根据设备状态的严重程度不同分为严重、异常、注意、正常等数据集, 并对原始样本集进行归一化处理。(2) 采用主成分分析法实现各数据集的特征优化, 以减少设备特征状态量的维数, 减少设备评价信号数据的复杂度。(3) 通过最近邻算法实现设备状态评价。当需要评价的样本到来时, 首先计算其与各个数据特征集中心的距离来确定其所属的状态, 取其中最小距离的状

11、态集作为设备状态评价的最终结果。2 数据挖掘在设备状态评价中的应用目前, 电力设备状态评价的方案主要根据标准导则对设备进行打分评估, 而数据挖掘技术和设备监测技术的发展为电力设备状态评价提供了新思路。本文在传统电网设备状态评价方法基础上, 将数据挖掘算法引入设备评价方法中, 提出基于数据挖掘算法的设备状态评价方法。2.1 设备状态量信息获取以数据挖掘方法进行设备状态评价的首要问题在于表征设备状态的各个维度的状态信息量的获取。与电网设备状态关系密切的数据信息来源较为复杂, 要对设备状态进行评估, 首先要收集设备的相关信息, 包括: (1) 设备台账信息, 此类信息作为固定参数自记录以后不再变化,

12、 作为某项状态量直接参与状态评估时的计算; (2) 设备在线监测信息, 此类信息采集周期短, 时效性强, 反映了设备的实时健康状态, 作为最主要的设备状态评估参数, 在设备评价时应给与最大的权重占比; (3) 设备运行信息、定检信息、缺陷信息, 此类信息通常采用周期性采集方式获取, 对设备状态评价结果的准确性有重要的参考作用; (4) 其他信息, 包括温度、气象、环境等因素, 此类信息相对稳定, 但会对设备状态评价结果产生影响。2.2 设备状态量信息预处理经过数据采集阶段获取设备状态信息量以后, 要对采集到的数据进行数据清理、集成、变换, 使获取到的数据能够满足数据挖掘算法的要求。(1) 数据

13、清理:按照固定规则丢弃部分采集到的设备状态量数据, 如在线监测信息不符合预定的数据格式、超出正常阈值范围、数据发生跳变等情况。(2) 数据集成:将不同来源、格式、特点性质的设备状态量在逻辑上统一起来, 将其转换为适合挖掘的统一形式。如设备状态量信息中包含 n 项信息量, 则将该信息转换为一个 n 维向量:x 1, x2, , xn。2.3 设备状态评价的数据挖掘方法基于主成分分析法提取关键信息参量的步骤如下:(1) 将采集到的设备历史状态量集合分为严重、异常、注意、正常四个集合, 记为 X1, X2, X3, X4。每个集合的数据集 Xi=xi1, xi2, , xin, 其中 n 表示抽取的

14、样本个数, x ij表示数据集 Xi中第 j 个训练样本。(2) 计算各个状态集数据状态量矩阵的正交相关矩阵 , 对 Ri进行奇异值分解, 得到矩阵 Ri的特征值和特征向量。将特征值按照从大到小的顺序排列: i1, i2, , ik为对应的特征向量。(3) 确定主成分向量数量。设有 m 个主成分能够表征设备状态, 令式 (13) 表示特征值 i1, i2, , im累计贡献 90%的置信区间, 由此确定m 个特征向量作为能够表征状态集的主成分向量 i1, i2, , ik。(4) 计算原始设备状态量矩阵在新的 m 维特征空间中的投影:式中:A i= i1, i2, , im表示特征因子矩阵,

15、i1, i2, , ik是 i1, i2, , im对应的特征向量。(6) 对于待评价设备状态信息量 y, 计算其在各状态集特征空间中的投影:计算 i与所有该状态集信息量在 m 维特征空间中的归一化投影的距离, 取其中的最小值所在的状态集作为该待评价设备的所属状态。(7) 根据上述导则对设备总体评价的规定, 可以得到设备整体状态的计算公式为:3 算例与讨论设备状态量参数集合的建立综合考虑了电网公司历史运行信息、实时监测信息、静态台账参数信息等不同类型的参数, 在这些参数基础上进行数据挖掘分析, 相比于现有的状态评价导则, 本文方法具有可信度高、代表性强的特点。通过某测控装置的相关数据对本方法进

16、行了初步验证, 而由于电网设备运行环境复杂的特点, 参数体系的选择、算法的实用性和准确性方面还需要结合实际情况进一步验证。(1) 从设备台账信息、历史运行信息、监测信息中提取出设备状态量, 将状态量以连续型数据或离散型数据表示。其中台账信息包括图纸设计质量、装置制造质量、施工安装质量、投产验收质量等信息。历史运行信息包括家族缺陷、装置缺陷、检修信息等信息。监测信息包括自检信息、监测数据等实时运行数据。表 1 给出了部分监测信息数据类型。表 1 测控装置部分监测信息 下载原表 (2) 从电网公司历史数据库中抽取采样数据进行主成分分析, 如表 2 所示, 并计算各状态集特征空间。表 2 样本集 下载原表 测试中设置 m=16 时可将 4 个状态集均降维至 90%的置信区间。将测试样本投影至各个状态集的特征空间, 验证结果如表 3 所示。表 3 测

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 学术论文 > 管理论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号