基于随机森林的异步电动机转子断条故障诊断 史干东 吴文军 张玉鸿 史丽萍 中国矿业大学 国网四川省电力公司 摘 要: 为了快速准确识别异步电动机转子断条故障, 提出一种随机森林算法 (Random Forests, RF) 的异步电动机转子断条故障诊断方法该方法以 Park 矢量模平方函数为故障特征提取手段, 然后采用随机森林进行故障模式自动识别Park矢量模平方函数方法可以较好地削弱定子电流中基频信号的影响, 便于故障特征量的准确提取而随机森林泛化能力好、训练时间短, 提高了故障识别的成功率实例验证表明, 基于随机森林的异步电动机转子断条故障诊断方法性能良好关键词: 异步电动机; 转子断条; Park 矢量模平方; 随机森林; 故障诊断; 作者简介:史干东 (1990-) , 男, 硕士研究生, 主要研究方向为感应电机故障诊断及电能质量检测收稿日期:2016-09-20Broken Rotor Bar Fault Diagnosis Based on Random Forests in Induction MotorsSHI Gan-dong WU Wen-jun ZHANG Yu-hong SHI Li-ping China University of Mining and Technology; State Grid Sichuan Electric Power Company; Abstract: To identified broken rotor bar faults in induction motors accurately and rapidly, a novel method was illustrated to diagnose broken rotor bar fault on the basis of random forests.Park's vector modulus could reduce the influence of the fundamental frequency signal in stator current, which could help extract the feature vector accurately.Random forests had better tolerance, lesser training time consuming and strengthening the classification correctness.As a result, the experiment reminds the effectiveness and superiority of the proposed method.Keyword: induction motor; broken rotor bar; Park's vector modulus; random forests (RF) ; fault diagnosis; Received: 2016-09-200 引言异步电动机转子断条故障是常见电机故障之一, 它将导致电动机运行性能下降, 严重时电机会因此无法驱动负载而出现堵转、停转, 甚至烧坏电机, 威胁工业生产的可靠性和安全性, 同时增加生产成本[1]。
因此对该故障及早进行检测和诊断颇为重要基于定子电流特性分析是异步电动机转子断条故障诊断的常用方法研究表明, 定子电流中包含电机的故障特征, 因而通过提取定子电流故障特征可以准确地检测电机故障[2]例如当异步电动机定子电流中出现 (1+2s) f 1频率分量 (f 1为供电频率, 即定子电流基频分量, s 为转差率) 时, 电机则发生转子断条故障, 因此在判断转子断条故障时可以以该边频分量作为特征向量[3]在异步电动机转子断条故障检测中, FFT 是最常用的电流特性分析方法但是当电机负载比较小时, 转差率 s 非常低, 边频分量 (1+2s) f 1极其接近基频 f1, 同时边频分量的幅值较基频很小且由于噪声干扰, 这就导致边频分量极易被淹没, 频谱泄露在所难免, 此时基于 FFT 的定子电流特征分量提取方法的灵敏度便会大打折扣[4]为此, 文献[4]使用混合骨干微粒群优化算法获得基波参数后构造出基波表达式, 并将其从原始信号中剔除, 以突出故障特征频率成分, 但此方法过程繁琐, 计算量大;文献[5]采用 Hilbert 变换把基波成分转换成直流信号从而使故障特征更加明显, 但存在交叉项问题。
目前神经网络[6-7]、支持向量机[8-9]等为电机状态识别主流方法神经网络具有自适应学习能力, 但是其在样本训练时容易陷入局部最优, 同时支持向量机也存在训练速度较慢的问题, 尤其是故障特征量较多时, 该方法占用系统较多资源, 不利于故障诊断不仅如此, 以上两种方法都只是基于单一分类器的故障诊断方法, 因而正确率较低本文针对异步电动机转子断条故障诊断中的故障特征量提取和故障识别问题, 首先采用 Park 矢量模平方函数方法提取转子断条时的故障特征量, 然后以其作为输入量训练随机森林形成分类器群, 识别故障模式, 以实现异步电动机转子断条故障的准确诊断1 Park 矢量模平方函数当异步电动机转子发生断条故障时, 定子电流中会出现边频分量 fbb= (1+2ks) f1 (为简化起见, 令 k=1) , 故定子三相电流 (i a, ib, ic) 可以用下列形式表达[10], 即:式中:I f, α 为基波电流 f1的幅值、初相位;I dl, β l为左边频分量 (1-2s) f 1的幅值、初相位;I dr, β r为右边频分量 (1+2s) f 1的幅值、初相位将式 (1) 、式 (2) 和式 (3) 代入式 (4) 和式 (5) , 则 Park 矢量的两个分量变为[11]:Park 矢量模平方函数:因此, Park 矢量模平方函数含有的成分:一个直流分量, 两个频率分别为 2sf1和 4sf1的交流分量。
其中, 4sf 1频率分量为最高频率分量该方法可以凸显故障特征, 能够很好地将边频交流分量与电源基频分量区分开来, 消除传统基于FFT 的电机电流频谱分析方法的一些局限性2 特征量提取故障特征的准确提取是运用随机森林算法进行异步电动机故障识别的关键之一以 Park 矢量模平方函数方法提取故障特征时, 断条故障特征频率 2sf1和 4sf1远离基频而靠近 0, 故能避免边频分量“湮没”问题同时为避免电机气隙偏心对故障识别正确率的影响, 将 0~20 Hz 频段作为断条故障模式识别的特征频段然后对 0~20 Hz 频段进行量化处理 (量化单位 1 Hz) , 得到 20 个量化值其具体方法参考文献[11]然后用式 (6) 中的直流分量去除这 20 个量化值进行“归一化”处理, 并将此结果作为异步电动机转子断条故障的特征矢量, 亦即随机森林的输入量图 1 为异步电动机在正常情况和转子断条故障下的 A 相定子电流波形, 图 2、图 3 分别为电机正常状态和断条故障时的特征矢量图 1 定子电流信号波形 下载原图图 2 正常电机特征矢量 下载原图图 3 转子断条电机特征矢量 下载原图3 随机森林算法随机森林 (以下简称 RF) 算法[12]结合了 Breimans 的“Boot Strap Aggregating”思想和 H.O.的“random subspace”方法[13]。
该方法的实质是一个分类器群, 即包含了多棵决策树的分类器, 所有决策树随机形成, 从而形成 RF, 森林中的树之间没有关联诊断时, 将测试数据输入 RF, 然后让每一棵决策树独自进行诊断分类, 即“投票”, 最后综合投票结果, 将所有决策树中分类结果最多的那类为最终结果RF 的步骤如下[14] (设样本的特征值个数为M, 且 0
图 4 为该文所提方法的整个流程图图 4 转子断条故障诊断方案 下载原图4 实例验证实验电机为一台 Y132M-4 型感应电机, 其主要技术参数如表 1 所示表 1 实验电机主要技术参数 下载原表 选取具有代表性的正常电机 (故障类别为 0) 和断条故障 (故障类别为 1) 的三相电流数据各 150 组, 按照上述的方法提取特征矢量, 组成训练数据集, 创建RF另外再选取 40 组正常电机和 30 组断条故障电机三相电流数据, 提取特征矢量, 作为测试数据集其中, 30 组断条故障电机数据为转子断条 1 根情况下, 分别以电机轻载、半载和满载时, 在不同时间节点各取 10 组数据, 然后提取特征矢量组成测试数据由于电机在轻载、半载和满载时特征频率 2sf1和 4sf1均在 0~20 Hz 频段以内, 故电机在额定负载转矩以内运行时不会影响特征矢量的提取, 本文的方法有效图 5 为测试数据集的混淆矩阵图 5 混淆矩阵 下载原图由图 5 可以看出, 在测试集的 70 个样本中, 一共有 3 个样本被判断错误 (1 个正常状态被错判为故障状态, 2 个故障状态被错判为正常状态) , 总的正确率为 95.7%。
当训练样本增加的时候, RF 的正确识别率还有一定的提高这表明RF 用于异步电动机断条故障诊断具有良好的性能另外, 为了便于比较, 本文同时采用相同的数据集训练 BP 神经网络, 形成故障诊断模型神经网络输入层节点数为 20, 隐含层节点数为 10, 输出层节点数为2训练中, 学习率设为 0.05, 目标误差为 0.000 04将测试数据集输入创建的 BP 神经网络, 其结果如表 2 所示表 2 不同识别方法的性能比较 下载原表 表 2 结果说明:与 BP 神经网络相比, RF 具有更高的正确识别率, 且缩短了训练和分类时间, 为电机故障诊断提供可能, 因而具有更好的实用价值和市场前景5 RF 算法性能分析RF 中决策树的棵数对算法的泛化能力具有较大影响, 因此合理确定树的棵数对故障识别的准确率至关重要为了分析决策树棵数对算法性能的影响, 作如下处理:确定决策树棵数以后, 创建 100 个 RF 模型, 取所有森林准确率的平均值作为当前决策树棵数下的分类准确率, 从而降低了随机性的影响图 6 为不同决策树棵数对电机故障正确识别率的影响由图 6 易知, 当 RF 所含决策树数目在 100 左右时算法性能最佳, 且此时也有利于缩短程序运行时间, 为异步电动机断条故障的诊断提供可能。
图 6 决策树棵数对算法性能的影响 下载原图6 结语本文首先利用 Park 矢量模平方函数方法使异步电动机转子断条故障特征频率远离基频, 便于故障特征量的凸显及准确提取然后再利用 RF 自动识别电机断条与否RF 因为包含了多棵决策树, 不仅增加了其泛化能力, 也进一步提高了故障识别的准确率同时, RF 算法简单, 在训练过程中无需耗费大量时间用于参数搜索和优化, 降低了计算量与传统的 BP 神经网络、支持向量机等方法相比。