基于卷积神经网络的领域适配模型的多工况迁移的轴承故障诊断

上传人:杨*** 文档编号:474980937 上传时间:2024-05-02 格式:DOCX 页数:16 大小:32.75KB
返回 下载 相关 举报
基于卷积神经网络的领域适配模型的多工况迁移的轴承故障诊断_第1页
第1页 / 共16页
基于卷积神经网络的领域适配模型的多工况迁移的轴承故障诊断_第2页
第2页 / 共16页
基于卷积神经网络的领域适配模型的多工况迁移的轴承故障诊断_第3页
第3页 / 共16页
基于卷积神经网络的领域适配模型的多工况迁移的轴承故障诊断_第4页
第4页 / 共16页
基于卷积神经网络的领域适配模型的多工况迁移的轴承故障诊断_第5页
第5页 / 共16页
点击查看更多>>
资源描述

《基于卷积神经网络的领域适配模型的多工况迁移的轴承故障诊断》由会员分享,可在线阅读,更多相关《基于卷积神经网络的领域适配模型的多工况迁移的轴承故障诊断(16页珍藏版)》请在金锄头文库上搜索。

1、 基于卷积神经网络的领域适配模型的多工况迁移的轴承故障诊断 钱思宇, 秦东晨, 陈江义, 袁 峰 (郑州大学 机械与动力工程学院,郑州 450001)滚动轴承是旋转机械中常用的零部件之一。绝大多数机电驱动系统和电机故障是由滚动轴承损坏引起的,这可能导致设备停机造成经济损失或者造成严重的安全事故。因此滚动轴承故障检测变得尤为重要。轴承振动信号复杂,且轴承在不同运转工况下,相同故障会采集到不同的振动信号。近几年,深度学习方法大量应用于轴承故障诊断领域,然而单一样本(源域)训练出来的模型,只能对源域的数据做出良好判定,很难在其他数据领域也做出良好的故障判定,模型无法在其他工作环境运行。Lu等1提出了

2、基于神经网络的领域自适应故障诊断。Pan等2提出通过最小化MMD(maximum mean discrepancy)来找出领域共享特征技术。Long等3设计一个子空间学习框架,整合MMD到深度神经网络。Wang等4使用多种变负载工况信号作为卷积模型输入,训练过程中利用领域鉴别器进行权重调整,实现了变负载环境下的轴承故障诊断。Wen等5使用稀疏自动编码器结合MMD,提出DTL(deep transfer learning)模型应用于故障诊断。领域迁移在很多领域可用找到应用,但在故障诊断的工况迁移自适应研究很少。针对上面的问题,提出一种适应于工况迁移的卷积迁移模型。其特点:实现从端到端的轴承故障诊

3、断模式,完全不需要对数据进行相关信号处理;模型相较于其他的模型结构简单,参数规模小,易于训练;模型在不同工况迁移环境下表现出极好的诊断性能。1 领域自适应领域自适应方法6的实施流程是提供源域有标签样本和少量目标域无标签样本进行训练,生成源域分类损失和域自适应损失进行模型学习。领域自适应中的数据领域分为两类:源域Ds(xs,ys),服从数据分布p;目标域Dt(xt),服从数据分布q。其中:x为域样本;y为域样本标签;s下标表示源域,t下标表示目标域。其原理:使用领域自适应中评估源域和目标域的数据分布偏移程度的相关方法,计算两个领域的特征数据分布的“偏移量”,作为模型损失函数的一部分,反向调整网络

4、权重,进而不断减小偏移量,目标域的特征数据分布不断逼近源域,最终模型能够正确识别目标域样本的类别。本文的领域自适应分为两步:全领域自适应;类别领域自适应。1.1 全领域自适应源域样本与目标域样本间存在数据分布偏移,通过全领域自适应,将源域和目标域的数据分布进行整体对齐(将两个域的数据映射到相同的特征空间),使模型一定程度将源域学习到的知识迁移至目标域,提高模型泛化能力。全领域迁移如图1所示。图1 全领域迁移的示意图Fig.1 Schematic diagram of whole domain migration经过全领域自适应后的模型并不能完全解决目标域样本如何实现正确分类这一问题,因为源域和

5、目标域中相同类别的样本会不同程度分布在不同的子类别领域中,模型仍旧会对部分目标域样本做出虚假判定。本文的解决方法:在全域自适应后再引入类别域自适应,进一步对全域中的子类别领域进行领域自适应。1.2 类别领域自适应类别领域自适应将全域自适应得到的领域进行域细化,即进行各类别子域对齐,在对齐过程中,源域样本有真实标签,而目标域样本为目标工况的轴承振动数据,并没有真实标签,故利用模型的源域样本分类器(属于有监督学习)对目标域样本进行标签预测,再进行类别领域自适应(属于半监督学习)。类别领域迁移示意图,如图2所示。图2 类别领域迁移示意图Fig.2 Schematic diagram of class

6、es domain migration1.3 领域分布距离目前迁移学习,尤其是域适应中,主要使用MMD来度量两个不同但相关的分布(p,q)的距离。两个分布的距离dH(p,q)定义为式(1)(1)式中:H为这个距离是由映射函数()将数据映射到再生核希尔伯特空间(reproducing kernel Hilbert space, RKHS)中进行度量的;xs为源域数据;xt为目标域数据;E为取平均值。(2)式中:ns为源域样本数量;nt为目标域样本数量,后续公式中含义一致。(3)(4)(5)(6)(7)(8)(9)2 网络模型细节2.1 主要网络结构模型使用卷积网络提取振动信号中的故障特征,由于振

7、动数据为一维时序数据,而深度学习中的一维卷积层多用于时序数据、文本数据的特征提取,很适用于本文中的振动时间序列数据。本文使用RELU函数作为卷积层后的激活函数,因其具有:求导简单,激活后的数据具有稀疏性,可一定程度减少网络过拟合等优点。本文的模型涉及领域迁移,根据自适应批标准化8的表述:模型训练时,使用每个批次样本的均值和方差进行标准化,而在模型验证测试阶段,使用验证样本集、测试样本集的均值和方差,这有利于模型进行迁移任务,故本文的模型在每个卷积层后,添加自适应批标准化层。深度学习中的注意力机制9核心目标是从众多信息中选择出对当前任务目标更关键的信息。目前常使用的机制类型有3种:通道注意力、空

8、间注意力、细粒度多特征融合。本文将通道注意力引入故障诊断任务中,提高模型的鲁棒性。算法流程,如图3所示。图3 通道注意力机制Fig.3 Channel attention mechanism2.2 模型损失函数2.2.1 交叉熵损失函数交叉熵损失函数又名分类损失函数,是分类问题中常用的一种损失函数,用于评估预测类别标签与真实类别标签之间的差异程度。其具体表达式(10)2.2.2 领域适配损失函数在工况迁移领域,域适配损失函数也就是在1.3中式(8)和式(9)提到的领域分布距离(11)(12)2.2.3 模型总损失函数根据式(10)、式(11)和式(12),可以得到模型的总损失函数losstot

9、al=lossJ+1lossWDA+2lossCDA(13)式中,参数1,2用来权衡全域适配损失和类别域适配损失在模型总损失中所占的权重。2.3 模型细节配置2.3.1 模型结构工况迁移模型CNN-DA由特征提取层、分类层、领域自适应模块等构成,具体算法流程如图4所示。图4 工况迁移模型流程图Fig.4 Flow chart of working condition migration model源域信号经过模型特征提取层得到低维特征,再经过线性层降维,得到低维特征,将低维特征输入分类层获取预测标签,并与真实标签比对计算出分类损失;同时,目标域信号共享源域的特征提取层,也得到低维特征,将源域与

10、目标域的低维特征输入进全域自适应模块,计算出全域适应损失;目标域的低维特征再经过共享线性层得到低维特征,再通过共享的分类层获取预测标签,类别域自适应模块利用源域低维特征、源域真实标签、目标域低维特征和目标域预测标签,计算得出类别域适应损失。模型的三类损失(分类损失、全域适应损失、类别域适应损失)在每个训练步数同步计算,加权求和为模型总损失,并进行反向梯度优化模型网络层权重。2.3.2 模型细节在模型数据输入端,加入随机采样层,能够让网络提取的故障特征更具鲁棒性。网络模型中,除了提取振动信号中高层特征的一维卷积神经网络层外,还添加通道注意力模块,分别加入到卷积模块的首尾两层,用于为特征通道分配不

11、同的权重,以增大有效特征在总特征域的占比,减少无效特征的干扰。模型中的卷积第一层使用宽卷积核提取原始信号的特征,目的在于增大卷积核感受野,相当于信号领域中:较少丢失信号频域分辨率的前提下提高信号的时域分辨率。3 试验测试本章中,基于Python-Pytorch搭建深度学习模型,在不同类型的数据集振动信号上进行5次训练和测试,对最终测试结果取平均值,并与其他模型进行性能对比,验证本文提出的卷积神经网络的领域适配模型(convolutional neural network-domain adaptation, CNN-DA)模型的工况迁移能力。3.1 数据集来源3.1.1 CW-Artifici

12、al数据集本数据集来自凯斯西储大学10(Case Western Reserve University,CWRU)滚动轴承人工损伤数据集。CWRU轴承数据采集系统,如图5所示。本测试选取驱动端轴承作为试验对象,型号为SKF6205,属于深沟球轴承,振动信号的采样频率为48 kHz,故障缺陷由电火花单点加工,加工位置为轴承内圈、轴承外圈、滚动体;根据不同的加工直径,分为0.18 mm,0.36 mm,0.53 mm可以造成9种不同的故障缺陷,再结合轴承健康运转状况,构成10种故障类别。图5 CWRU轴承系统平台Fig.5 CWRU bearing system platform轴承运转工况分为7

13、35 W,1 470 W,2 205 W(负载),工况迁移实验使用735 W,1 470 W,2 205W工况两两组合成6个迁移进行模型训练。由于轴承的运转工况只有负载的变化,不涉及轴承转速、轴承径向载荷等工况变量,故CW-Artificial数据集属于简单工况迁移数据集。本文不对数据进行任何预处理,实现端输入,数据长度为1 600(轴承旋转一周的采样点数),数据采取半周期重叠采样,以扩充数据量。数据集中分为训练集(用于训练模型)、验证集(用于调整模型参数)、测试集(用于验证模型性能)。具体数据集构成如表1所示。表1 CW-Artificial数据集工况迁移数据集:源域(A)目标域(B),代表

14、模型从工况A迁移至工况B。具体工况迁移配置如表2所示。表2 CW-Artificial工况迁移3.1.2 PB-Artificial数据集本数据集来自帕德博恩大学11(Paderborn University, PB)滚动轴承人工损伤数据集。PB轴承数据采集系统,如图6所示,试验台由电机、扭矩测量轴、滚动轴承测试模块、飞轮和负载电机组成。本测试选取轴承IBU6203作为试验轴承,振动信号的采样频率64 kHz,故障缺陷由电动雕刻机单点加工,加工位置为轴承内圈、轴承外圈;根据不同的加工长度(14 mm),分为损伤等级1、损伤等级2,造成4种不同的故障缺陷,再结合轴承健康运转状况,构成5种故障类别

15、。轴承运转工况分为N15M07F10,N09M07F10,N15M01F10,N15M07F04,使用4种工况两两组合成12个工况迁移类别进行模型训练。由于轴承的运转工况有负载变化、转速变化、径向载荷变化,工况变量较多,故PB-Artificial数据集属于复杂工况迁移数据集。数据采样长度规则与CW-Artificial数据集一致(即轴承运转一周的采样点数),故采样数据长度为2 560,其他设置也完全一致。数据集具体构成,如表3所示。工况迁移领域说明,如表4所示,A为源域,B为目标域。1.电机; 2.扭矩测量轴; 3.滚动轴承测试模块; 4.飞轮; 5.负载电机。图6 PB滚动轴承状态监测试验台Fig.6 PB rolling bearing condition monitoring test bench表3 PB-Artificial数据集表4 PB-Artificial工况迁移3.1.3 PB-Reality数据集本数据集来自帕德博恩大学11滚动轴承加速寿命试验损伤数据集。加速寿命试验台,如图7所示。由一个轴承箱和一个电机组成,电机为主轴提供动力。轴承箱中有4个IBU/MTK/FAG6203型试验轴承,测试轴承在弹簧螺旋机构施加的径向载荷下旋转,所施加的径向力高于轴承在正常工作下的径

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 研究报告 > 信息产业

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号