大数据挖掘理论下的电气工程应用.doc

上传人:pu****.1 文档编号:551240269 上传时间:2022-09-08 格式:DOC 页数:6 大小:16.03KB
返回 下载 相关 举报
大数据挖掘理论下的电气工程应用.doc_第1页
第1页 / 共6页
大数据挖掘理论下的电气工程应用.doc_第2页
第2页 / 共6页
大数据挖掘理论下的电气工程应用.doc_第3页
第3页 / 共6页
大数据挖掘理论下的电气工程应用.doc_第4页
第4页 / 共6页
大数据挖掘理论下的电气工程应用.doc_第5页
第5页 / 共6页
点击查看更多>>
资源描述

《大数据挖掘理论下的电气工程应用.doc》由会员分享,可在线阅读,更多相关《大数据挖掘理论下的电气工程应用.doc(6页珍藏版)》请在金锄头文库上搜索。

1、大数据挖掘理论下的电气工程应用摘要:论文提出了一种基于大数据挖掘理论的电气项目故障分析办法。在该研究中,将全局信息引入电力系统中,主要采用大数据挖掘理论中的聚类分析技术,快速准确地检测出故障分量和故障区段,最终完成故障分析。将全局信息引入电气项目中,为电气项目故障分析开辟了新的应用领域。运用大数据挖掘从大型数据库信息中自动提取有效的、新颖的、潜在有用的信息,且大数据挖掘理论可为电机项目的研究做出重要奉献。关键词:故障分析;大数据挖掘;数据分类;电气项目;聚类分析1引言大数据挖掘是从大量数据中有效地发现有价值的、不明显的信息,这种波及从数据中提取信息的过程也是一种探索性数据分析1。大数据挖掘是从

2、存储在数据库、数据仓库或其他信息库中的大量数据中发现有趣的信息,如模式、关联、变化、异常和重要结构的过程2。大数据挖掘通常用于非常大的数据库,由于数据库的复杂性和容量庞大,使得它通常是不能被解读或分析。大数据挖掘的目的是从这些大型数据库中发现有用的信息,这种过程被称为数据库知识发现KnowledgeDiscoveryinDatabases,KDD3。大数据挖掘波及数据库技术、统计学、机器学习、高性能计算、模式辨认、神经网络、数据可视化、信息检索等多学科的技术集成45。大数据挖掘中的一个常见问题是查找数据属性之间的关联。大数据挖掘任务有下列类别68:分类描述;关联分析;聚类分析;孤立点分析;进化

3、分析。故障是指与察看到的变量或与设备相关联的计算参数在可接受范围内发生了偏离,即故障是一个过程异常或病症。总的来说,故障与设备或仪表的正常行为相背离。它们可能出现在根本设备或其控制仪器中,并代表着性能恶化、局部故障或全部故障。故障分析的目的是通过行为异常辨认系统来保证操作成功。由于适当的过程监控,使停机时间最小化,改善了操作的平安性,降低了制造本钱。一般来说,故障分析的过程可分为三个主要步骤9:报警、辨认、评估。电力系统是一个最复杂的人工系统,其平安、稳定、经济可靠运行,在社会经济的开展中起着非常重要的作用。为了解决电力系统故障分析这一难题,必须对电力系统本身及其复杂性不断提高分析、运行和控制

4、水平。当电力系统从正常运行状态到异常运行故障时,其电量可能发生显著变化。继电爱护器就是利用电力的忽然变化来判别电力系统是否发生故障或运行异常。通过对电力测量与正常系统参数的比照,可以检测出故障类型和故障位置。此外,还可以实现选择性故障排除。在本研究中,全局信息将被引入后备爱护系统中。在某些故障后,利用电源管理单元PhasorMeasurementUnit,PMU进行实时测量,并对电量变化的特征进行查找。然后对故障分量和故障区段进行快速准确的分析,最终完成故障隔离。基于统计理论,还将对非线性复杂系统进行大量的根底研究,采用大数据挖掘中的聚类分析技术解决电气项目中的故障检测问题。2电路原理考虑一个

5、带有电阻器R、电感器L和电容器(C)的电路。每一个元件在回路中连接电路,包含一个元件的电路局部称为支路。支路连接的点称为节点。在这个最简单的测试中,有三个分支和节点.令iR,iL和iC分别代表经过对应电阻R,电感器L和电容器C的电流,同样地,vR,vL和vC分别代表电路的三个支路上的电压。如果认为水是通过管道流动的,则电流就像水的流量一样,电压就像水的压力一样。基尔霍夫电流定律指出,流入一个节点的总电流必须等于从该节点流出的电流。这意味着在讨论的电路中电流关系为|iR|=|iL|=|iC|。按图1所示的方向定位分支,那么i=iR=iL=iC1基尔霍夫电压定律指出,所有回路电压降之和为零。那么v

6、R+vL+vC=02对于电路元件的性质和决定变量的规律研究中,电阻器是由电流iR和电压vR之间的关系确定。因此只考虑一个线性电阻,根据欧姆定律,可得vR=RiR3其中,R0为常数,vR和iR互为非线性函数关系。电感器的特点是电流对时间的导数diL/dt,对于电感器的电压vL,根据法拉第定律,可得LdiRdt=vL4其中,常数L0被称为电感。电感器是通过一个线圈制作构成,线圈中电流变化引起的磁场在线圈上产生电压降。电容器的特点是电压对时间的导数dvC/dt,对于电容器的电流iC为CdvCdt=iC5其中,常数C0被称为电容。3数据挖掘中的分类分类是大数据挖掘领域的经典课题之一10。聚类是将数据对

7、象分类成一组不相交类的过程,称为簇,因此类中的对象之间具有高度的相似性11。聚类是无监督分类的一个分支。“分类是指将数据对象分配给一组类的过程。“无监督意味着集群不依赖于预定义的类,而对数据对象进行分类12。聚类分析的应用包括下列三个方面13:1辨认原始数据中的簇;2确定原始数据中簇的个数;3验证原始数据中发现的簇。聚类分析具有很强的数据分析能力,已成功应用于各个领域的研究。若有n个样本,每个样本有m个指标,观测数据可以表示为ij(i=1nj=1m)。最常用的描述关系程度的测量是距离dij通常表示样本(i)和(j)之间的距离。常用的距离定义包括:1Minkovski距离:dij(q)=&eum

8、l;ûåt=1m|it-jtq1q62Lance距离14:dij(L)=1måt=1m|it-jt(it+jt)73马氏距离:dij(M)=(i)-(j)S-1(i)-(j)8其中,S-1是样本协方差矩阵的逆矩阵。4斜空间距离15:为了克服相对论的影响,我们可以定义斜空间的距离:dij=ëû1måk=1mål=1m(ik-jk)(il-jl)kl129其中,kl是(k)与(l)的相关系数。4基于数据挖掘的故障分析考虑IEEE-9总线系统,在电力网的结构中,总线1出现单相接地故障。通过BPA程序,相应变量的向量值只

9、在每个周期中输出一次。相应变量使用实际测量的数据,可以进行故障和非故障的元件分析故障和非故障段。4.1基于节点相电压的故障诊断在计算IEEE-9总线系统后,可以得到五个时刻T-1、T0故障、T1、T2和T3的节点相电压.整个聚类分析过程遵循从高到低从近到远的相似性原那么,顺序是:步骤1:总线C与总线B结合并形成新的总线B;步骤2:总线3与总线2结合并形成新的总线2;步骤3:总线A与总线2结合并形成新的总线2;步骤4:总线2与支路1结合并形成新的支路1;步骤5:支路3与支路2结合并形成新的支路2;步骤6:支路2与支路1结合并形成新的支路1;步骤7:总线B与总线1结合并形成新的总线1;步骤8:总线

10、1与支路1结合并形成新的支路1。总线1与其他总线有着显著的不同,其故障特征是明显的。这些结果与预先设定的故障位置完全相同,因此我们可以通过基于节点相电压的聚类分析来确定故障位置。4.2基于节点负序电压的故障诊断通过BPA程序,可以得到五个时刻T-1、T0故障、T1、T2和T3的节点负序电压.整个聚类分析过程仍然按照相似性原那么进行,从高到低从近到远的相似原那么,顺序是:步骤1:总线A与总线2结合并形成新的总线2;步骤2:总线3与总线2结合并形成新的总线2;步骤3:总线C与总线B结合并形成新的总线B;步骤4:总线2与支路1结合并形成新的支路1;步骤5:支路3与支路2结合并形成新的支路2;步骤6:

11、支路2与支路1结合并形成新的支路1;步骤7:总线B与总线1结合并形成新的总线1;步骤8:总线1与支路1结合并形成新的支路1。从整个聚类过程分析中,总线1与其他节点的相似性最低与其他节点的距离最远。总线1和其他总线的差别更明显。因此,利用基于节点负序电压的聚类分析也能有效地辨认出故障点。这些实例充沛证明了大数据挖掘理论可以对故障局部进行分析。5结语在电力系统的控制中,特别是在电力系统的广域后备爱护中,爱护装置的准确、快速、可靠性能的前提是相应的故障类型和故障位置可以快速辨认并准确定义。在本研究中,全局信息已经被引入到后备爱护系统中。基于大数据挖掘理论,主要利用聚类分析技术来寻找电量的显著变化特征

12、。然后,对故障部件和故障局部进行快速准确的辨认,最后完成故障分析。本文的主要技术奉献和创新在于将全局信息引入到电气项目中,为电气项目的故障分析开发新的应用。大数据挖掘被定义为从大型数据库中自动提取有效、新颖、潜在有用且全面的信息挖掘过程。它在学术和应用科学研究中得到了广泛的应用,在这些研究中,数据集是通过实验产生的。大数据挖掘理论的最重要特征是其跨学科性和普遍性。大数据挖掘在很大程度上与机器学习有关,在机器学习中,科学家开发算法和技术来发现和描述数据中的潜在规律。因此,大数据挖掘为信息处理、模式辨认和人工智能等许多领域提供了有用的技术。参考文献1王元卓,贾岩涛,刘大伟,等.基于开放网络知识的信

13、息检索与数据挖掘J.计算机研究与开展,2008,5202:456-474.2李涛,曾春秋,周武柏,等.大数据时代的数据挖掘从应用的角度看大数据挖掘J.大数据,2008,104:57-80.3赵建华.半监督学习在网络入侵分类中的应用研究J.计算机应用研究,2008,3106:1874-1876.4马昱欣,曹震东,陈为.可视化驱动的交互式数据挖掘办法综述J.计算机辅助设计与图形学学报,2008,2801:1-8.5梁吉业,钱宇华,李德玉,等.大数据挖掘的粒计算理论与办法J.中国科学:信息科学,2008,4511:1355-1369.6吉根林,赵斌.面向大数据的时空数据挖掘综述J.南京师大学报自然科

14、学版,2008,3701:1-7.7何清,庄福振,曾立,等,谭庆.PDMiner:基于云计算的并行分布式数据挖掘工具平台J.中国科学:信息科学,2008,4407:871-885.8贺瑶,王文庆,薛飞.基于云计算的海量数据挖掘研究J.计算机技术与开展,2008,2302:69-72.9许侃,范春菊.不同电压等级局部耦合线路的单回线故障分析J.电力系统自动化,2008,3912:81-87.10陈新.数据挖掘分类办法中的决策树算法探究J.电脑知识与技术,2008,935:7904-7905,7910.11邓曦辉.软件项目领域中的异常数据挖掘算法J.电子技术与软件项目,200824:188.12王

15、竞哲.基于聚类分析的数据挖掘算法研究J.信息化建设,200806:36.13李昀昊,王建学,王秀丽.基于混合聚类分析的电力系统网损评估办法J.电力系统自动化,2008,4001:60-65.14LiJunguo,ZengYanan,Wang,Jianqiang.SimulationofFlowFieldofOxygenLanceGasJetUtilizedfor50tCon⁃verterJ.JournalofIronandSteelResearchInterna⁃tional,2008,1804:11-18.15GenChao,LiuJie,XiKai,etal.MonteCarloevaluationofspatialmultiple-bitup

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 大杂烩/其它

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号