工控网首页
>

应用设计

>

基于粗糙集与神经网络的故障诊断研究

基于粗糙集与神经网络的故障诊断研究

2008/1/2 15:41:00


摘要: 本文通过引入粗糙集理论,利用可辨识矩阵约简算法对故障诊断决策表进行属性约简,剔除其中不必要的属性,然后构造改进的BP 神经网络作为粗糙集的后端处理机,构造了基于粗糙集与神经网络的故障诊断模型。仿真结果表明,该方法可以有效地减少输入层个数,简化神经网络结构,减少网络的训练时间,在故障诊断中有良好的应用景。
关键词:故障诊断;神经网络;粗糙集;属性约简
文献标识码 A 中图分类号 TP391
Study on fault diagnosi based on rough set and neural network
Abstract : This paper introducs rough sets theory .And rough sets theory isused to eliminate unnessary attributes from the decision table.then make improvement BP network as the back processor of rough set ,and a fault diagnosis model based on rough set and neural network. The result of emluator indicats that this method can reduce the needed training samples and simply the neural network structure and shortened the training time of the network. It is estimated that the optimized strategymay be further applied in fault diagnoses.
Keywords: Fault diagnosis;Neural network;Rough set;attribute reduction

1 引言
       自20 世纪80 年代以来,智能故障诊断被认为是诊断技术的重要发展方向。传统的故障诊断方法是建
立在系统的数学模型基础上的,数学模型依赖于被诊断系统的结构,而很多故障会造成系统结构的变化。
神经网络技术具有自学习、非线性模式识别、联想记忆及推测的能力、良好的容错性和扩展性,因此在故
障诊断中得到广泛应用。诊断问题的实质是一种映射,神经网络的输入节点对应着故障征兆,输出节点对
应着故障类型[1]。故障的模式分类就是根据给定的一组征兆,实现征兆到故障集之间的非线性映射的过程。
但神经网络不能确定哪些输入特征是冗余的,哪些又是有用的,不能将输入信息空间维数简化,因而
当输入信息空间维数较大时,训练时间过于漫长的固有缺点成为制约神经网络实用化的因素之一。而粗糙
集理论是基于不可分辨关系的思想,具有很强的定性分析能力,不需要预先给定某些特征或属性的数量描
述,能在保留关键信息的前提下对数据进行约简,去除冗余属性和冗余样本,压缩信息空间维数,精简知
识系统[2] [3]。因此将神经网络方法和粗集方法相融合,用粗集方法约简信息表达空间,去掉冗余信息,使
训练集简化,以减小神经网络结构的复杂性,从而减少训练时间。

2 粗糙集理论的基本知识
       粗糙集理论是一种研究不精确、不确定性知识的工具,由波兰数学家Z.Pawlak 在1982 年首先提出[2]。
粗糙集理论作为一种处理不完备信息的有力工具,不需要预先给定某些特征或属性的数量描述,而是直接
从给定问题的描述集合出发,找出该问题的内在规律。其主要思想是,在保持信息系统分类能力不变的前
提下,通过属性约简,提取问题的决策或分类规则。目前,粗糙集理论已经广泛应用于机器学习与知识发
现、故障诊断、控制算法获取、数据挖掘等各种应用领域,并且,已经取得了很大的成功[3]。
设U 是一个论域, R 是U 上的一个等价关系。U / R 表示R 在U 上导出的所有等价类; R [x] 表示包
含元素x 的R 的等价类,x ∈U 。设P 是U 上的一个等价关系族,如果Q ⊆ P ,且Q ≠ φ ,则∩Q (Q的
所有等价关系的交)也是一个等价关系,记作IND(Q) 。
      粗糙集理论中的知识表达方式一般采用信息系统形式,它可以表示为四元有序组S = (U, A,V, f ) ,
其中U 为论域, A 为属性集, V 是属性集的值域, f :U × A → V 为信息函数。如果属性集
A = C ∪ D,C ∩ D = φ ,C 称为条件属性,D称为决策属性。具有条件属性和决策属性的知识表示系统
称为决策表。


3 基于粗糙集与神经网络的的故障诊断模型
3.1 建立故障诊断模型的步骤[5]
(1)数据预处理:粗糙集方法处理的对象是离散数据,不能直接处理连续属性,而实际应用中所采
集的故障特征大多为连续属性,因此连续属性的离散化成为预处理中的主要问题之一。通过离散化,可以
有效地减少数据表的大小,提高发现知识的有效性。连续属性离散化结果的好坏对故障决策的分类也会产
生较大的影响。一般来讲,连续数据的离散化应尽可能满足以下两点:①连续属性离散化后的空间维数应
尽可能小,也就是经过离散化后的每一个属性都应包含尽量少的属性值的种类;②连续属性值离散化处理
后丢失的信息应尽量少。
(2)数据压缩:即在决策表中,将信息相同的对象及其信息删除,只留其中一个得到压缩后的决策
表。
(3)属性约简:属性约简的任务是在保留原始信息表分类能力的前提下,找到一个尽可能小的属性
子集。属性约简是数据约简的重要内容之一。通过属性约简可以得到原始数据的一个约简集,它比原始数
据少得多。
(4)构建神经网络:以最小条件属性集的并集作为输入层神经元,使得神经网络的输入端数量大减
少,减少信息表达的特征数量,简化神经网络结构,也减少后续使用过程中的特征值计算时间,提高了系
统的速度,实时性增强。
3.2 算例分析
表1 为柴油机缸套活塞磨损的样本数据,测取某型叉车柴油机缸体表面振动信号,对柴油机缸套活塞
磨损程度进行诊断。由于缸套活塞间的磨损是循序渐进的,故不可能对磨损状态定一个明显的界限,选择
有代表性的3 个状态进行分析即正常工作状态、轻微磨损状态及严重磨损状态。将时间一频率平面等分为
12 个区域[4],条件属性C={C1,C2,C3…C12}对应于这12 个时域局部能量特征参数,决策属性d={1,2,
3}对应于正常状态、轻微磨损状态和严重磨损状态。
表1 柴油机缸套活塞磨损的样本数据


       由于条件属性的取值为连续量,因此在利用粗糙集方法处理之前,需要先对各条件属性进行离散化处
理。我们的处理方法是:首先计算候选断点集,然后根据原始决策表构造临时信息表,运用启发式算法求
出结果断点集。候选断点集算法描述如下[6]:



结果断点集算法:
第一步:根据初始决策表构造临时信息表S*,令结果断点集Cut= Φ ;
第二步:计算S*中各列的1 的数目;
第三步:选择S*中1 的数目最大的一列,将该列所对应的断点加入Cut,并去掉表中该列所有的1 对
应的行及该列;
第四步:如果S*非空,转入第二步,否则算法结束,输出Cut。
根据上述离散化优化算法对表1 的样本数据进行离散化,离散化后的决策表如表2 所示。
表2 离散化处理后的决策表


      由于条件属性较多,每种属性只用3 类即可使数据表相容,因此可以采用如下的形式来表示输出:正
常状态: (0 0 1);轻微磨损状态: (0 1 0);严重磨损状态: (1 0 0)。
        根据可辨识矩阵约简算法对表2 进行约简。可辨识矩阵逻辑运算约简算法的主要思想是将可辨识矩阵
和逻辑运算结合起来,利用前者求出核属性,并研究矩阵中除核属性外的其他属性组合,同时,利用一些
简单的数学逻辑进行运算,该算法可以得到所有可能的属性约简结果。
约简算法描述如下:
1)根据离散化后的决策表得到可辨识矩阵;
2)找出矩阵中条件属性组合数为1 的元素项即核属性Core;
3)在可辨识矩阵中找出所有不包含核属性的属性集合s,即Q={Bi:Bi∩Core≠φ, i=1,2,…,s}, s=s-Q,其
中Q 为 包含核属性的属性集合,每个属性组合表示为Bi;
4)将属性组合s 表示为合取范式的形式,即P=∧(∨bik: (i=1,2,…, s; k=1,2,…,m )),其中bik,是每个属性组
合的元素。
5)将P 转化为析取范式形式并进行化简。
6)根据需要选择满意的属性组合,如需属性数最小,可直接选择析取式中属性数最少的组合。
        根据上述算法可知:可辨识矩阵中所有条件属性组合数为1 的属性均为决策表的核属性,可知表2 的
核属性为{C2,C3,C4,C11}。由于矩阵中没有不包含核属性的属性组合,所以原决策表的条件属性可约
简为{C2,C3,C4,C11}。
       然后构造神经网络作为粗糙集的后端处理机,采用引入动量项的改进的BP 神经网络。前馈神经网络
是神经网络模型中应用最广泛的网络之一,具有

投诉建议

提交

查看更多评论