刘曼兰1,2,崔淑梅3,郭斌2
(1哈尔滨工业大学机电工程学院,哈尔滨150001;2哈尔滨工业大学材料科学与工程学院,哈尔滨150001;
3哈尔滨工业大学电气工程学院,哈尔滨150001)
摘要:构建了两种基于BP神经网络和支持向量机的的永磁卣流电机故障模式识别分类器,并对废两种模式识别分类器在永磁自流电机故障诊断中的应用进行了实验研究与理论分析。研究结果表明:于支持向量机的永磁直流电机故障模式识别方法在小样本情况下的诊断正确率高于基于BP神经网络,****能达到94.6667%,且小存在局部极小值问题和过学习问题。
0引 言
小功率永磁直流电机因其具有结构简单、运行可靠、体积小、重量轻、效率高等优点,被广泛地应用于汽车工业以及航空、航灭领域。为了这些电机的安全运行,非常有必要实现永磁直流电机故障在线监测与智能诊断。故障模式识别是实现故障在线监测与智能诊断的关键环节。专家系统在故障诊断领域实现了基于人类专家经验知识的故障模式智能识别技术。但由于永磁直流电机是一个比较复杂的对象,它的故障特征参数具有一定的分散性、随机性和模糊性:同一电机同种故障不同故障程度时的故障特征参数大小可能不一致;同一电机同种故障程度在不同负载状态下的故障特征参数大小电会不一致[1-2]。因此获取完备、有效的诊断知识非常困难。知识获取已经成为建造永磁直流电机故障模式识别系统模型的“瓶颈”问题。知识的自动获取更是其难点。机器学习是解决永磁直流电机故障模式识别知识获取问题的有效途径。
目前应用较为广泛的基于机器学习的故障模式识删算法主要确人T神经网络算法和支持向量算法。
而基于误差反向传播的BP(Error Back—PropagationAlgorithm)神经网络算法是目前应用最为广泛、最为成熟的神经网络学习算法,可以实现任意M维输入空间到N维输出空间的非线性映射,解决模式识别和分类问题的能力较强。据统计,有近90%的神经网络应用是基于BP算法的[3]
1 基于BP的永磁直流电机故障模式识别研究
本文以永磁直流电机的其中3种故障类型(电刷磨损、元件开路、匝间短路)的故障样本为例来研究基于BP的永磁直流电机故障模式识别方法的识别性能。电机的故障特征参数是一五维特征向量T=[△fΔiav△istd△imΔk][4]。故对于本文所研究的问题,就是将五维欧式空问****分割为3个决策区域的问题。构建一单隐层BP网络,规定输入层设置五个神经元(与输入特征维数同),输出层为3个神经元(与输出类别数同)。BP网络隐节点的个数没有固定标准,与训练样本个数、输入输出神经元个数都有关。当训练样本数据一定时,隐层神经元数目可以在参考如下经验公式的基础上,通过反复凑试,找到比较合适的隐层神经元数目[5]。
式中,n为输入神经元数;m为输出神经元数;a为1~10的整数。经过反复实验研究,对于本文的三类永磁直流电机故障样本(60个训练样本和300个测试样本),****隐层神经元个数为6。
1.1 基于BP的故障识别结果稳定性研究
随机抽取文献[6]中提取的电刷磨损、元件开路、匝问短路三种故障样本中的其中各20个作为训练样本集,各100个作为测试样本集。在如下表1所示的同样的BP网络参数和样本参数的前提下,重复运行基于BP的永磁直流电机的故障模式识别程序5次的识别结果如下表1所示。
表1实验数据表明:在BP网络结构,样本参数都相同的情况下,程序运行五次得到的训练和测试结果各不相同。在第一次实验中陷入了局部极小值,训练误差性能曲线出现图l中(a)的情况,误差性能曲线多次迭代居高不下,最终因为多次迭代梯度无变化而中止训练,而第二次记录中,训练误差性能曲线出现图1中(b)的情况,性能曲线迅速下降到目标值,训练精度达到了100%的精度,但其测试精度较第三、四次的都差,说明出现了过学习现象。第三次训练过程巾的误差变化曲线如下图1中(c)所示,此次训练误差虽然不如第二次和第五次的,但测试误差相对其他几次都要高。第四、五次训练中也出现了一定程度的过学习现象。另外,训练时间波动较大,但测试时间比较稳定。
这是由于永磁直流电机的故障样本为五维向量,而Bp网络采用梯度算法,梯度法是一种局部寻优方法,其解最终收敛于局部极值点,而在多维空间中可能存在众多的局部极值点,局部极值点之间有很大的差异,因此BP神经网络的解必然呈现出一定的随机性。另一方面,由于网络的参数由迭代算法最终取优,即开始网络的连接权重及域值的赋值是随机产生的,故即使参数设置相同的网络,在相同输入的情况下,每次训练得到的输冉结果都不同;所 以以下文中所有BP实验结果都为五组相同参数的网络输出的平均值.
1.2样本数目对BP神经网络故障识别性能的影响
在小样本前提下,随机抽取文献[3]提取的电刷磨损、元件开路、匝间短路三种故障样本中的各l00个,共300个样本作为测试样本集[6],进行训练样本数分别为15、30、45、60和75的实验,研究训练样本数目对BP神经网络分类性能的影响。此处所说训练样本数为样本总数,例如30个训练样本即表示其中有电刷磨损、电枢元件开路和电枢绕组短路三种状态的训练样本,每种状态的样本数均为10个。以后全文巾所有有关的叙述均遵从此约定,不再赘述。下表2所示样本数目对BP神经网络分类性能的影响。
由表2可以看出,随着训练样本比例(训练样本比例=训练样本总数/测试数据总数)的增大,BP神经网络的故障诊断错误率呈下降趋势;随着训练样本比例的增大,训练时间呈增加趋势,而且增加速度很快;随着训练样本比例的增大,过学习问题得到缓解,但并没有完全消除。
这是由于神经网络寻优目标是基于经验风险最小化,经验风险最小化原则总是把注意力集中在如何使经验风险更小。但实验数据表明:一味追求训练误差小并不是总能达到好的预测效果。当训练误差过小反而会导致推广能力的下降,这就是过学习问题。
2基于SVM的永磁直流电机故障模式识别研究
由sVM优化问题的数学模型可知,影响基于sVM模式识别算法识别结果的主要因素包括:sVM的结构参数(包括它的误差惩罚参数A、核函数形式以及相应的核函数的内部参数)和训练样本数目、…。
2.1样本数目对故障识别性能的影响
下文将研究训练样本数目对永磁直流电机故障模式识别的影响。为r对比,基于sVM的永磁直流电机故障模式识别方法实验研究中所用训练样本和测试样本与前基于BP的永磁直流电机故障模式识别方法中的完全相同。
由表3可以看出,随着训练样本比例(训练样本比例=训练样本总数/测试数据总数)的增大,sVM的诊断精度成升高趋势;但变化不明显。随着训练样本比例的增大,训练时间呈增加趋势,但增加速度很慢。
这是由于svM寻优目标是结构风险最小化,而结构风险最小化原则下分类器的实际风险是由训练样本的经验风险和置信范围两部分组成的,而且结构风险最小化原则是要同时最小化经验风险和置信范围,从而达到期望风险最小的目的,冈此在小样本情况下也具有良好的分类性能。
2.2核函数参数对故障识别性能的影响
取A=50,实验研究核函数的内部参数r对基于svM的永磁直流电机故障模式识别性能的影响。如下表4所示。
实验结果表明:随着参数r的增大,训练精度逐渐增大,训练精度最后能达到100%;而测试精度却有先增后减的过程,即当r较大时,反而使测试精度降低;而训练时间也受空间的复杂度的影响,存在一定的波动,但都在很小的范围内。v=O.5时其故障识别精度****。
2.3误差惩罚参数对故障识别性能的影响
取定r=O.5,实验研究惩罚因子A对永磁直流电机故障模式识别性能的影响,识别的各项性能指标如表5所示。
实验结果表明:随着λ值的增大,训练误差减小,一直减小到训练误差为零时则趋于稳定,测试误差首先随着λ值的增大而减小,但到达一定之后,又逐渐减小。但总的来说,误差惩罚参数对sVM分类性能的影响波动范嗣不大。这也验证了svM的结构稳定性。训练时间和测试时间基本稳定。
原因分析:惩罚因子λ在确定的特征子空问巾起到调节学习机器置信范围和经验风险的比例的作用,以使学习机器的推广能力****。λ可以控制sVM的泛化性能和错分率之间的折衷。它的选取一般由具体的问题而定,并取决于数据中噪声的数量。
在确定的特征子空间巾,λ的取值小表示对经验误差的惩罚小,学习机器的复杂度小而经验风险值较大;如果λ取∞,则所有的约束条件都必须满足,这意味着训练样本必须要准确地分类。每个特征子空问至少存在一个合适的λ,使得sVM推广能力****。当λ超过一一定值时,sVM的复杂度达到了特征子空问允许的****值,此时经验风险和推广能力几乎不再变化。
3结论
(1)基于BP神经网络的永磁直流电机故障模式分类器的解呈现出一定的随机性,且存在陷入局部极小值问题。该方法在小样本问题巾存在严重的过学习现象。
(2)基于支持向量机的永磁直流电机故障模式识别方法在小样本情况下的诊断正确率都是随着训练数据量占测试数据量比例的增加而增加,且****能达到94.6667%,高于同样情况下的基于BP算法的****精度90.6790%,不存在局部极小值问题和过学习问题。
(3)永磁直流电机尤其航空航天应用领域中的电机不可能带故障艮期运行,故难以获得大景典型故障样本,从而产生训练样本数量有限(即小样本)的限制。因此相比较而言,支持向量机方法更适合永磁直流电机的故障在线监测与诊断。 |