摘要:该文针对永磁直流电机故障在线诊断中存在类样本数目不平衡、误判损失不等、在线样本数据缺少类别标识等问题,通过对支持向量机数学模型中的误差惩罚因子进行加权,构建了一种基于加权支持向量机的永磁直流电机故障模式识别算法。理论分析和实验结果表明:该算法可以提高小样本类(故障样本类)诊断精度,降低误判损失。
关键词:永磁直流电机;类加权支持向量机:模式识别;故障诊断
0引 言
在对永磁直流电机的故障模式识别方法的研究巾,提高它的诊断精度、降低误判损失是改进现有永磁直流电机的故障模式识别方法的重要研究方向。
永磁直流电机故障在线诊断存在如下问题:由于诊断对象不可能长期带故障运行,导致故障样本难得,所以故障样本数比正常样本数要小很多,存在类样本数不平衡问题;而且对于电机故障在线诊断,尤其是航空航灭应用领域中的永磁直流电机,如果把正常状态诊断为故障状态,就可能会进行一些不必要的维修,造成一定的损失;但如果把真正的故障状态诊断为正常状态,则会延误维修工作而造成设备的损坏和人身伤亡,造成不可挽回的损失,即存在误判损失不等问题。也就是说,本文的电机故障诊断中,既存在类样本数不平衡问题,义要求小样本类具有较高的分类精度。而基于支持向量机的模式识别方法在样本类大小均衡的前提下,相对于两类误判而言是等概率而非等风险的,要达到等风险,必须提高小样本类(故障样本类)诊断精度。这是基于支持向量机的永磁直流电机故障模式识别方法没法解决的问题。
本文通过分析支持向量机数学模型中的各个可控参数所代表的物理意义,根据本文特定的应用需要,通过修整支持向量机通用模型中的不同参数,可以得到不同的改进支持向量机方法。本文通过对svM算法数学模型中的误差惩罚因子进行加权修正,米提高永磁直流电机故障模式识别中的小样本的故障类分类精度,解决了上述提到的永磁支流电机故障在线诊断应用的中类样本不平衡问题及误判损失不等问题。
1 基于SVM的模式识别方法性能分析
假定大小为l的训练样本集{(xi,yi),i=1,2,…,l},由二类别组成,如果xi∈Rn,属于第1类,则对应的yi标记为正(yi=1),如果xi∈R属于第2类,则对应的yi标记为负(yi=一1)。由非线性svM的数学模型,有这时xi位于所属类一侧的间隔面I二或者间隔带内或者间隔带外其所属类的相对类一侧,下图1给出了svM中a取不同值对应的不同分布区域示意图。
分析式(1)和(2),得出:
1)如果哦=0,则ξi=0.7这时xi被正确分类。
2)如果0<α1<λ,则有yi(ωφ(X1)+b)一1+ξi=0和ξ=O。这时xi处在所属类一侧的间隔面上,被称为边界上(In_hound)支持向量。
3)如果d,=A,则有yi(ωφ(xi)+b)一1+ξi=0和ξi≥0,这时如果0≤ξi≤l,xi处在超平面和所属类一侧的间隔而之问,被正确分类;如果ξi>l,xi被分到超平面的另一侧;边界支持向量(B0und sup—port vectors)是指ξ>O的样本。边界支持向量的比例反映了分类的错误率。
假设NBSV+和NBSN分别代表正类和负类中边界支持向量的个数,NSV+和NSN分别代表正类和负类巾所有支持向量的个数,m+和m分别代表正类和负类巾的样本数。根据svM的数学模型,有:
(1)如果m+=m_,则正类和负类巾边界支持向量比例的上界和支持向量比例的上界相等。
(2)如果m+>m_,正类中的边界支持向量比例的上界小于负类中的边界支持向量的上界。
(3)如果m。
上述结论意味着如果两个样本类的大小不‘样,小样本类中的样本被错分的比例比大样本类中的样本被错分的比例大。这种偏差行为表明基于通用svM的模式识别方法不太适合永磁南流电机故障模式识别问题。
2类加权sVM算法及其类别补偿能力的分析
类加权svM算法的优化问题数学模型可描述为7:
在加权sVM算法巾,通过给不同类别的样本设置一定比例关系的权值就可有效地补偿类别大小差异对分类的影响。例如在两种类别的情况下,正类由式(32)和式(33)并结合式(15)可知:
1)类权重的变化将影响分类超平面的走向、位置和类间隔的变化。
2)某类权重的增加将导致该类中边界支持向量比例和支持向量的比例下降,因此将提高训练时该类的分类准确率,同时将降低其相对类的分类精度。
本文以上推导为理论依据对sVM算法数学模型中的误差惩罚因子进行加权修正,来提高永磁直流电机故障模式识别中的小样本故障样本类的分类精度,解决了工程应用中故障样本比正常样本少的类样本不平衡问题和误判损失不等问题。
3实验分析与结论
本文随机抽取了文献[7]中用到的电刷磨损、元件开路、匝间短路三类故障样本,其中三类故障的训练样本数分别是:电刷磨损为20个,元件开路为40个,匝问短路为20个,三类故障的测试样本各为100个时。分别用通用支持向量机算法(对应表中权重因子比例为1:1:1的情况)和加权支持向量机算法在不同加权比例因子下的识别结果如下表1所示。其中取λ=50,核函数为高斯径向基(RBF)函数,
1)对于训练样本数多的类别元件开路的训练精度和测试精度要远远高于其他两类.而通过对两种小样本类系数进行加权后,小样本的电刷磨损和匝间短路故障的识别率大大提高,而大样本类的元件开路故障的识别率有所降低,在权重因子为2:1:2时,三种故障样本的识别率基本持平。
2)上面的研究表明:可以通过对小类别样本(如故障样本)进行加权可提高故障样本类的分类精度,但这是以牺牲大类别样本分类精度为代价的。
而相对降低了没有加大权重因子的大样本类(如正常状态的样本)的识别精度。从而解决了前文提到的永磁支流电机故障在线监测与智能诊断的工程应用中误判损失不等的问题: |