机械伺服系统基于模糊神经网络的复合控制
徐春梅
北京交通大学电气工程学院,北京100044
摘 要:惯性参数大范围变化和低速状态下的非线性摩擦是制约机械伺服系统跟踪性能的主要因素,基于LuGre动态摩擦模型和干扰观测器的补偿控制可以实现非线性摩擦力矩的动态补偿,但状态观测器的设计是基于被控对象的数学模型,当负载惯性参数大范围变化时,上述控制系统性能无法保障,针对上述问题提出一种基于模糊神经网络补偿的状态观测器复合控制,分析了基于模糊神经网络补偿复合控制的理论与实现方法,并以直流电机飞行仿真转台作为被控对象进行了仿真试验,试验结果表明了控制方法的有效性。
关键词:机械伺服系统;干扰观测器;模糊神经网络;摩擦力矩;补偿;跟踪控制
中图分类号:TP 27 文献标识码:A
1引言
对于负载参数大范围变化的高精度伺服系统,设计出具有强鲁棒稳定性和鲁棒模型跟踪性能的控制器,是目前研究的热点,对于摩擦环节产生的非线性扰动力矩,必须通过施加适当的控制作用来消除摩擦力短的影响,目前常采用的方法包括自适应摩擦补偿方法、变结构控制方法、基于干扰观测器的补偿方法。以及基于摩擦模型的补偿方法等。
基于LuGre摩擦模型的补偿加干扰观测器的控制方法,近年来在伺服控制系统中获得了成功的应用。但干扰观测器的设计基于被控对象开环数学模型,因为伺服系统的非线性、不确定性及各种测量噪声的影响,伺服系统精确的数学模型无法获得,特别当伺服系统负载大范围变化时,控制系统性能就无法保障,为解决这一问题,本文提出了伺服系统基于神经网络补偿的复合控制方法。
2复合控制器设计
复合控制器结构,如图1所示。
其中,d为等效干扰,ξ为测量噪声,虚线框内为干扰观测器,Gp(s)为机械伺服系统广义被控对象开环模型,Gn(s)为名义模型,Q(s)为低通滤波器,Ge(s)为位置闭环控制器,Tf(θ)为摩擦补偿环节。
控制器的输出为
1)干扰观测器设计干扰观测器的基本思想是将外部力矩干扰及模型参数变化造成的实际对象与名义模型输出的差异,统统等效到控制输入端,即观测出等效干扰,在控制中引入等量的补偿,实现对干扰完全抑制。如图1中的Gp(S)为对象的传递函数,Gn(s)为名义模型,d为等效丰扰,d为观测于扰,u为控制输入。由图l,求出等效干扰的估计值d为
对于机械伺服系统,忽略转轴的扭曲变形及未建模动态等因素影响,名义模型可以取为
式中,Jn为系统的等效转动惯量;bn为系统的等效阻尼系数。
Q(s)的选择应使Q(s)/Gn(s)正则,取:
2)位置闭环控制器设计位置闭环采用微分先行的PD控制,控制律如下:
速度信号通过位置倍号的后向差分得到,考虑到量化噪声的影响,将差分信号经过IIR滤波。选择PD控制参数时,直接以名义模型为控制对象,使闭环系统有足够的稳定裕量和相位裕量,响应无超调。
3)摩擦补偿环节设计LuCre摩擦模型是一种典型动态摩擦模型,设状态变量=代表接触面鬃毛的平均变形则r可由下面的LuCre模型来描述:
式中σ0,σ1,称为动态摩擦参数FC,Fs,α,K称为静态摩擦参数,其中,Fc为库仑摩擦,Fs为静摩擦,α为粘性摩擦系数,vs为切换速度。
因此,LuGre模型是由参数σ0,σ1,FC,Fs,ct,α,vs决定的,对于特定的系统这些参数可通过实验进行辨识。
4)模糊神经网络补偿器设计模糊神经网络采用的二输入一输出的4层动态回归网络结构,如图2所示。
网络推理过程及参数学习算法请参看文献。为建立模糊神经网络的学习算法,分析图1所示的拄制系统,电动伺服系统经过参数简化处理的微分方程表述如下:
由图l复合控制器输出电压为
带人式(11),得:
整理得:
由上式看出,当  时,模糊神经网络对系统非线性、模型不确定性及各种干扰因素进行了完全补偿。此时
 ,即按照名义模型设计的复合控制器只对理想线性系统进行控制,系统误差e—0。
为此定义如下变量:
由式(12):
当v=0时,模糊神经网络对系统非线性进行了完全补偿,系统误差e-0。因此定义模糊神经网络性能指标函数:
由负梯度下降法及链式法则可得模糊神经网络的参数迭代算法如下:
这样通过模糊神经网络参数在线学习,使v—0,则控制系统误差e—0。
3应用研究
以某直流电动飞行仿真转台内框为仿真实验对象,此系统简化模型为
通过模型辨识模型参数J=0 003 3,b=0. 067。控制器设计目的是控制电机电压u,使转台转角跟踪输入信号。
PD控制器参数取Kp=1.2,KV=0.083 3;取Q(s)=Q31(s),考虑干扰观测器的稳定性和对扰动的抑制能力,取滤波器参数为τ=0.02。
LuGre摩擦模型参数辨识是一个复杂的过程,本文直接给出通过遗传算法优化的结果:
模糊神经网络输入变量为跟踪误差e和uf这5个模糊变量。
为了验证加入模糊神经网络补偿器对提高系统跟踪性能的影响,在实验过程中作了对比试验,实验结果如下所述:
为了叙述方便,采用下面英文缩写来代表组成控制器的各个组成部分:
① PD代表位置闭环PD控制律;
②DOB代表扰观测器部分;
③TF代表基于LuGre摩擦模型的补偿器;
④FNN代表模糊神经网络补偿器。
试验1通过实验研究控制器对外部干扰的鲁棒性,指令信号为r(t) =0.5sin(πt),系统无外加负载,系统进入稳定状态后在t=4 s处在控制端加入阶跃干扰信号du=1.0,PD+ DOB+ TF控制器位置跟踪曲线和PD+ DOB +TF+ FNN控制器位置跟踪曲线,如图3所示。
由此可知,加入模糊神经网络补偿器,模糊神经网络补偿了非线性和各种干扰因素,控制跟踪精度更高,PD+ DOB+ TF+ FNN控制器更好地抑制摩擦非线性影响,并对外部干扰有强鲁棒稳定性。
试验2通过实验研究控制器对负载变化的鲁棒性。在不改变控制器参数的情况下,通过更换机械安装负载改变控制系统惯量参数,指令信号仍为r(t)=0 Ssin(πt),当负载由0增加为20 kg时,PD +DOB +TF控制器跟踪和PD +DOB+ TF+ FNN控制器跟踪曲线如图4所示。
由图4可知,PD+ DOB+ TF控制器能抑制摩线性因素和外部干扰,且当惯性系统变化时,能通擦和外部干扰,并具有鲁棒稳定性,但随着被控对 过模糊神经网络的自学习能力补偿惯性系统改变带象惯性系统的改变,控制系统跟踪性能变差。而加 来的不确定性,控制系统跟踪性能仍然很好。入模糊神经网络补偿的控制器不但能抑制摩擦等非
4结语
针对机械伺服系统控制中遇到的摩擦、外部干扰和惯性系统大范围变化等非线性和不确定性因素,本文给出了一种新的复合控制方案,通过LuGre动态摩擦模型和干扰观测器实现了摩擦和外部干扰的动态补偿,并通过模糊神经网络在线调整动态补偿机械负载变化带来的模型参数摄动,与没有模糊神经网络补偿的控制器相比,可以在机械负载变化时取得更好的跟踪性能。
|