为了阐述自适应鲁棒控制的基本概念,本小节以目前直线电机控制常用的简化二阶刚 性动力学为例,系统地介绍自适应鲁棒控制算法的基本组成和各种变化形式[34, 68, 108],从 而为随后各种非线性补偿的自适应鲁棒控制器设计提供铺垫。
25
26 第三章 基于有效非线性补偿的直线电机自适应鲁棒控制研究
3.2.1 问题阐述
把简化的非线性动力学(2-8)和(2-19)代入(2-1),并将定位力忽略为建模误差,我们可 以得到以下状态空间形式的系统动力学
˙x1 = x2, (3-1)
θ1˙x2 = u− θ2x2− θ3Sf + θ4+ ˜d, (3-2) 其中x1 = y 和x2 = ˙y分别为位置和速度,θ = [θ1, θ2, θ3, θ4]T,θ1 = M/K,θ2 = B/K,θ3 = Af/K,而θ4和 ˜d分别为Fdis/K中的常值和时变成分。
一般来说,虽然θ和 ˜d的真实值常常未知,但是其变化范围是可以确定的。因此我们可 以给出以下实际假设
假设 3.1: 未知的参数向量θ处于一个有界的凸集Ωθ内。为了不失一般性,我们假 设∀θ ∈ Ωθ,θimin≤ θi ≤ θimax, i = 1, . . . , 4。其中θimin和θimax为已知的常数。 假设 3.2: 不确定的时变建模误差 ˜d(y, ˙y, t)是有界的,例如
d˜∈ Ωd
=∆ { ˜d : | ˜d| ≤ δd} (3-3)
其中δd(t)为一已知的有界函数。
定义yd(t)为参考运动轨迹,它是有界的并且二阶可导的。我们的控制问题即为:
在假设3.1和假设3.2下,如何设计控制输入u,使得动力学系统(3-1)-(3-2)的输出跟踪误 差e = y− yd(t)越小越好,同时还能拥有精确的在线参数估计。
3.2.2 符号定义和投影式自适应律
我们对本文中使用的符号进行统一的说明。ˆ•表示为•的估计值,而˜• = ˆ• − •为参数估 计的误差。•i 代表向量•的第i个元素。•max 和•min为•的最大和最小值。•f代表•经滤波后 的输出信号。两向量之间的<和≤等表示向量中彼此对应的每个元素之间都满足这个大小 关系。
自适应鲁棒控制的一个关键因素[53, 56]是使用已知的参数上下界,来约束参数自适应 律。因此我们使用一个映射函数P rojθˆ(•),使参数的在线估计值即使在外界时变干扰下始 终在已知界 ¯Ωθ(Ωθ的闭包集)的范围内。其标准的定义如下
P rojθˆ(•) =
•, if θˆ∈Ω◦θor nTˆ
θ• ≤ 0 (
I − ΓnnTθˆnTθˆ
θˆΓnθˆ
)
•, θˆ∈ ∂Ωθand nTθˆ• > 0 (3-4)
浙江大学博士学位论文 27
其中• ∈ Rp, Γ(t) ∈ Rp×p。Ω◦θ 和∂Ωθ分别是Ωθ 的内集和边界。nθˆ代表ˆθ ∈ ∂Ωθ时的单位法向 向量。
引理 3.1: 如果我们使用以下的投影式自适应律
˙ˆθ = Projθˆ(Γτ ) , θ(0)ˆ ∈ Ωθ (3-5)
其中τ 为自适应函数,Γ(t)是一个连续可导且正定对称的自适应律矩阵。(3-5)可以保证:
(P1) 所有的参数估计都在有界的已知集合 ¯Ωθ内,例如对于∀t满足ˆθ(t) ∈ ¯Ωθ。因此,从假 设3.1上知,对于∀t满足θimin≤ ˆθi(t)≤ θimax, i = 1, . . . , 4。
(P2)
θ˜T (
Γ−1P rojθˆ(Γτ )− τ)
≤ 0, ∀τ (3-6)
对于Γ是常值正定对角矩阵的时候,映射函数也可以简化为P rojθˆ(•) = [P rojθˆ1(•1),· · · , P rojθˆ4(•4)]T,而引理3.1的结论不变。
P rojθˆi(•i) =
0 if ˆθi = θimax and•i > 0 0 if ˆθi = θiminand•i < 0
•i otherwise
(3-7)
3.2.3 直接自适应鲁棒控制(DARC)
定义一个类滑模变量p
p= e + k∆ 1e = x2− x2eq, x2eq = ˙∆ yd− k1e, (3-8) 其中e = x1− yd为输出跟踪误差,k1 > 0为常数增益。由于Gp(s) = e(s)p(s) = s+k1
1是一个稳定 的收敛速度为k1的传递函数,当p很小或者趋于零时,e也就会很小或者趋于零。因此,剩 下的控制目标就只是如何使p尽可能的小。对p进行求导,同时注意到公式(3-2),我们可以 获得
θ1p = u˙ − θ1˙x2eq− θ2x2− θ3Sf + θ4 + ˜d,
= u + φTθ + ˜d
(3-9) 其中φT = [− ˙x2eq,−x2,−Sf(x2), 1]。我们设计的直接自适应鲁棒控制器为
u = ua+ us, ua=−φTθ,ˆ (3-10)
28 第三章 基于有效非线性补偿的直线电机自适应鲁棒控制研究 其中ua是自适应模型补偿项,us为鲁棒反馈项。将公式(3-10)代入公式(3-9),我们可以得 到
θ1p = u˙ s− φTθ + ˜˜ d. (3-11) 因此,鲁棒反馈控制项us可以取成
us = us1+ us2, us1 =−k2p, (3-12) 其中us1为简单的比例反馈来稳定名义动力学,而us2是用来减弱模型不确定影响的鲁棒 项,它满足下面的两个条件
p{us2− φTθ + ˜˜ d} ≤ ε (3-13)
pus2 ≤ 0 (3-14)
其中ε为一任意小的常数。例如满足上面条件的us2可以取成
us2 =−ks2p, ks2 = 1
4εh2 (3-15)
而h是任何满足下面不等式的光滑函数
h≥ ∥θM∥∥φ∥ + δd (3-16)
其中θM = θmax− θmin
定理 3.1: 如果我们采用投影式自适应律(3-5)和(3-7),并且选择Γ为常值正定对角矩 阵,τ 为以下函数
τ = φp (3-17)
那么,直接自适应鲁棒控制器(3-10)可以保证
A. 所有信号都是有界的。而且,如果我们定义一个正定函数Vs = 12θ1p2,那么它有界 于
Vs(t)≤ exp(−λt)Vs(0) + ε
λ[1− exp(−λt)] (3-18) 其中λ = 2k2/θ1max。
B. 如果在有限时间t0后,系统只存在参数不确定性,即 ˜d = 0,∀t ≥ t0。那么除了结 果A,我们还能实现最终的零跟踪误差,即在t→ ∞时,e → 0 和p → 0。
浙江大学博士学位论文 29
证明: 我们对Lyapunov函数Vs进行求导,并注意公式(3-11),(3-12)和(3-13) V˙s = −k2p2+ p
[
us2− φTθ + ˜˜ d ]
≤ −λVs+ ε
(3-19)
故通过比较引理,我们可以直接得到不等式(3-18)。因此,p是有界的。通过稳定的传递 函数Gp(s),我们知道e和 ˙e也是有界的。由于理想轨迹yd是有界并且二次可导,x1 = e + yd 和x2 = ˙e + ˙yd也是有界的。由于采用投影式的自适应律,ˆθ是有界的,故而控制输入u也是 有界的。所以,所有的信号都是有界的,定理3.1的结论A证毕。
现在考虑定理3.1的结论B,选择Lyapunov函数Va如下
Va= 1
2θ1p2 +1 2
θ˜TΓ−1θ˜ (3-20)
当 ˜d = 0时,由(3-5),(3-6),(3-11),(3-12)和(3-14)可知 V˙a = p
[−k2p− ˜θTφ + us2 ]
+ ˜θTΓ−1P rojθˆ(Γτ )
= −k2p2+ us2p + ˜θT (Γ−1P rojθˆ(Γτ )− τ)
≤ −k2p2
(3-21)
因此p∈ L2∩ L∞。通过Barbalat引理,当t→ ∞时,p → 0和e → 0。
3.2.4 期望补偿的自适应鲁棒控制(DCARC)
为了减少测量噪声的影响,Yao提出了期望补偿的自适应鲁棒控制(DCARC)理论[72], 我们也将这个思想应用到了直线电机的自适应鲁棒控制器设计中。
利用中值定理,我们可以得到
Sf(x2)− Sf( ˙yd) = gf(x2, t) ˙e (3-22) 其中gf(x2, t)为一确定的非线性函数。
期望补偿的自适应鲁棒控制器可设计成
u = ua+ us, ua=−φTdθˆ (3-23) us = us1+ us2, us1 =−ks1p (3-24)
˙ˆθ = Projθˆ(Γφdp) (3-25)
30 第三章 基于有效非线性补偿的直线电机自适应鲁棒控制研究
浙江大学博士学位论文 31
有界的。所以,所有的信号都是有界的,定理3.2的结论A证毕。
现在考虑定理3.2的结论B,当 ˜d = 0时,选择Lyapunov函数Va如下
Va = Vs+ 1 2
θ˜TΓ−1θ˜ (3-32)
注意到(3-30),可知
V˙a ≤ −k2p2− 12θ1k13e2+ pus2− ˜θTφdp + ˜θTΓ−1P rojθˆ(Γφdp)
≤ −k2p2− 12θ1k13e2 =−W (3-33) 因此W ∈ L1,Va ∈ L∞。由于所以信号都有界,很容易验证W 是有界的且一致连续的。应 用Barbalat引理,当t→ ∞时W → 0,因此可得p → 0和e → 0。
3.2.5 间接自适应鲁棒控制(IARC)
原先的直接自适应鲁棒控制主要把关注重点放在控制误差上,而对未知参数的估计仅 仅是保证其有界性。为了获得更好的在线参数估计,这里提出了间接自适应鲁棒控制的思
路[109]。由于使用了投影式的自适应律,无论怎么取τ 和Γ,其参数估计值都是有界的。因
此我们依旧选用期望补偿自适应鲁棒控制中的控制器(3-23),以保证其鲁棒的瞬态和稳态 性能。唯一不同的是,我们可以选择不同的在线参数估计算法,以实现更好的在线参数估 计。
定理 3.3: 我们选用投影式自适应律(3-25)和(3-4),以及期望补偿的自适应鲁棒控制 器(3-23),无论τ 和Γ如何选取,定理3.2的A结论始终能够实现
证明: 由于证明过程中未涉及τ 和Γ的选取,此证明可以同定理3.2的A结论证明完全
一致。
由于定理3.3已经保证了系统在存在建模误差的情况下的瞬态和稳态性能。本小节接下 来的内容主要是当系统只存在参数不确定性( ˜d = 0)时,如何设计在线参数估计算法,即 选择恰当的τ 和Γ,使参数估计能收敛到真实值,并且获得渐进跟踪的结论。
定义Hf(s)为一个稳定的滤波函数,例如Hf(s) = τ 1
fs+1。在 ˜d = 0的情况下,对动力 学(3-2)两边进行滤波,我们可以得到
θ1y¨f = uf − θ2y˙f − θ3Sf f + θ41f (3-34)
32 第三章 基于有效非线性补偿的直线电机自适应鲁棒控制研究 其中¨yf, ˙yf, uf, Sf f, 1f分别为¨y, ˙y, u, Sf( ˙y), 1的滤波输出。因此公式(3-34)可以写成
uf =−φTfθ (3-35) 其中φTf = [−¨yf,− ˙yf,−Sf f, 1f]。分别定义预估输出和预估误差为
ˆ
uf =−φTfθˆ ϵ = ˆuf − uf
(3-36)
我们可以得到预估误差的模型
ϵ =−φTfθ˜ (3-37) 基 于 上 面 的 预 估 误 差 模 型 , 各 种 参 数 估 计 的 办 法 都 可 以 使 用 。 下 面 我 们 分 别 选 用Krstic和Landau书中[66, 110]提出的两种典型估计算法(梯度估计和最小二乘估计)进 行阐述。
A. 梯度估计
对于梯度估计,Γ > 0选成一个常对角阵,例如Γ = diag[γ1, ..., γ4]。而τ 定义为
τ = 1
1 + ν∥φf∥2φfϵ, ν ≥ 0 (3-38) B. 最小二乘估计
这里使用指数遗忘的最小二乘法[110],Γ > 0定义为
˙Γ = αΓ− 1 1 + νφTfΓφf
ΓφfφTfΓ, Γ(0) = ΓT(0) > 0 (3-39)
其中ν ≥ 0,而α为遗忘因子。τ定义为
τ = 1
1 + νφTfΓφfφfϵ (3-40) 在实际中,上面的最小二乘估计在不满足持续激励的情况下有可能会发生估计器发散,例 如λmax(Γ(t))→ ∞。因此我们对(3-39)进行了如下改进,设置了自适应更新率的上限ρM, 从而使Γ(t)≤ ρMI, ∀t
˙Γ =
αΓ−1+νφ1T
fΓφfΓφfφTfΓ, if λmax(Γ(t))≤ ρM
0, otherwise
(3-41)
浙江大学博士学位论文 33
定理 3.4: 系统只存在参数不确定性( ˜d = 0)时,使用期望补偿的自适应鲁棒控 制器(3-23),以及投影式自适应律(3-25)和(3-4)。无论选择梯度估计(3-38)还是最小二乘估 计(3-40)和(3-41),如果持续激励的条件满足,即
∫ t t−T
φfφTf dτ ≥ βIp,∀t > t0 for some T > 0, t0, andβ > 0 (3-42)
那么ˆθ可以收敛到真实值,即˜θ → 0。此外,在定理3.3的基础上,还可以实现渐进跟踪,
即t→ ∞时e → 0。
证明: 注意到(3-30),由于 ˜d = 0以及pus2 ≤ 0 V˙s ≤ −k2p2− 1
2θ1k31e2 − pφTdθ˜ (3-43) 在满足持续激励条件下,从自适应控制参考书[111]上可知,当t → ∞时˜θ → 0并且˜θ ∈ L2。 由于φd有界,故φTdθ˜∈ L2。从不等式(3-43)可得p, e ∈ L2。应用Barbalat引理,当t → ∞时
可得e→ 0。
3.2.6 直接/间接集成的自适应鲁棒控制(DIARC)
虽 然IARC可 以 达 到DARC一 样 的 理 论 结 果 , 但 是 由 于 缺 少 了 快 速 动 力 学 补 偿 项,IARC会因为参数估计误差而影响到瞬态跟踪误差,故而实际应用中控制性能往 往不如DARC。DIARC就是想结合两者的特色,在获得IARC准确参数估计的同时依然能保 证DARC的控制性性能[108]。具体实现上,就是把快速的动力学补偿和间接参数估计的模型 补偿综合起来。
DIARC的控制器设计如下
u = ua+ us, ua= ua1+ ua2, ua1 =−φTdθ,ˆ (3-44) us = us1+ us2, us1 =−ks1p (3-45)
˙ˆθ = Projθˆ(Γφdp) (3-46)
其中ua1为IARC一样的自适应模型补偿项,并采用IARC一样的参数估计算法,ua2为快速 动力学补偿项。us为鲁棒反馈控制项,其中us1同IARC一样,而us2略有不同。将(3-44)代 入(3-2)可得
θ1p =˙ −ks1p + (θ1k1− θ2− θ3gf) ˙e + ua2+ us2− φTdθ + ˜˜ d (3-47)
34 第三章 基于有效非线性补偿的直线电机自适应鲁棒控制研究 定义常数d0和时变函数 ˜d∗(t)分别为
d0+ ˜d∗(t) =−φTdθ + ˜˜ d (3-48) 从概念上说,公式(3-48)代表了外干扰以及参数估计误差引起的不确定性,其中d0和 ˜d∗(t)分 别表示其低频和高频成分。因此d0可以参照DARC进行快速的动力学补偿。将(3-48)代 入(3-47)得
θ1p =˙ −ks1p + (θ1k1− θ2− θ3gf) ˙e + ua2+ us2+ d0+ ˜d∗(t) (3-49) 设计快速动力学补偿项ua2为
ua2 = − ˆd0 (3-50)
其中 ˆd0代表了d0的估计,由以下公式确定
d˙ˆ0 = P rojdˆ0(γdp), | ˆd0(0)| ≤ ˆdmax (3-51)
dˆmax为 ˆd0(t)预设的上界。类似于DARC,我们使用映射函数(3-7)来保证| ˆd0(t)| ≤ ˆdmax,∀t。
将(3-50)代入(3-49)得
θ1p =˙ −ks1p + (θ1k1− θ2− θ3gf) ˙e + us2− ˜d0+ ˜d∗(t) (3-52) 同(3-27)类似,us2需满足以下两个条件
p{us2− ˜d0+ ˜d∗(t)} ≤ ε
pus2 ≤ 0 (3-53)
因此,同(3-15)类似,us2可以取成
us2 =−ks2p, ks2 = 1
4εh2 (3-54)
h是任何满足下面不等式的光滑函数
h≥ ˆdmax+∥θM∥∥φd∥ + δd, (3-55) 定理 3.5: 使用IARC一样的参数估计算法, ˆd0由(3-51)决定,DIARC控制器(3-44)可
获得跟定理3.3和定理3.4 一样的结论。
浙江大学博士学位论文 35
证明: 定理3.3结论的证明过程同前面未有任何改变,故不详述。下面证明定理3.4的 结论,我们选择Lyapunov函数如下
Va = 1
2θ1p2+1
2θ1k12e2+ 1
2γd−1dˆ20 (3-56) 注意到(3-30),由于 ˜d = 0以及pus2 ≤ 0
V˙a ≤ −k2p2− 12θ1k31e2− pφTdθ˜− ˆd0p + ˆd0γd−1P rojdˆ0(γdp)
≤ −k2p2− 12θ1k31e2− pφTdθ˜
(3-57)
在满足持续激励条件下,当t→ ∞时˜θ → 0并且˜θ ∈ L2。由于φd有界,故φTdθ˜∈ L2。从不等 式(3-57)可得p, e∈ L2。应用Barbalat引理,当t→ ∞时可得e → 0。