简化二阶刚性动力学的自适应鲁棒控制

为了阐述自适应鲁棒控制的基本概念，本小节以目前直线电机控制常用的简化二阶刚性动力学为例，系统地介绍自适应鲁棒控制算法的基本组成和各种变化形式[34, 68, 108]，从而为随后各种非线性补偿的自适应鲁棒控制器设计提供铺垫。

26 第三章基于有效非线性补偿的直线电机自适应鲁棒控制研究

3.2.1 问题阐述

把简化的非线性动力学(2-8)和(2-19)代入(2-1)，并将定位力忽略为建模误差，我们可以得到以下状态空间形式的系统动力学

˙x₁ = x₂, (3-1)

θ₁˙x₂ = u− θ2x₂− θ3S_f + θ₄+ ˜d, (3-2) 其中x₁ = y 和x₂ = ˙y分别为位置和速度，θ = [θ₁, θ₂, θ₃, θ₄]^T，θ₁ = M/K，θ₂ = B/K，θ₃ = A_f/K，而θ₄和 ˜d分别为F_dis/K中的常值和时变成分。

一般来说，虽然θ和 ˜d的真实值常常未知，但是其变化范围是可以确定的。因此我们可 以给出以下实际假设

　　 假设 3.1：未知的参数向量θ处于一个有界的凸集Ω_θ内。为了不失一般性，我们假设∀θ ∈ Ωθ，θ_imin≤ θi ≤ θimax, i = 1, . . . , 4。其中θ_imin和θ_imax为已知的常数。　　假设 3.2：不确定的时变建模误差 ˜d(y, ˙y, t)是有界的，例如

d˜∈ Ωd

=∆ { ˜d : | ˜d| ≤ δd} (3-3)

其中δd(t)为一已知的有界函数。

定义y_d(t)为参考运动轨迹，它是有界的并且二阶可导的。我们的控制问题即为：

在假设3.1和假设3.2下，如何设计控制输入u，使得动力学系统(3-1)-(3-2)的输出跟踪误 差e = y− yd(t)越小越好，同时还能拥有精确的在线参数估计。

3.2.2 符号定义和投影式自适应律

我们对本文中使用的符号进行统一的说明。ˆ•表示为•的估计值，而˜• = ˆ• − •为参数估 计的误差。•i 代表向量•的第i个元素。•max 和•min为•的最大和最小值。•f代表•经滤波后 的输出信号。两向量之间的<和≤等表示向量中彼此对应的每个元素之间都满足这个大小 关系。

自适应鲁棒控制的一个关键因素^{[53, 56]}是使用已知的参数上下界，来约束参数自适应 律。因此我们使用一个映射函数P rojθˆ(•)，使参数的在线估计值即使在外界时变干扰下始 终在已知界 ¯Ω_θ（Ω_θ的闭包集）的范围内。其标准的定义如下

P rojθˆ(•) =







•, if θˆ∈Ω^◦θor n^T_ˆ

θ• ≤ 0 (

I − Γ_nⁿ^T^θ^ˆⁿ^T^θ^ˆ

θˆΓnθˆ

)

•, θˆ∈ ∂Ωθand n^T_θ_ˆ• > 0 (3-4)

浙江大学博士学位论文 27

其中• ∈ R^p, Γ(t) ∈ R^p^×p。Ω^◦θ 和∂Ω_θ分别是Ω_θ 的内集和边界。nθˆ代表ˆθ ∈ ∂Ωθ时的单位法向向量。

　　引理 3.1：如果我们使用以下的投影式自适应律

˙ˆθ = Projθˆ(Γτ ) , θ(0)ˆ ∈ Ωθ (3-5)

其中τ 为自适应函数，Γ(t)是一个连续可导且正定对称的自适应律矩阵。(3-5)可以保证：

(P1) 所有的参数估计都在有界的已知集合 ¯Ω_θ内，例如对于∀t满足ˆθ(t) ∈ ¯Ωθ。因此，从假设3.1上知，对于∀t满足θimin≤ ˆθi(t)≤ θimax, i = 1, . . . , 4。

(P2)

θ˜^T (

Γ⁻¹P roj_θ_ˆ(Γτ )− τ)

≤ 0, ∀τ (3-6)

对于Γ是常值正定对角矩阵的时候，映射函数也可以简化为P rojθˆ(•) = [P rojθˆ1(•1),· · · , P rojθˆ4(•4)]^T，而引理3.1的结论不变。

P rojθˆi(•i) =











0 if ˆθ_i = θ_imax and•i > 0 0 if ˆθ_i = θ_iminand•i < 0

•i otherwise

(3-7)

3.2.3 直接自适应鲁棒控制(DARC)

定义一个类滑模变量p

p= e + k^∆ ₁e = x₂− x2eq, x_2eq = ˙^∆ y_d− k1e, (3-8) 其中e = x₁− yd为输出跟踪误差，k₁ > 0为常数增益。由于G_p(s) = ^e(s)_p(s) = _s+k¹

1是一个稳定 的收敛速度为k₁的传递函数，当p很小或者趋于零时，e也就会很小或者趋于零。因此，剩 下的控制目标就只是如何使p尽可能的小。对p进行求导，同时注意到公式(3-2)，我们可以 获得

θ₁p = u˙ − θ1˙x_2eq− θ2x₂− θ3S_f + θ₄ + ˜d,

= u + φ^Tθ + ˜d

(3-9) 其中φ^T = [− ˙x2eq,−x2,−Sf(x₂), 1]。我们设计的直接自适应鲁棒控制器为

u = u_a+ u_s, u_a=−φ^Tθ,ˆ (3-10)

28 第三章基于有效非线性补偿的直线电机自适应鲁棒控制研究 其中ua是自适应模型补偿项，us为鲁棒反馈项。将公式(3-10)代入公式(3-9)，我们可以得到

θ₁p = u˙ _s− φ^Tθ + ˜˜ d. (3-11) 因此，鲁棒反馈控制项u_s可以取成

us = us1+ us2, us1 =−k2p, (3-12) 其中u_s1为简单的比例反馈来稳定名义动力学，而u_s2是用来减弱模型不确定影响的鲁棒项，它满足下面的两个条件

p{us2− φ^Tθ + ˜˜ d} ≤ ε (3-13)

pu_s2 ≤ 0 (3-14)

其中ε为一任意小的常数。例如满足上面条件的us2可以取成

u_s2 =−ks2p, k_s2 = 1

4εh² (3-15)

而h是任何满足下面不等式的光滑函数

h≥ ∥θM∥∥φ∥ + δd (3-16)

其中θ_M = θ_max− θmin

　　定理 3.1：如果我们采用投影式自适应律(3-5)和(3-7)，并且选择Γ为常值正定对角矩 阵，τ 为以下函数

τ = φp (3-17)

那么，直接自适应鲁棒控制器(3-10)可以保证

A. 所有信号都是有界的。而且，如果我们定义一个正定函数V_s = ¹₂θ₁p²，那么它有界于

V_s(t)≤ exp(−λt)Vs(0) + ε

λ[1− exp(−λt)] (3-18) 其中λ = 2k₂/θ_1max。

B. 如果在有限时间t0后，系统只存在参数不确定性，即 ˜d = 0，∀t ≥ t0。那么除了结 果A，我们还能实现最终的零跟踪误差，即在t→ ∞时，e → 0 和p → 0。

浙江大学博士学位论文 29

证明：我们对Lyapunov函数Vs进行求导，并注意公式(3-11)，(3-12)和(3-13) V˙_s = −k2p²+ p

[

u_s2− φ^Tθ + ˜˜ d ]

≤ −λVs+ ε

(3-19)

故通过比较引理，我们可以直接得到不等式(3-18)。因此，p是有界的。通过稳定的传递 函数G_p(s)，我们知道e和 ˙e也是有界的。由于理想轨迹y_d是有界并且二次可导，x₁ = e + y_d 和x₂ = ˙e + ˙y_d也是有界的。由于采用投影式的自适应律，ˆθ是有界的，故而控制输入u也是 有界的。所以，所有的信号都是有界的，定理3.1的结论A证毕。

现在考虑定理3.1的结论B，选择Lyapunov函数V_a如下

V_a= 1

2θ₁p² +1 2

θ˜^TΓ⁻¹θ˜ (3-20)

当 ˜d = 0时，由(3-5)，(3-6)，(3-11)，(3-12)和(3-14)可知 V˙_a = p

[−k2p− ˜θ^Tφ + u_s2 ]

+ ˜θ^TΓ⁻¹P roj_θ_ˆ(Γτ )

= −k2p²+ u_s2p + ˜θ^T (Γ⁻¹P rojθˆ(Γτ )− τ)

≤ −k2p²

(3-21)

因此p∈ L2∩ L_∞。通过Barbalat引理，当t→ ∞时，p → 0和e → 0。

3.2.4 期望补偿的自适应鲁棒控制(DCARC)

为了减少测量噪声的影响，Yao提出了期望补偿的自适应鲁棒控制(DCARC)理论^[72]，我们也将这个思想应用到了直线电机的自适应鲁棒控制器设计中。

利用中值定理，我们可以得到

S_f(x₂)− Sf( ˙y_d) = g_f(x₂, t) ˙e (3-22) 其中gf(x2, t)为一确定的非线性函数。

期望补偿的自适应鲁棒控制器可设计成

u = u_a+ u_s, u_a=−φ^T_dθˆ (3-23) u_s = u_s1+ u_s2, u_s1 =−ks1p (3-24)

˙ˆθ = Projθˆ(Γφ_dp) (3-25)

30 第三章基于有效非线性补偿的直线电机自适应鲁棒控制研究

浙江大学博士学位论文 31

有界的。所以，所有的信号都是有界的，定理3.2的结论A证毕。

现在考虑定理3.2的结论B，当 ˜d = 0时，选择Lyapunov函数Va如下

V_a = V_s+ 1 2

θ˜^TΓ⁻¹θ˜ (3-32)

注意到(3-30)，可知

V˙_a ≤ −k2p²− ¹₂θ₁k₁³e²+ pu_s2− ˜θ^Tφ_dp + ˜θ^TΓ⁻¹P rojθˆ(Γφ_dp)

≤ −k2p²− ¹₂θ₁k₁³e² =−W (3-33) 因此W ∈ L1，V_a ∈ L∞。由于所以信号都有界，很容易验证W 是有界的且一致连续的。应 用Barbalat引理，当t→ ∞时W → 0，因此可得p → 0和e → 0。

3.2.5 间接自适应鲁棒控制(IARC)

原先的直接自适应鲁棒控制主要把关注重点放在控制误差上，而对未知参数的估计仅仅是保证其有界性。为了获得更好的在线参数估计，这里提出了间接自适应鲁棒控制的思

路^[109]。由于使用了投影式的自适应律，无论怎么取τ 和Γ，其参数估计值都是有界的。因

此我们依旧选用期望补偿自适应鲁棒控制中的控制器(3-23)，以保证其鲁棒的瞬态和稳态性能。唯一不同的是，我们可以选择不同的在线参数估计算法，以实现更好的在线参数估计。

　　定理 3.3：我们选用投影式自适应律(3-25)和(3-4)，以及期望补偿的自适应鲁棒控制 器(3-23)，无论τ 和Γ如何选取，定理3.2的A结论始终能够实现

证明：由于证明过程中未涉及τ 和Γ的选取，此证明可以同定理3.2的A结论证明完全

一致。

由于定理3.3已经保证了系统在存在建模误差的情况下的瞬态和稳态性能。本小节接下来的内容主要是当系统只存在参数不确定性（ ˜d = 0）时，如何设计在线参数估计算法，即 选择恰当的τ 和Γ，使参数估计能收敛到真实值，并且获得渐进跟踪的结论。

定义H_f(s)为一个稳定的滤波函数，例如H_f(s) = _τ ¹

fs+1。在 ˜d = 0的情况下，对动力 学(3-2)两边进行滤波，我们可以得到

θ₁y¨_f = u_f − θ2y˙_f − θ3S_{f f} + θ₄1_f (3-34)

32 第三章基于有效非线性补偿的直线电机自适应鲁棒控制研究其中¨yf, ˙yf, uf, Sf f, 1f分别为¨y, ˙y, u, Sf( ˙y), 1的滤波输出。因此公式(3-34)可以写成

u_f =−φ^Tfθ (3-35) 其中φ^T_f = [−¨yf,− ˙yf,−Sf f, 1_f]。分别定义预估输出和预估误差为

u_f =−φ^T_fθˆ ϵ = ˆu_f − uf

(3-36)

我们可以得到预估误差的模型

ϵ =−φ^Tfθ˜ (3-37) 基于上面的预估误差模型，各种参数估计的办法都可以使用。下面我们分别选用Krstic和Landau书中^{[66, 110]}提出的两种典型估计算法（梯度估计和最小二乘估计）进行阐述。

A. 梯度估计

对于梯度估计，Γ > 0选成一个常对角阵，例如Γ = diag[γ₁, ..., γ₄]。而τ 定义为

τ = 1

1 + ν∥φf∥²φ_fϵ, ν ≥ 0 (3-38) B. 最小二乘估计

这里使用指数遗忘的最小二乘法^[110]，Γ > 0定义为

˙Γ = αΓ− 1 1 + νφ^T_fΓφf

Γφ_fφ^T_fΓ, Γ(0) = Γ^T(0) > 0 (3-39)

其中ν ≥ 0，而α为遗忘因子。τ定义为

τ = 1

1 + νφ^T_fΓφ_fφ_fϵ (3-40) 在实际中，上面的最小二乘估计在不满足持续激励的情况下有可能会发生估计器发散，例 如λ_max(Γ(t))→ ∞。因此我们对(3-39)进行了如下改进，设置了自适应更新率的上限ρM， 从而使Γ(t)≤ ρMI, ∀t

˙Γ =





αΓ−_1+νφ¹T

fΓφfΓφ_fφ^T_fΓ, if λ_max(Γ(t))≤ ρM

0, otherwise

(3-41)

浙江大学博士学位论文 33

　　定理 3.4：系统只存在参数不确定性（ ˜d = 0）时，使用期望补偿的自适应鲁棒控 制器(3-23)，以及投影式自适应律(3-25)和(3-4)。无论选择梯度估计(3-38)还是最小二乘估计(3-40)和(3-41)，如果持续激励的条件满足，即

∫ t t−T

φfφ^T_f dτ ≥ βIp,∀t > t0 for some T > 0, t0, andβ > 0 (3-42)

那么ˆθ可以收敛到真实值，即˜θ → 0。此外，在定理3.3的基础上，还可以实现渐进跟踪，

即t→ ∞时e → 0。

证明：注意到(3-30)，由于 ˜d = 0以及pu_s2 ≤ 0 V˙_s ≤ −k2p²− 1

2θ₁k³₁e² − pφ^T_dθ˜ (3-43) 在满足持续激励条件下，从自适应控制参考书^[111]上可知，当t → ∞时˜θ → 0并且˜θ ∈ L2。 由于φ_d有界，故φ^T_dθ˜∈ L2。从不等式(3-43)可得p, e ∈ L2。应用Barbalat引理，当t → ∞时

可得e→ 0。

3.2.6 直接/间接集成的自适应鲁棒控制(DIARC)

虽然IARC可以达到DARC一样的理论结果，但是由于缺少了快速动力学补偿项，IARC会因为参数估计误差而影响到瞬态跟踪误差，故而实际应用中控制性能往往不如DARC。DIARC就是想结合两者的特色，在获得IARC准确参数估计的同时依然能保证DARC的控制性性能^[108]。具体实现上，就是把快速的动力学补偿和间接参数估计的模型补偿综合起来。

DIARC的控制器设计如下

u = u_a+ u_s, u_a= u_a1+ u_a2, u_a1 =−φ^T_dθ,ˆ (3-44) us = us1+ us2, us1 =−ks1p (3-45)

˙ˆθ = Proj_θ_ˆ(Γφ_dp) (3-46)

其中u_a1为IARC一样的自适应模型补偿项，并采用IARC一样的参数估计算法，u_a2为快速 动力学补偿项。u_s为鲁棒反馈控制项，其中u_s1同IARC一样，而u_s2略有不同。将(3-44)代入(3-2)可得

θ₁p =˙ −ks1p + (θ₁k₁− θ2− θ3g_f) ˙e + u_a2+ u_s2− φ^Tdθ + ˜˜ d (3-47)

34 第三章基于有效非线性补偿的直线电机自适应鲁棒控制研究 定义常数d0和时变函数 ˜d^∗(t)分别为

d₀+ ˜d^∗(t) =−φ^Tdθ + ˜˜ d (3-48) 从概念上说，公式(3-48)代表了外干扰以及参数估计误差引起的不确定性，其中d₀和 ˜d^∗(t)分 别表示其低频和高频成分。因此d₀可以参照DARC进行快速的动力学补偿。将(3-48)代入(3-47)得

θ1p =˙ −ks1p + (θ1k1− θ2− θ3gf) ˙e + ua2+ us2+ d0+ ˜d^∗(t) (3-49) 设计快速动力学补偿项u_a2为

u_a2 = − ˆd₀ (3-50)

其中 ˆd₀代表了d₀的估计，由以下公式确定

d˙ˆ0 = P rojdˆ0(γdp), | ˆd0(0)| ≤ ˆdmax (3-51)

dˆ_max为 ˆd₀(t)预设的上界。类似于DARC，我们使用映射函数(3-7)来保证| ˆd₀(t)| ≤ ˆd_max,∀t。

将(3-50)代入(3-49)得

θ₁p =˙ −ks1p + (θ₁k₁− θ2− θ3g_f) ˙e + u_s2− ˜d₀+ ˜d^∗(t) (3-52) 同(3-27)类似，u_s2需满足以下两个条件

p{us2− ˜d₀+ ˜d^∗(t)} ≤ ε

pu_s2 ≤ 0 (3-53)

因此，同(3-15)类似，u_s2可以取成

u_s2 =−ks2p, k_s2 = 1

4εh² (3-54)

h是任何满足下面不等式的光滑函数

h≥ ˆd_max+∥θM∥∥φd∥ + δd, (3-55) 　　定理 3.5：使用IARC一样的参数估计算法， ˆd₀由(3-51)决定，DIARC控制器(3-44)可

获得跟定理3.3和定理3.4 一样的结论。

浙江大学博士学位论文 35

证明：定理3.3结论的证明过程同前面未有任何改变，故不详述。下面证明定理3.4的结论，我们选择Lyapunov函数如下

V_a = 1

2θ₁p²+1

2θ₁k₁²e²+ 1

2γ_d⁻¹dˆ²₀ (3-56) 注意到(3-30)，由于 ˜d = 0以及pu_s2 ≤ 0

V˙a ≤ −k2p²− ¹₂θ1k³₁e²− pφ^Tdθ˜− ˆd0p + ˆd0γ_d⁻¹P rojdˆ0(γdp)

≤ −k2p²− ¹₂θ₁k³₁e²− pφ^T_dθ˜

(3-57)

在满足持续激励条件下，当t→ ∞时˜θ → 0并且˜θ ∈ L2。由于φ_d有界，故φ^T_dθ˜∈ L2。从不等 式(3-57)可得p, e∈ L2。应用Barbalat引理，当t→ ∞时可得e → 0。

在文檔中博士学位论文 (頁 49-59)