机器人最优控制 - 章　　机器人控制概论

动态规划与方程

用动态规划方法解最优控制问题是在世纪年代末提出的，其基本思想是：若对一系统做出的一系列决策构成了对一性能指标的最优决策的话，

则不论系统的先前决策如何，相继决策都构成了一个以先前决策所得状态为初始

图输入力矩曲线

下面用饱和函数代替控制器（）中的符号函数，取

，仿真结果如图所示，可以看出控制作用变得平滑。

定义

式中，

因等式右端

状态的对同一性能指标的最优决策。用这一基本思想解最优控制问题的方法如下。

设系统方程为

为控制；为

式中：为系统状态；参考输入。给定一性能指标

式中：为已知；分别为初始时间和终止时间。最优控制问题的提法是：给

）和终止时间，要求满足

定参考输入确定控制，使得相应的状态

）且使式（所定义的

系统方程（性能指标达到其最小值，即有

被称为最优控制，被称为最优性能指标。

这样的控制

为推导出最优控制应满足的必要条件，设最优控制存在，则最优性能指标

）和初始时的函数，即由式知

只是初始状态间

取。由动态规划原理知，由上表示对所有可能的最小值，

式可得出

，则

（在（（）处展开

，再将，得到

，将上两式代入式（ ^{）后得}

的函数，可提出括号外，故上式即为不是

式（

将上式两端同除后再令得到

考虑到

故上式可写为

）

因起始时间可以是任意时刻，故由上式知，当控制为最优控制时，它必满足

）即为方程。方程是关于性能指标的编微分方程，由

）知其边界条件为

通常称为系统状态向量的伴随向量（或协态向量），则

）可写为方程（

定义

为函数。利

故也称用函数的定义，可将方

程式（）改写为

）

由方程（）知，若最优控存在，则它必使函数取最大值。因此当对不存在其他约束时，最优控制应满足

基于自由运动机器人最优控制

自由运动机器人方程

十可写为

式中，。引入状态变量

可将机器人方程（）写为状态方程形式

）

其中

给定期望轨迹，则期望状态若记状态误差，则误差方程为

）

取性能指标为

其中，）为半正定矩阵， _和）分别为和

正定矩阵。性能指标中第一项反映了对终点误差的要求，积分号后第一项反映了对控制过程中误差的要求，第二项间接反映了对能量消耗的要求。按定义，

函数

故是最优控制。对应的最优误差方程和最优函数 _分别为

由的表达式（知，要完全确定出最优控制，还必须求出由方程的边界条件式（）知

故可设为二次型，即设

将上式及式（）代入方程后知

由的独立性知）应满足方程

及边界条件

））

至此，求出了最优控制形如

式中

是方程（）和（）对称正定矩阵解。

特别地，当且取性能指标中均为常值矩阵，则由式（）知

最优控控制

）

式中对称正定矩阵

满足代数方程

由式（和（显然可知；本节求出的最优控制与计算力矩法所得出的控制律在形式上完全一样，只不过其中的速度反馈增益矩阵或，和位置反馈增益矩或由式（所确定，且当终止时刻时，速度反馈

是时变的。因此，本节中求出的

增益矩阵和位置反馈增益矩阵最优

控制律（和（均可视为计算力矩法的推广。

在文檔中章　　机器人控制概论 (頁 94-99)