• 沒有找到結果。

机器人最优控制

在文檔中 章  机器人控制概论 (頁 94-99)

动态规划与 方程

用动态规划方法解最优控制问题是 世 纪 年代末提出的,其 基本思想是:若对一系统做出的一系列决策构成了对一性能指标的最优决策的话,

则不论系统的先前决策如何,相继决策都构成了一个以先前决策所得状态为初始

输 入 力 矩 曲 线

下 面 用 饱 和 函 数 代替控制器( )中的符号函数,取

,仿真结果如图 所示,可以看出控制作用变得平滑。

定 义

式中,

式中,

因等式右端

状态的对同一性能指标的最优决策。用这一基本思想解最优控制问题的方法如下。

设系统方程为

为 控 制; 为

式 中: 为系统状态; 参考输入。给定一性能指标

式 中 : 为 已 知; 分别为初始时间和终止时间。最优控制问题的提法是:给

)和 终 止 时 间 ,要求 满 足

定参考输入 确定控制 ,使得相应的状态

)且使式( 所定义的

系统方程( 性能指标达到其最小值,即有

被称为最优控制, 被称为最优性能指标。

这样的控制

为推导出最优控制应满足的必要条件,设最优控制 存在,则最优性能指标

)和初始时 的函数,即 由式

只是初始状态

取 。由动态规划原理知,由上 表示对所有可能的 最小值,

式可得出

处 展 开

,再将 ,得 到

,将上两式代入式( )后 得

的函数,可提出括号外,故上式即为 不是

式(

式(

将上式两端同除 后 再令 得 到

考虑到

故 上 式 可 写 为

因起始时间 可以是任意时刻 ,故由上式知,当控制 为最优控制时,它必满足

)即 为 方 程 。 方程是关于性能指标 的编微分方程,由

)知其边界条件为

通 常 称 为系统状态向量的伴随向量(或协态向量),则

)可 写 为 方 程(

定 义

函 数 。 利

故 也 称 函数的定义,可将

式( )改 写 为

方 程( )知 ,若 最 优 控 存在,则它必使 函数 取 最 大 值 。因 此 当 对 不存在其他约束时,最优控制应满足

基于自由运动机器人最优控制

自由运动 机器人方程

可 写 为

式 中 , 。引入状态变量

可将机器人方程( )写为状态方程形式

其中

给 定 期望 轨 迹 ,则 期 望 状 态 若记状态误差 ,则误差方程 为

取性能指标为

其 中 , )为半正定矩阵, )分别 为

正定矩阵。性能指标中第一项反映了对终点误差的要求,积分号后第一项反映了对 控制过程中误差的要求,第二项间接反映了对能量消耗的要求。按定义,

函数

故 是最优控制。对应的最优误差方程和最优 函 数 分别为

的表达式( 知,要完全确定出最优控制 ,还必须求出 方程的边界条件式( )知

故可设 为二次型,即设

将上式及式( )代 入 方 程 后 知

的独立性知 应 满 足 方程

及边界条件

至此,求出了最优控制形如

式 中

方程( )和 )对称正定矩阵解。

特别地,当 且取性能指标中 均为常值矩阵,则由式( )知

最优控控制

式中对称正定矩阵

满足代数 方程

由 式( 和( 显然可知;本节求出的最优控制 与计算力矩法所得出的控 制律在形式上完全一样,只不过其中的速度反馈增益矩阵 或 和 位 置 反 馈 增 益 矩 或 由 式( 所确定,且当终止时刻 时,速度 反 馈

是 时变 的 。因此 ,本 节中 求出 的

增益矩阵 和位置反馈增益矩阵 最 优

控 制 律( 和( 均可视为计算力矩法的推广。

在文檔中 章  机器人控制概论 (頁 94-99)