基于神经元网络的移动机器人路径规划

自动路径规划的目标是找到一条从起点到终点的不与障碍物相碰撞的连续路径。通常解决这个问题的方法由两个步骤组成：第一，建立表示空间集合约束条件的数据结构；第二，对该数据结构进行搜索以找到一条无碰撞的路径。据此不少人对此进行了大量的研究，并提出了许多路径规划的算法。一般说来，根据上述两个步骤所研究的各种算法均存在计算工作量太大的缺点，以至于很难实时应用。

这里介绍一种并行连接网络结构，它可以实时地进行无碰撞的路径规划。该网络对一系列的路径点进行规划，其目标是使得整个路径的长度尽量短，同时又要尽可能远离障碍物。从数学的观点来看，它等效于优化一个代价函数，该代价函数由路径长度和碰撞罚函数两部分组成。之所以适合于并行计算，主要因为：首先障碍物是用连接模型来表示的；其次，单个路径点运动的计算只需用到局部的信息。该网络不仅可以处理将物体视为一个质点的情况，同时也可将其处理为能平移和旋转的三维实体。最后，该网络结合模拟退火算法可以解决局部极值的问题。

碰撞路径的表示

如图所示，无碰撞路径可以用一系列中间点来表示，相邻点之间用线段相连。这样的表示有几点好处：一是可以通过指定足够多的点来达到任意的精度；

二是可将原始问题分解为一组统一的规模较小的任务。在这些小任务中，问题仅仅变为主要关心一个点与障碍物的关系；三是由于将路径规划问题局限为一系列路径点，从而便于实现大量的并行和分布计算。

为了对路径与障碍物之间的碰撞性质加以量化，一条路径的碰撞罚函数定义为各路径点的碰撞罚函数之和，而一个点的碰撞罚函数是通过它对各个障碍物的连结网络表示得到的。其基本想法是，障碍物无假设为多面体，它可用一组线性不等式来表示，于是在障碍物中的点必定满足所有不等式的限制。

图所示为一个障碍物的罚函数的连结网络。底层的三个结点分别表示给

图无碰撞路径图一个障碍物的罚函数的连结网络

定路径点的坐标和，中间层的每个结点对应于障碍物的一个不等式限制条

图矩形障碍物的连结网络

免物体与障碍物相碰撞，另一个是要求规划的路径尽量短。基于上述关于障碍物的网络表示，这两个约束条件可以加以量化。这样，路径规划问题便可变为一个极值问题或优化问题，其优化的能量函数由路径的长度及障碍物的罚函数两部分组成。

如果物体用一个点来表示，则路径的碰撞罚函数定义为所有路径点的碰撞罚函数之和。每个点的碰撞罚函数可通过相应的连结网络来计算。相应于碰撞罚函数的这部分能量可表示为

式中，是障碍物系数；是路径点的个数；表示第个路径点对第个障碍物的碰撞罚函数。

图所示为计算的连结网络结构。可以看出，该网络的计算对于每个路径点和每个障碍物都是并行的，即对于每个可以同时计算。

相应于路径长度的能量定义为所有线段长度的平方和。即对于所有路径点

，定义

式中，表示第个线段的长度；反映了整个路径的长度。

整条路径的总的能量定义为

式中，和分别表示对每一部分的加权。

使整个能量极小便意味着该路径的长度较短，并较少可能与障碍物相碰撞，这正是我们所期望的目标。由于整个能量是各个路径点函数，因此通过移动每个路径点，使其朝着能量减小的方向运动，最终便能获得总能量最小的路径。求

其中

可见

图碰撞罚函数连结网络结构

对时间的导数得

若取

取为正数，则

将逐渐减小，直至时才有，这时取得最小值。

所得结果即为要求的路径。

根据式（有

根据式（）到式（）有

以上推证过程非常类似于算法。其差别在于，该算法优化的变量是网络的输入，而在标准的算法中优化的变量是连接权系数。

物体表示为多面体时的路径规划

上述算法可以很容易地推广到物体表示为多面体的情况。这时有两个不同的特点需要考虑：一是当物体沿路径运动时，不仅要考虑物体的移动，同时也要考虑物体的转动；二是在计算物体关于障碍物的碰撞罚函数时，应该考虑物体上的许多点，而不只是一个点。

）即可表示物体的位置，现当只用一个点来表示物体时，只需一个

在需要用固绕在物体上的一个坐标系来描述该物体的位置和姿态。定义

、俯

）为该坐标的原点在基坐标中的位置，采用滚动角仰角和偏转角来表示该坐标系的姿态或方位。以后所说路径点均指的是该坐标系的位置和姿态，它共有

个分量。图所示为物体沿路径的位姿表示。

为了确定物体与障碍物的碰撞程度，可在物体上选择试点，是该物体的碰撞罚函数即为所有这些测试点的碰撞罚函数之和。这些测试点相对于物体坐标系是固定的，而相对基坐标的位姿可由下式确定

）

从而得关于点）的动态运动方程为

其中（参考式（

图物体沿路径的位姿表示

。这样，根据式（）

式中采用了简化符号便可计算出物体上

各测试点在基坐标中的位置，将它作为连结网络的输入便可计算出它所对应的碰撞罚函数。

基于上面的分析，可求得该物体沿路径的总的能量函数为

个路径点物体坐标系个路径点物体坐标系原

式中：表示第点到第原点间

个障碍物的碰撞罚函数。

的距离；表示第个路径点上第个测试点对第

类似前面将物体作为质点时的分析，通过对求导，我们可以建立起使总能量趋向极小的各变量的动态运动方程如下。

（

表示物体上

其中第个测试点相对于物体坐标系的位置向量；

个路径点时相对于基坐标的位置向表示物体上第个测试点在第

）个路径点时的位置向量；是物体坐标系量；是物体坐标系原点在第

在第个路径点时的姿态矩阵

式中

避免局部极值的模拟退火方法

在前面所介绍的寻优算法中很可能存在局部极值问题。也就是说，由路径长度及碰撞罚函数所组成的总能量函数可能有多个极值点，因而有可能停留在某个局部极小点，而不能确保总能量一定能达到全局的极小点。局部极小点所对应的路径可能比最优的路径要长得多，或者不能完全躲避障碍物。为此需要设法找到一种能够跳出局部极值的方法。

模拟退火方法是一种可以跳出局部极值的有效方法，它能够解决诸如旅行商等多种优化问题。所谓模拟退火就是模拟金属退火的过程，即首先用高温将金属熔化，然后逐渐缓慢冷却，直至形成良好的晶体结构，也就是进入一种具有最小能量的状态。

模拟退火方法也可用这里的路径规划算法以避免局部极值。具体实现时是通过改变式（）所示的形函数（见图）中的参数，它相当于金属退火中的温度。

如图所示，当很大时，形曲线比较平坦，较小时，形曲线比较陡峭，当

时，形曲线趋向阶跃函数。形函数影响总的碰撞罚函数，当较大时，罚函数能量曲

图形激发函数 ^）

面在障碍物的边界处变化较平缓，这时它只

）随的变化

是粗略地反映障碍物的形状。这里在障碍物

内部，罚函数能量曲面有一定的斜度。因此，当路径点位于障碍物内部时，由于能量函数曲面有一定斜度，它将驱使该路径点向低洼的方向运动。而当非常小时，罚函数网络像一个开关：路径点在障碍物内部时它输出，路径点在障碍物外部时它输出。罚函数能量曲面除了在障碍物的边界处很陡峭外，其余地方均很平坦，这就使得路径点很难沿着表面运动。正是利用了参数与罚函数能量曲面的这种关

，然后逐渐减

系，通过开始用较高的“温度小，从而达到了模拟退火的效果。

可以证明，当“ 温度按以下规律

变化时，退火一定能达到全局的极小值。其中是起始的高“温度” 是随时间变化的人为设置的“温度”。由于按上式变化收敛速度较慢，所以可采用如下的模拟退火规律

采用该规律大大加快了收敛速度，缩短了路径规划的计算时间，但不一定能确保获得全局的最优。

仿真举例

图所示为一个物体点与两个障碍物的路径规划，是一种较简单的情况：

平面中有两个障碍物，物体表示为质点，初始路径可以任意选择，这里选为从起点到终点的直线，如图（）所示。图）所示为碰撞罚函数的形状。由于罚函数在障碍物边界处变化很陡，因此靠近边界的点的运动远远快于其他地方的点。图（）所示为路径点的收敛过程。图（所示为最终的无碰撞路径。

图一个物体点与两个障碍物的路径规划

图所示为路径规划收敛到局部极值一个仿真的例子，说明了若不采取模拟退火方法，它将收敛到局部极值。这里共有五个障碍物，并且靠得比较近，物体也

时的碰撞

看作为质点。图（所示为当罚函数，图）所示为最后寻优得到的结果，显然它停留在一个局部极值上。这是因为初始的路径点有一部分是在障碍

在文檔中章　　机器人控制概论 (頁 190-200)