人工神经网络应用于伺服控制系统.doc

资源描述

《人工神经网络应用于伺服控制系统.doc》由会员分享，可在线阅读，更多相关《人工神经网络应用于伺服控制系统.doc（12页珍藏版）》请在金锄头文库上搜索。

1、人工神经网络应用于伺服控制系统（译文）钱玲楠 050810504人工神经网络应用于伺服控制系统Yuan Kang, Min-Hwei Chu and Min-Chou Chen中原大学（台湾）机械工程系、东南科技大学（台湾）机械工程系摘要本章讲述了基本的神经网络控制器。介绍了有专门学习结构的神经控制。讨论和模拟了带有近似雅可比的直接神经控制。提出了使用多重神经网络的自适应控制，其中包括直接神经控制器，神经模拟器和神经调谐器。神经模拟器是用来近似雅克比值。误差以及误差的微分的线性组合是用来近似权值更新的反向传播误差。神经协调器是一种可在线调整线性组合中关键参数的在线神经网络。关键词：直接神经网

2、络，伺服控制，专门学习结构，多重神经网络，神经协调器1.介绍近年来，神经控制因其在线学习能力和自适应能力应用于多种领域，有许多神经网络的学习策略被提出并应用于一些具体的非线性控制系统，以克服未知模型和参数的变化问题。一般学习结构和专门学习结构在早期的神经控制发展中被提出和研究1。一般学习结构如图19.1所示，用神经网络学习被控对象的逆动态，将训练好的神经网络应用于前馈控制器。在这个例子中，一般过程因为其神经网络需要在一个超过实际需要的操作范围上学习被控对象的的响应，效率较低。一个可能解决这一问题的办法就是将一般过程的方法与专门过程结合。在本章中，将介绍带有专门学习结构的直接神经控制器应用于伺服

3、控制系统。19.3 专门学习结构的直接控制这种专门的学习结构如图19.2表示，训练专门的神经网络控制器仅作用于特定的范围。训练需要用期望的响应映作为神经网络的输入。训练这个网络用于找出可驱动被控对象输出理想命令的输入。这是用期望和实际被控对象响应之间的误差以一个最速下降的过程来调整网络的权值。权值在递归迭代中不断地调整以减小误差。这个过程需要知道被控对象的雅可比值。有两种策略可促进专业学习，一种是直接控制，如图19.2；一种是间接控制，如图19.3。前者，被控对象被看作是神经网络中不可调整的附加层，图19.2中的虚线图表示权值的更新需要被控对象的信息；后者，已经有过很多应用，它是一个两重过程，

4、包括被控对象动态特性的鉴定和控制。在间接控制策略中，一个子网（模拟器）需要在控制阶段之前被训练，模拟器训练的质量对于控制性能非常重要。因此训练模拟器时送入的数据必须覆盖足够大范围的输入和输出数据对，但如果这些用于训练模拟器的数值在输入值范围之外，模拟器的反向传播失败，将造成不好的，甚至不稳定的控制性能。如果先知道被控对象的定性知识或者被控对象雅可比值（被控对象输入关于输出的偏微分），直接控制策略可以避免这个问题。但通常很难近似得到一台未知被控对象的雅可比值。在本章中，将介绍获得用于直接神经网络的近似雅可比值的方法。使用了近似方法的直接控制策略已经成功应用于伺服控制系统，相应的性能已经被调研和讨

5、论。2.直接神经控制器一个三层的直接神经控制器，如19.4所示。已知被控对象的定性知识或者被控对象的雅可比值，一个带有隐藏层的三层神经网络可以计算出输出值的任意判别边界6。尽管有两个隐藏层的神经网络在一些专门问题上能获得更好的近似值，但也更容易陷入局部极小7，需要更多的CPU时间。在下面一节中，将考虑带有一个隐藏层的反向传播网络（BPN）。此外，还将考虑一个隐藏曾里面包含的正确单元的数目。李普曼8提供了全面的几何论据以及推理来证明为什么一个单隐藏层中单元的最大数目等于M（N+1），其中M是输出单元的数目，N为输入单元的数目。张等人2已经测试了一个传播跟踪控制系统上单隐含层的不同数目单元的数目。

6、最终发现，一个带有三至五个隐藏层的网络足够给出一个满意的结果。2.1直接神经控制器的算法这里提出的直接神经控制器是有两个输入单元，一个输出单元，若干隐含单元的三层神经网络。，X和分别代表需要的命令输入，参考模型的输出和被控对象的输出。网络的两个输入是误差以及它关于和的微分。参考模型可以按照标准二阶传递函数设计，阻尼比和固有频率可以按照被控对象的物理特性定义。直接控制器的算法和权值更新方程如图表19.4并由下述方程表述。这里的直接神经控制器有隐含层（下标j），输出层（下标k）和输入层（下标i）.为了标准化为-1和+1，输入信号在输入层被乘以增益和。切线双曲函数作为隐含层和输出层的激活函数。隐含层

7、的单元数目等于J。输入层的单元数目等于I。输出层的单元数目等于K。隐含层中j节点的输入为： i=1，2I，j=1，2J （19.1）节点j的输出为：（19.2）其中0,在输出层，节点k的输入为： j=1,2,J,k=1,2,K (19.3)节点k的输出为： (19.4)输出层中节点k的输出被认为是单输入单输出系统的控制输入up。方程中，代表输入层和隐含层之间的连接权，代表隐含层和输出层之间的连接权。和分别代表隐含层和输出层的偏值。第N个样本作用时，误差方程被定义为： (19.5)和分别代表参考模型的输出和被控被控对象在第N次样本作用时的输出，在从N次改变到N+1次的时间间隙，权值矩阵得到更新

8、。 (19.6)其中为指学习速率，为动量项因子。关于权系数的梯度变化为： (19.7)定义: n=1,2,K (19.8)这里定义为被控对象的雅克比值。同样的，关于权系数梯度变化，由下式决定： (19.9)这里： m=1,2,J (19.10)输出层和隐含层的权系数修正公式为：（19.11）（19.12）这里和可以由公式（19.21）和（19.24）得到。神经网络中的连接权在从样本N到样本N+1改变的过程中得到更新。（19.13）（19.14）切线双曲函数作为激活函数，使得神经网络控制器输出（ 19.4 ）是介于-1和+1之间的值，再乘以尺度因子作为被控对象的输入。初始化置权值和偏值为

9、+0.5到-0.5之间的最小随机数。根据公式（19.13）和（19.14）更新数值。2.2 在线调节的自适应神经控制器根据公式（19.8），被控对象的雅克比值需要预先知道。然而，因为被控对象的动态特性，确切的很难决定。用微分近似的方法，在很小的的范围内改变被控对象的每个输入，并测量输出的变化，雅克比是指：（19.15）或者，将微分关系的变量的变化与之前迭代的值比较，微分可以由以下关系近似：（19.16）早些的报告2中指出，当被控制被控对象惯性大或者有干扰时，使用公式（19.5）或者（19.6）近似时经常造成模棱两可的情况。这种情况说明神经控制器在输入和输出之间建立了一种因果关系。这是与期望

10、的情形相违背的。一个简单的正负号函数由张等人提出用来近似被控对象的雅克比值2。被称为是工业跟踪控制应用的在线训练自适应神经控制器。因此，用和的变化率来近似。被他们的符号函数代替。因此根据公式（19.8）：（19.17）清楚地了解控制信号如何影响被控对象的输出可以提供需要的符号信息。因此，当时，得：（19.18）当，得：（19.19）用公式（19.17）和由公式（19.18）和（19.19）得到的给定的微分的符号，神经控制器将根据被控对象的输出误差e(N)，有效地输出正确方向的控制信号。3.雅克比近似值准确地跟踪响应需要增加收敛速度。然而，对于一个单输入单输出的控制系统，误差关于网络输出的

11、灵敏度可以根据适应法则9被近似，将误差和误差的微分线性组合，如下：（19.20）这里和都是正常数，因此公式（19.8）可化为以下形式：（19.21）例19.1：一个应用于直流速度伺服控制系统的直接神经控制器如图表19.5所示。假定伺服放大器的电压增益是单位1。速度传感器的增益为0.001V/rpm。直流伺服电机的一阶动态模型为：（19.22）应用了适应法则的直接神经控制器由三个层，五个神经元组成，如图表19.6所示，用于控制和调节电机速度。学习速率=0.1，采样时间为0.0001s，, ,分配给模拟阶段的为1V（1000rpm），模拟结果如图表19.7，19.8，19.9所示。模拟结果

12、表明，连接权将收敛。的时域响应表明神经网络保持着一个适当的电压信号输出以克服旋转电枢产生的速度电压。同样的，神经控制器可以提供克服扭矩载荷和摩擦的输出。这与PI控制器类似，但神经控制器可以加强自适应调节能力以及改善控制系统的性能。该MATLAB仿真程序包在附录列出。用正负号函数接近雅克比的在线训练神经控制器也被应用于这个控制系统。仿真结果如图表19.10，19.11和19.12所示，该仿真结果表明，在线训练的方法需要较长的收敛时间。图19.5 使用直接神经控制器的直流速度伺服控制系统图19.6 使用适应法则的直接神经控制器图19.7 直流伺服电机的速度响应图19.8 控制输入的时域响应图1

13、9.9 所有连接权值在0.4s后收敛图19.10 直流伺服电机的速度响应图19.11 直流伺服电机的时域响应图19.12 所有连接权在0.6s后收敛用适应法则的直接神经控制器可以比在线训练方法提供更好的控制性能。适应法则使用误差的微分增加了误差收敛过程的阻尼，改善了权值更新算法的稳定性和收敛速度。没有提出专门的方法决定参数和的合适的值，这些参数只能在尝试和误差中调整。4.用神经协调器训练参数和应用适应法则提高了连接权更新的在线学习速率。然而，没有专门的方法在线确定参数和.参数仅在尝试和误差中调整。这很难计算出合适的参数值。参数和可以很容易地由输入信号的边界决定。输入信号在输入层与参数和相乘

14、，使之以-1和+1的形式表示。近期有人证明，神经网络可以调节PID控制器的参数10。在这一节，将为伺服控制系统介绍一种使用多重神经网络的模式跟随自适应调节控制。直接神经控制系统包括一个传统的直接神经控制器，神经模拟器和神经调谐器。它用误差和误差微分的线性组合来近似反向误差。参数调节器用于在线调节线性组合中的参数。神经模拟器预先训练用于近似被控对象的雅克比值。这三种不同的网络和参考模型融入了自适应调节算法。多重神经网络自适应控制系统（MNNACS）假设：传统的直接神经控制器有5个隐含的神经元，神经模拟器和神经协调器均有8个隐含的神经元，以及一台非线性的三阶被控对象可用。一个非线性的三阶被控对象是用于证明：这里的n是指第n次采样，up是被控对象的输入，是被控对象的输出以及是一个非线性函数可用神经网络描述。非线性三阶被控对象的模拟图表如19.13所示。带有一个隐含层和8个隐含神经元的BP神经网络如图表19.14所示，它需要被预先训练以及适应被控对象输入输出关系的模型。的输入早输入神经元中被标准化为-1和+1。的输出与一个常数增益相乘来近似作为被控对象的电压。这可以合成来近似目标位置。图19.13 离线训练的被控设备模拟器的结构

展开阅读全文