线性系统二次型指标的最优控制线性二次型问题

资源描述

《线性系统二次型指标的最优控制线性二次型问题》由会员分享，可在线阅读，更多相关《线性系统二次型指标的最优控制线性二次型问题（108页珍藏版）》请在金锄头文库上搜索。

1、线性系统二次型指标的最优控制线性二次型问题Stillwatersrundeep.流静水深流静水深,人静心深人静心深Wherethereislife,thereishope。有生命必有希望。有生命必有希望n5.1 引言引言n5.2 线性二次型问题的提法线性二次型问题的提法n5.3 终端时间有限时连续系统的状态调节器问题终端时间有限时连续系统的状态调节器问题n5.4 稳态时连续系统的状态调节器问题稳态时连续系统的状态调节器问题n5.5 离散系统的线性二次型问题离散系统的线性二次型问题n5.6 伺服跟踪问题伺服跟踪问题n5.7 设计线性二次型最优控制的若干问题设计线性二次型最优控制的若干问题n5.8

2、小结小结5.1 引言引言用极小值原理解非线性系统的最优控制将导致用极小值原理解非线性系统的最优控制将导致非线性两点边值问题，这类问题求解是很困难的。非线性两点边值问题，这类问题求解是很困难的。即使系统是线性的，但当指标函数是最短时间、最即使系统是线性的，但当指标函数是最短时间、最少燃料这种形式，要求得到最优控制的解析表达式，少燃料这种形式，要求得到最优控制的解析表达式，并构成反馈控制（即把并构成反馈控制（即把表示为表示为的函数）也是的函数）也是非常困难的。非常困难的。返回子目录返回子目录的确定归结为求解一个非线性矩阵黎卡提（Riccati）微分方程或代数方程。而黎卡提方程的求解已研究

3、得很透彻，有标准的计算机程序可应用，因此，求解既规范又方便。这种问题简称为线性二次型(Linear Quadratic 简称LQ)问题，目前应用得十分广泛，是现代控制理论最重要的结果之一。下面我们将看到，若系统是线性的，指标函数是下面我们将看到，若系统是线性的，指标函数是二次型的（指标函数是二次型的（指标函数是和和的二次函数），则的二次函数），则可以求得线性最优反馈控制律可以求得线性最优反馈控制律。线性二次型问题的实用意义还在于：例如，在飞行器的轨迹优化问题中，根据飞行器的状态方程（一般是非线性的）用极小值原理计算出名义的最优控制和最优状态轨迹，设分别用和表示。把它所得到的

4、最优反馈控制与非线性系统的开环把它所得到的最优反馈控制与非线性系统的开环最优控制结合起来，可减小开环控制的误差，达到更最优控制结合起来，可减小开环控制的误差，达到更精确的控制的目的。精确的控制的目的。因为状态方程只能是对飞行器实际动力学特性的近似描绘，这里存在着模型误差，把加到飞行器上去，所产生的实际状态将不同于（这里我们还未考虑作用在飞行器上的其它扰动作用）。（这里我们还未考虑作用在飞行器上的其它扰动作用）。令状态误差为令状态误差为，我们要使，我们要使愈小愈好，为此，可根据愈小愈好，为此，可根据构成一个最优反馈控构成一个最优反馈控制制，作为校正信号加到，作为校正信号加到上

5、去，得到的实际上去，得到的实际控制信号控制信号将使飞行器尽可能沿着将使飞行器尽可能沿着飞行。飞行。由于由于、应该比较小，它们将满足应该比较小，它们将满足线性的状态方程，所以可用线性二次型问题设计线性的状态方程，所以可用线性二次型问题设计出反馈控制出反馈控制。我们可用图。我们可用图5-1表表示上面的思想。示上面的思想。n 图图5-1 线性二次最优反馈控制的应用线性二次最优反馈控制的应用5.2 线性二次型问题的提法线性二次型问题的提法n一般情况的线性二次型问题可表示如下：其中，其中，为为维状态向量，维状态向量，为为维控制向量，维控制向量，为为维输出向量。设维输出向量。设不

6、受约束。不受约束。设线性时变系统的方程为设线性时变系统的方程为（5-15-1）（5-25-2）返回子目录返回子目录其中，其中，为为维理想输出向量。寻找最优控维理想输出向量。寻找最优控制，使下面的性能指标最小制，使下面的性能指标最小（5-4）令误差向量令误差向量为为（5-35-3）其中，其中，是是对称半正定常数阵，对称半正定常数阵，是是对对称半正定阵称半正定阵, 是是对称正定阵。对称正定阵。一般将一般将、、取成对角阵。取成对角阵。下面对性能指标中的每一项作一说明。因为正定阵，则当，就有。例如设，，则为正定阵，于是它与消耗的控制能量成正比，消耗得越多，则性

7、能指标值越大。故性能指标中这一项表示了对消耗控制能量的惩罚。、可看作加权系数，如认为的重要性大于，则可加大。将选成时间函数，是为了对不同时刻的加权不一样。实际上，为了简单起见常选用常数阵。为半正定阵，则当，就有，表示误差平方和积分，故这项表示对系统误差的惩罚。表示对终端误差的惩罚，当对终端误差要求较严时，可将这项加到性能指标中。总之，性能指标总之，性能指标最小表示了要用不大的最小表示了要用不大的控制量来保持较小的误差，以达到能量和误差的控制量来保持较小的误差，以达到能量和误差的综合最优。综合最优。这时这时（单位阵），理想输（单位阵），理想输出出，则，则，

8、这时，问题归，这时，问题归结为用不大的控制量使结为用不大的控制量使保持在零值附近。因而保持在零值附近。因而称为状态调节器问题。称为状态调节器问题。n下面讨论几种特殊情况：1）调节器问题。例如电机转速调节系统中，由于外加电压波动例如电机转速调节系统中，由于外加电压波动使转速偏离要求值，通过施加控制使转速偏差趋于使转速偏离要求值，通过施加控制使转速偏差趋于零。零。这时，，这时要用不大的控制量使跟踪，因而称为跟踪问题。例如，用雷达跟踪飞行器的运动，通过控制使跟踪误差趋于零。n2）伺服机问题。5.3 终端时间有限时连续系统的状终端时间有限时连续系统的状态调节器问题态调节器问题要求寻找最

9、优控制要求寻找最优控制，使，使最小。这里最小。这里无约束。无约束。、为对称半正定阵，为对称半正定阵，为对称正定阵。终端时间为对称正定阵。终端时间为有限值。为有限值。(5-5)(5-6)考虑下面的系统状态方程和性能指标返回子目录返回子目录5.3.1 用极小值原理求解上面的问题用极小值原理求解上面的问题因因无约束，故等同于用经典变分法求解。取无约束，故等同于用经典变分法求解。取哈密顿函数为哈密顿函数为协态方程为协态方程为最优解的必要条件如下：最优解的必要条件如下：（5-7）（5-8）因因正定，故正定，故存在，由上式可确定最优控存在，由上式可确定最优控制制。为寻求最优反馈控制律

10、还需把。为寻求最优反馈控制律还需把与状与状态态联系起来。联系起来。（5-9）控制方程为我们再一次遇到了两点边值问题（已知我们再一次遇到了两点边值问题（已知和和），如前所述，一般要试凑），如前所述，一般要试凑再积分协态方程使再积分协态方程使满足要求。满足要求。但这里处理的是线性微分方程，可找到更简单但这里处理的是线性微分方程，可找到更简单的解法。从的解法。从(5-10)可见，协态可见，协态和状态和状态在终在终端端时刻成线性关系。时刻成线性关系。(5-10)横截条件为然后再来求出然后再来求出（这种方法称为扫描法）。将（这种方法称为扫描法）。将（5-11）代入（）代入（5-

11、9），再代入（），再代入（5-5），得），得（5-11）(5-12)(5-13)由（由（5-11）和（）和（5-8）可得）可得这启发我们假定：上式对任意上式对任意都应成立，故方括号内的项应都应成立，故方括号内的项应为零，这就得出为零，这就得出(5-14)将(5-12)代入(5-13)可得上式是的非线性矩阵微分方程，称为黎卡提（Riccati）矩阵微分方程。一般来说得不出的解析表达式，但可用计算机程序算出的数值解。为了求解，要知道它的边界条件。比较(5-11)和(5-10)可知因此可从到逆时间积分黎卡提微分方程，求出。由(5-9)和(5-11)就可构成最优反馈控制(5-15

12、) 又称为最优反馈增益矩阵。又称为最优反馈增益矩阵。最优反馈系统的结构图如图最优反馈系统的结构图如图5-2所示。所示。(5-16) 图5-2 最优反馈系统的结构图注意到与状态无关，故可在系统未运行前，将先计算出来（称为离线计算），把它存储在计算机中。在系统运行时，将在系统运行时，将从计算机存储从计算机存储元件中取出，与同一时刻测量到的元件中取出，与同一时刻测量到的相乘，就可相乘，就可构成最优控制构成最优控制。由此可见，系统运行时的计算量（称为在线计由此可见，系统运行时的计算量（称为在线计算量）只是一个乘法计算，故可用简单的微计算机算量）只是一个乘法计算，故可用简单的微计算机来

13、完成。来完成。5.3.2 矩阵黎卡提微分方程的求解及的性质矩阵黎卡提微分方程的求解及的性质1、于是可用下面的差分方程来近似黎卡提微分方程于是可用下面的差分方程来近似黎卡提微分方程（5-17）矩阵黎卡提微分方程是非线性的，一般不能求得闭合形式的解。在数字机上求解时，可用一阶差分代替微分2、求解上式时，以求解上式时，以为初始条件，取为初始条件，取为负为负的小量，从的小量，从到到逆时间递推计算，即可出逆时间递推计算，即可出。是对称矩阵，即，表示转置。这可证明如下：因为、、都是对称的，将(5-14)式转置一下，可得因此和一样满足同一黎卡提方程，并且边界条件一样，即。于

14、是，由微分方程解的唯一性可知利用这个对称性，求利用这个对称性，求维维的元时，只的元时，只需积分需积分个方程即可。个方程即可。n3、即使系统是定常的，即系统矩阵A，输入矩阵B为常数阵，加权阵和也是常数阵，但仍为时变阵。这从这从是黎卡提微分方程的解可看出。是黎卡提微分方程的解可看出。时时变时，反馈控制增益也时变，在实现时总是不太方变时，反馈控制增益也时变，在实现时总是不太方便。便。下一段将看到，对线性定常系统，若终端时间下一段将看到，对线性定常系统，若终端时间，且系统满足一些附加条件时，且系统满足一些附加条件时，将变为常数阵将变为常数阵。例例5-1 设系统状态方程为设

15、系统状态方程为（5-18）（5-19）寻找最优控制寻找最优控制使下面的性能指标使下面的性能指标为最小。为最小。解考虑到考虑到是对称阵，设是对称阵，设为简单起见，上式右端省略了自变量为简单起见，上式右端省略了自变量。把上面。把上面的的、、、和和代入黎卡提方程（代入黎卡提方程（5-14）式，）式，可得可得（5-20）（5-21）把状态方程（5-18）和（5-5）式相比较，把性能指标（5-19）和（5-6）式相比较，可得令上式等号左右端的对应元相等，得令上式等号左右端的对应元相等，得（5-23）（5-22）由由到到逆时间积分上面的非线性微分方程逆时间积分上面的非线性微分方

16、程组，即可求得组，即可求得。于是最优控制为。于是最优控制为（5-24）得得（5-25）这是一组非线性微分方程。由边界条件、、、和和随时间变化的曲随时间变化的曲线可求出，如图线可求出，如图5-3(a)、(b)、(c)所示。所示。图图5-3 、、、和和的时间曲线的时间曲线由图5-3可见，定常系统的反馈系数、都是时变的。当比系统的过渡过程时间大很多时，、只在接近时才有较大的变化，其它时间接近于常数。当时，、和都趋于零，则黎卡提微分方程变为黎卡提代数方程解上面的方程组可得、、的稳态值于是最优控制律可表示为于是最优控制律可表示为（5-27）最优控制系统的结

17、构图如图最优控制系统的结构图如图5-4所示。所示。图5-4 重积分系统最优控制的结构图5.4 稳态时连续系统的状态调节器问稳态时连续系统的状态调节器问题题对于稳态问题，当系统状态方程和性能指标中对于稳态问题，当系统状态方程和性能指标中的加权阵满足一定条件时，可得出常数的最优反馈的加权阵满足一定条件时，可得出常数的最优反馈增益阵，这样在实现时非常方便，因此有很大的实增益阵，这样在实现时非常方便，因此有很大的实际意义。际意义。我们不加证明地列出下面的结果，然后再对我们不加证明地列出下面的结果，然后再对问题中的条件作一些说明。问题中的条件作一些说明。现在来研究工程实践中经常碰到的情况：系统是定

18、常的，积分指标的上限为无穷大。这种线性二次型问题称为稳态问题。返回子目录返回子目录为为维，维，为为维，系统是可控的或至少是可维，系统是可控的或至少是可稳的（可稳指不可控的状态是渐近稳定的）。性能稳的（可稳指不可控的状态是渐近稳定的）。性能指标为指标为（5-28）（5-29）线性定常系统其中不受约束，和为常数对称正定阵。或者可将对的要求改为对称半正定，可观测，或至少可检测（可检测指不可观测的状态是渐近稳定的），是的矩阵平方根：。上节我们已经证明了：使上节我们已经证明了：使为为极小的最优极小的最优控制是存在和唯一的，且可表示为：控制是存在和唯一的，且可表示为：（5-3

19、0）其中为维常数阵，称为反馈增益阵，为维正定对称阵，满足下面的矩阵黎卡提代数方程对照有限时间调节器的公式（对照有限时间调节器的公式（5-14）可见，令）可见，令，并将时变阵换成常数阵即得到（，并将时变阵换成常数阵即得到（5-31）式。在）式。在5.5中将针对离散型系统求取与（中将针对离散型系统求取与（5-30）对应的线）对应的线性二次型状态调节器的控制规律。性二次型状态调节器的控制规律。（5-31）可以看到，与有限时间的调节器不同，稳态调节器问题附加了两个条件：系统可控或至少可稳；为对称正定阵，或对称半正定并且可观，至少可检测, 。下面对这些条件作些解释。也就是受控系统

20、的状态变量必须是渐近稳也就是受控系统的状态变量必须是渐近稳定的（这时由定的（这时由产生的反馈控制产生的反馈控制也收敛到也收敛到零）。零）。因为稳态问题的性能指标积分上限为无穷，为因为稳态问题的性能指标积分上限为无穷，为了保证积分值为有限，了保证积分值为有限，和和要收敛到零。要收敛到零。1）系统可控或至少可稳。这个要求是为了保证性能指标的积分为有限值（不趋于无穷）而提出的。如果系统可控，则通过状态反馈可任意配置闭环系统极点，使系统渐近稳定。可控的条件可减弱为可稳，即不可控的状态是渐进稳定的。对有限时间调节器来讲，因为积分上限为有限值，即使系统不可控，状态变量不稳定，但积分指标仍可为

21、有限值，故仍旧有最优解。 2）为正定或为半正定并且可观测至少可检测，。这个条件是保证最优反馈系统稳定而提出的，这个条件是保证最优反馈系统稳定而提出的，因性能指标因性能指标取有限值，还不能保证系统稳定。取有限值，还不能保证系统稳定。例如只要不稳定的状态变量在性能指标中不出例如只要不稳定的状态变量在性能指标中不出现（未被指标函数所现（未被指标函数所“观测观测”到）即可。到）即可。为半正定为半正定时就可能出现这种情况，所以时就可能出现这种情况，所以必须正定。或者半必须正定。或者半正定，但还有正定，但还有可观，至少可检。下面用例子来可观，至少可检。下面用例子来说明。说明。例例5-2

22、已知系统方程已知系统方程要寻找最优控制使要寻找最优控制使最小。最小。（5-32）性能指标是性能指标是（5-33）解设，即未控系统是不稳的，但系统是可控的。若，，即、为正定。黎卡提代数方程（5-31）化为（5-34）（5-35）取正定解取正定解由（5-30）求得最优控制代入状态方程（5-32），得闭环特征根变为即最优反馈系统是稳定的。（5-37）从的形式立即可判断出时最小。这时无反馈控制作用，系统保持为开环不稳定。从黎卡提方程来看，这时有有两个解：和。只有可使，从而性能指标为最小，但这时系统不稳定。若（相当于为半正定），则指标蜕化为例5-3 考虑下面的不可

23、控系统要求出最优控制使为最小。（5-38）（5-39）（5-40）性能指标为解显然，这个系统的是可控的，而不可控，性能指标中只包含了可控的状态变量。由状态方程和性能指标求得显然为半正定阵。可控性阵为（5-41）（5-42）由对构成的可观性阵为是非奇异阵，故为可观测对。令是奇异的，系统不可控。将阵作下面的分解（5-43）为保证正定，根据塞尔维斯特判据，的各阶主子式应大于零，即代入矩阵黎卡提代数方程（5-31）可得由上式可解得（5-44）（5-45）（5-46）将求得的、、的值代入上面正定性条件，可得若，则上式将导致，发生矛盾若，则可成立，可正定。而由(

24、5-39)，时，不可控的状态是稳定的，即系统满足可稳的要求，于是存在正定的最优反馈增益阵。（5-47）最优控制可计算如下（5-48）（5-49）最优闭环系统为当时，闭环系统也是稳定的闭环系统矩阵为它的特征根为（5-50）（5-51）5.5 离散系统的线性二次型问题离散系统的线性二次型问题先考虑一般的线性时变离散系统在终端时间有限时的状态调节器问题，再考虑线性定常离散系统在终端时间无限时的稳态状态调节器的问题返回子目录返回子目录5.5.1 终端时间有限的状态调节器问题终端时间有限的状态调节器问题设系统状态方程为二次型性能指标为（5-53）（5-52）、为半正定阵，为正定阵。要求

25、寻找最优控制序列，使最小。写出哈密顿函数协态方程（5-54）（5-55）横截条件为控制方程为假设（5-56）（5-57）（5-58）把上式代入（5-59）并消去等式两端的，可得必须满足下面的黎卡提矩阵差分方程把（5-58）代入协态方程（5-55）得由状态方程（5-52）和控制方程（5-57）可得所以（5-59）对上式方括号部分应用矩阵求逆引理。令可得矩阵黎卡提差分方程的另一形式（5-61）（5-60）从开始反向递推计算（5-60）即可决定。求出后，下面来决定。由（5-55）得黎卡提方程的终端条件为因而由（5-57）得（5-62）（5-63）式（5-63）可化为另一形式，将

26、（5-60）代入（5-63）并利用(5-61)得取可得对上式花括号内引用前面的矩阵求逆引理是最优反馈增益阵。（5-64）（5-65）n例5-4 设系统状态方程为 n解要求寻找最优序列、，使最小。从给定的系统方程可见，系统矩阵，输入矩阵。给定（5-66）性能指标为（5-67）从给定的性能指标可知加权阵，，。黎卡提方程（5-60）可写成终端值。由反向计算，求出、。（5-68）（5-69）再利用（5-63）式计算，，1。再计算（5-70）（5-71）（5-72）（5-73）5.5.2 稳态状态调节器问题稳态状态调节器问题为维状态向量，为维输入向量。性

27、能指标为设系统的状态方程为（5-74）（5-75）假设（）可控或可稳，为对称正定的常数阵，为对称正定的常数阵，或为对称半正定常数阵，但可观测或可检测，。要求寻找最优控制使最小。可以证明，对于上面的问题，最优控制是存在和唯一的，它可以表示为（5-76） L为mn维的常数反馈增益阵,参考（5-65），将时变阵换成常数阵，L可表示为其中K为nn常数阵,是下面的矩阵黎卡提代数方程的唯一的对称正定解。在（5-61）的矩阵黎卡提差分方程中，将时变阵换为常数阵，即可得出矩阵黎卡提代数方程为（5-77）（5-78）例5-5 系统的状态方程为它是渐近稳定的，即的特征值的模小于1。最优反

28、馈控制系统为下面用例子来说明上述结果的应用。性能指标为（5-80）（5-79）（5-81）n解，，，（5-82）因非奇异，故系统可控。当为半正定，故有下面的分解寻找最优控制使最小。由状态方程（5-80）和性能指标（5-81）可求得下面的矩阵即（5-83）非奇异，故对可观测。于是满足稳态状态调节器问题的条件。由（5-78）令 ,黎卡提方程可写成由上式可解得由（5-76）、（5-77）可得（5-84）最优反馈增益阵闭环系统的系统矩阵为闭环特征根为。显然，根的模都小于1，闭环系统稳定。由状态方程（5-80）可见，开环系统的根为，系统不是渐近稳定的。当，于是，闭环系统不是

29、渐近稳定的，这是由于不满足可观性条件，即（5-83）式为奇异阵，这时稳态状态调节器的最优控制解是不存在的。此外，当，则有。5.6 伺服跟踪问题伺服跟踪问题其中，为维，为维，为维。设理想输出为，跟踪误差为设系统的状态方程和输出方程为（5-85）（5-86）（5-87）返回子目录返回子目录寻找控制（不受约束）使下列性能指标最小其中为正定阵，、为半正定阵，给定。跟踪问题的哈密顿函数为（5-88）（5-89）因U无约束，由控制方程由协态方程得出（5-91）可得（5-90）由上式可见中有一项与成线性关系，另一项与理想输出成线性关系。根据扫描法的思想，令由横截条件得（5

30、-92）（5-93）其中矩阵和向量时间函数待定。将（5-93）式对t微分，得设法从上式中消去，为此把（5-90）和（5-93）代入状态方程（5-85），可求出将（5-95）代入（5-94），即得（5-94）（5-95）（5-96）另外，（5-93）代入（5-91）可得（5-97）（5-96）减去（5-97）可得上式对任意的、均应成立，于是可得（5-98）（5-99）（5-100）上面的微分方程组的边界条件可推导如下：由（5-93）得而由（5-92）得比较上面两式，可得（5-101）（5-102）由上面的时的边界条件出发，逆时间积分（5-99）和（5-100）即可求出、。

31、于是，最优控制可根据（5-90）和（5-93）求得为中一项与状态成正比（同状态调节问题），另一项与时间函数成正比，而是与理想输出有关的，故它表示了跟踪的驱动作用。（5-103）值得指出的是：为了求出当时时刻的，需要知道全部未来时刻的，。这是因为积分（5-100）求是从逆时间进行的。于是在实现最优控制时，必须预先知道在中的变化规律。在某些情况下能做到这点，如跟踪卫星时，卫星的运动可事先计算出来。但大部分情况下的将来值是未知的，如导弹攻击敌机，敌机的运动规律不知道。这时可有两种处理方法：一种是根据对的测量，预报它的将来值，另一种是将看成随机的。用后一种处理方

32、法时，当然只能得到统计平均意义下的最优。例5-6 已知一阶系统其中，，。寻找最优控制使最小。性能指标为（5-104）（5-105）解由（5-104）（5-105）知由（5-103）得由（5-99）可得标量函数满足下面的一阶黎卡提方程（5-106）（5-107）最优轨线由（5-95）求得：标量函数满足微分方程（5-100），即由（5-101）求得边界条件边界条件由（5-102）求得为图5-5 、、以为参数的时间曲线图5-5 (a)表示了当，，，，和理想输出时，以为参数的最优的一组曲线。由图可见，随着的减小，跟踪的能力增强。此外，在接近时，跟踪误差又

33、回升，这时因为，，使的缘故。图5-5 (b)表示了最优控制曲线，随着r的减小，增大，所以提高跟踪能力是以增大控制量为代价的。图5-5 (c)是的变化曲线。由图5-5 (a)可见当，也就是的百分之一时，控制量较大才获得较好的跟踪性能。5.7 设计线性二次型最优控制的若干问题设计线性二次型最优控制的若干问题 1）给出系统的数学模型，通常以、的形式给出（本章只讨论了为单位阵的情况）。 2）给定二次型性能指标中的加权阵、、。通常选用常数对角阵。线性二次型最优控制的设计步骤可大致归结为：返回子目录返回子目录3）解黎卡提方程。对定常系统，终端时间无穷的稳态问题可解矩阵黎卡提

34、代数方程，其它情况一般要解矩阵黎卡提微分方程，或矩阵黎卡提差分方程。对连续系统得到或以后，可求得反馈增益阵或。对离散系统则是求得反馈增益矩阵或，若或阵各元素的值太大，不易在系统中实现，则要更换、、阵，并返回到步骤2），若或阵各元素的值合理，则进行步骤4）。 4）构成闭环系统，求解在典型输入或初始条件下各状态变量的动态响应，若响应不满足要求，则要进一步改变、、阵，并返回步骤2）. 若满足要求，则停止计算。一般来说，把中某个加权系数增大，则对应的状态变量会收敛得更快些，中某个加权系数增大则对应的控制量会小些。从上面的设计步骤可看出，这是一个试凑的过程。若

35、、阵选择得合理，就可以减少试凑次数。若、选择不合理，设计出来的系统是不满意的。因此所谓“最优”控制只是使取最小值，并不一定保证系统的特性在实用中“最优”。另外，采用合理的计算方法可以使黎卡提方程的求解快速和精确。下面对这两个问题作一些简单的讨论。（一）加权阵的选择。若已知各状态变量和控制变量允许的最大值为 , 和 , ，，则作为初始选择，可令然后，再根据情况进行调整，直至设计结果满意为止。（二）对黎卡提矩阵微分方程的求解。建议采用变步长的四阶龙格库塔法。不推荐用欧拉法，因为它的数值特性不好。龙格库塔法的计算机程序在一般的计算机数学库中都可找到。黎卡提矩阵代数方程的数值求解也不

36、是一件容易的事，它的解法有很多种。这里介绍一种迭代法（称为牛顿方法）。在（5-31）所示的黎卡提代数方程中，加上一项再减去可得（5-109）因为故（5-109）可写成迭代格式为（5-110）上式是关于的线性方程，当已求得第步的后，很容易求得下一次迭代值。一般来说迭代不一定收敛，但已证明，若选择初始估计使得闭环系统方程稳定，则迭代将收敛到黎卡提代数方程的唯一正定解。收敛标准可用其中，表示矩阵的第行第j列元素，是指定的小数。（5-111）本节讨论了线性系统二次型指标的最优控制问题，这时可得到线性的最优反馈控制律，即控制量正比于状态变量，可写成，或。把这种线性二次型问

37、题的最优控制与非线性系统的开环控制结合起来，还可减少开环控制的误差。线性二次型问题的最优控制一般可分状态调节器问题和伺服跟踪问题两大类。5.8 小结小结1、返回子目录返回子目录这时最优控制可写成满足黎卡提矩阵微分方程（5-14），终端条件。从到逆向积分（5-14）即可求得，积分方法建议采用变步长四阶龙格库塔法。对离散系统有类似要求，最优控制对于终端时刻有限的连续系统状态调节器问题，要求加权阵、为对称半正定，为对称正定，但并不要求系统完全可控。2、满足矩阵黎卡提差分方程。当连续系统是定常的，为无限时，可得到所谓稳态状态调节器问题。3、这时的附加条件是：系统要可控，至少可稳；要正定，或半正定，但可观测，至少可检，。满足这些条件后，为常数阵。K满足黎卡提矩阵代数方程。可用牛顿迭代法求解。离散系统的稳态状态调节器的求解是类似的，由（5-76）、（5-77）得，而K满足黎卡提代数方程（5-78）。设计线性二次型最优控制系统时，关键问题是要选择合理的、、阵，另外，要选择好的数值方法来求解黎卡提方程。4、5、，、满足微分方程（5-99）、（5-100），终端条件为（5-101）、（5-102）即，是理想输出。跟踪问题的解法可表示为

展开阅读全文

线性系统二次型指标的最优控制线性二次型问题

最新文档