极小值原理及其应用ppt课件

上传人:新** 文档编号:579355730 上传时间:2024-08-26 格式:PPT 页数:104 大小:2.97MB
返回 下载 相关 举报
极小值原理及其应用ppt课件_第1页
第1页 / 共104页
极小值原理及其应用ppt课件_第2页
第2页 / 共104页
极小值原理及其应用ppt课件_第3页
第3页 / 共104页
极小值原理及其应用ppt课件_第4页
第4页 / 共104页
极小值原理及其应用ppt课件_第5页
第5页 / 共104页
点击查看更多>>
资源描述

《极小值原理及其应用ppt课件》由会员分享,可在线阅读,更多相关《极小值原理及其应用ppt课件(104页珍藏版)》请在金锄头文库上搜索。

1、第四章第四章 极小值原理及其应用极小值原理及其应用4.1 经典变分法的局限性经典变分法的局限性4.2 连续系统的极小值原理连续系统的极小值原理4.3 最短时间控制问题最短时间控制问题4.4 最少燃料控制问题最少燃料控制问题4.5 离散系统的极小值原理离散系统的极小值原理4.6 小结小结4.1 经典变分法的局限性经典变分法的局限性 上面我们用经典变分法解最优控制问题时,得出了上面我们用经典变分法解最优控制问题时,得出了最优性的必要条件最优性的必要条件 在得出这个条件时,作了下面的假定:在得出这个条件时,作了下面的假定: 是任意的,即不受限制,它遍及整个向量空间,是任意的,即不受限制,它遍及整个向

2、量空间,是一个开集;是一个开集; 是存在的。是存在的。 在实际工程问题中,控制作用常常是有界的。在实际工程问题中,控制作用常常是有界的。如飞机舵面的偏角有限制,火箭的推力有限制,生如飞机舵面的偏角有限制,火箭的推力有限制,生产过程中的生产能力有限制等等。一般,我们可用产过程中的生产能力有限制等等。一般,我们可用下面的不等式来表示下面的不等式来表示iiMtu)(这这时时 属属于于一一个个有有界界的的闭闭集集,写写成成 , 为为闭闭集集。更更一一般般的的情情况况可可用用下下面面的不等式约束来表示。的不等式约束来表示。 当当 属于有界闭集,属于有界闭集, 在边界上取值时,在边界上取值时, 就不是任意

3、的了,因为无法向边界外取值,这时就不是任意的了,因为无法向边界外取值,这时 就不一定是最优解的必要条件。考察由就不一定是最优解的必要条件。考察由图图4-14-1所表示所表示的几种情况,图中横轴上每一点都表的几种情况,图中横轴上每一点都表示一个标量控制函数示一个标量控制函数 ,其容许取值范围为,其容许取值范围为 。图图4-14-1有界闭集内函数的几种形状有界闭集内函数的几种形状对于图对于图4-14-1(a a) 仍对应最优解仍对应最优解 。对于。对于图图4-1(b) 4-1(b) 所对应的解所对应的解 不是最优解,最优不是最优解,最优解解 在边界上。对于图在边界上。对于图4-14-1(c c)

4、常数,由这个常数,由这个方程解不出最优控制方程解不出最优控制 来(这种情况称为奇异情况)来(这种情况称为奇异情况),最优解,最优解 在边界上。另外,在边界上。另外, 也不一定是存在也不一定是存在的。例如状态方程的右端的。例如状态方程的右端 对对U U的一阶偏导数的一阶偏导数可能不连续,或由于有些指标函数,如燃料最优控制可能不连续,或由于有些指标函数,如燃料最优控制问题中,具有下面的形式问题中,具有下面的形式这时这时 对对U U的一的一阶偏导数不连续。阶偏导数不连续。 经典变分法无法处理上面的情况,必须另辟新经典变分法无法处理上面的情况,必须另辟新的途径。极小值原理就是解决这类问题的有力工具。的

5、途径。极小值原理就是解决这类问题的有力工具。用极小值原理求解控制无约束的最优控制问题和古用极小值原理求解控制无约束的最优控制问题和古典变分法是完全一样的。典变分法是完全一样的。19561956年前苏联学者庞特里年前苏联学者庞特里雅金提出这个原理时,把它称为极大值原理,目前雅金提出这个原理时,把它称为极大值原理,目前较多地采用极小值原理这个名字。较多地采用极小值原理这个名字。庞特里雅金极小值原理写为如下形式:庞特里雅金极小值原理写为如下形式:定理(极小值原理):定理(极小值原理):系统状态方程系统状态方程(4-1)初始条件初始条件 (4-2)4.2 连续系统的极小值原理连续系统的极小值原理控制向

6、量控制向量 ,并受下面的约束,并受下面的约束 终端约束终端约束 (4-3)(4-4)(4-5)指标函数指标函数 要求选择最优控制要求选择最优控制 ,使,使 取极小值。取极小值。 取极小值的必要条件是取极小值的必要条件是 、 、 和和 满足下面的一组方程满足下面的一组方程1 1 正则方程正则方程 (协态方程)(协态方程) (4-164-16)(状态方程)(状态方程) (4-174-17)2 2 边界条件边界条件 (4-18)3 3 横截条件横截条件 (4-19) 4 4 最优终端时刻条件最优终端时刻条件 (4-204-20)5 5在最优轨线在最优轨线 和最优控制和最优控制 上哈密上哈密 顿函数取

7、极小值顿函数取极小值 (4-21)将上面的结果与用古典变分法所得的结果对比可见,将上面的结果与用古典变分法所得的结果对比可见,只是将只是将 这个条件用(这个条件用(4-214-21)代替,其它)代替,其它无变化。无变化。 应该指出,当应该指出,当 存在,且存在,且 得出的得出的 绝对极小,如图绝对极小,如图4-14-1(a a)所示时,)所示时, 即为条件(即为条件(4-214-21)式。所以极小值原理可以解决变)式。所以极小值原理可以解决变分法所能解决的问题,还能解决变分法不能解决的分法所能解决的问题,还能解决变分法不能解决的问题。如何应用条件(问题。如何应用条件(4-214-21)式,这是

8、一个关键,)式,这是一个关键,我们将用具体例子来说明。我们将用具体例子来说明。4.3 最短时间控制问题最短时间控制问题 节省时间意味着提高生产率或先发制人取得军事节省时间意味着提高生产率或先发制人取得军事行动的胜利。所以人们很早就开始了对最短时间控行动的胜利。所以人们很早就开始了对最短时间控制的研究,这方面的研究结果很多,这里先就简单制的研究,这方面的研究结果很多,这里先就简单的重积分系统的最短时间控制展开讨论。的重积分系统的最短时间控制展开讨论。 例例4-1 4-1 重积分系统的最短时间控制重积分系统的最短时间控制状态方程状态方程 (4-22)初始条件为初始条件为 (4-23)终端条件为终端

9、条件为 (4-24)控制约束为控制约束为 (4-25)求出使性能指标求出使性能指标 (4-26)取极小的最优控制。取极小的最优控制。解解 因为控制作用有限制(属于有界闭集),故要因为控制作用有限制(属于有界闭集),故要用极小值原理求解。取哈密顿函数用极小值原理求解。取哈密顿函数 协态方程为协态方程为 (4-28) (4-29)(4-27)积分上面两个方程可得积分上面两个方程可得 (4-304-30) (4-314-31)其中,其中, 、 是积分常数。是积分常数。 由表达式(由表达式(4-274-27)可见,若要选择)可见,若要选择 使使 取极小,只要使取极小,只要使 越负越好,而越负越好,而

10、,故当故当 ,且,且 与与 反号时,反号时, 取极取极小,即最优控制为小,即最优控制为(4-27)由此可见,最优解由此可见,最优解 取边界值取边界值+1+1或或-1-1,是开关函,是开关函数的形式。什么时候发生开关转换,将取决于数的形式。什么时候发生开关转换,将取决于 的符号。而由(的符号。而由(4-314-31)式可见,)式可见, 是是 的线性函的线性函数,它有四种可能的形状(见图数,它有四种可能的形状(见图4-24-2) (4-314-31)图图4-2 4-2 与与 的四种形状的四种形状(4-314-31)由图由图4-24-2可见,当可见,当 为为 的线性函数时的线性函数时 最多最多改变一

11、次符号。改变一次符号。 也相应有四种序列也相应有四种序列从上面两式消去从上面两式消去t t,即可得相轨迹方程,即可得相轨迹方程 (4-33)当当 时,状态方程的解为时,状态方程的解为 (4-324-32)下面来求出下面来求出 取不同值时的状态轨迹(也称为相取不同值时的状态轨迹(也称为相轨迹)。轨迹)。当当 时,状态方程的解为时,状态方程的解为 (4-344-34)消去消去 ,可得相轨迹方程,可得相轨迹方程图图4-3 4-3 相轨迹图相轨迹图在图在图4-34-3中用实线表示,不同的中用实线表示,不同的C C值可给出一簇曲线。值可给出一簇曲线。由(由(4-324-32)第一式知)第一式知 增大时增

12、大时 增大,故相轨迹进增大,故相轨迹进行方向是自下而上,如图中曲线上箭头所示行方向是自下而上,如图中曲线上箭头所示。在图在图4-34-3中用虚线表示。因中用虚线表示。因 增大时,增大时, 减少,减少,故相轨迹进行方向是自上而下。故相轨迹进行方向是自上而下。两簇曲线中,每一簇中有一条曲线的半支进入原点。两簇曲线中,每一簇中有一条曲线的半支进入原点。在在 的曲线簇中,通过原点的曲线方程为的曲线簇中,通过原点的曲线方程为 (4-364-36)这半支用这半支用 表示。表示。在在 的曲线簇中,通过原点的曲线方程为的曲线簇中,通过原点的曲线方程为 (4-374-37) 半半支用支用 表示。表示。 和和 这

13、两个半支通过原点的抛物线称为开这两个半支通过原点的抛物线称为开关线,其方程为关线,其方程为 (4-38)图图4-4 4-4 最优相轨迹与开关线最优相轨迹与开关线当初始状态当初始状态 在开关线左侧,如图在开关线左侧,如图4-44-4中中D D点,点,从从D D点转移到原点,并在转移过程中只允许点转移到原点,并在转移过程中只允许 改变一改变一次符号的唯一途径如图所示,即从次符号的唯一途径如图所示,即从D D点沿点沿 的抛的抛物线移到与物线移到与 相遇,在相遇点改变相遇,在相遇点改变 的符号为的符号为 ,再沿,再沿 到达原点。因此,只要初始状态到达原点。因此,只要初始状态在开关线左侧,都沿在开关线左

14、侧,都沿 的抛物线转移到的抛物线转移到 ,然后然后 改变符号为改变符号为 ,并沿,并沿 到达原点。同到达原点。同样,当初始状态在开关线右侧,如图样,当初始状态在开关线右侧,如图4-44-4中的中的M M点,则点,则先沿先沿 的抛物线转移到的抛物线转移到 ,然后,然后 改变符改变符号为号为 ,并沿,并沿 到达原点。到达原点。在图在图4-44-4中开关曲线(由中开关曲线(由 和和 组成)把组成)把 - - 平面划成两个区域。开关线左侧(图中划阴影线部平面划成两个区域。开关线左侧(图中划阴影线部分)区域用分)区域用 表示,表示, 中的点满足中的点满足 则则 (4-394-39)开关线右侧区域用开关线

15、右侧区域用 表示,表示, 中的点满足中的点满足 则则 (4-4-4040)于是最优控制规律可表示为状态于是最优控制规律可表示为状态 的函数,即的函数,即 (4-414-41) (4-424-42)根据上面的关系,根据上面的关系, 可以通过非线性的状态可以通过非线性的状态反馈来构成。反馈来构成。图图4-5 4-5 重积分系统时间最优控制的框图重积分系统时间最优控制的框图图图4-54-5表示了重积分系统时间最优控制的工程实现。表示了重积分系统时间最优控制的工程实现。由图可见由图可见 时,时, ,即满足(,即满足(4-394-39)式;)式; 时,时, ,即满足(,即满足(4-404-40)式。)式

16、。 图中的继电函数早期是用继电器实现的,由于继电图中的继电函数早期是用继电器实现的,由于继电器在动作时有砰砰声,故这种最优控制又称为器在动作时有砰砰声,故这种最优控制又称为“砰砰砰砰”控制。当然,现在可以用无接触的电子开关或控制。当然,现在可以用无接触的电子开关或微处理机来实现这种控制规律,既方便、可靠,又微处理机来实现这种控制规律,既方便、可靠,又无砰砰声了。无砰砰声了。例例4 42 2 积分环节和惯性环节串联系统的最短时间控制积分环节和惯性环节串联系统的最短时间控制其传递函数为其传递函数为 (4-43)其中其中 为大于零的实数。由(为大于零的实数。由(4-434-43)式可得运动方)式可得

17、运动方程为程为(4-44)令令 和和 为状态变量,为状态变量,并有并有(4-45)控制约束为控制约束为 ,最优控制只能取,最优控制只能取 。(1 1)对于)对于 情形,状态方程为情形,状态方程为其状态轨线相迹为其状态轨线相迹为 (4-46)(a) u=1图4-6 系统的相轨迹如图如图4-6(a)4-6(a)所示,箭头为状态运动方向。它有一条所示,箭头为状态运动方向。它有一条渐近线渐近线 ,如图中虚线所示。在这簇曲,如图中虚线所示。在这簇曲线中,只有线中,只有 到达平衡位置到达平衡位置0 0。 (4-47)(2 2)对于)对于 的情形,状态方程为的情形,状态方程为其状态轨线相迹为其状态轨线相迹为

18、 (4-48)(b) u= -1图4-6 系统的相轨迹如图如图4-6(b)4-6(b)所示,箭头为状态运动方向。它有一条所示,箭头为状态运动方向。它有一条渐近线渐近线 ,如图中虚线所示。在这,如图中虚线所示。在这簇曲线中,只有簇曲线中,只有 到达平衡位置到达平衡位置0 0。 (4-494-49)将将 和和 合并成一条曲线,其方程为合并成一条曲线,其方程为 (4-50)令令 (4-51)(4-52)于是曲线于是曲线 方程可写为方程可写为 (4-534-53)图4-7 系统的时间最优相轨迹和开关线系统的时间最优相轨迹和开关线曲线曲线 将相平面分成两部分,如图将相平面分成两部分,如图4-74-7所示

19、。所示。的上半平面包括的上半平面包括 记为记为 , 的下半平面的下半平面包括记为包括记为 ,那么,那么 (4-544-54)由于最优控制只取 ,它们的切换最多一次,根据状态初始位置不同,它们最优控制是不同的,如图中初始状态在A点时,它属于 ,所以开始 。当运动到达时 , 与交于a点,马上切换为 ,以后沿 运动直到平衡位置0,再除去控制量 。当初始状态在B点时,它属于 ,最优控制应先取 ,到达 交于b点时,马上切换为 ,以后沿 继续运动,直到平衡位置0,切除控制量。综上所述,最优控制的状态反馈规律为综上所述,最优控制的状态反馈规律为 (4-55)最短时间最优控制的方框图如图最短时间最优控制的方框

20、图如图4-84-8所示,图中虚所示,图中虚线部分是最短时间最优控制器。线部分是最短时间最优控制器。图4-8 系统的时间最优控制框图系统的时间最优控制框图4.4 最少燃料控制问题最少燃料控制问题在人类的经济活动、军事行动以及其它活动中在人类的经济活动、军事行动以及其它活动中无时无刻不在消耗着形形色色的燃料,减少燃料消无时无刻不在消耗着形形色色的燃料,减少燃料消耗,节省能源成了当今世界科研的重要课题。特别耗,节省能源成了当今世界科研的重要课题。特别在宇宙航行中,所消耗的燃料十分昂贵,而且如果在宇宙航行中,所消耗的燃料十分昂贵,而且如果需要的燃料多了,会减少运送的有效载荷(如卫星、需要的燃料多了,会

21、减少运送的有效载荷(如卫星、空间站等),因此在宇宙航行中最早提出了最少燃空间站等),因此在宇宙航行中最早提出了最少燃料消耗的最优控制问题。一般来说,控制物体运动料消耗的最优控制问题。一般来说,控制物体运动的推力或力矩的大小,是和单位时间内燃料消耗量的推力或力矩的大小,是和单位时间内燃料消耗量成正比的,因而在某一过程中所消耗的燃料总量可成正比的,因而在某一过程中所消耗的燃料总量可用下面的积分指标来表示用下面的积分指标来表示其中其中 是单位时间内的燃料消耗量。是单位时间内的燃料消耗量。 值得指出的是,在最少燃料控制问题中,终端时间值得指出的是,在最少燃料控制问题中,终端时间 一般应给定,或者是考虑

22、响应时间和最少燃料一般应给定,或者是考虑响应时间和最少燃料的综合最优问题。因为若考虑纯粹的最少燃料控制问的综合最优问题。因为若考虑纯粹的最少燃料控制问题,则将导致系统的响应时间过长,理论上要经过无题,则将导致系统的响应时间过长,理论上要经过无穷长时间,系统才转移到所要求的状态。这是很显然穷长时间,系统才转移到所要求的状态。这是很显然的,因为燃料消耗得少,推力就小,系统的运动加速的,因为燃料消耗得少,推力就小,系统的运动加速度和速度就小。另一方面所指定的时间度和速度就小。另一方面所指定的时间 必须大必须大于同一问题的最短时间控制所解出的最短时间于同一问题的最短时间控制所解出的最短时间 ,否则最少

23、燃料控制将会无解。我们还是以重积分系统否则最少燃料控制将会无解。我们还是以重积分系统为例来说明最少燃料控制的解法。为例来说明最少燃料控制的解法。例例4 43 3 重积分系统的最少燃料控制重积分系统的最少燃料控制系统状态方程系统状态方程 (4-564-56)初始条件初始条件 (4-574-57)终端条件终端条件 (4-58)控制约束控制约束 (4-594-59)求出使性能指标求出使性能指标 (4-604-60)取极小的最优控制取极小的最优控制。解解 用极小值原理求解,哈密顿函数为用极小值原理求解,哈密顿函数为(4-61)协态方程为协态方程为 (4-62)积分上面两个方程可得积分上面两个方程可得

24、(4-63)这里哈密顿函数这里哈密顿函数 与最短时间控制的与最短时间控制的 不同,考不同,考察的表达式可知,无论察的表达式可知,无论 为何值,使极为何值,使极小等价于求下式的极小小等价于求下式的极小(4-61)(4-27)考察上面的表达式,当考察上面的表达式,当 时,如时,如 ,则则 ,故应取,故应取 ;当;当 时,则应取时,则应取 ,使使 ,于是可得出使,于是可得出使 极小极小的最优控制规律为的最优控制规律为 (4-64) (4-65) (4-66) (4-67)注意到上面得到的最优控制规律中前两式确定了注意到上面得到的最优控制规律中前两式确定了 可取值可取值0 0、1 1,而后两式只确定了

25、,而后两式只确定了 的符号,未确的符号,未确定定 的值。但由的值。但由 的表达式可知,只要的表达式可知,只要 就随就随 而线性变化并有图而线性变化并有图4-24-2所示四种所示四种图形,于是图形,于是 只可能在两个孤立的时刻只可能在两个孤立的时刻 取得值取得值+1+1和和-1-1。这两个孤立时刻。这两个孤立时刻 的值对积分指标的值对积分指标 的的贡献为零,因此我们可不加考虑,而认为贡献为零,因此我们可不加考虑,而认为 只能取只能取值值0 0和和1 1。这说明。这说明 可用带死区的继电函数描述,可用带死区的继电函数描述,如图如图4-94-9。和最短时间控制一样,。和最短时间控制一样, 时的状态轨

26、时的状态轨迹为迹为图图4-2 4-2 与与 的四种形状的四种形状(4-314-31)图4-9 带死区的继电函数图4-10 最少燃料控制的控制量和相轨迹 (4-68)(4-69)在图4-10中用实线表示。 时的状态轨迹为 (4-69)在图4-10中用虚线表示。最少燃料控制的特点是最少燃料控制的特点是 可取零值。可取零值。当当 ,由状态方程可求得,由状态方程可求得 (4-704-70)状态轨迹为水平线,在图状态轨迹为水平线,在图4-104-10中用点划线表示。当中用点划线表示。当 时,水平线向右移动,时,水平线向右移动, 时,水平时,水平线向左移动。线向左移动。若初始状态 是第一象限内的点A,则从

27、图4-10状态轨迹的运动方向可知,引向原点的轨迹有下面几种(见图4-11):图4-11最少燃料控制的相轨迹1 1 沿沿ABOABO到达原点,对应的控制序列到达原点,对应的控制序列 为为 。这是最少燃料控制,但因为在。这是最少燃料控制,但因为在BOBO段段 (即(即 ),故),故 到达原点的时间到达原点的时间 为无穷大,不能为无穷大,不能满足给定值的要求满足给定值的要求。2 沿沿ADOADO到达原点,对应的控制序列为到达原点,对应的控制序列为 。这是最短时间控制的轨迹,到达原点时间将小于给定这是最短时间控制的轨迹,到达原点时间将小于给定的的 ,但它不是最少燃料控制。,但它不是最少燃料控制。3 沿

28、沿ACEOACEO到达原点。其中到达原点。其中C C点和点和E E点坐标待定,以满点坐标待定,以满足给定的终端时刻足给定的终端时刻 。这是满足终端时刻。这是满足终端时刻 要求的要求的最少燃料控制。最少燃料控制。设初始点设初始点A A的时刻为的时刻为 , ,坐标为坐标为 ;到达;到达C C点的时刻为点的时刻为 ,坐标为,坐标为 ,到,到E E点的点的时刻为时刻为 ,坐标为,坐标为 ;到达原点;到达原点 的的时刻为时刻为 。ACAC段对应段对应 ,CECE段段 ,EOEO段段 ,由积分状态方程(,由积分状态方程(4-564-56)可得)可得(4-564-56)(4-71)(4-72)(4-564-

29、56)(4-73)(4-74)(4-564-56) (4-75) (4-76)由(由(4-75)、()、(4-76)两式消去)两式消去 ,再,再考虑(考虑(4-73)式可得)式可得 (4-77) (4-73) (4-76)(4-75)(4-78)(4-74)由上面六个方程来解六个未知数:由上面六个方程来解六个未知数: 、 、由(由(4-71)、()、(4-72)两式得)两式得 : (4-71)(4-72)(4-80)(4-79)由(由(4-784-78)、()、(4-794-79)两式得)两式得 将(将(4-814-81)代入()代入(4-744-74)式得)式得 (4-78)(4-79)(4

30、-814-81)(4-74)再再利用(利用(4-774-77)和()和(4-804-80)式,即得)式,即得 由上式解出由上式解出 (4-82)(4-77)(4-80)这里必须保证这里必须保证 为实数,并在上式中选择正确为实数,并在上式中选择正确的加减号。为了使的加减号。为了使 为实数,必须有为实数,必须有 这说明,若这说明,若 规定小于最短时间(使上式等于规定小于最短时间(使上式等于零的零的 值),最少燃料控制是无解的。值),最少燃料控制是无解的。为了选择正确的加、减号,应注意有下面的关系为了选择正确的加、减号,应注意有下面的关系即即 ,由(,由(4-814-81)式可得)式可得 于是从(于

31、是从(4-824-82)式可知,应选择加号,即)式可知,应选择加号,即 (4-83)(4-814-81)(4-82)将上式代入(将上式代入(4-784-78)和()和(4-794-79)式可得)式可得 (4-84) (4-78)(4-79)(4-85) (4-83)这样,我们就完全可以确定转换点这样,我们就完全可以确定转换点C C和和E E的坐标。由的坐标。由图图4-114-11可见可见E E点的坐标点的坐标 处在开处在开关线关线 上上 ,可按最短时间控制一样的方式来构,可按最短时间控制一样的方式来构成反馈控制。成反馈控制。C C点坐标点坐标 由式由式(4-804-80)和()和(4-834-

32、83)给出,由此二式可见,它们取)给出,由此二式可见,它们取决于决于 和和 、 。当。当 给定时,还要给定给定时,还要给定一个初始条件,譬如一个初始条件,譬如 ,才能从此二式消去,才能从此二式消去 得到下面的得到下面的C C点轨迹曲线(在图点轨迹曲线(在图4-124-12中用中用 来表示)来表示)(4-80) (4-83)当当 、 可取各种值时,开关曲线将取决于初可取各种值时,开关曲线将取决于初始条件,这在工程实现上是不方便的。始条件,这在工程实现上是不方便的。最后,我们要强调指出,规定了终端时刻,最少燃料最后,我们要强调指出,规定了终端时刻,最少燃料的控制量的控制量 不仅可取边界值不仅可取边

33、界值 ,而且还可取,而且还可取零值,对重积分系统来讲,系统有加速段,减速段和零值,对重积分系统来讲,系统有加速段,减速段和等速运行段。而最短时间控制系统只有加速和减速段。等速运行段。而最短时间控制系统只有加速和减速段。以飞机为例,从一个城市以规定的时间飞到另一城市以飞机为例,从一个城市以规定的时间飞到另一城市且使燃料消耗为最少的策略是,作一段加速飞行,作且使燃料消耗为最少的策略是,作一段加速飞行,作一段等速滑翔飞行,再作一段减速飞行,而且规定的一段等速滑翔飞行,再作一段减速飞行,而且规定的时间要足够大,否则最少燃料问题是无解的时间要足够大,否则最少燃料问题是无解的。图图4-12 4-12 满足

34、终端时刻满足终端时刻 要求的最少燃料控制的相轨迹要求的最少燃料控制的相轨迹4.5 离散系统的极小值原理离散系统的极小值原理 在现实世界中有些系统本身是离散的,要用离在现实世界中有些系统本身是离散的,要用离散的状态方程来加以描述。有些系统本身虽是连续散的状态方程来加以描述。有些系统本身虽是连续的,但采用计算机控制,控制量只在离散的时刻算的,但采用计算机控制,控制量只在离散的时刻算出来,设计这类系统时,连续对象的状态方程要进出来,设计这类系统时,连续对象的状态方程要进行离散化。下面就来讨论离散系统的极小值原理。行离散化。下面就来讨论离散系统的极小值原理。问题的提法如下:问题的提法如下:系统的状态方

35、程为系统的状态方程为 (4-864-86) 为为 维向量,维向量, 为为 维向量。维向量。上式右端在一般情况下是上式右端在一般情况下是 和和 的非线性的非线性函数。函数。初始条件为初始条件为 (4-874-87)终端约束为终端约束为 (4-884-88) 是是 维向量方程。维向量方程。性能指标为性能指标为 (4-894-89)要求确定控制序列要求确定控制序列 , ,1 1, ,使使 最小。最小。下面按控制向量下面按控制向量 受约束和不受约束两种情况受约束和不受约束两种情况来讨论。来讨论。(一)控制向量无约束(一)控制向量无约束 1这时可用古典变分法求解。作增广性能指标这时可用古典变分法求解。作

36、增广性能指标(4-90)式中,式中, 是协态向量(是协态向量( 维),维), 是是拉格朗日乘子向量(拉格朗日乘子向量( q 维)维) 引入下面的哈密顿函数引入下面的哈密顿函数 (4-91) 并令并令 (4-92)则 (4-93) 的一次变分可写成 (4-94)上式中 。由于初始条件 给定,故 。根据 以及 , , 的任意性,可推导出最优控制序列应满足的必要条件:正则方程 (4-95) (4-96) 横截条件 (4-97) 控制方程 (4-98) 初始条件 (4-99)所得结果与连续系统类似,但应注意协态方程所得结果与连续系统类似,但应注意协态方程(4-954-95)的右侧无负号。从上面的一组方

37、程可知,)的右侧无负号。从上面的一组方程可知,我们已知初始条件我们已知初始条件 ,又从横截条件可,又从横截条件可求出求出 ,这样得出了离散非线性两点边值问,这样得出了离散非线性两点边值问题,求解一般是困难的。题,求解一般是困难的。(二)控制向量有约束。(二)控制向量有约束。 这时这时 一般不成立。根据极小值原一般不成立。根据极小值原理,哈密顿函数在最优控制序列上取极小值,即理,哈密顿函数在最优控制序列上取极小值,即例例4 44 4 系统的状态方程为系统的状态方程为 (4-4-100100)无约束,指标函数为无约束,指标函数为 (4-101)用离散极小值原理求最优控制用离散极小值原理求最优控制

38、,使,使 取极小。取极小。解解 哈密顿函数为哈密顿函数为 (4-1024-102)协态方程为协态方程为 (4-1034-103)即协态为常数。即协态为常数。横截条件为横截条件为 (4-1044-104)控制方程为控制方程为 (4-105) (4-106)因协态为常数,故控制也是常数,令因协态为常数,故控制也是常数,令 (4-1074-107)现在来解系统的状态方程,由初始条件现在来解系统的状态方程,由初始条件 可得可得 (4-108) (4-109)因为因为 (4-1104-110)故故 (4-1114-111)于是最优控制为于是最优控制为 (4-1124-112) 代入系统状态方程,可求得最

39、优状态为代入系统状态方程,可求得最优状态为 (4-113)例4-5 在N级换热器系列的最优设计中,设 为流出第 个换热器的油料温度, 是第 个换热器的换热面积, 是第 个换热器的热载体温度, 是第 个换热器的正常数。则状态方程为 (4-114)方程右端对 是非线性的。这里 表示加热器级数,是空间离散变量,但在求解时与时间离散问题一样。边界条件为 (4-115)性能指标是使换热总面积最小,即 (4-116)最小。解 这里 无约束,可用变分法求解。作哈密顿函数 (4-117)协态方程为 即 (4-118)控制方程为 即 (4-119)由上式求出 比求 容易,故解得 (4-120)将(4-120)式

40、代入协态方程(4-118),消去 ,得 (4-121)由状态方程(4-114)可解出 (4-122)令 ,由上式可得 (4-123)将(4-122)、(4-123)代入(4-121),消去 ,可得 (4-124)(4-124)式是关于 的非线性差分方程,若 已知和 就可递推求出 ,故从终端 向后递推比较方便。已知 ,但不知 ,只能先假定一个 ,由(4-124)算出 ;再循环用(4-124)可依次递推求得, , 。若最后求出的 等于或很接近于给定的初始条件 ,则这组序列 就是最优状态轨迹;否则另取 再重算,直到 ,这组序列 就是最优状态轨迹。把 代入式(4-122)就可求出最优控制序列 。从上面

41、的说明可知,我们要反复试凑以满足 的边界条件,这是非线性两点边值问题所引起的。这里因为 的初始和终端条件都给定,我们采用的解题技巧是消去协态量 ,直接解 。 4.6 4.6 小结小结1、极小值原理是对经典变分法的扩展,它可以解决经典变分法无法解决的最优控制问题。也就是当控制有约束(控制变量属于一个有界闭集,可表示为 或 ),哈密顿函数 对 不可微时,要用极小值原理。2、极小值原理所得出的最优控制必要条件与变分法所得的条件的差别,仅在于用哈密顿函数在最优控制上取值的条件 代替 ,而后者可作为前者的特殊情况。其它条件如正则方程,横截条件,边界条件等都一样。 参看图4-1可知,极小值原理可解决在边界

42、上取极值的情况,因此比变分法所得的条件大大加强了。总之,极小值原理可解决经典变分法可解决的问题,也可解决经典变分法不能解决的问题。所以有些书上把用经典变分法解决的问题也称为用极小值原理求解。若系统方程是非线性的,则用极小值原理求解(和经典变分法一样)将产生非线性微分方程两点边值问题,求解非常困难。3、前面我们讨论了极小值原理,但经过简单的转换就可将极大值原理化为极小值原理。设要使性能指标 极大,对应的协态变量为 ,拉格朗日乘子为 ,则令 就化为 的极小值问题,并且极小值问题 的和 与 和 的关系为 , 。4、离散系统的极小值原理与连续系统的极小值原理所得出的最优解的必要条件在形式上是相似的,只

43、是前者的协态方程(4-95)的右端没有负号。若系统方程是非线性差分方程,则离散极小值原理将产生非线性差分方程两点边值问题。从例4-5可见,即使对于一个简单的问题,求解也是很困难的。5、极小值原理可成功地解决最短时间控制问题。若控制量满足约束条件 ,则最短时间的控制量只能取约束的边界值+1或-1。于是在系统中必然要有一个二位置继电式元件来生 这就是所谓的砰砰控制。对于简单二阶系统重积分系统,在相平面 上的相轨迹是抛物线,开关曲线由 和 两个半支抛物线组成。6、最少燃料控制的控制量可取边界值+1、-1和0,因此系统中必然要有一个包含死区的三位置继电式元件来产生 。重积分系统的相轨迹除抛物线外还有平行于横轴的直线段。另外,终端时刻 必须大于同一问题的最短时间控制所需时间,否则最少燃料控制无解。

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 教学/培训

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号