28第三章 极大值原理前面一章介绍的变分法属于经典变分学的内容经典变分学只能解决容许控制属于开集的一类最优控制问题,而且对轨线x( t )、函数L、f均有连续可微要求而在实际工程应用问题中,这些要求一般是无法得到满足的极大值原理就是为了解决容许控制属于闭集的一类最优控制问题而提出来的极大值原理(Maximum Principle),或称最大值原理,也有称为极小值原理或最小值原理(Minimum Principle),是前苏联数学家庞特里亚金(俄文ЛОНТЛЯТИН,英文Pontryagin)受力学中 amilton原理启发,于1958年提出并加以证明的极大值原理的提出,将经典变分学推进到现代变分学,也成为了现代控制理论的重要基石3.1 泛函极值的充分条件(1) 几个有关定义I. 正常场定义3-1:若(t,x)平面某一区域D上每一点都有曲线族),( ctxx =中一条且仅有一条通过,则称曲线族在区域D上形成一个正常场曲线族),( ctxx =上点(t,x)处的切线的角系数称为场在点(t,x)的斜率II. 中心场定义3-2:若区域D上曲线族),( ctxx =的全部曲线都通过一点(t0,x0),即它们形成曲线束,且束心也属于D,同时除束心外,曲线在D内不再相交,曲线布满区域D,则该场为中心场。
III. 极值曲线场定义3-3:若正常场或中心场是由某一变分问题的极值曲线族所形成,则称之为极值曲线场2) 维尔斯特拉斯E函数(Weierstrass Erdmann Function)设有泛函∫=fttdtttxtxLxJ0]),(),([)( & (3-1-1)若用p(x,t)表示其极值曲线场中极值曲线斜率,则可以证明泛函增量可表示为∫=∆fttdtttxptxtxExJ0]),,(),(),([)( &(3-1-2)其中],,[][],,[],,[],,,[ tpxLppxtpxLtxxLtpxxE∂∂−−−= &&&(3-1-3)称为维尔斯特拉斯E函数3) 泛函J在曲线上达到极值的充分条件29设泛函J在曲线c上达到极值,可分为弱极值和强极值两种情况,其充分条件分别为:对于弱极值,1) 曲线c应是满足极值条件的极值曲线;2) 极值曲线c能够被包含在极值曲线场中;3) 对于c近旁所有点(x, t)以及近于p(x, t)的x&值,函数),,,( tpxxE&不变号,极小值时E≥0,极大值时E≤0对于强极值,1) 曲线c应是满足边界条件的极值曲线;2) 极值曲线c能够被包含在极值曲线场中;3) 对于c近旁所有点(x, t)以及任意的x&值,函数),,,( tpxxE&不变号,极小值时E≥0,极大值时E≤0。
3.2 连续系统极大值原理考虑系统状态方程]),(),([)( ttutxftx =&(3-2-1)其中,mnRtuRtx ∈∈ )(,)(,m≤n初始状态00)( xtx = (3-2-2)终态满足0]),([ =ffttxψ(3-2-3)其中,rR∈ψ,r≤nu(t)属于有界闭集Ω,受不等式]),(),([ ttutxg≥0 (3-2-4)约束,g为p维连续可微函数,p≤m求最优控制)(*tu,满足上列条件,并使性能指标∫+Φ=fttffdtttutxLttxuJ0)]),(),([]),([)( (3-2-5)达到极小值这里与前面讨论的问题不同的是u(t)有界并受不等式约束u(t)有界一般可以考虑为是分段连续函数,对不等式约束则要设法转化为等式约束处理引进新变量Z(t)和w(t),取0)(],),(),([)]([02== tZttutxgtZ&(3-2-6)300)(),()(0== twtutw&(3-2-7)这里,取gZ =2&可以保证g非负;而由u(t)的分段连续性,有)(tw&的分段连续性,则进一步有w(t)分段光滑连续因此,可以采用Lagrange乘子法进行求解。
分别取Lagrange乘子nR∈λ,rR∈ν,pR∈γ,构造广义性能指标∫−+−+++Φ=fttffffadtZtwxgxtwxftwxLttxtttxuJ0]}),,([]),,([),,({]),([)(]),([)(2&&&&&aaaγλψν(3-2-8)取),,(),,(),,,( twxftwxLtwxH &&&aλλ+=(3-2-9)]),,([),,,(),,,,,,(2ZtwxgxtwxHtZwxxF&&&&&&& −+−=aaγλλγλ (3-2-10)则有∫++Φ=fttffffadttZwxxFttxtttxuJ0),,,,,,(]),([)(]),([)( γλψν&&&a(3-2-11)求其一阶变分有ZwxtaJJJJJfδδδδδ +++=(3-2-12)其中各部分分别为ftfftttftfttFtttFdttJffffffδνψδψνδδ}{}{ +∂∂+∂Φ∂=++Φ∂∂=∫+aa(3-2-13)}][){(}{}{}{00∫∫∂∂−∂∂+∂∂+∂∂+∂Φ∂=∂∂+∂∂++Φ∂∂=fffffttttftttfxdtxFdtdxFxxFxxxxdtxFxxFxxxJ&&&&aaaaaaaaδδνψδδδψνδδ(3-2-14)式(3-2-14)中,由于ffftxtxx δδδ &+= )((参见第二章第6节),则有∫∂∂−∂∂+∂∂−∂∂+∂∂+∂Φ∂=fffttfttfxdtxFdtdxFxtxFxxFxxxJ0][)(}{&&&&aaaaδδνψδδ(3-2-14’)∫∂∂−∂∂=fftttwdtwFdtdwwFwJ0])(&&aaδδδ(3-2-15)∫∂∂−∂∂=fftttZdtZFdtdZZFZJ0])(&&aaδδδ(3-2-16)31由泛函极值必要条件0=aJδ及Zwxxtffδδδδδ ,,,,的任意性,得此泛函问题的极值必要条件为:欧拉方程:0=∂∂−∂∂xFdtdxF&(3-2-17)0=∂∂wFdtd&(3-2-18)0=∂∂ZFdtd&(3-2-19)横截条件:0}{ =∂∂−+∂∂+∂Φ∂ftffxFxFtt &&aaνψ(3-2-20)0}{ =∂∂+∂∂+∂Φ∂ftxFxx &νψa(3-2-21)0=∂∂ftwF&(3-2-22)0=∂∂ftZF&(3-2-23)将F函数定义式(3-2-10)代入以上各式,可得泛函极值必要条件为:欧拉方程:γλxgxH∂∂−∂∂−=T&(3-2-24)0}{ =∂∂+∂∂γwgwHdtd&&T(3-2-25)0)( =Zdtd&Tγ(3-2-26)横截条件:0}{ =+∂∂+∂Φ∂ftffHttνψa(3-2-27)0}{ =−∂∂+∂Φ∂ftxxλνψa(3-2-28)320}{ =∂∂+∂∂ftwgwHγ&&T(3-2-29)0)( =ftZ&Tγ (3-2-30)由3.1节中泛函达到极值的充分条件,维尔斯特拉斯E函数在泛函极小值时沿最优轨线非负,即有0)()()(),,,,,(),,,,,(************≥∂∂−−∂∂−−∂∂−−−=ZFZZwFwwxFxxZwxZwxFZwxZwxFE&&&&&&&&&&&&&&&aaa(3-2-31)将F函数定义式(3-2-10)代入(3-2-31),并考虑由(3-2-18)和(3-2-22)两式,有0≡∂∂wF&;由(3-2-19)和(3-2-23)两式,有0≡∂∂ZF&,以及在最优轨线上有),,(2tuxgZ =&,所以有0),,,(),,,(*****≥−= twxHtwxHE && λλ (3-2-32)考虑uw=&,上式即),,,(),,,(*****tuxHtuxH λλ≥ (3-2-33)或),,,(min),,,(*****tuxHtuxHuλλΩ∈= (3-2-33’)以上为极大值原理的简单推导。
总结以上讨论,可以将庞特里亚金极大值原理表示为下列定理,定理3-1:设系统的状态方程为]),(),([)( ttutxftx =& (3-2-1)控制变量u(t)是有第一类间断点的分段连续函数,属于m维空间中的有界闭集Ω,满足不等式约束条件]),(),([ ttutxg≥0 (3-2-4)则为把状态x(t)自初始状态00)( xtx = (3-2-2)转移满足边界条件0]),([ =ffttxψ (3-2-3)的终态,其中tf未知,并使性能指标(泛函)33∫+Φ=fttffdtttutxLttxuJ0)]),(),([]),([)( (3-2-5)达到最小值,实现最优控制的条件是:(1) 设u*(t)是最优控制,x*(t)为由此最优控制产生的最优轨线,则存在与其相对应的协态向量λ*(t),使x*(t)和λ*(t)满足规范方程组∂∂=∂∂=]),(),(),([)(]),(),(),([)(********ttuttxHxtttuttxHtxλλλλ&&(3-2-34)(2) 在最优轨线上与最优控制u*(t)对应的Hamilton函数取最小值]),(),(),([min]),(),(),([*****ttuttxHttuttxHuλλΩ∈= (3-2-35)(3) Hamilton函数在最优轨线终点处的值由下式决定0}{ =∂∂+∂Φ∂+ftffttH νψa(3-2-36)(4) 协态向量λ*(t)的终值满足横截条件ftfxxt }{)(*νψλ∂∂+∂Φ∂=a(3-2-37)(5) 状态向量x*(t)满足边界条件==0]),([)(00ffttxxtxψ(3-2-38)3.3 极大值原理的几种典型情况在极大值原理应用中,可能会出现各种情况。
以下几种典型情况的分析将有助于解决实际问题,特别是如何确定解欧拉方程规范方程组的边界条件1)0]),([ =Φffttx,ffxtx =)(固定,tf自由此时即有0]),([ =Φffttx和0)(]),([ =−=ffffxtxttxψ不显含tf ,由(3-2-36)式有0=ftH,这为确定tf提供了一个条件;又由(3-2-37)式有,即在终点处对λ无约束这时,因00)( xtx =和ffxtx =)(已经为规范方程组提供了2n个边界条件,无需λ(t)的任何约束2)0]),([ =Φffttx,)(ftx受n-k个方程约束,tf自由此时有)]([]),([ffftxhttx =ψ,h为n-k维连续可微向量函数因为340)]([]),([ ==ffftxhttxψ不显含tf ,由(3-2-36)式有0=ftH由(3-2-37)式有∂∂∂∂∂∂=∂∂=−−knfknfffftxhtxhtxhtxhtννννλML2121*])(,;)(,)([)()(a,即各λi*(t)是)(fitxh∂∂的线性组合考虑特殊情况knixtxtxhiffifi−=−= ,,2,1,)()]([ L,则有knitifi−== ,,2,1,)(*Lνλnknitfi,,1,0)(*L+−==λ即状态终值为规范方程组提供n-k个边界条件,其余k个边界条件由协态终值提供。
3)0]),([ =Φffttx,不受约束,tf自由这时0]),([ ≡ffttxψ,有0=ftH,0)(*=ftλ,即协态终值为规范方程组提供所需的n个边界条件4)0]),([ =Φffttx,)(ftx属于动点h(tf ),tf自由这时,)(ftx=h (tf ),因而有0)()(]),([ =−=ffffthtxttxψ,有νλ=)(*ft,)(*fffttttHfλψνψ∂∂=∂∂=aa(5)情况同(4),但tf固定此时ftδ不存在,因而横截条件(3-2-36)不存在,即tf不用确定6)情况同(1)~(4),但0]),([ ≠Φf。