第五章用变分法求解连续最优控制问题—有约束条件的泛函极值上节讨论没有约束条件的泛函极值问题。但在最优控制问题中,泛函J所依赖的函数总要受到受控系统状态方程的约束。解决这类问题的思路是应用拉格朗日乘子法,将这种有约束条件的泛函极值问题转化为无约束条件的泛函极值问题。ttutxftx,,nRtxrRtuttutxf,,一、拉格朗日问题考虑系统——n维连续可微的矢量函数。(5-1)式中;;fttt,0ftttttutxLJ0d,,设给定,初始状态为x(t0)=x0,终端状态x(tf)自由。性能泛函为寻求最优控制u(t),将系统从初始状态x(t0)=x0转移到终端状态x(tf),并使性能泛函J取极值。(5-2)0,,txttutxffttTttxttutxftttutxLJ0d,,,,将状态方程式(5-1)写成约束方程形式应用拉格朗日乘子法,构造增广泛函式中λ(t)——待定的n维拉格朗日乘子矢量。(5-3)tuxftuxLtuxHT,,,,,,,fttTtxtuxHJ0d,,,fttttuxxHJ0d,,,,txttutxftttutxLtuxxHT,,,,,,,,定义纯量函数称H[x,u,λ,t]为哈密尔顿函数。则或(5-4)(5-5)(5-6)式中(5-7)fffttTttTttTxtxtx000ddffttTttTxtxtuxHJ00d,,,对式(5-5)右边第二项作分部积分,得将上式代入式(5-5),得(5-8)ffttTttTTxtuHuxHxJ00d使J´取极小的必要条件是,对任意的δu和δx,都有δJ´=0成立。设u(t)和x(t)相对于最优控制u*(t)及最优轨线u*(t)的变分为δu和δx,计算由δu和δx引起的J´的变分为:0xHxH0uH00ftt因此得(5-9)(5-10)(5-11)(5-12)式(5-9)称为动态系统的伴随方程或协态方程,λ又称为伴随矢量或协态矢量。式(5-10)即系统的状态方程。式(5-9)与式(5-10)联立称为哈密尔顿正则方程。式(5-11)称为控制方程,Utu0uH这个方程是在假设δu为任意,控制u(t)取值不受约束条件下得到的。如果u(t)为容许控制,受到的约束,δu变分不能任意取值,那么,关系式不成立,这种情况留待极小值原理中讨论。00xtx0ft(5-13)(5-14)式(5-12)称为横截条件。常用于补充边界条件。例如,若始端固定,终态自由时,由于δx(t0)=0,δx(tf)任意,则有00xtxffxtx若始端和终端都固定时,δx(t0)=0,δx(tf)=0则以作为两个边界条件。(5-16)(5-15)实际上,上述泛函极值的必要条件,亦可由式(5-6)写出欧拉方程直接导出。即00000dd0dd0dd00ffttttuHxHxHxHuHtuHHtHxHtxH(5-17)0uH,~*xuu***,~xuu应用上述条件求解最优控制的步骤如下:1)由控制方程解出2)将u*代入正则方程解两边边值问题,求x*、λ*。3)再将x*、λ*代入得为所求。11000022mind21202ttuJu(t)ω(t)θ(t)x1x2s1s1例1:有系统如图1所示。欲使系统在2s内从状态转移到,使性能泛函,试求u(t)。uxx100010002,110xx解:系统状态方程及边界条件为由式(5-7),得xuxuxfLHTT10001021200100dd2121xHtxH1210由欧拉方程,得010dd21uuHtuH2u0100010ddxuxHtHuxxx2215个未知数x1,x2,λ1,λ2,u,由5个方程联立求得通解3221243223112121211212161CtCtCxCtCtCtCxCtCuCtCC...