一、变分法概述研究功能极值的数学方法是变分法(Variationalcalculus),,就在几何和力学领域在17世纪末陆续提出了一些功能极值问题(最陡降线问题,最小旋转面问题等)形成和发展了变分方法。在本章中,我们介绍变分方法及其在最优控制中的应用。(一)泛函及其极值给出泛函的定义是最先要做的定义1.1设Ω为一函数的集合,若对于每一个函数x(t)∈Ω,都有一个实数J与之对应,则称J是定义在Ω上的泛函,记作J(x(t))。Ω称为J的容许函数集合,x(t)∈Ω称为宗量。例1对于xy平面上过定点A(x1,y1)和B(x2,y2)的每一条光滑曲线y(x),绕x轴旋转得一旋转体,旋转体的侧面积是曲线y(x)的泛函J(y(x))=∫x1x22πy(x)√(1+˙y2(x))dx,容许函数集合可表示为Ω={y(x)|y(x)∈C1[x1,x2],y(x1)=y1,y(x2)=y2}.三个性能指标1)麦耶(Mayer)型性能指标就是终端型性能指标的别称J(x)=Φ(x(t1),t1),2)拉格郎日(Lagrange)型性能指标又被叫做积分型性能指标J(x)=∫t0t1f0(t,x(t),˙x(t))dt,3)包尔查(Bolza)型性能指标也可以说是混合型性能指标J(x)=Φ(x(t1),t1)+∫t0t1f0(t,x(t),˙x(t))dt,他们同为泛函数,且都是相关的引进新的函数x0(t),它是如下微分方程初值问题的解˙x0(t)=f0(t,x(t),˙x(t)),x0(t0)=0.则拉格郎日(Lagrange)型性能指标就化为Φ(x(t1),t1)≡x0(t1)=∫t0t1f0(t,x(t),˙x(t))dt,变成麦耶(Mayer)型性能指标。引进函数f0(t,x(t),˙x(t))≡ddtΦ(x(t),t)=Φx(x(t),t)˙x(t)+Φt(x(t),t),我们有Φ(x(t1),t1)=Φ(x(t0),t0)+∫t0t1f0(t,x(t),˙x(t))dt,Φ(x(t0),t0)作为已知的函数,可以忽略,拉格郎日(Lagrange)型性能指标就是通过将麦耶(Mayer)型性能指标转的。所以说这三种函数都是能够进行代表的定义宗量的距离,是我们进行函数的连续性验证的时候必须要进行的设x(t),y(t)∈Ω,对他们之间的距离进行定义dk(x,y)=max{sup|x(t)−y(t)|,⋯,sup|x(k)(t)−y(k)(t)|}k=0,1,2,⋯其中|x(t)−y(t)|=(∑i=1n|xi(t)−yi(t)|2)12,⋯,|x(k)(t)−y(k)(t)|=(∑i=1n|xi(k)(t)−yi(k)(t)|2)12,x(t)=(x1(t),…,xn(t))T,y(t)=(y1(t),…,yn(t))T。上面提到的距离的定义,描述两个函数之间接近程度通过dk<ε的一种描述,d0<ε要求两个函数值的坐标非常相近,要求俩函数值的坐标以及一阶导数都要改相近才能使d1<ε。这样看来后一个函数比前一个函数更将接近。dk<ε意思是两个函数有K的接近值。宗量x0(t)∈Ω的δ-邻域用Ni(x0(t),δ)表示,即Ni(x0(t),δ)={x(t):di(x(t),x0(t))<δ}.定义1.3设J是定义在Ω上的泛函,如果对于任给的ε>0,都可以找到δ>0,使得当dk(x(t),x0(t))<δ,x(t)∈Ω时,就有|J(x(t))−J(x0(t))|<ε,则称泛函J在x0(x)处是k阶接近的连续泛函。定义1.4设L(x(t))是定义在Ω上的泛函,如果对任何常数α,β都有L(αx(t)+βy(t))=αL(x(t))+βL(y(t)),∀x(t),y(t)∈Ω,则称L(x(t))是Ω上的线性泛函。泛函的变化受到宗量的影响,δx=x1(t)−x(t)是两个宗量之间的差,泛函数的增加量是ΔJ=J(x1(t))−J(x(t))=J(x+δx)−J(x)增量的线性如同函数的微分是主部一样,泛函的增量的线性是泛函的变分的主部,既有J是定义在Ω上的泛函,一旦有δx的线性泛函L(x,δx),使得ΔJ=L(x,δx)+r(x,δx)⋅max|δx|,其中r(x,δx)是max|δx|的高阶无穷小量,即当max|δx|→0时有r(x,δx)→0,我们称L(x,δx)为泛函J(x)的变分(variation),记作δJ=L(x,δx)。函数的微分概念的推广就是泛函的变分。它可以表为对参数α的导数,是因为泛函的变分的一个重要形式是,即有δJ(x(t))=∂∂αJ(x(t)+αδx(t))|α=0,这是因为如果变分存在,则增量,根据L和r的性质有L(x(t),αδx)=αL(x(t),δx),limα→0r(x,αδx)⋅max|αδx|α=limα→0max|αδx|αδxr(x,αδx)δx=0,所以∂∂αJ(x(t)+αδx(t))|α=0¿limα→0J(x+αδx)−J(x)α¿limα→0L(x,αδx)+r(x,αδx)⋅max|αδx|α¿δJ(x).J(x(t))是定义在Ω上的泛函,x0(t)∈Ω,若对任意一个x(t)∈Ω都有ΔJ=L(x,αδx)+r(x,αδx)⋅max|αδx|J(x(t))≥J(x0(t)).则称J(x0(t))为J(x(t))的绝对是极小值(最小值)。或者说J(x(t))在x0(t)∈...