第四章 动态最优化基础 §4
1 动态最优化的基本问题 例:最短路问题 图 4
1 给出了从城市A 到城市B 的路线图(省略了距离单位标注)
现求一条从A 到 B的最短路线
1 显然,为了从A 到B,必须先逐步经过C1、 C2、 C3、 C4 等诸城市
而在C1、 C2、C3、 C4,又都有多种选择
而关键性的困难是当前的最优选择不一定是全局的最优
这类问题也称为多阶段决策问题
2 动态最优化的基本概念 阶段:将全过程分为若干个有相互联系的阶段,常用字母t、 k 表示; 状态:系统在不同阶段性态
一般来说,系统在一个阶段有多个状态
系统在某一阶段的所有可能的状态构成的集合成为状态集,记为Sk; 状态变量:表示系统状态的变量,记为sk
它与阶段有关; 决策:在某一阶段的某一状态下,系统由该状态演变到下一阶段某一状态的选择
在第 k 阶段,处于状态sk 时的所有可能的决策集记为Dk( sk); 决策变量:描述决策的变量,它与阶段与系统在该阶段的状态有关
在第k 阶段,处于状态sk 时的决策记为dk( sk); 状态转移:从当前阶段的某一状态转移到下一阶段的某一状态
状态转移方程:描述状态转移规律的数学方程
它是当前状态变量与决策变量的函数,即 ) ,(1kkkkdsTs; 策略:从起点到终点的每一阶段的决策所构成的决策序列,称为(全局)策略
自某一阶段起,至终点的决策称为子策略,记为))(,),(()(11,nnknksdsdsp
指标(目标)函数:性能指标或效用指标,它用来评价决策的效果
它可分为阶段指标与全局指标两类
阶段指标是指衡量某一阶段在某一状态下的决策效果的指标
它仅依赖当前状态和当前决策
记为))(,(kkkksdsv; 全局指标是指衡量整个全过程或自某一阶段起至终点的各阶段决策的总体效果的指标
它是所有各阶段的状态和决策的函数