§6动态规划模型举例以上讨论的优化问题属于静态的,即不必考虑时间的变化,建立的模型——线性规划、非线性规划、整数规划等,都属于静态规划
多阶段决策属于动态优化问题,即在每个阶段(通常以时间或空间为标志)根据过程的演变情况确定一个决策,使全过程的某个指标达到最优
例如:(1)化工生产过程中包含一系列的过程设备,如反应器、蒸馏塔、吸收器等,前一设备的输出为后一设备的输入
因此,应该如何控制生产过程中各个设备的输入和输出,使总产量最大
(2)发射一枚导弹去击中运动的目标,由于目标的行动是不断改变的,因此应当如何根据目标运动的情况,不断地决定导弹飞行的方向和速度,使之最快地命中目标
(3)汽车刚买来时故障少、耗油低,出车时间长,处理价值和经济效益高
随着使用时间的增加则变得故障多,油耗高,维修费用增加,经济效益差
使用时间俞长,处理价值也俞低
另外,每次更新都要付出更新费用
因此,应当如何决定它每年的使用时间,使总的效益最佳
动态规划模型是解决这类问题的有力工具,下面介绍相关的基本概念及其数学描述
(1)阶段整个问题的解决可分为若干个相互联系的阶段依次进行
通常按时间或空间划分阶段,描述阶段的变量称为阶段变量,记为
(2)状态状态表示每个阶段开始时所处的自然状况或客观条件,它描述了研究过程的状况
各阶段的状态通常用状态变量描述
常用表示第阶段的状态变量
个阶段的决策过程有个状态
用动态规划方法解决多阶段决策问题时,要求整个过程具有无后效性
即:如果某阶段的状态给定,则此阶段以后过程的发展不受以前状态的影响,未来状态只依赖于当前状态
(3)决策某一阶段的状态确定后,可以作出各种选择从而演变到下一阶段某一状态,这种选择手段称为决策
描述决策的变量称为决策变量
决策变量限制的取值范围称为允许决策集合
用表示第阶段处于状态时的决策变量,它是的函数,用表示的允许决策集合
(4)策略一个由每个