实用标准文案精彩文档常用降维动态规划1逐次逼近动态规划(DPSA)逐次逼近动态规划是求解多维问题的有效方法之一,它的基本思想是把带有若干决策变量的问题分解成仅带有1个决策变量的若干个子问题,每个子问题比原来的总问题具有较少的状态变量,从而大大节省状态存储量及计算工作量,便于计算机求解
对于多库联调优化问题,在确定初始可行调度线后采用DPSA求解的过程如下:(1)先假定第2个到最后一个水库的调度过程全部固定,对第1个水库进行优化,这时相当于单库优化调度,可以通过常规动态规划找到第1个水库的最优调度过程,此时其它水库仅进行简单的水务计算即可
计算完成后用最优结果替代初始解中第1个水库的调度过程
(2)假定第1个,第3个到最后一个水库的调度过程全部固定,求第2个水库的最优过程,这也相当于单库优化调度,同样通过常规动态规划找到第2个水库的最优调度过程
并将其最优结果替代初始解中第2个水库的调度过程
(3)依次类推,直至最后一个水库计算完成
此时初始可行解依次被各次的单库最优结果替代,一轮计算完成
(4)以上一轮最优结果为基础,重新依次计算单个电站的最优过程,并替换总体最优结果,反复轮流优选,直至收敛
DPSA的思想是通过减少每次参与计算的电站数目,达到降维效果,其搜索结果精度与初始状态序列有关,因此它不能保证在所有情况下都收敛到真正的总体最优解,求解过程中可以从多个不同的初始状态(库群初始调度过程)开始,求得多个最优值,然后选择最好的结果
2增量动态规划(DDDP)DDDP是用逐次逼近方法寻优,每次寻优只在某个状态序列附近的小范围内,用动态规划法进行搜索
其搜索流程是先根据一般经验或常规方法获得初始状态序列作为初始调度线,然后在该初始状态序列的上下各变动一个小范围,这个变动范围成为增量,形成一个带状“廊道”,接着在该廊道内用常规的动态规划寻优,可求得一条新的更接近于最优的状态序列