动态规划算法原理与的应用(16 页)Good is good, but better carries it
精益求精,善益求善
动态规划算法原理及其应用讨论 系别: x x x 姓名: x x x 指导教员: x x x2025 年 5 月 20 日摘要:动态规划是解决最优化问题的基本方法,本文介绍了动态规划的基本思想和基本步骤,并通过几个实例的分析,讨论了利用动态规划设计算法的具体途径
关键词:动态规划 多阶段决策1
引言 规划问题的最终目的就是确定各决策变量的取值,以使目标函数达到极大或微小
在线性规划和非线性规划中,决策变量都是以集合的形式被一次性处理的;然而,有时我们也会面对决策变量需分期、分批处理的多阶段决策问题
所谓多阶段决策问题是指这样一类活动过程:它可以分解为若干个互相联系的阶段,在每一阶段分别对应着一组可供选取的决策集合;即构成过程的每个阶段都需要进行一次决策的决策问题
将各个阶段的决策综合起来构成一个决策序列,称为一个策略
显然,由于各个阶段选取的决策不同,对应整个过程可以有一系列不同的策略
当过程实行某个具体策略时,相应可以得到一个确定的效果,实行不同的策略,就会得到不同的效果
多阶段的决策问题,就是要在所有可能实行的策略中选取一个最优的策略,以便得到最佳的效果
动态规划是一种求解多阶段决策问题的系统技术,可以说它横跨整个规划领域(线性规划和非线性规划)
在多阶段决策问题中,有些问题对阶段的划分具有明显的时序性,动态规划的“动态”二字也由此而得名
动态规划的主要创始人是美国数学家贝尔曼(Bellman)
20 世纪 40 年代末 50 年代初,当时在兰德公司(Rand Corporation)从事讨论工作的贝尔曼首先提出了动态规划的概念
1957 年贝尔曼发表了数篇讨论论文,并出版了他的第一部著作《动态规划》
该著作成为了当时唯一的进一步讨论和应用动态