动态规划算法原理及其应用讨论系 别: x x x 姓 名: x x x指导教员: x x x 2 0 1 2年 5 月2 0 日摘要:动态规划就是解决最优化问题得基本方法,本文介绍了动态规划得基本思想与基本步骤,并通过几个实例得分析,讨论了利用动态规划设计算法得具体途径
关键词:动态规划 多阶段决策1、引言 规划问题得最终目得就就是确定各决策变量得取值,以使目标函数达到极大或微小
在线性规划与非线性规划中,决策变量都就是以集合得形式被一次性处理得;然而,有时我们也会面对决策变量需分期、分批处理得多阶段决策问题
所谓多阶段决策问题就是指这样一类活动过程:它可以分解为若干个互相联系得阶段,在每一阶段分别对应着一组可供选取得决策集合;即构成过程得每个阶段都需要进行一次决策得决策问题
将各个阶段得决策综合起来构成一个决策序列,称为一个策略
显然,由于各个阶段选取得决策不同,对应整个过程可以有一系列不同得策略
当过程实行某个具体策略时,相应可以得到一个确定得效果,实行不同得策略,就会得到不同得效果
多阶段得决策问题,就就是要在所有可能实行得策略中选取一个最优得策略,以便得到最佳得效果
动态规划就是一种求解多阶段决策问题得系统技术,可以说它横跨整个规划领域(线性规划与非线性规划)
在多阶段决策问题中,有些问题对阶段得划分具有明显得时序性,动态规划得“动态”二字也由此而得名
动态规划得主要创始人就是美国数学家贝尔曼(B ell m an)
2 0 世纪40年代末 50 年代初,当时在兰德公司(Ran d Corporati o n)从事讨论工作得贝尔曼首先提出了动态规划得概念
1957 年贝尔曼发表了数篇讨论论文,并出版了她得第一部著作《动态规划》
该著作成为了当时唯一得进一步讨论与应用动态规划得理论源泉
在贝尔曼及其助手们致力于进展与推广这一技术得同时,其她一些学者也对动态规划得进展做