动态规划入门(论文)模板

资源描述

《动态规划入门(论文)模板》由会员分享，可在线阅读，更多相关《动态规划入门(论文)模板（16页珍藏版）》请在金锄头文库上搜索。

1、动态规划思想入门作者：陈喻（ 2008 年 10 月 7 日）关键字：动态规划，最优子结构，记忆化搜索引言动态规划 (dynamicprogramming)是运筹学的一个分支，是求解决策过程(decisionprocess)最优化的数学方法。20世纪50年代初美国数学家等人在研究多阶段决策过程(multistep decision process)的优化问题时，提出了著名的最优化原理(principle of optimality)，把多阶段过程转化为一系列单阶段问题，逐个求解，创立了解决这类过程优化问题的新方法动态规划。 1957 年出版了他的名著Dynamic Programming，这

2、是该领域的第一本著作。动态规划问世以来，在经济管理、生产调度、工程技术和最优控制等方面得到了广泛的应用。例如最短路线、库存管理、资源分配、设备更新、排序、装载等问题，用动态规划方法比用其它方法求解更为方便。虽然动态规划主要用于求解以时间划分阶段的动态过程的优化问题，但是一些与时间无关的静态规划 ( 如线性规划、非线性规划 ) ，只要人为地引进时间因素，把它视为多阶段决策过程，也可以用动态规划方法方便地求解。动态规划的基本思想动态规划是：将待求的问题分解成若干个相互联系的子问题，先求解子问题，然后从这些子问题的解得到原问题的解；对于重复出现的子问题，只在第一次遇到的时候对它直接求解，

3、并把答案保存起来，让以后再次遇到是直接引用答案，不必从新求解，其实质是分治思想和解决冗余。例 1：求 AB 的最短路径图 1这是一个利用动态规划思想的经典问题，通过直接观察图 1 我们可以枚举出 20 多条路径，并可以计算出其中最短的路径长度为 16用动态规划的思想来分析，我们可以把这个问题转换成下面这个模型阶段状态决策图 2阶段：根据问题的特点和需要，将问题按时间或空间特征分解为若干相互联系的阶段。在本例中，我们根据空间特性将问题分成了 6 个阶段。状态：各阶段的开始条件，本例中， A,B,C P这些节点都属于状态，表示从该点到 B的最短路径，在这里我们计做 S(i)，表示从第 i

4、个节点（状态）到 B的最短路径决策：某阶段状态确定后，从该状态到下阶段某状态的选择。比如 S(A) ，它可以选择通过 C到达 B，也可以选择通过 D到达 B 。状态转移方程：系统由某阶段的一个状态转变到下一阶段的另一状态称状态转移，体现转移规律的方程称状态转移方程。在本例中，我们不难推出 S(A)=MINS(C)+4,S(D)+3,S(C)=MINS(E)+5,S(F)+3 S(B)=0，由此我们可以得出状态转移方程 (i)=MINS(j)+Vij(j 为与 i相邻接的节点， Vij 表示邻接节点 i， j之间的距离 )。一个动态规划模型应该满足以下几个性质：1.最优子结构性质最优子结构可这样

5、阐述：一个最优化策略具有这样的性质，不论过去状态和决策如何，对前面的决策所形成的状态而言，余下的诸决策必须构成最优策略。简而言之，一个最优化策略的子策略总是最优的。例如在图2 的模型中， S(A)是 A 到 B 的最短路径 (最优策略 )，而它所依赖的 S(C) 和 S(D) 作为 S(A) 的子策略分别是 C 到 B 的最短路径和 D 到 B 的最短路径，也是最优的。因此根据最优子结构性质我们得出了上面的状态转移方程。证明：如图 2 设路线 W1=(A,C),(C,F),(F,J)W2=(J,M),(M,O),(O,B)若路线 W1 和 W2 是 A 到 B 的最优路径，则根据最优化原理

6、，路线 W2 必是从 J 到 B 的最优路线。用反证法证明：假设有另一路径 W2 是 J 到 B 的最优路径，则 A 到 B 的路线取 W1 和 W2 比 W1 和 W2 更优，矛盾。从而证明 W2 必是 J 到 B 的最优路径 W2 。最优子结构性质是动态规划的基础，任何问题，如果失去了最优子结构性质的支持，就不可能用动态规划方法计算。根据最优子结构性质导出的动态规划状态转移方程是解决一切动态规划问题的基本方法。可以看出，图 2 的模型是满足最优子结构性质的。2子问题重叠性质在我们根据状态转移方程用递归算法自顶向下对问题进行求解时，每次产生的子问题并不总是新的，而且某些子问题会被重复计

7、算多次，比如，在求 S（ C）时需要递归求出 S（F）的值，而在求 S（D）时也需要递归求出 S（F）的值，因此整个求解过程中 S（ F）的值会被求解两次，如果我们能把这多余的一次重复计算剔除，将可以最大程度的提高程序执行效率；动态规划正是利用了这种子问题的重叠性质，对每个子问题只计算一次，然后将其结果保存在一个表格中，当再次需要计算已经计算过的子问题时，只是在表格中简单的查询一下结果，从而获得较高的解题效率，这个方法就是我们常说的记忆化搜索。因此，如果我们把第一次求解出的 S（F）的值用一种数据结构保存下来，下次再用到 S（F）时，我们直接去查，这样能使程序的时间和空间效

8、率将会大大提高。下面通过对具体实例的分析，帮助大家领会动态规划的这两个性质和动态规划的算法设计思想例：导弹拦截某国为了防御敌国的导弹袭击 , 发展出一种导弹拦截系统 . 但是这种导弹拦截系统有一个缺陷 : 虽然它的第一发炮弹能够到达任意的高度 , 但是以后每一发炮弹都不能高于前一发的高度 .某天 , 雷达捕捉到敌国的导弹来袭 .由于该系统还在试用阶段 , 所以只有一套系统 , 因此有可能不能拦截所有的导弹 .输入导弹依次飞来的高度 ( 雷达给出的高度数据是不大于 30000 的正整数 ), 计算这套系统最多能拦截多少导弹 ,并依次输出被拦截的导弹飞来时候的高度 .样例 :INPUT389 2

9、07 155 300 299 170 158 65OUTPUT6 ( 最多能拦截的导弹数 )389 300 299 170 158 65分析 : 因为只有一套导弹拦截系统 ,并且这套系统除了第一发炮弹能到达任意高度外 ,以后的每一发炮弹都不能高于前一发炮弹的高度 ; 所以 , 被拦截的导弹应该按飞来的高度组成一个非递增序列 .题目要求我们计算这套系统最多能拦截的导弹数 ,并依次输出被拦截导弹的高度 , 实际上就是要求我们在导弹依次飞来的高度序列中寻找一个最长非递增子序列 .解决思路：设X=x 1 ,x 2 ,2 ,y k 为问题的最优解,x n 为依次飞来的导弹序列( 即 X 的最长非递增子序

10、列 ), s, Y=y 1 ,y为问题的状态( 表示导弹拦截系统当前发送炮弹能够到达的最大高度, 初值为s=第一发炮弹能够到达任意的高度). 如果y 1 =x 1 ,即飞来的第一枚导弹被成功拦截. 那么 ,根据题意每一发炮弹都不能高于前一发的高度, 问题的状态将由s=变成 sx 1 ( x 1为第一枚导弹的高度);在当前状态下,序列Y 1 =y 2 ,y k 也应该是序列X 1 =x 2 ,x n 的最长非递增子序列( 用反证法很容易证明 ). 也就是说 , 在当前状态 sx 1 下, 问题的最优解 Y 所包含的子问题 ( 序列 X 1 ) 的解 ( 序列 Y 1 ) 也是最优的 .这就是拦

11、截导弹问题的最优子结构性质 .根据最优子结构性质推出状态转移方程：设 D(i) 为第 i 枚导弹被拦截之后 ,这套系统最多还能拦截的导弹数 ( 包含被拦截的第 i 枚). 我们可以设想 , 当系统拦截了第 k 枚导弹 x k , 而 x k 又是序列 X=xk , ,xn 中的最小值 , 即第 k 枚导弹之后飞来的导弹高度都比它高 , 则有 D(k)=1 ; 当系统拦截了最后一枚导弹 x n , 那么 ,系统最多也只能拦截这一枚导弹了 , 即 D(n)=1 ; 其它情况下 , 也应该有 D(i) 1 . 根据以上分析 , 可归纳出问题的动态规划递归方程为 :1(i=n或者 xi=minxiXn

12、)D(i)=MaxD(j)+1 (ji且 j=n且 xj=xi)假设系统最多能拦截的导弹数为dmax (即问题的最优值 ), 则dmax ( i为被系统拦截的第一枚导弹的顺序号)所以 ,要计算问题的最优值dmax , 需要分别计算出D(1) , D(2) ,D(n) 的值 ,然后将它们进行比较 , 找出其中的最大值 .即： dmax=maxD(i)(1=i且i=n)分析子问题重叠，解决冗余根据上面分析出来的递归方程 , 我们完全可以设计一个递归函数 , 采用自顶向下的方法计算 D(i) 的值 . 然后 , 对 i 从 1 到 n 分别调用这个递归函数 ,就可以计算出 D(1) , D(2) , D(n) . 程序如下：int D(int i)int j,max=0;if(i=n)|(min(x,i,n)=xi)/min(x,i,n)返回数组 x 在下标 i n 之间的最小值return 1;elsefor(j=i+1;j=n;j+)if(xjmax)max=D(j)+1;return max;从这个程序的递归模型中可以看出，会有大量的子问题被重复计算 . 比如在调用递归函数计算 D(1) 的时候 , 可能需要先计算 D(5) 的值 ; 之后在分别调用

展开阅读全文