数模(动态规划).ppt－金锄头文库

资源描述

《数模(动态规划).ppt》由会员分享，可在线阅读，更多相关《数模(动态规划).ppt（78页珍藏版）》请在金锄头文库上搜索。

1、1 数学模型电子教案重庆邮电大学数理学院沈世云 2 第7章动态规划 Dynamicprogramming 动态规划的基本思想最短路径问题投资分配问题背包问题 3 动态规划是用来解决多阶段决策过程最优化的一种数量方法其特点在于它可以把一个n维决策问题变换为几个一维最优化问题从而一个一个地去解决需指出动态规划是求解某类问题的一种方法是考察问题的一种途径而不是一种算法必须对具体问题进行具体分析运用动态规划的原理和方法建立相应的模型然后再用动态规划方法去求解 4 即在系统发展的不同时刻或阶段根据系统所处的状态不断地做出决策每个阶段都要进行决策目的是使整个过程的决

2、策达到最优效果动态决策问题的特点系统所处的状态和时刻是进行决策的重要因素找到不同时刻的最优决策以及整个过程的最优策略多阶段决策问题是动态决策问题的一种特殊形式在多阶段决策过程中系统的动态过程可以按照时间进程分为状态相互联系而又相互区别的各个阶段 5 多阶段决策问题的典型例子 1 生产决策问题企业在生产过程中由于需求是随时间变化的因此企业为了获得全年的最佳生产效益就要在整个生产过程中逐月或逐季度地根据库存和需求决定生产计划 2 机器负荷分配问题某种机器可以在高低两种不同的负荷下进行生产在高负荷下进行生产时产品的年产量g和投入生产的机器数量u1的关系为g g u1 1

3、2 n 状态决策状态决策状态状态决策 6 这时机器的年完好率为a 即如果年初完好机器的数量为u 到年终完好的机器就为au 0 a 1 在低负荷下生产时产品的年产量h和投入生产的机器数量u2的关系为h h u2 假定开始生产时完好的机器数量为s1 要求制定一个五年计划在每年开始时决定如何重新分配完好的机器在两种不同的负荷下生产的数量使在五年内产品的总产量达到最高相应的机器年完好率b 0 b 1 7 3 航天飞机飞行控制问题由于航天飞机的运动的环境是不断变化的因此就要根据航天飞机飞行在不同环境中的情况不断地决定航天飞机的飞行方向和速度状态使之能最省燃料和实现目的

4、如软着落问题不包含时间因素的静态决策问题本质上是一次决策问题也可以适当地引入阶段的概念作为多阶段的决策问题用动态规划方法来解决 4 线性规划非线性规划等静态的规划问题也可以通过适当地引入阶段的概念应用动态规划方法加以解决 8 5 最短路问题给定一个交通网络图如下其中两点之间的数字表示距离或花费试求从A点到G点的最短距离总费用最小 1 2 3 4 5 6 A B1 B2 C1 C2 C3 C4 D1 D2 D3 E1 E2 E3 F1 F2 G 5 3 1 3 6 8 7 6 3 6 8 5 3 3 8 4 2 2 2 1 3 3 3 5 2 5 6 6 4 3 9 一基

5、本概念1 阶段把一个问题的过程恰当地分为若干个相互联系的阶段以便于按一定的次序去求解描述阶段的变量称为阶段变量阶段的划分一般是根据时间和空间的自然特征来进行的但要便于问题转化为多阶段决策 2 状态表示每个阶段开始所处的自然状况或客观条件通常一个阶段有若干个状态描述过程状态的变量称为状态变量一个数一组数一个向量状态变量的取值有一定的允许集合或范围此集合称为状态允许集合一动态规划的基本思想 10 3 决策表示当过程处于某一阶段的某个状态时可以作出不同的决定从而确定下一阶段的状态这种决定称为决策描述决策的变量称为决策变量决策变量是状态变量的函数可用一

6、个数一组数或一向量多维情形来描述在实际问题中决策变量的取值往往在某一范围之内此范围称为允许决策集合系统在某一阶段的状态转移不但与系统的当前的状态和决策有关而且还与系统过去的历史状态和决策有关 4 多阶段决策过程可以在各个阶段进行决策去控制过程发展的多段过程其发展是通过一系列的状态转移来实现的 11 图示如下状态转移方程是确定过程由一个状态到另一个状态的演变过程如果第k阶段状态变量sk的值该阶段的决策变量一经确定第k 1阶段状态变量sk 1的值也就确定其状态转移方程如下一般形式能用动态规划方法求解的多阶段决策过程是一类特殊的多阶段决策过程即具有无后效性的多阶段

7、决策过程 12 如果状态变量不能满足无后效性的要求应适当地改变状态的定义或规定方法动态规划中能处理的状态转移方程的形式状态具有无后效性的多阶段决策过程的状态转移方程如下无后效性马尔可夫性如果某阶段状态给定后则在这个阶段以后过程的发展不受这个阶段以前各段状态的影响过程的过去历史只能通过当前的状态去影响它未来的发展构造动态规划模型时要充分注意是否满足无后效性的要求状态变量要满足无后效性的要求 13 5 策略是一个按顺序排列的决策组成的集合在实际问题中可供选择的策略有一定的范围称为允许策略集合从允许策略集合中找出达到最优效果的策略称为最优策略 6 状态转移方程是确定

8、过程由一个状态到另一个状态的演变过程描述了状态转移规律 7 指标函数和最优值函数用来衡量所实现过程优劣的一种数量指标为指标函数指标函数的最优值称为最优值函数在不同的问题中指标函数的含义是不同的它可能是距离利润成本产量或资源消耗等动态规划模型的指标函数应具有可分离性并满足递推关系 14 小结指标函数形式和积无后效性可递推 15 解多阶段决策过程问题求出 f1 s1 从k到终点最优策略子策略的最优目标函数值 16 1 动态规划方法的关键在于正确地写出基本的递推关系式和恰当的边界条件简称基本方程要做到这一点就必须将问题的过程分成几个相互联系的阶段恰当的

9、选取状态变量和决策变量及定义最优值函数从而把一个大问题转化成一组同类型的子问题然后逐个求解即从边界条件开始逐段递推寻优在每一个子问题的求解中均利用了它前面的子问题的最优化结果依次进行最后一个子问题所得的最优解就是整个问题的最优解二动态规划的基本思想 17 2 在多阶段决策过程中动态规划方法是既把当前一段和未来一段分开又把当前效益和未来效益结合起来考虑的一种最优化方法因此每段决策的选取是从全局来考虑的与该段的最优选择答案一般是不同的最优化原理作为整个过程的最优策略具有这样的性质无论过去的状态和决策如何相对于前面的决策所形成的状态而言余下的决策序列必然构成

10、最优子策略也就是说一个最优策略的子策略也是最优的 3 在求整个问题的最优策略时由于初始状态是已知的而每段的决策都是该段状态的函数故最优策略所经过的各段状态便可逐段变换得到从而确定了最优路线 18 三建立动态规划模型的步骤1 划分阶段划分阶段是运用动态规划求解多阶段决策问题的第一步在确定多阶段特性后按时间或空间先后顺序将过程划分为若干相互联系的阶段对于静态问题要人为地赋予时间概念以便划分阶段 2 正确选择状态变量选择变量既要能确切描述过程演变又要满足无后效性而且各阶段状态变量的取值能够确定一般地状态变量的选择是从过程演变的特点中寻找 3 确定决策变量及允许决策集

11、合通常选择所求解问题的关键变量作为决策变量同时要给出决策变量的取值范围即确定允许决策集合 19 4 确定状态转移方程根据k阶段状态变量和决策变量写出k 1阶段状态变量状态转移方程应当具有递推关系 5 确定阶段指标函数和最优指标函数建立动态规划基本方程阶段指标函数是指第k阶段的收益最优指标函数是指从第k阶段状态出发到第n阶段末所获得收益的最优值最后写出动态规划基本方程以上五步是建立动态规划数学模型的一般步骤由于动态规划模型与线性规划模型不同动态规划模型没有统一的模式建模时必须根据具体问题具体分析只有通过不断实践总结才能较好掌握建模方法与技巧 20 例一从A地到D地要铺

12、设一条煤气管道其中需经过两级中间站两点之间的连线上的数字表示距离如图所示问应该选择什么路线使总距离最短 A B1 B2 C1 C2 C3 D 2 4 3 3 3 3 2 1 1 1 4 二最短路径问题 21 解整个计算过程分三个阶段从最后一个阶段开始第一阶段 C D C有三条路线到终点D A B1 B2 C1 C2 C3 D 2 4 3 3 3 3 2 1 1 1 4 D C1 C2 C3 显然有f1 C1 1 f1 C2 3 f1 C3 4 22 d B1 C1 f1 C1 3 1f2 B1 mind B1 C2 f1 C2 min3 3d B1 C3 f1 C3 1 44

13、 min6 45 第二阶段 B C B到C有六条路线 A B1 B2 C1 C2 C3 D 2 4 3 3 3 3 2 1 1 1 4 D C1 C2 C3 B1 B2 最短路线为B1 C1 D 23 d B2 C1 f1 C1 2 1f2 B2 mind B2 C2 f1 C2 min3 3d B2 C3 f1 C3 1 43 min6 35 A B1 B2 C1 C2 C3 D 2 4 3 3 3 3 2 1 1 1 4 D C1 C2 C3 B1 B2 最短路线为B2 C1 D 24 第三阶段 A B A到B有二条路线 f3 A 1 d A B1 f2 B1 2 4 6f3 A 2 d

14、A B2 f2 B2 4 3 7 f3 A min min 6 7 6 d A B1 f2 B1 d A B2 f2 B2 最短路线为A B1 C1 D A B1 B2 C1 C2 C3 D 2 4 3 3 3 3 2 1 1 1 4 D C1 C2 C3 B1 B2 A 25 A B1 B2 C1 C2 C3 D 2 4 3 3 3 3 2 1 1 1 4 D C1 C2 C3 B1 B2 A 最短路线为A B1 C1 D路长为6 26 练习1 A B1 B2 C1 C2 C3 C4 D1 D2 D3 E1 E2 E3 F1 F2 G 5 3 1 3 6 8 7 6 3 6 8 5 3 3

15、8 4 2 2 2 1 3 3 3 5 2 5 6 6 4 最优路线为 A B1 C2 D1 E2 F2 G路长 18 求从A到G的最短路径 3 27 k 5 出发点E1 E2 E3 28 k 2 f2 B1 13u2 B1 C2f2 B2 16u2 B2 C3 29 759 u5 E2 F2 u6 F2 G 最优策略 A B1 B2 C1 C2 C3 C4 D1 D2 D3 E1 E2 E3 F1 F2 G 5 3 1 3 6 8 7 6 3 6 8 5 3 3 8 4 2 2 2 1 3 3 3 5 2 5 6 6 4 3 30 求从A到E的最短路径路线为A B2 C1 D1 E 最短路

16、径为19 A B2 B1 B3 C1 C3 D1 D2 E C2 5 2 14 1 12 6 10 10 4 3 12 11 13 9 6 5 8 10 5 2 练习2 1 31 现有数量为a 万元的资金计划分配给n个工厂用于扩大再生产假设 xi为分配给第i个工厂的资金数量万元 gi xi 为第i个工厂得到资金后提供的利润值万元问题是如何确定各工厂的资金数使得总的利润为最大据此有下式三投资分配问题 32 令 fk x 以数量为x的资金分配给前k个工厂所得到的最大利润值用动态规划求解就是求fn a 的问题当k 1时 f1 x g1 x 因为只给一个工厂当1 k n时其递推关系如下设 y为分给第k个工厂的资金其中0 y x 此时还剩x y 万元的资金需要分配给前k 1个工厂如果采取最优策略则得到的最大利润为fk 1 x y 因此总的利润为 gk y fk 1 x y 33 如果a是以万元为资金分配单位则式中的y只取非负整数0 1 2 x 上式可变为所以根据动态规划的最优化原理有下式 34 例题设国家拨给60万元投资供四个工厂扩建使用

展开阅读全文

数模(动态规划).ppt

最新文档