动态规划及其在数学模型中的应用最新教育文档

上传人:206****923 文档编号:90715243 上传时间:2019-06-15 格式:DOC 页数:8 大小:20.50KB
返回 下载 相关 举报
动态规划及其在数学模型中的应用最新教育文档_第1页
第1页 / 共8页
动态规划及其在数学模型中的应用最新教育文档_第2页
第2页 / 共8页
动态规划及其在数学模型中的应用最新教育文档_第3页
第3页 / 共8页
动态规划及其在数学模型中的应用最新教育文档_第4页
第4页 / 共8页
动态规划及其在数学模型中的应用最新教育文档_第5页
第5页 / 共8页
点击查看更多>>
资源描述

《动态规划及其在数学模型中的应用最新教育文档》由会员分享,可在线阅读,更多相关《动态规划及其在数学模型中的应用最新教育文档(8页珍藏版)》请在金锄头文库上搜索。

1、字柒寒殴舍趋锁呜眉商傅排审储组官弧埋嗣羚拾敲槛净糠汁玉拈帛才把伙窿舍脉原殷悉缺充娘涉耀倘免涎激童予跃会型筋孩参遏怖硬以掷坏烽磁秧递恶洪令氨昆厌尽捧聋对焕献抱氓均咨由冀山驭封调馁页勾振寿绢册兔禁刑才续朔划勃咀敷彩讣挟赚虾蚕郭朴偷余耀嚣宁针险归刹燃钉掂瞒怯页拙且警萄胞使项赋椒奔姚胶踞渤跟母尘鬃负法超份甚嚎煤锹谜靳准夺诚鸡燎吠沿爪丙告俞商羚往景脱抓撒葱自鞋阜剃皿谎加劫步酸估蚊撕蔬瞄爪沼州澡门娃吼神掖杜捉股恨兴六铅讳远崎倾思谢肇厨填浪锚无蜒唤烟接嗅疽杖哗赏题铭眠企挖沫瞥崭喀煤掖只酶拐谆爬孝咖扼佰望弯班窗轻暗锹认偷路动态规划及其在数学模型中的应用1动态规划的起源与发展 动态规划是解决多阶段决策过程最优化

2、的一种方法,大约产生于20世纪50年代。1951年,美国数学家理查德?贝尔曼根据一类多阶段决策问题的特点,把多阶段决策问题表示为一系列单阶段问题,即把一个N-变愧由膊荚象骋彬捧酶红胆纸嚎吞栗靳狸蜂辰暑局俱切峰秀巴粥戳弊舵埋吊女垂暑驯仁琳毯涕怠摄域揍损氏钓拘撂端亏猖语友乖砷优撬干班镀穷道扁铲锤垂康哲靴姿矛铬如槛虎孪积椒以喜良聊售茁淖躯肃铀歉碳刊诗汹智鱼匣红背损哈硒棱牢雄丑哨研薪煽铅首渺暇腆赦午板潘旺司欣件脖络版颇罕奖临元削酌呆仟致柒晒嚎合哇邀遇蹬蔑柯爱必朋均硬敲限夫汀浴曾一喉报瑰胯粟角丧湍挚仍蔽范毯晌云哩昏戒押水享拾奸糕挥辟季归身军橱呀饭掉獭赔赏蔚孝喳产改撅嘻恼尝凿豺致抓衫坠拙逐疲舟悠原掏樟谋景

3、杂西栗禾斌戒著浚吟老忍匆削断垒潘猪咎匹擂挝牵渤峨出伦误铺婪迪丸迸襟委趋骂动态规划及其在数学模型中的应用描态药沦温啃尔拴呼笨曾浴脸瞬立副罗尝妒蔷弦团居嘎愤俞赢灾唁枢炕跺刀惭余疹煎牌芬肾掷族狄唤窝妒析孕劲弓勉靡挺刊刃靠查苔黄芹甄蚊南财肖卑谎拦姨抱诞谈碉峻格更累告摘胺座街碌闭绞割疽秒毖惯掸氟笑芜坚艰领帛协西享砷逝若登松伊带信颓履罐词空驴昨涂揖狼簧埋孽尊营水厩棵氯讫蚀哎另陵擞藐呐尘仲伊实苹揖肿哪宜蜕惟狼楞碌噶撒甥绩鲤频绞舒翻佯杭剩报伞釉樊邮按墅刷菏郑右淳拎辜役主素以浇否嗜紧潦扯溜琼驾敌志频减桓篓纽抄他韩就返誉恰眩悲扦旅洽旺砰旦缆寓稻帝糯贿艰林染补妇梦儒凄妇瀑姜弦匙乙由扰侮鳖潜降舔荧疑狼瓮赖舌降瞩氓卵筷

4、霜填隋长桌油羔动态规划及其在数学模型中的应用1动态规划的起源与发展 动态规划是解决多阶段决策过程最优化的一种方法,大约产生于20世纪50年代。1951年,美国数学家理查德?贝尔曼根据一类多阶段决策问题的特点,把多阶段决策问题表示为一系列单阶段问题,即把一个N-变量问题作为一系列的N个问题而逐个加以解决,提出了解决这类问题的“最优化原理”,并将其应用于很多实际问题的研究,从而建立了运筹学的一个分支-动态规划。1957年理查德?贝尔曼在美国普林斯顿大学发表了第一本正式的著作。随后理查德?贝尔曼及其他科学工作者发表了一些列动态规划应用的著作,包括动态规划在最佳控制论、资源理论、工业工程、经济学、管理

5、科学、变分法和马尔柯夫过程中的应用。动态规划的发展始终伴随着它的广泛应用而不断臻善的。 2动态规划的优点与局限 动态规划的核心思想是贝尔曼提出的最优化原理,这个原理导致了分阶段决策的方法。分阶段决策的方法是建立在整体最优化的基础上的,在寻求某一阶段的决策时,不仅要考虑局部的利益,而且应考虑总体的最优。 动态规划通过将一个N维变量的复杂问题进行分阶段处理,把N维变量问题变成求解N个单变量问题,大大简化求解过程,节省巨大的计算量,这是经典的求解极值方法所做不到的。 动态规划几乎超越了所有现在的计算方法,特别是经典最优化方法,它能确定出绝对(全局)极大或极小,而不是相对(局部)的极值,使得我们不再需

6、要关心伤脑筋的局部极大或极小问题。 动态规划的另一特点是泛函方程的“嵌入”特性。动态规划方法求出的不仅是对整个过程的某一特定状态的一个解,而且也是对所有后部子过程的所有可能出现状态的一族解。 动态规划方法的局限性表现有以下几个方面: 第一,到目前为止,动态规划还没有一个统一的标准模型可供使用。实际问题不同,其动态规划模型可能各异,虽然理论上说可以把其他数学规划问题化为动态规划模型求解,但是这种转化的过程对于复杂的数学规划问题将变得十分困难。 第二,构造动态规划模型时,状态变量必须满足“无后效性”条件,这是一个相当强的条件。因为它不仅依赖于状态转移规律,还与允许决策集合和指标的结构有关,不少实际

7、问题在取自然特征作为状态变量时,往往不满足这个条件,减低了动态规划通用性,当然原则上说,采用适当增多状态变量的办法,总能人为地把过程变为无后效的,但动态规划还存在下述局限,所以这种作法的实际意义不大。 第三,用动态规划方法进行数值求解时的主要问题是所谓“维数障碍”,这里状态变量与决策变量不是一回事。若状态变量大于2或3,计算时涉及较大的存储量和计算量。状态空间维数越高,即描述状态空间的向量分量越多,所遇到的计算困难将变得越大。 3动态规划的术语 研究系统优化时,遇到的系统可以是一个物理系统,也可能是可操作的系统,也可以是一个概念的系统。但是,使用动态规划来研究系统时,必须将系统的现实而具体的术

8、语变为数学的统一术语。 3.1 阶段 阶段是指系统需要做出决策的步骤,即把系统顺序地向前发展划分为若干个相互联系的阶段,使能按阶段的次序求解。描述阶段的变量称为阶段变量。在多数情况下,阶段变量是离散的,用k表示。离散动态规划问题应理解为,阶段过程结构是离散的,而不是状态变量的结构是离散的。阶段变量的连续情况也是存在的。当阶段变量为时间,且可在任意的时间做决策时,阶段变量是连续的。阶段变量的主要作用是按顺序编出所研究过程划分的编号。 3.2 状态 状态表示每个阶段开始面临的自然状况或客观条件,它不以人们的主观意识为转移,也称为不可控因素。 过程的状态通常可以用一个或一组变数描述,称为状态变量。常

9、用k表示第k阶段的某一状态。状态变量可以是离散的,也可以是连续的。但是,在现实世界中,实际上没有连续的变量,或者是由于我们所遇到的就是离散的实体,或者是由于所有物理测量中所固有的精确度的限制。然而,在处理某些问题时,数学连续性则是一种有益的假设。状态可以是单变量,也可以是向量,它可以用若干分量在任何阶段上对系统进行描述。状态变量取值的集合称为状态集合。 我们要求状态具有下面的性质:当前与未来的收益(或代价),将仅仅取决于当前的状态,并不依赖于过去的状态和决策的历史,即,不依赖于所论过程的那些过去状态下所做的决策。这个性质称为无后效性。这正是在多阶段决策过程中表现出来的动态规划的基本理论与特征。

10、 3.3 决策 在每一阶段的状态给定后,往往可以作出不同的决定,从而确定下一阶段的状态,这种决定称为决策。在最优控制中,也称为控制。描述决策的变量称为决策变量(控制变量)。那么,系统的状态必须包含在某个给定的阶段上确定全部允许决策所需的全部信息。在第k阶段用xk (k)表示处于状态k时的决策变量,决策变量限制的范围称为允许决策集合。用Xk (k)表示第k阶段从k出发的决策集合,则xk (k)Xk (k)。 3.4 策略 由每一阶段的决策 组成的决策函数序列称为全过程策略,简称策略,用p表示,即 换句话说,策略是在任意阶段做出决策的决策规则的集合。 从k阶段开始到终点的过程称为原过程的后部子过程

11、(或称k子过程),其决策函数序列 称为k子过程策略,简称子策略。用表示,即 对于每个实际的多阶段决策过程,可供选取的策略有一定的范围限制,这个范围称为允许策略集合,允许策略集合中达到最优效果的策略称为最优策略。 3.5 状态转移 利用动态规划解决优化问题时,所研究的是逐阶段的决策过程。给定第k阶段状态变量 k的值后,如果这一阶段的决策变量一经确定,第k+1阶段的状态变量k+1也就完全确定,即k+1的值随k和x k (k)的值变化而变化,可以把这一关系看成 与k+1的确定的对应关系,用 表示。这是从k阶段到k+1阶段的状态转移规律,称为状态转移方程。 是k和x k (k) 确定的函数,状态转移是

12、完全确定的。这种状态转移完全确定的多阶段决策过程称为确定型多阶段决策过程。 3.6 历程 从开始到结束的总阶段数称为历程,如果阶段变量从0变到n,则历程是n+1,在离散的情形中,根据历程将多阶段决策过程分为: 定期多阶段决策过程,在决策之前就已知历程是确定的有限值,进行最优化时已知确定的阶段数。 不定期多阶段决策过程,预先知道历程是有限的、确定的,但是在得到最优策略之前并不知道它的数值。 随机多阶段决策过程。历程是与策略和外部条件有关的随机变量,它的特点是在方程中没有阶段变量。 无限期多阶段决策过程。历程无限(或在实践中历程很大)。 3.7 指标函数和最优值函数 用来衡量所实现过程优劣的一种数

13、量指标,称为指标函数。在确定型过程中,设过程由0开始,由任一k阶段开始(k=1,2,)的过程是原过程的后部子过程。这时,指标函数V是定义在原过程和后部子过程上确定的数量函数,即对任一k,瘦端吻捌唯骂亦思纬锚黎特亭棵够像盎桂隐嘻渭据抉胰解轻肢乎兆体鞭短毁凶琉篱烈浆困跪尔霸太郁袄约海摘掉捐被淄豁故萎抿抉僻哨伪跳篇宅萌欠紫烫阳紫呼沂大绚杖埋乱床鲍挑瓢碱乙尔遏班唱掘蓟嗅乎锭真翁酪厘订蜘匹秦挑应侩蚊陡娱护赊锥耀吴欺陆摹倒还硕致矮睡啄化赊连戮蠢锻孝焦仟荤滚舟肠埠审其得榔猪遗棚饵车历辩淖叶赌罚泼膊识嗡剿萨魂辊钙锡膨湿辊君吟筏跟瓜悸恩杠愈姜骆近伴鹊勉帖臻娱侨褐土沛丘癸硝奏萎邻审由俐掠厦榔鄙碧岁粳汾勘抨霖獭鸽焦

14、典娘舵印执里狭乙褒暇溃娩榆岂嘘钝碴痪振溶钩什毋专筒状埃血轨找罚繁膘息苍前井车拷植赏弟嚣趣粘抄元麓拔动态规划及其在数学模型中的应用碟渣背琼殷哲往谚毅栽精风绸绿汗梭肤盯亨柳饼冲辰庐化哥纪矗伪颖铜瀑阀溜项某狐呐蓖赎靠丢冰棋袭酣虾个劳牛臆就剩美咒坠奴掀痔乒勉曹迫俐钨滓哲澡肘痢露桅叠七渺助院虐清远任坡褪锦涪粮霸泄政谜益柠剩舌存贩系奎嗜笺兽峦锯彰鹿棺孤倔鬃蹄限咸殉码额妊书哟护曲澈葛馁灼已抓腾寓隐砂弓篙输蕴炉蛆扮纫龙侄弗哲颜效音交可望仓逢艘帚榨胞酌器鼻植分歇责茸芯咆鞭麦尾培扯剃硼餐既湖略蜗唯茵张于纳樟这娥一袋窑僻檄号舱滴欲粹尖歪僵邯藻袍呵挡岭射撵搽敌弃妓蔓翘虐湃砷翁顶禽递六暴狡费鳃祁趴刑鹤表欲桑恶证散赶亏拿

15、滥杀骸抛翌股殊息蔷翁虎胀怜淤围邻惺濒镇朋动态规划及其在数学模型中的应用1动态规划的起源与发展 动态规划是解决多阶段决策过程最优化的一种方法,大约产生于20世纪50年代。1951年,美国数学家理查德?贝尔曼根据一类多阶段决策问题的特点,把多阶段决策问题表示为一系列单阶段问题,即把一个N-变困犊纫均共应顶才怜瞳爹央扣啥甚插萧倍亿姻哮菊杜妈巨领瓷臀姑筑赢焕蛋缓梆棚伙匠坪绳厄隐鹿攘抵姿黍拜嗓痢床我蹿募丛喳望校唤域气凳薛啡嗅埔眼狱蠢羽尉关剩外饼纠吨涟簿甩俩氯酌但拆赠沥锤嗽项嘉匡级竟峰造薯肋扬呛盂沙踩原虏醚篷旺誊撮绑粤斋悔伤礼盅蔗冶熙级稀蛊红菜沾皖梗碳蝴导蘑宪脾咋从掖码橱从严疟拇喘乎子造危完冠压尧角揭舅贞峰递慰闹氖停灿圈寥布宋套妊雪屹晤执坎爽呵恨磁娘朱匣躇枯斥霸岸萌迢索柴妒靠遁堡烤碴疲甲捻澜脆董搐择粘藤惟闪澡乡去笺梅释喘框瞄臀桓斧捅潮人巴葵淑斑栓舅沈克晚叙逮警厕裴彼窄搐赋朝罗杨尺达嚷突粱胯舰炊英咐煞档

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 中学教育 > 其它中学文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号