多AGENT决策中融合与博弈的研究

上传人:jiups****uk12 文档编号:41018243 上传时间:2018-05-28 格式:PDF 页数:60 大小:2.20MB
返回 下载 相关 举报
多AGENT决策中融合与博弈的研究_第1页
第1页 / 共60页
多AGENT决策中融合与博弈的研究_第2页
第2页 / 共60页
多AGENT决策中融合与博弈的研究_第3页
第3页 / 共60页
多AGENT决策中融合与博弈的研究_第4页
第4页 / 共60页
多AGENT决策中融合与博弈的研究_第5页
第5页 / 共60页
点击查看更多>>
资源描述

《多AGENT决策中融合与博弈的研究》由会员分享,可在线阅读,更多相关《多AGENT决策中融合与博弈的研究(60页珍藏版)》请在金锄头文库上搜索。

1、摘要根据参与决策的a g e n t 的 行为,多a g e n t 决策通常可以 分为两类:一 类是所有 a g e n t 之间 都 没 有利 益冲突的 多a g e n t 集体决 策; 另一 类是 这些a g e n t 之间既 有共同 利益、又 存在竞 争关 系的 多a g e n t 多目 标合作博弈。 在多a g e n t 集体 决策中, 主要 考虑如何最大 程度的融合每个a g e n t 的不同意见、 去除相互矛盾的信息, 以 做出 最 佳的 决策; 而 多a g e n t 多目 标合作 博弈中, 既 要妥善 解决 不同a g e n t 之间 合 作与 博 弈的关系,还

2、要同时满足决策的多个目标。对于这两个问题的研究是有现实意义的,本文的主要工作就是围绕这两方面展开的。首先, 在多a g e n t 集 体决策中, 可以 用影响图 来表示a g e n t 对于 决 策 环境的 认 识; 为了 使决 策结 果更为 准确, 需 要 将不同a g e n t 构 造的 影响图 合并 起来。 由 于 影 响图与贝叶斯网在结构上具有很多相似之处,本文首先在贝叶斯网结构合并的基础 卜 ,给出了影响图的结构合并的方法,然后借助于 D - S证据理论等方法实现了概率表和效用表的融合,使得决策模型得以优化。其次, 本文讨论了 多a g e n t 多步博 弈问 题的特点, 说

3、明了 其解空间的 规模过大 且求解困难。利用遗传算法在解决大规模问题中所具有的优秀的全局搜索性能,提出了 基于遗传算法求解多a g e n t 多步博弈的方法。再次, 本文分析了 多a g e n t 多目 标合作博弈除了 具有解空间规模巨大的 特点以 外, 还要处 理多a g e n t 之间 的 合作与 竞争, 且需要同 时 满足多 个目 标, 提出了 一 种 将遗 传算法与 适 合具体问 题的 其他算 法相结 合求解多a g e n t 多目 标合作 博弈的方 法思想。由 于笔者水平有限,本文一定存在很多不足的地方;为了弥补这些不足,文 章在最后给出了部分未来研究方向。关键字:影响图、模

4、型合并、遗传算法、D - S 证据理论、合作博弈A b s t r a c tA c c o r d i n g t o t h e a g e n t s a c t i o n , th e p r o b l e m o f m u lt i - a g e n t d e c i s i o n - m a k i n g c a n b e d i v i d e d i n t o t w o k i n d s : o n e i s m u l t i - a g e n t c o l l e c t i v e d e c i s i o n - m a k in g ,

5、i n w h i c h t h e r e l a t i o n o f a l l a g e n t s i s c o o p e r a t i v e a n d t h e y h a v e n o c o n fl i c t i o n a b o u t t h e i r i n t e r e s t ; a n o t h e r i s m u l t i - a g e n t m u l t i - o b j e c t i v e c o o p e r a t i v e g a m e , i n w h i c h t h e a g e n t

6、 s n o t o n l y c o o p e r a t e b u t a l s o c o m p e t e e a c h o t h e r . I n t h e f i r s t k i n d o f p r o b l e m , i t s h o u l d b e d e a l t w i t h h o w t o f u s i o n t h e d i ff e r e n t o p i n i o n s o f d i ff e r e n t a g e n t s , in o r d e r t o t h e b e s t d e

7、c i s i o n c a n b e m a d e . I n t h e s e c o n d , w e s h o u l d d e a l w i t h t h e r e l a t i o n o f c o o p e r a t i o n a n d c o m p e t i t i o n , a t t h e s a m e t i m e w e s h o u l d s a t i s f y m a n y o b j e c t i v e s . T h i s d i s s e rt a t i o n j u s t d i s c u

8、 s s e s t h e s e t w o k i n d s o f p r o b l e m s .F i r s t l y , t h e i n fl u e n c e d i a g r a m i s i n t r o d u c e d a s m o d e l w h i c h c a n d e s c r i b e t h e a g e n t s o p i n i o n s a b o u t t h e s i t u a t i o n o f t h e d e c i s i o n - m a k i n g . T h e n a m

9、 e t h o d i s p u t f o r w a r d t o u n i te d i f f e r e n t i n fl u e n c e d i a g r a m s c o n s t r u c t e d b y d i ff e r e n t a g e n t s i n t o a n e w i n fl u e n c e d i a g r a m , w h i c h c a n r o u n d l y d e s c r i b e t h e d e c i s i o n - m a k i n g s i t u a t i o

10、 n . T h i s m e t h o d i n c l u d e s t w o s t e p s : a t t h e f i r s t t h e g r a p h i c a l s t r u c t u r e s a r e u n i t e d b y m e a n s o f t h e w a y t o m e r g e d i ff e r e n t B a y e s i a n n e t w o r k s , w h i c h h a s b e e n p u t f o r w a r d ; t h e n t h e c o

11、n d i t i o n a l p r o b a b i l i t y t a b l e s a n d u t i l i t y t a b l e a r e f u s e d b a s e d o n D - S e v i d e n c e t h e o r y a n d o t h e r me t h o d .S e c o n d l y , t h e p r o b l e m o f m u l t i - a g e n t m u lt i - s t e p g a m e i s d i s c u s s e d . T h e n a m

12、 e t h o d i s d e s c r i b e d t h a t c a n s o l v e t h e N a s h - e q u i l i b r i u m o f m u l t i - a g e n t m u l t i - s t e p g a m e b y m e a n s o f g e n e t i c a l g o r i t h m.F i n a l l y , t h e c h a r a c t e r i s t i c s o f t h e p r o b l e m o f m u l t i - a g e n t

13、 m u l t i - o b j e c t i v e c o o p e r a t i v e g a m e a r e d e s c r ib e d a n d a n a l y z e d . T h e n a n a l g o r i t h m , w h i c h c a n s o l v e t h i s k in d o f p r o b l e m , i s d e v e l o p e d t h a t c o m b i n e g e n e t i c a l g o r it h m w i t h s o m e o t h e

14、r a l g o r i t h m.K e y w o r d : I n fl u e n c e D i a g r a m s , m o d e l u n i o n , G e n e t i cA l g o r i t h m , D - S e v i d e n c e t h e o ry ,a t i v e g a m eY8 9 9 2 5 0创匕.0口 厂 口H 月本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以 标注和致谢的地方外,论文中不包含其他人已 经发表或撰写过的研究成果,也不包含为获得云南大学或其他教

15、育机构的学位或证明而使用过的 材料。与我一同工作的同 志对本研究所做的任何贡献均已 在论文中作了明确的说明并表示了谢意。研究 生 签 名: 1 日 期:2 J 0 6 , 了 . w论文使用和授权说明本人完全了 解云南大学有关保留、使用学位论文的规定,即:学校有权保留送交论文的复印件,允许论文被查阅或借阅;学校可以公布论文的全部或部分内容, 可以 采用影印、 缩印或其他复制手段保存论文。研 究 生 签 名 : 卫要-导 师 签 名: 列难一 日期 : a n b - s . L 9引言引言2 0 世纪5 0 年代建 立起来的 统计 决策 理论 和博 弈 理论, 是 研究多a g e n t 决

16、策问 题最 为有效 的 理论。 根据参与 决策的a g e n t 的 行为, 多a g e n t 决策 通常可以 分为两 类: 一 类是 所有a g e n t 之间都没有利 益的 冲突, 他们 作为一 个 整体进行集体决策, 追求 集体 利益的 最大 化; 另 一 类是这 些a g e n t 之间 既 存在 着共同的 利 益, 又 在某 些 局势下具有一定的利益冲突,存在博弈关系。在 第一 类相互没 有利益冲突的多a g e n t 集 体决策中, 每 个a g e n t 由于 在决策 局 势中的角度或地位不同,或进行决策的时刻不一致,得出的决策模型可能既有相同的部分, 又有相互矛盾的地方。 如何能 够融合所有a g e n t 的决策模型中一致的信 息、 去除 相互 之间的冲 突信息、 得出一 个全面 反 映决 策 环境的 决策 模型, 是多a g e n t 集体决策需要解决的关键问题。关于第二类既有共同利益、 又存在利益冲突的多a g e n t 合作博弈问 题, 在实际 情况下, 常 常还有多个决 策目 标需 要同 时 满足。 如 何能 够使利 益冲突中

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文 > 毕业论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号