多AGENT决策中融合与博弈的研究

资源描述

《多AGENT决策中融合与博弈的研究》由会员分享，可在线阅读，更多相关《多AGENT决策中融合与博弈的研究（60页珍藏版）》请在金锄头文库上搜索。

1、摘要根据参与决策的a g e n t 的行为，多a g e n t 决策通常可以分为两类:一类是所有 a g e n t 之间都没有利益冲突的多a g e n t 集体决策; 另一类是这些a g e n t 之间既有共同利益、又存在竞争关系的多a g e n t 多目标合作博弈。在多a g e n t 集体决策中，主要考虑如何最大程度的融合每个a g e n t 的不同意见、去除相互矛盾的信息，以做出最佳的决策; 而多a g e n t 多目标合作博弈中，既要妥善解决不同a g e n t 之间合作与博弈的关系，还

2、要同时满足决策的多个目标。对于这两个问题的研究是有现实意义的，本文的主要工作就是围绕这两方面展开的。首先，在多a g e n t 集体决策中，可以用影响图来表示a g e n t 对于决策环境的认识; 为了使决策结果更为准确，需要将不同a g e n t 构造的影响图合并起来。由于影响图与贝叶斯网在结构上具有很多相似之处，本文首先在贝叶斯网结构合并的基础卜，给出了影响图的结构合并的方法，然后借助于 D - S证据理论等方法实现了概率表和效用表的融合，使得决策模型得以优化。其次，本文讨论了多a g e n t 多步博弈问题的特点，说

3、明了其解空间的规模过大且求解困难。利用遗传算法在解决大规模问题中所具有的优秀的全局搜索性能，提出了基于遗传算法求解多a g e n t 多步博弈的方法。再次，本文分析了多a g e n t 多目标合作博弈除了具有解空间规模巨大的特点以外，还要处理多a g e n t 之间的合作与竞争，且需要同时满足多个目标，提出了一种将遗传算法与适合具体问题的其他算法相结合求解多a g e n t 多目标合作博弈的方法思想。由于笔者水平有限，本文一定存在很多不足的地方;为了弥补这些不足，文章在最后给出了部分未来研究方向。关键字:影响图、模

4、型合并、遗传算法、D - S 证据理论、合作博弈A b s t r a c tA c c o r d i n g t o t h e a g e n t s a c t i o n , th e p r o b l e m o f m u lt i - a g e n t d e c i s i o n - m a k i n g c a n b e d i v i d e d i n t o t w o k i n d s : o n e i s m u l t i - a g e n t c o l l e c t i v e d e c i s i o n - m a k in g ,

5、i n w h i c h t h e r e l a t i o n o f a l l a g e n t s i s c o o p e r a t i v e a n d t h e y h a v e n o c o n fl i c t i o n a b o u t t h e i r i n t e r e s t ; a n o t h e r i s m u l t i - a g e n t m u l t i - o b j e c t i v e c o o p e r a t i v e g a m e , i n w h i c h t h e a g e n t

6、 s n o t o n l y c o o p e r a t e b u t a l s o c o m p e t e e a c h o t h e r . I n t h e f i r s t k i n d o f p r o b l e m , i t s h o u l d b e d e a l t w i t h h o w t o f u s i o n t h e d i ff e r e n t o p i n i o n s o f d i ff e r e n t a g e n t s , in o r d e r t o t h e b e s t d e

7、c i s i o n c a n b e m a d e . I n t h e s e c o n d , w e s h o u l d d e a l w i t h t h e r e l a t i o n o f c o o p e r a t i o n a n d c o m p e t i t i o n , a t t h e s a m e t i m e w e s h o u l d s a t i s f y m a n y o b j e c t i v e s . T h i s d i s s e rt a t i o n j u s t d i s c u

8、 s s e s t h e s e t w o k i n d s o f p r o b l e m s .F i r s t l y , t h e i n fl u e n c e d i a g r a m i s i n t r o d u c e d a s m o d e l w h i c h c a n d e s c r i b e t h e a g e n t s o p i n i o n s a b o u t t h e s i t u a t i o n o f t h e d e c i s i o n - m a k i n g . T h e n a m

9、 e t h o d i s p u t f o r w a r d t o u n i te d i f f e r e n t i n fl u e n c e d i a g r a m s c o n s t r u c t e d b y d i ff e r e n t a g e n t s i n t o a n e w i n fl u e n c e d i a g r a m , w h i c h c a n r o u n d l y d e s c r i b e t h e d e c i s i o n - m a k i n g s i t u a t i o

10、 n . T h i s m e t h o d i n c l u d e s t w o s t e p s : a t t h e f i r s t t h e g r a p h i c a l s t r u c t u r e s a r e u n i t e d b y m e a n s o f t h e w a y t o m e r g e d i ff e r e n t B a y e s i a n n e t w o r k s , w h i c h h a s b e e n p u t f o r w a r d ; t h e n t h e c o

11、n d i t i o n a l p r o b a b i l i t y t a b l e s a n d u t i l i t y t a b l e a r e f u s e d b a s e d o n D - S e v i d e n c e t h e o r y a n d o t h e r me t h o d .S e c o n d l y , t h e p r o b l e m o f m u l t i - a g e n t m u lt i - s t e p g a m e i s d i s c u s s e d . T h e n a m

12、 e t h o d i s d e s c r i b e d t h a t c a n s o l v e t h e N a s h - e q u i l i b r i u m o f m u l t i - a g e n t m u l t i - s t e p g a m e b y m e a n s o f g e n e t i c a l g o r i t h m.F i n a l l y , t h e c h a r a c t e r i s t i c s o f t h e p r o b l e m o f m u l t i - a g e n t

13、 m u l t i - o b j e c t i v e c o o p e r a t i v e g a m e a r e d e s c r ib e d a n d a n a l y z e d . T h e n a n a l g o r i t h m , w h i c h c a n s o l v e t h i s k in d o f p r o b l e m , i s d e v e l o p e d t h a t c o m b i n e g e n e t i c a l g o r it h m w i t h s o m e o t h e

14、r a l g o r i t h m.K e y w o r d : I n fl u e n c e D i a g r a m s , m o d e l u n i o n , G e n e t i cA l g o r i t h m , D - S e v i d e n c e t h e o ry ,a t i v e g a m eY8 9 9 2 5 0创匕.0口厂口H 月本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我所知，除了文中特别加以标注和致谢的地方外，论文中不包含其他人已经发表或撰写过的研究成果，也不包含为获得云南大学或其他教

15、育机构的学位或证明而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。研究生签名: 1 日期:2 J 0 6 , 了 . w论文使用和授权说明本人完全了解云南大学有关保留、使用学位论文的规定，即:学校有权保留送交论文的复印件，允许论文被查阅或借阅;学校可以公布论文的全部或部分内容，可以采用影印、缩印或其他复制手段保存论文。研究生签名 : 卫要-导师签名: 列难一日期 : a n b - s . L 9引言引言2 0 世纪5 0 年代建立起来的统计决策理论和博弈理论，是研究多a g e n t 决

16、策问题最为有效的理论。根据参与决策的a g e n t 的行为，多a g e n t 决策通常可以分为两类: 一类是所有a g e n t 之间都没有利益的冲突，他们作为一个整体进行集体决策，追求集体利益的最大化; 另一类是这些a g e n t 之间既存在着共同的利益，又在某些局势下具有一定的利益冲突，存在博弈关系。在第一类相互没有利益冲突的多a g e n t 集体决策中，每个a g e n t 由于在决策局势中的角度或地位不同，或进行决策的时刻不一致，得出的决策模型可能既有相同的部分，又有相互矛盾的地方。如何能够融合所有a g e n t 的决策模型中一致的信息、去除相互之间的冲突信息、得出一个全面反映决策环境的决策模型，是多a g e n t 集体决策需要解决的关键问题。关于第二类既有共同利益、又存在利益冲突的多a g e n t 合作博弈问题，在实际情况下，常常还有多个决策目标需要同时满足。如何能够使利益冲突中

展开阅读全文