贝叶斯网络介绍－金锄头文库

资源描述

《贝叶斯网络介绍》由会员分享，可在线阅读，更多相关《贝叶斯网络介绍（4页珍藏版）》请在金锄头文库上搜索。

1、3 5 贝叶斯网络贝叶斯网络是一系列变量的联合概率分布的图形表示。一般包含两个部分，一个就是贝叶斯网络结构图，这是一个有向无环图( DAG ) ，其中图中的每个节点代表相应的变量，节点之间的连接关系代表了贝叶斯网络的条件独立语义。另一部分，就是节点和节点之间的条件概率表(CPT ) ，也就是一系列的概率值。如果一个贝叶斯网络提供了足够的条件概率值，足以计算任何给定的联合概率，我们就称，它是可计算的，即可推理的。3.5.1 贝叶斯网络基础首先从一个具体的实例(医疗诊断的例子)来说明贝叶斯网络的构造。假设：命题S(moker) ：该患者是一个吸烟者命题C(oal Mi

2、ner) ：该患者是一个煤矿矿井工人命题L(ung Cancer) ：他患了肺癌命题E(mphysema) ：他患了肺气肿命题 S 对命题 L 和命题 E 有因果影响，而 C 对 E 也有因果影响。命题之间的关系可以描绘成如右图所示的因果关系网。因此，贝叶斯网有时也叫因果网，因为可以将连接结点的弧认为是表达了直接的因果关系。图 3-5 贝叶斯网络的实例图中表达了贝叶斯网的两个要素：其一为贝叶斯网的结构，也就是各节点的继承关系，其二就是条件概率表CPT 。若一个贝叶斯网可计算，则这两个条件缺一不可。贝叶斯网由一个有向无环图( DAG )及描述顶点之间的概率表组成。其中

3、每个顶点对应一个随机变量。这个图表达了分布的一系列有条件独立属性：在给定了父亲节点的状态后，每个变量与它在图中的非继承节点在概率上是独立的。该图抓住了概率分布的定性结构，并被开发来做高效推理和决策。贝叶斯网络能表示任意概率分布的同时，它们为这些能用简单结构表示的分布提供了可计算优势。假设对于顶点xi,其双亲节点集为Pai,每个变量xi的条件概率P(xi|Pai)。则顶点集合X=x1,x2,xn的联合概率分布可如下计算：。双亲结点。该结点得上一代结点。该等式暗示了早先给定的图结构有条件独立语义。它说明贝叶斯网络所表示的联合分布作为一些单独的局部交互作用模型的结果具有因式分解

6、减少更加明显。贝叶斯网络是一系列变量的联合概率分布的图形表示。这种表示法最早被用来对专家的不确定知识编码，今天它们在现代专家系统、诊断引擎和决策支持系统中发挥了关键作用。贝叶斯网络的一个被经常提起的优点是它们具有形式的概率语义并且能作为存在于人类头脑中的知识结构的自然映像。这有助于知识在概率分布方面的编码和解释，使基于概率的推理和最佳决策成为可能。3.5.2 贝叶斯网的推理模式在贝叶斯网中有三种重要的推理模式，因果推理(由上向下推理) ，诊断推理(自底向上推理)和辩解。3.5.3 5 2 1 因果推理让我们通过概述的实例来说明因果推理得过程。给定患者是一个吸烟者(S) ，计算他

9、直到所有的概率值可从CPT 表中得到，推理完成。3 5 2 2 诊断推理同样以概述中的例题为例，我们计算不得肺气肿的不是矿工的概率 P(C|E), 即在贝叶斯网中，从一个子结点计算父结点的条件概率。也即从结果推测一个起因，这类推理叫做诊断推理。使用 Bayes 公式就可以把这种推理转换成因果推理。P(CbE)= P(E卜C)*P(C)/P(E),从因果推理可知P(E|C) = P(E,S|C)+P(E,S|C)= P(E|S,C)*P(S)+P(E|S,C)*P(S)= (1-0.3)*0.4+(1-0.10)*(1-0.4)=0.82;由此得：P(C卜E)= P(E卜C)*P(C

10、)/ P(E)(贝叶斯公式)=0.82*(1-0.3)/ P(E)=0.574/ P(E)同样的，P(C卜E) = P(E|C)* P(C)/ P(E)=0.34*0.3/ P(E)=0.102 /P(E)由于全概率公式：P(C卜E)+P(C卜E) = 1代入可得P(E)=0.676所以，P(C卜E) = 0.849这种推理方式主要利用 Bayes 规则转换成因果推理。3 5 2 3 辩解如果我们的证据仅仅是E (不是肺气肿)，象上述那样，我们可以计算C患者不是煤矿工人的概率。但是如果也给定S (患者不是吸烟者)，那么C也应该变得不确定。这种情况下，我们说S解释E,使C变得不确定。这类推理使用

11、嵌入在一个诊断推理中的因果推理。作为思考题，读者可以沿着这个思路计算上式。在这个过程中，贝叶斯规则的使用，是辩解过程中一个重要的步骤。3.5.3 D 分离在本节最开始的贝叶斯网图中，有三个这样的结点： S, L, E。从直观来说，L的知识(结果)会影响S 的知识(起因) ， S 会影响 E 的知识(另一个结果) 。因此，在计算推理时必须考虑的相关因素非常多，大大影响了算法的计算复杂度，甚至可能影响算法的可实现性。但是如果给定原因S， L 并不能告诉我们有关E 的更多事情。即对于S， L 和 E 是相对独立的，那么在计算S 和 L 的关系时就不用过多地考虑E ，将会大大减少计

12、算复杂度。这种情况下，我们称S能D分离L和E。D分离是一种寻找条件独立的有效方法。如下图，对于给定的结点集如果对贝叶斯网中的结点Vi和Vj之间的每个无向路径，在路径上有某个结点 Vb,如果有属性：1) Vb在e中，且路径上的两条弧都以Vb为尾(即弧在 Vb处开始(出发)2) Vb在e中，路径上的一条弧以 Vb为头，一条以 Vb为尾3) Vb和它的任何后继都不在e中，路径上的两条弧都以 Vb为头(即弧在 Vb处结束)则称Vi和Vj被Vb结点阻塞。结论：如果Vi和Vj被证据集合e中的任意结点阻塞，则称Vi和Vj是被e集合D分离，结点Vi和Vj条件独立于给定的证据集合,即P(Vi|Vj, e 手

13、 P(Vi| e)P(Vj|Vi, e 手 P(Vj| s )表示为：I(Vi,Vj| 期 I(Vj,Vi| )无向路径：DAG图是有向图，所以其中的路径也应该是有向路径，这里所指的无向路径是不考虑DAG图中的方向性时的路径。条件独立：如具有以上三个属性之一，就说结点Vi和Vj条件独立于给定的结点集o阻塞：给定证据集合s,当上述条件中的任何一个满足时，就说 Vb阻塞相应的那条路径。D分离：如果Vi和Vj之间所有的路径被阻塞，就叫证据集合e可以D分离Vi和Vj注意：在论及路径时，是不考虑方向的；在论及头和尾时，则必须考虑弧的方向。头的含义是箭头方向(有向弧)的终止点，尾的含义是箭头方向(有向弧

14、)的起始点。回到最开始的医疗诊断实例：为简单起见，选择证据集合e为单个结点集合。对于给定的结点 S,结点E阻塞了结点C和结点L之间的路径，因此 C和L是条件独立的，有I (C, L|S)成立。而对于给定结点 E, S和L之间找不到阻塞结点。因此， S和L不是条件独立的。即使使用了 D分离，一般地讲，在贝叶斯网中，概率推理仍是 NP难题。然而，有些简化能在一个叫Polytree的重要网络分类中使用。一个Polytree网是一个DAG ,在该DAG的任意两个结点间，顺着弧的每一个方向只有一条路径。如图就是一个典型的Polytree。图 3-7 PolytreeD分离的实质就是寻找贝叶斯网中的条件独立语义，以简化推理计算。总结本节就Bayes网络的基本问题进行了阐述，着重点在推理计算上。其本质就是通过各种方法寻找网络中的条件独立性，达到减少计算量和复杂性的目的。这些都只是粗浅的描述，进一步的学习，请参考相应的参考书的五Ilytree的概率推理和Bayes网的学习和动作等章节，其中有很详细的阐述。

展开阅读全文

贝叶斯网络介绍

最新文档