朴素贝叶斯方法课件

上传人:鲁** 文档编号:571095633 上传时间:2024-08-08 格式:PPT 页数:53 大小:2.05MB
返回 下载 相关 举报
朴素贝叶斯方法课件_第1页
第1页 / 共53页
朴素贝叶斯方法课件_第2页
第2页 / 共53页
朴素贝叶斯方法课件_第3页
第3页 / 共53页
朴素贝叶斯方法课件_第4页
第4页 / 共53页
朴素贝叶斯方法课件_第5页
第5页 / 共53页
点击查看更多>>
资源描述

《朴素贝叶斯方法课件》由会员分享,可在线阅读,更多相关《朴素贝叶斯方法课件(53页珍藏版)》请在金锄头文库上搜索。

1、知识管理与数据分析实验室知识管理与数据分析实验室知识管理与数据分析实验室数据挖掘技术专题数据挖掘技术专题数据挖掘技术专题贝叶斯网络与朴素贝叶斯张嶷2010-022024/8/81知知识管理与数据分析管理与数据分析实验室室一、贝叶斯法则问题如何判定一个人是好人还是坏人?如何判定一个人是好人还是坏人?2024/8/8知知识管理与数据分析管理与数据分析实验室室2总做一些好事总做一些好事? ?好人好人总做一些坏事总做一些坏事?坏人坏人人的人的主观主观认识认识一、贝叶斯法则引言当你无法准确的知悉一个事物的本质时,当你无法准确的知悉一个事物的本质时,你可以依靠与事物特定本质相关的事件出你可以依靠与事物特定

2、本质相关的事件出现的次数来判断其本质属性的现的次数来判断其本质属性的概率概率。如果你看到一个人总是做一些好事,那这个人如果你看到一个人总是做一些好事,那这个人如果你看到一个人总是做一些好事,那这个人如果你看到一个人总是做一些好事,那这个人就就就就越可能越可能越可能越可能是一个好人。是一个好人。是一个好人。是一个好人。数学语言表达就是:支持某项属性的事件数学语言表达就是:支持某项属性的事件发生得越多,则该属性成立的可能性就愈发生得越多,则该属性成立的可能性就愈大大贝叶斯法则贝叶斯法则贝叶斯法则贝叶斯法则2024/8/8知知识管理与数据分析管理与数据分析实验室室3一、贝叶斯法则起源贝叶斯法则来源于

3、英国数学家贝叶斯法则来源于英国数学家贝叶斯(贝叶斯(Thomas BayesThomas Bayes)在)在17631763年发表的著作年发表的著作论有关机论有关机遇问题的求解遇问题的求解。2024/8/8知知识管理与数据分析管理与数据分析实验室室4贝叶斯法则最初是一种用于概率论基础理论贝叶斯法则最初是一种用于概率论基础理论的归纳推理方法,但随后被一些统计学学者的归纳推理方法,但随后被一些统计学学者发展为一种系统的统计推断方法,运用到统发展为一种系统的统计推断方法,运用到统计决策、统计推断、统计估算等诸多领域。计决策、统计推断、统计估算等诸多领域。一、贝叶斯法则贝叶斯公式贝叶斯公式贝叶斯公式定

4、义一定义一定义一定义一 假定某个过程有若干可能的前提条件假定某个过程有若干可能的前提条件假定某个过程有若干可能的前提条件假定某个过程有若干可能的前提条件 ,则,则,则,则 表示人们事表示人们事表示人们事表示人们事先对前提条件先对前提条件先对前提条件先对前提条件X X X Xi i i i出现的可能性大小的估计,即出现的可能性大小的估计,即出现的可能性大小的估计,即出现的可能性大小的估计,即先验概率。先验概率。先验概率。先验概率。定义二定义二定义二定义二 假定某个过程得到了结果假定某个过程得到了结果假定某个过程得到了结果假定某个过程得到了结果A A A A,则,则,则,则 表示在出现结果表示在出

5、现结果表示在出现结果表示在出现结果A A A A的前提下,的前提下,的前提下,的前提下,对前提条件对前提条件对前提条件对前提条件X X X Xi i i i出现的可能性大小的估计,即后出现的可能性大小的估计,即后出现的可能性大小的估计,即后出现的可能性大小的估计,即后验概率。验概率。验概率。验概率。2024/8/8知知识管理与数据分析管理与数据分析实验室室5一、贝叶斯法则算例全垄断市场条件下,只有一家企业全垄断市场条件下,只有一家企业全垄断市场条件下,只有一家企业全垄断市场条件下,只有一家企业M M M M提供产品和服务。企提供产品和服务。企提供产品和服务。企提供产品和服务。企业业业业K K

6、K K考虑是否进入该市场。同时,企业考虑是否进入该市场。同时,企业考虑是否进入该市场。同时,企业考虑是否进入该市场。同时,企业M M M M为阻止为阻止为阻止为阻止K K K K进入该市进入该市进入该市进入该市场采取了相应的投资行为,而场采取了相应的投资行为,而场采取了相应的投资行为,而场采取了相应的投资行为,而K K K K能否进入该市场完全取决能否进入该市场完全取决能否进入该市场完全取决能否进入该市场完全取决于于于于M M M M为阻止其进入所花费的成本大小。为阻止其进入所花费的成本大小。为阻止其进入所花费的成本大小。为阻止其进入所花费的成本大小。假设假设假设假设K K K K并不知道原垄

7、断者并不知道原垄断者并不知道原垄断者并不知道原垄断者M M M M是属于高阻挠成本类型还是低阻是属于高阻挠成本类型还是低阻是属于高阻挠成本类型还是低阻是属于高阻挠成本类型还是低阻挠成本类型,但能确定,如果挠成本类型,但能确定,如果挠成本类型,但能确定,如果挠成本类型,但能确定,如果M M M M属于高阻挠成本类型,属于高阻挠成本类型,属于高阻挠成本类型,属于高阻挠成本类型,K K K K进进进进入市场时入市场时入市场时入市场时M M M M进行阻挠的概率是进行阻挠的概率是进行阻挠的概率是进行阻挠的概率是20%20%20%20%;如果;如果;如果;如果M M M M属于低阻挠成本属于低阻挠成本属

8、于低阻挠成本属于低阻挠成本类型,类型,类型,类型,K K K K进入市场时进入市场时进入市场时进入市场时M M M M进行阻挠的概率是进行阻挠的概率是进行阻挠的概率是进行阻挠的概率是100%100%100%100%。现设现设现设现设K K K K认为认为认为认为M M M M属于高阻挠成本企业的概率为属于高阻挠成本企业的概率为属于高阻挠成本企业的概率为属于高阻挠成本企业的概率为70%70%70%70%,而在,而在,而在,而在K K K K进入进入进入进入市场后,市场后,市场后,市场后,M M M M确实进行了商业阻挠。试以企业确实进行了商业阻挠。试以企业确实进行了商业阻挠。试以企业确实进行了商

9、业阻挠。试以企业K K K K的角度,判断的角度,判断的角度,判断的角度,判断企业企业企业企业M M M M为高阻挠成本类型的概率。为高阻挠成本类型的概率。为高阻挠成本类型的概率。为高阻挠成本类型的概率。2024/8/8知知识管理与数据分析管理与数据分析实验室室6一、贝叶斯法则算例利用贝叶斯公式建模:利用贝叶斯公式建模:前提条件:设前提条件:设前提条件:设前提条件:设M M M M是高阻挠成本类型为是高阻挠成本类型为是高阻挠成本类型为是高阻挠成本类型为X X X X1 1 1 1, , , ,低阻挠低阻挠低阻挠低阻挠成本类型为成本类型为成本类型为成本类型为X X X X2 2 2 2;结果:结

10、果:结果:结果:M M M M对对对对K K K K进行阻挠为进行阻挠为进行阻挠为进行阻挠为A;A;A;A;所求概率即为在已知结果所求概率即为在已知结果所求概率即为在已知结果所求概率即为在已知结果 A A A A的情况下,推断条的情况下,推断条的情况下,推断条的情况下,推断条件为件为件为件为X X X X1 1 1 1的后验概率的后验概率的后验概率的后验概率 ; ; ; ;已知已知已知已知 为为为为0.20.20.20.2, 为为为为1 1 1 1,P(XP(XP(XP(X1 1 1 1) ) ) )为为为为0.70.70.70.7,P(XP(XP(XP(X2 2 2 2) ) ) )为为为为

11、0.30.30.30.3。2024/8/8知知识管理与数据分析管理与数据分析实验室室7一、贝叶斯法则算例即即, ,根据实际市场的运作情况,企业根据实际市场的运作情况,企业K K可判可判断企业断企业M M为高阻挠成本类型的概率为为高阻挠成本类型的概率为0.320.32,换句话说,企业换句话说,企业M M更可能属于低阻挠成本类更可能属于低阻挠成本类型。型。2024/8/8知知识管理与数据分析管理与数据分析实验室室8根据贝叶斯公式可计算:根据贝叶斯公式可计算:二、贝叶斯网络引言贝叶斯网络又称为信度网络,是基于概率贝叶斯网络又称为信度网络,是基于概率推理的图形化网络。它是贝叶斯法则的扩推理的图形化网络

12、。它是贝叶斯法则的扩展,而贝叶斯公式则是这个概率网络的基展,而贝叶斯公式则是这个概率网络的基础。础。贝叶斯网络适用于表达和分析不确定性和贝叶斯网络适用于表达和分析不确定性和概率性事件,应用于有条件地依赖多种控概率性事件,应用于有条件地依赖多种控制因素的决策过程,可以从不完全、不精制因素的决策过程,可以从不完全、不精确或不确定的知识或信息中做出推理。确或不确定的知识或信息中做出推理。2024/8/8知知识管理与数据分析管理与数据分析实验室室9二、贝叶斯网络引言贝叶斯网络由贝叶斯网络由Judea PearlJudea Pearl于于19881988年提出,年提出,最初主要用于处理人工智能中的不确定

13、信最初主要用于处理人工智能中的不确定信息。息。随后,逐步成为处理不确定性信息技术的随后,逐步成为处理不确定性信息技术的主流,并在文本分类、字母识别、经济预主流,并在文本分类、字母识别、经济预测、医疗诊断、工业控制等领域得到了广测、医疗诊断、工业控制等领域得到了广泛的应用。目前,贝叶斯网络是泛的应用。目前,贝叶斯网络是不确定知不确定知识表达识表达和和推理领域推理领域最有效的理论模型之一。最有效的理论模型之一。2024/8/8知知识管理与数据分析管理与数据分析实验室室10二、贝叶斯网络定义符号符号B(D,G)B(D,G)表示一个贝叶斯网络,表示一个贝叶斯网络,包括两个部分:包括两个部分:一个有向无

14、环图(一个有向无环图(一个有向无环图(一个有向无环图(Directed Directed Directed Directed Acyclic Graph, DAGAcyclic Graph, DAGAcyclic Graph, DAGAcyclic Graph, DAG)。它由代表)。它由代表)。它由代表)。它由代表变量的节点及连接这些节点的有向变量的节点及连接这些节点的有向变量的节点及连接这些节点的有向变量的节点及连接这些节点的有向边构成。其中,节点代表随机变量,边构成。其中,节点代表随机变量,边构成。其中,节点代表随机变量,边构成。其中,节点代表随机变量,可以是任何问题的抽象,如:测试可以

15、是任何问题的抽象,如:测试可以是任何问题的抽象,如:测试可以是任何问题的抽象,如:测试值、观测现象、意见征询等;节点值、观测现象、意见征询等;节点值、观测现象、意见征询等;节点值、观测现象、意见征询等;节点间的有向边代表了节点间的互相关间的有向边代表了节点间的互相关间的有向边代表了节点间的互相关间的有向边代表了节点间的互相关系(由父节点指向其后代节点)。系(由父节点指向其后代节点)。系(由父节点指向其后代节点)。系(由父节点指向其后代节点)。2024/8/8知知识管理与数据分析管理与数据分析实验室室11ABC二、贝叶斯网络定义一个节点与节点之间的条件概率表一个节点与节点之间的条件概率表(Con

16、ditional Probability Table, Conditional Probability Table, CPTCPT)。如果节点没有任何父节点,则该节)。如果节点没有任何父节点,则该节点概率为其先验概率。否则,该节点概率点概率为其先验概率。否则,该节点概率为其在父节点条件下的后验概率。为其在父节点条件下的后验概率。2024/8/8知知识管理与数据分析管理与数据分析实验室室12实际实际实际实际类型类型类型类型 A AB BC CD DA A0.80.80.10.10.050.050.050.05B B0.20.20.650.650.10.10.050.05C C0.250.250.

17、10.10.600.600.050.05D D0.050.050.10.10.150.150.70.7目标类型目标类型目标类型目标类型二、贝叶斯网络定义数学定义:数学定义:贝叶斯网络贝叶斯网络贝叶斯网络贝叶斯网络B(D,P)B(D,P)B(D,P)B(D,P),D D D D表示一个有向无环图表示一个有向无环图表示一个有向无环图表示一个有向无环图, , , , 是条是条是条是条件概率分布的集合,其中件概率分布的集合,其中件概率分布的集合,其中件概率分布的集合,其中 是是是是D D D D中节点中节点中节点中节点X X X Xi i i i的父的父的父的父节点集合。在一个贝叶斯网络中,节点集合节

18、点集合。在一个贝叶斯网络中,节点集合节点集合。在一个贝叶斯网络中,节点集合节点集合。在一个贝叶斯网络中,节点集合 ,则其联合概率分布,则其联合概率分布,则其联合概率分布,则其联合概率分布P(X)P(X)P(X)P(X)是此贝叶斯网络中所是此贝叶斯网络中所是此贝叶斯网络中所是此贝叶斯网络中所有条件分布的乘积:有条件分布的乘积:有条件分布的乘积:有条件分布的乘积: 2024/8/8知知识管理与数据分析管理与数据分析实验室室13二、贝叶斯网络定义这是一个最简单的包含3个节点的贝叶斯网络。其中, 是节点A的概率分布(先验概率),与 为节点B,C的概率分布(后验概率)2024/8/8知知识管理与数据分析

19、管理与数据分析实验室室14ABC二、贝叶斯网络研究前景贝叶斯网络的特性:贝叶斯网络的特性: 贝叶斯网络本身是一种不定性因果关联模型,它将多贝叶斯网络本身是一种不定性因果关联模型,它将多贝叶斯网络本身是一种不定性因果关联模型,它将多贝叶斯网络本身是一种不定性因果关联模型,它将多元知识图解可视化,贴切的蕴含了网络节点变量之间元知识图解可视化,贴切的蕴含了网络节点变量之间元知识图解可视化,贴切的蕴含了网络节点变量之间元知识图解可视化,贴切的蕴含了网络节点变量之间的因果关系及条件相关关系;的因果关系及条件相关关系;的因果关系及条件相关关系;的因果关系及条件相关关系; 贝叶斯网络具有强大的不确定性问题的

20、处理能力,它贝叶斯网络具有强大的不确定性问题的处理能力,它贝叶斯网络具有强大的不确定性问题的处理能力,它贝叶斯网络具有强大的不确定性问题的处理能力,它用条件概率表达各个信息要素之间的相关关系,能在用条件概率表达各个信息要素之间的相关关系,能在用条件概率表达各个信息要素之间的相关关系,能在用条件概率表达各个信息要素之间的相关关系,能在有限的、不完整的、不确定的信息条件下进行知识学有限的、不完整的、不确定的信息条件下进行知识学有限的、不完整的、不确定的信息条件下进行知识学有限的、不完整的、不确定的信息条件下进行知识学习和推理;习和推理;习和推理;习和推理; 贝叶斯网络能有效的进行多源信息表达与融合

21、,可将贝叶斯网络能有效的进行多源信息表达与融合,可将贝叶斯网络能有效的进行多源信息表达与融合,可将贝叶斯网络能有效的进行多源信息表达与融合,可将故障诊断与维修决策相关的各种信息纳入到网络结构故障诊断与维修决策相关的各种信息纳入到网络结构故障诊断与维修决策相关的各种信息纳入到网络结构故障诊断与维修决策相关的各种信息纳入到网络结构中,并按节点的方式统一进行处理与信息融合。中,并按节点的方式统一进行处理与信息融合。中,并按节点的方式统一进行处理与信息融合。中,并按节点的方式统一进行处理与信息融合。2024/8/8知知识管理与数据分析管理与数据分析实验室室15二、贝叶斯网络研究前景贝叶斯网络的缺陷贝叶

22、斯网络的缺陷 研究如何根据数据和专家知识高效、准确的建立贝叶研究如何根据数据和专家知识高效、准确的建立贝叶研究如何根据数据和专家知识高效、准确的建立贝叶研究如何根据数据和专家知识高效、准确的建立贝叶斯网络,是十多年来研究的热点之一,也是贝叶斯网斯网络,是十多年来研究的热点之一,也是贝叶斯网斯网络,是十多年来研究的热点之一,也是贝叶斯网斯网络,是十多年来研究的热点之一,也是贝叶斯网络更加广泛、有效地用于实际问题领域的关键和焦点络更加广泛、有效地用于实际问题领域的关键和焦点络更加广泛、有效地用于实际问题领域的关键和焦点络更加广泛、有效地用于实际问题领域的关键和焦点之一。之一。之一。之一。 目前对于

23、这一类学习问题,主要有基于打分目前对于这一类学习问题,主要有基于打分目前对于这一类学习问题,主要有基于打分目前对于这一类学习问题,主要有基于打分搜索的搜索的搜索的搜索的学习方法和基于依赖分析的学习方法,但前者存在搜学习方法和基于依赖分析的学习方法,但前者存在搜学习方法和基于依赖分析的学习方法,但前者存在搜学习方法和基于依赖分析的学习方法,但前者存在搜索空间巨大,可能收敛于局部最优解等问题,后者则索空间巨大,可能收敛于局部最优解等问题,后者则索空间巨大,可能收敛于局部最优解等问题,后者则索空间巨大,可能收敛于局部最优解等问题,后者则存在节点之间的独立性或条件独立性判断困难,高阶存在节点之间的独立

24、性或条件独立性判断困难,高阶存在节点之间的独立性或条件独立性判断困难,高阶存在节点之间的独立性或条件独立性判断困难,高阶条件独立性检验的结果不够可靠等问题。条件独立性检验的结果不够可靠等问题。条件独立性检验的结果不够可靠等问题。条件独立性检验的结果不够可靠等问题。2024/8/8知知识管理与数据分析管理与数据分析实验室室16二、贝叶斯网络研究前景贝叶斯网络与马尔科夫链贝叶斯网络与马尔科夫链 马尔科夫链蒙特卡罗(马尔科夫链蒙特卡罗(马尔科夫链蒙特卡罗(马尔科夫链蒙特卡罗(Markov Chain Monte CarloMarkov Chain Monte CarloMarkov Chain Mo

25、nte CarloMarkov Chain Monte Carlo,MCMCMCMCMCMCMCMC)方法是源于统计物理学和生物学的一类重要的)方法是源于统计物理学和生物学的一类重要的)方法是源于统计物理学和生物学的一类重要的)方法是源于统计物理学和生物学的一类重要的随机抽样方法,该方法广泛应用于机器学习、统计和随机抽样方法,该方法广泛应用于机器学习、统计和随机抽样方法,该方法广泛应用于机器学习、统计和随机抽样方法,该方法广泛应用于机器学习、统计和决策分析等领域的高维问题的推理和求积运算。决策分析等领域的高维问题的推理和求积运算。决策分析等领域的高维问题的推理和求积运算。决策分析等领域的高维问

26、题的推理和求积运算。 MHSMHSMHSMHS(Metropolis-Hasting SamplerMetropolis-Hasting SamplerMetropolis-Hasting SamplerMetropolis-Hasting Sampler)抽样算法作为)抽样算法作为)抽样算法作为)抽样算法作为MCMCMCMCMCMCMCMC方法中常用的抽样方法之一,通过构建一条马尔方法中常用的抽样方法之一,通过构建一条马尔方法中常用的抽样方法之一,通过构建一条马尔方法中常用的抽样方法之一,通过构建一条马尔科夫链,模拟一个收敛于科夫链,模拟一个收敛于科夫链,模拟一个收敛于科夫链,模拟一个收敛于

27、BoltzmannBoltzmannBoltzmannBoltzmann分布的系统。将分布的系统。将分布的系统。将分布的系统。将MHSMHSMHSMHS抽样算法引入贝叶斯网络,能够较好的解决进化学抽样算法引入贝叶斯网络,能够较好的解决进化学抽样算法引入贝叶斯网络,能够较好的解决进化学抽样算法引入贝叶斯网络,能够较好的解决进化学习方法中由于个体趋同而产生的早熟问题,保证算法习方法中由于个体趋同而产生的早熟问题,保证算法习方法中由于个体趋同而产生的早熟问题,保证算法习方法中由于个体趋同而产生的早熟问题,保证算法的学习精度。的学习精度。的学习精度。的学习精度。2024/8/8知知识管理与数据分析管理

28、与数据分析实验室室17二、贝叶斯网络研究前景贝叶斯网络与马尔科夫链贝叶斯网络与马尔科夫链 此外,针对其计算精度低、收敛速度较慢的不足,随此外,针对其计算精度低、收敛速度较慢的不足,随此外,针对其计算精度低、收敛速度较慢的不足,随此外,针对其计算精度低、收敛速度较慢的不足,随机拟机拟机拟机拟MCMCMCMCMCMCMCMC方法也具有一定的优越性。方法也具有一定的优越性。方法也具有一定的优越性。方法也具有一定的优越性。 不过,该算法存在的收敛速度慢和收敛性判断困难等不过,该算法存在的收敛速度慢和收敛性判断困难等不过,该算法存在的收敛速度慢和收敛性判断困难等不过,该算法存在的收敛速度慢和收敛性判断困

29、难等问题仍未能得到有效解决。因此,如何更有效地将问题仍未能得到有效解决。因此,如何更有效地将问题仍未能得到有效解决。因此,如何更有效地将问题仍未能得到有效解决。因此,如何更有效地将MCMCMCMCMCMCMCMC方法用于贝叶斯网络的结构学习与推理学习成为方法用于贝叶斯网络的结构学习与推理学习成为方法用于贝叶斯网络的结构学习与推理学习成为方法用于贝叶斯网络的结构学习与推理学习成为近年来重要的研究方向之一。近年来重要的研究方向之一。近年来重要的研究方向之一。近年来重要的研究方向之一。2024/8/8知知识管理与数据分析管理与数据分析实验室室18三、朴素贝叶斯引言贝叶斯网络与朴素贝叶斯贝叶斯网络与朴

30、素贝叶斯2024/8/8知知识管理与数据分析管理与数据分析实验室室19贝叶斯法则贝叶斯法则数数学学基基础础贝叶斯网络贝叶斯网络模模型型朴素贝叶斯朴素贝叶斯具体方法具体方法三、朴素贝叶斯贝叶斯分类器贝叶斯分类器是用于分类的贝叶斯网络。贝叶斯分类器是用于分类的贝叶斯网络。该网络中通常包含类节点该网络中通常包含类节点C C,其取值来自类,其取值来自类集合集合 ;还包含一组节点;还包含一组节点,表示用于进行分类的特征属,表示用于进行分类的特征属性。对于贝叶斯网络分类器,若某一待分性。对于贝叶斯网络分类器,若某一待分类的样本类的样本D D,其分类特征值为,其分类特征值为 ,则样本,则样本D D属于类别属

31、于类别C Ci i i i的概率的概率 , 应满足:应满足:2024/8/8知知识管理与数据分析管理与数据分析实验室室20三、朴素贝叶斯贝叶斯分类器由贝叶斯公式可以得到:由贝叶斯公式可以得到:其中,其中, 可由领域专家的经验获可由领域专家的经验获得,而得,而 和和 的计算较为困难。的计算较为困难。2024/8/8知知识管理与数据分析管理与数据分析实验室室21三、朴素贝叶斯贝叶斯分类器贝叶斯网络分类器进行分类的两个阶段贝叶斯网络分类器进行分类的两个阶段2024/8/8知知识管理与数据分析管理与数据分析实验室室22阶段一贝叶斯网络分类器的学习(结构学习和CPT学习)阶段二贝叶斯网络分类器的推理(计

32、算类节点的条件概率,对数据进行分类)两个阶段的时间复杂度均取决于两个阶段的时间复杂度均取决于两个阶段的时间复杂度均取决于两个阶段的时间复杂度均取决于特征值间的依赖程度特征值间的依赖程度特征值间的依赖程度特征值间的依赖程度三、朴素贝叶斯贝叶斯分类器根据对特征值间不同关联程度的假设,可根据对特征值间不同关联程度的假设,可以得出各种贝叶斯分类器,其中较典型、以得出各种贝叶斯分类器,其中较典型、研究较深入的贝叶斯分类器主要有四种,研究较深入的贝叶斯分类器主要有四种,分别是:分别是:NBNBNBNB( NaNaNaNa ve Bayesve Bayesve Bayesve Bayes )TANTANTA

33、NTAN( Tree Augmented NaTree Augmented NaTree Augmented NaTree Augmented Na ve-Bayes ve-Bayes ve-Bayes ve-Bayes )BAN BAN BAN BAN (BN Augmented NaBN Augmented NaBN Augmented NaBN Augmented Na ve-Bayesve-Bayesve-Bayesve-Bayes )GBNGBNGBNGBN(Global Bayesian NetworksGlobal Bayesian NetworksGlobal Bayesian

34、 NetworksGlobal Bayesian Networks)2024/8/8知知识管理与数据分析管理与数据分析实验室室23三、朴素贝叶斯引入朴素贝叶斯(朴素贝叶斯(朴素贝叶斯(朴素贝叶斯(NaNaNaNa ve Bayesve Bayesve Bayesve Bayes)算法是贝叶斯分类器)算法是贝叶斯分类器)算法是贝叶斯分类器)算法是贝叶斯分类器中研究较多,使用较广的一种,在许多场合,朴中研究较多,使用较广的一种,在许多场合,朴中研究较多,使用较广的一种,在许多场合,朴中研究较多,使用较广的一种,在许多场合,朴素贝叶斯的分类算法可以与决策树和神经网络分素贝叶斯的分类算法可以与决策树和

35、神经网络分素贝叶斯的分类算法可以与决策树和神经网络分素贝叶斯的分类算法可以与决策树和神经网络分类算法相媲美。类算法相媲美。类算法相媲美。类算法相媲美。朴素贝叶斯分类器的基础:朴素贝叶斯分类器的基础:朴素贝叶斯分类器的基础:朴素贝叶斯分类器的基础:假设一个指定类别中假设一个指定类别中假设一个指定类别中假设一个指定类别中各个属性的取值是相互独立的,各个属性的取值是相互独立的,各个属性的取值是相互独立的,各个属性的取值是相互独立的,即在给定目标值即在给定目标值即在给定目标值即在给定目标值的情况下,观察到联合的的情况下,观察到联合的的情况下,观察到联合的的情况下,观察到联合的 的概率正好是对每个单独属

36、性的概率乘积。的概率正好是对每个单独属性的概率乘积。的概率正好是对每个单独属性的概率乘积。的概率正好是对每个单独属性的概率乘积。2024/8/8知知识管理与数据分析管理与数据分析实验室室24三、朴素贝叶斯方法2024/8/8知知识管理与数据分析管理与数据分析实验室室25考虑到考虑到考虑到考虑到 是是是是一个取大的过程,则一个取大的过程,则一个取大的过程,则一个取大的过程,则 对于结果不产生影响,故可以看对于结果不产生影响,故可以看对于结果不产生影响,故可以看对于结果不产生影响,故可以看作系数作系数作系数作系数a a a a。则,原公式可以简化。则,原公式可以简化。则,原公式可以简化。则,原公式

37、可以简化。贝叶斯分类器贝叶斯分类器贝叶斯分类器贝叶斯分类器朴素贝叶斯简化朴素贝叶斯简化朴素贝叶斯简化朴素贝叶斯简化三、朴素贝叶斯研究现状朴素贝叶斯分类器由朴素贝叶斯分类器由朴素贝叶斯分类器由朴素贝叶斯分类器由DudaDudaDudaDuda和和和和HartHartHartHart于于于于1937193719371937年提出,年提出,年提出,年提出,它是一个简单有效而且在实际使用中比较成功的它是一个简单有效而且在实际使用中比较成功的它是一个简单有效而且在实际使用中比较成功的它是一个简单有效而且在实际使用中比较成功的分类器。现在,被广泛的运用在数据挖掘、模式分类器。现在,被广泛的运用在数据挖掘、

38、模式分类器。现在,被广泛的运用在数据挖掘、模式分类器。现在,被广泛的运用在数据挖掘、模式识别、故障诊断等众多领域。识别、故障诊断等众多领域。识别、故障诊断等众多领域。识别、故障诊断等众多领域。朴素贝叶斯算法有很多优点:朴素贝叶斯算法有很多优点:朴素贝叶斯算法有很多优点:朴素贝叶斯算法有很多优点: 应用范围广泛;应用范围广泛;应用范围广泛;应用范围广泛; 可以很好的扩展到超大规模问题,并且不需要通过搜可以很好的扩展到超大规模问题,并且不需要通过搜可以很好的扩展到超大规模问题,并且不需要通过搜可以很好的扩展到超大规模问题,并且不需要通过搜索来寻找最大后验概率的朴素贝叶斯假设;索来寻找最大后验概率的

39、朴素贝叶斯假设;索来寻找最大后验概率的朴素贝叶斯假设;索来寻找最大后验概率的朴素贝叶斯假设; 可以轻松地应付有噪声的训练数据,并在适当的时候可以轻松地应付有噪声的训练数据,并在适当的时候可以轻松地应付有噪声的训练数据,并在适当的时候可以轻松地应付有噪声的训练数据,并在适当的时候给出概率预测。给出概率预测。给出概率预测。给出概率预测。2024/8/8知知识管理与数据分析管理与数据分析实验室室26三、朴素贝叶斯研究现状朴素贝叶斯分类器假设一个指定类别中各属性的朴素贝叶斯分类器假设一个指定类别中各属性的朴素贝叶斯分类器假设一个指定类别中各属性的朴素贝叶斯分类器假设一个指定类别中各属性的取值是相互独立

40、的。这一假设可以帮助有效减少取值是相互独立的。这一假设可以帮助有效减少取值是相互独立的。这一假设可以帮助有效减少取值是相互独立的。这一假设可以帮助有效减少在构造贝叶斯分类器时所需要进行的计算量。在构造贝叶斯分类器时所需要进行的计算量。在构造贝叶斯分类器时所需要进行的计算量。在构造贝叶斯分类器时所需要进行的计算量。不过,实际的应用领域中,各个属性相互独立的不过,实际的应用领域中,各个属性相互独立的不过,实际的应用领域中,各个属性相互独立的不过,实际的应用领域中,各个属性相互独立的假设很难成立,这也从很大程度上影响了朴素贝假设很难成立,这也从很大程度上影响了朴素贝假设很难成立,这也从很大程度上影响

41、了朴素贝假设很难成立,这也从很大程度上影响了朴素贝叶斯分类器的分类能力。当前,半朴素贝叶斯分叶斯分类器的分类能力。当前,半朴素贝叶斯分叶斯分类器的分类能力。当前,半朴素贝叶斯分叶斯分类器的分类能力。当前,半朴素贝叶斯分类器、相关属性删除、概率值条件、贝叶斯树以类器、相关属性删除、概率值条件、贝叶斯树以类器、相关属性删除、概率值条件、贝叶斯树以类器、相关属性删除、概率值条件、贝叶斯树以及懒惰贝叶斯规则方法,都是对朴素贝叶斯算法及懒惰贝叶斯规则方法,都是对朴素贝叶斯算法及懒惰贝叶斯规则方法,都是对朴素贝叶斯算法及懒惰贝叶斯规则方法,都是对朴素贝叶斯算法的改进与推广,并在不同的领域取得了显著的成的改

42、进与推广,并在不同的领域取得了显著的成的改进与推广,并在不同的领域取得了显著的成的改进与推广,并在不同的领域取得了显著的成果。果。果。果。2024/8/8知知识管理与数据分析管理与数据分析实验室室27四、算例系统控制中的应用在信息技术迅速发展及其在军事领域广泛应用的在信息技术迅速发展及其在军事领域广泛应用的在信息技术迅速发展及其在军事领域广泛应用的在信息技术迅速发展及其在军事领域广泛应用的条件下,防空作战环境变得愈加复杂,也给现代条件下,防空作战环境变得愈加复杂,也给现代条件下,防空作战环境变得愈加复杂,也给现代条件下,防空作战环境变得愈加复杂,也给现代防空作战中的空情探测带来了严峻的挑战。由

43、于防空作战中的空情探测带来了严峻的挑战。由于防空作战中的空情探测带来了严峻的挑战。由于防空作战中的空情探测带来了严峻的挑战。由于受到自身性能、电子干扰等因素的影响,不同的受到自身性能、电子干扰等因素的影响,不同的受到自身性能、电子干扰等因素的影响,不同的受到自身性能、电子干扰等因素的影响,不同的空情雷达对同一空中目标的探测的准确度不同,空情雷达对同一空中目标的探测的准确度不同,空情雷达对同一空中目标的探测的准确度不同,空情雷达对同一空中目标的探测的准确度不同,从而影响了防控侦察预警信息的准确性,应用贝从而影响了防控侦察预警信息的准确性,应用贝从而影响了防控侦察预警信息的准确性,应用贝从而影响了

44、防控侦察预警信息的准确性,应用贝叶斯网络算法探讨计算不同雷达在探测同一目标叶斯网络算法探讨计算不同雷达在探测同一目标叶斯网络算法探讨计算不同雷达在探测同一目标叶斯网络算法探讨计算不同雷达在探测同一目标的可信度,通过数据融合推断出空中目标的类型,的可信度,通过数据融合推断出空中目标的类型,的可信度,通过数据融合推断出空中目标的类型,的可信度,通过数据融合推断出空中目标的类型,是贝叶斯网络算法在系统可靠性领域的重要应用是贝叶斯网络算法在系统可靠性领域的重要应用是贝叶斯网络算法在系统可靠性领域的重要应用是贝叶斯网络算法在系统可靠性领域的重要应用之一。之一。之一。之一。2024/8/8知知识管理与数据

45、分析管理与数据分析实验室室28四、算例系统控制中的应用例例例例4.1 4.1 4.1 4.1 假设两个空情雷达探测同一目标,目标可假设两个空情雷达探测同一目标,目标可假设两个空情雷达探测同一目标,目标可假设两个空情雷达探测同一目标,目标可能的类型:能的类型:能的类型:能的类型:A.A.A.A.大型战机、大型战机、大型战机、大型战机、B.B.B.B.小型机密密集编队、小型机密密集编队、小型机密密集编队、小型机密密集编队、C.C.C.C.小型战绩、小型战绩、小型战绩、小型战绩、D.D.D.D.巡航导弹。在时刻巡航导弹。在时刻巡航导弹。在时刻巡航导弹。在时刻t t t t,一号空情雷,一号空情雷,一

46、号空情雷,一号空情雷达报告的条件概率表如表所示。达报告的条件概率表如表所示。达报告的条件概率表如表所示。达报告的条件概率表如表所示。2024/8/8知知识管理与数据分析管理与数据分析实验室室29 雷达雷达雷达雷达报报告告告告 A AB BC CD DA A0.80.80.10.10.050.050.050.05B B0.20.20.650.650.10.10.050.05C C0.250.250.10.10.600.600.050.05D D0.050.050.10.10.150.150.70.7实际类型实际类型四、算例系统控制中的应用根据战前分析,假定权威人员预测战场中在某个根据战前分析,假

47、定权威人员预测战场中在某个根据战前分析,假定权威人员预测战场中在某个根据战前分析,假定权威人员预测战场中在某个作战阶段各种空袭兵器运用的概率为:作战阶段各种空袭兵器运用的概率为:作战阶段各种空袭兵器运用的概率为:作战阶段各种空袭兵器运用的概率为:那么在一号空情雷达报告信息中,报告目标类型那么在一号空情雷达报告信息中,报告目标类型那么在一号空情雷达报告信息中,报告目标类型那么在一号空情雷达报告信息中,报告目标类型大型战机、小型机密集编队、小型战机、巡航导大型战机、小型机密集编队、小型战机、巡航导大型战机、小型机密集编队、小型战机、巡航导大型战机、小型机密集编队、小型战机、巡航导弹的概率分别为:弹

48、的概率分别为:弹的概率分别为:弹的概率分别为:P(A)P(A)P(A)P(A)、P(B)P(B)P(B)P(B)、P(C)P(C)P(C)P(C)、P(D)P(D)P(D)P(D)。 2024/8/8知知识管理与数据分析管理与数据分析实验室室30四、算例系统控制中的应用根据贝叶斯公式,则一号空情雷达报告目标类型根据贝叶斯公式,则一号空情雷达报告目标类型根据贝叶斯公式,则一号空情雷达报告目标类型根据贝叶斯公式,则一号空情雷达报告目标类型为为为为A A A A的条件下,实际目标类型为的条件下,实际目标类型为的条件下,实际目标类型为的条件下,实际目标类型为A A A A、B B B B、C C C

49、C、D D D D的条件的条件的条件的条件概率分别为:概率分别为:概率分别为:概率分别为:2024/8/8知知识管理与数据分析管理与数据分析实验室室31 表示传感器报告目标为类型表示传感器报告目标为类型表示传感器报告目标为类型表示传感器报告目标为类型A A A A的条件下,实际目标的条件下,实际目标的条件下,实际目标的条件下,实际目标为为为为A A A A的概率;的概率;的概率;的概率; 表示实际目标类型为表示实际目标类型为表示实际目标类型为表示实际目标类型为A A A A的条件下,传感的条件下,传感的条件下,传感的条件下,传感器报告目标类型为器报告目标类型为器报告目标类型为器报告目标类型为A

50、 A A A的概率;的概率;的概率;的概率;P(A)P(A)P(A)P(A)表示存在类型为表示存在类型为表示存在类型为表示存在类型为A A A A的目标的先验概的目标的先验概的目标的先验概的目标的先验概率;率;率;率;表示所有传感器报告目标类型为表示所有传感器报告目标类型为表示所有传感器报告目标类型为表示所有传感器报告目标类型为A A A A的概率之和,即的概率之和,即的概率之和,即的概率之和,即 。四、算例系统控制中的应用同样可以计算出一号空情雷达报告类型分别为同样可以计算出一号空情雷达报告类型分别为同样可以计算出一号空情雷达报告类型分别为同样可以计算出一号空情雷达报告类型分别为B B B

51、B、C C C C、D D D D的条件下,实际目标类型的条件概率,如下的条件下,实际目标类型的条件概率,如下的条件下,实际目标类型的条件概率,如下的条件下,实际目标类型的条件概率,如下表所示:表所示:表所示:表所示:2024/8/8知知识管理与数据分析管理与数据分析实验室室32 雷达雷达雷达雷达报报告告告告 A AB BC CD DA A0.4600.4600.3800.3800.0960.0960.0480.048B B0.0390.0390.8600.8600.0260.0260.0660.066C C0.0200.0200.3130.3130.3750.3750.0990.099D D

52、0.0360.0360.1190.1190.2380.2380.8330.833实际类型实际类型四、算例系统控制中的应用于是,一号空情雷达报告假设目标类型为于是,一号空情雷达报告假设目标类型为于是,一号空情雷达报告假设目标类型为于是,一号空情雷达报告假设目标类型为A A A A的可信的可信的可信的可信度为:度为:度为:度为:同理可以得到第一号传感器报告假设目标类型为同理可以得到第一号传感器报告假设目标类型为同理可以得到第一号传感器报告假设目标类型为同理可以得到第一号传感器报告假设目标类型为B B B B、C C C C、D D D D的可信度,即的可信度,即的可信度,即的可信度,即 :2024

53、/8/8知知识管理与数据分析管理与数据分析实验室室33为了提高探测的准确性,一般要设置一个可信度阈值为了提高探测的准确性,一般要设置一个可信度阈值为了提高探测的准确性,一般要设置一个可信度阈值为了提高探测的准确性,一般要设置一个可信度阈值 ,将计算出的可信度值与可信度阈值,将计算出的可信度值与可信度阈值,将计算出的可信度值与可信度阈值,将计算出的可信度值与可信度阈值 比较,看目标识别的可比较,看目标识别的可比较,看目标识别的可比较,看目标识别的可信度是否达到要求。假设信度是否达到要求。假设信度是否达到要求。假设信度是否达到要求。假设 ,则以上的可信,则以上的可信,则以上的可信,则以上的可信度值

54、没有一个达到要求,因此需要重新进行识别,将以上计度值没有一个达到要求,因此需要重新进行识别,将以上计度值没有一个达到要求,因此需要重新进行识别,将以上计度值没有一个达到要求,因此需要重新进行识别,将以上计算的可信度值作为下一次计算的先验概率。算的可信度值作为下一次计算的先验概率。算的可信度值作为下一次计算的先验概率。算的可信度值作为下一次计算的先验概率。四、算例系统控制中的应用现略去计算步骤,可得到基于两个传感器现略去计算步骤,可得到基于两个传感器报告的目标类型为报告的目标类型为A A、B B、C C、D D的可信度为:的可信度为: 。同样假设同样假设 ,则可以知道,则可以知道B B的可的可信

55、度大于阈值,则可判定,空中目标类型信度大于阈值,则可判定,空中目标类型为为B B。2024/8/8知知识管理与数据分析管理与数据分析实验室室34四、算例信息检索中的应用贝叶斯网络检索模型可贝叶斯网络检索模型可贝叶斯网络检索模型可贝叶斯网络检索模型可以计算术语与术语,术以计算术语与术语,术以计算术语与术语,术以计算术语与术语,术语与文档之间的条件概语与文档之间的条件概语与文档之间的条件概语与文档之间的条件概率。下图给出了一种贝率。下图给出了一种贝率。下图给出了一种贝率。下图给出了一种贝叶斯网络检索模型,利叶斯网络检索模型,利叶斯网络检索模型,利叶斯网络检索模型,利用同义词对查询术语进用同义词对查

56、询术语进用同义词对查询术语进用同义词对查询术语进行扩展,用于信息检索行扩展,用于信息检索行扩展,用于信息检索行扩展,用于信息检索领域。领域。领域。领域。2024/8/8知知识管理与数据分析管理与数据分析实验室室35Q QT2T2T3T3T4T4T5T5R1R1R2R2R3R3R4R4R5R5D1D1T T1 1D2D2四、算例信息检索中的应用假设有文档集合假设有文档集合假设有文档集合假设有文档集合d d d d表示表示表示表示为为为为 ;这些文档的索引术语集这些文档的索引术语集这些文档的索引术语集这些文档的索引术语集合合合合r r r r表示为表示为表示为表示为 。右图即为贝叶斯网络。右图即为

57、贝叶斯网络。右图即为贝叶斯网络。右图即为贝叶斯网络模型扩展的拓扑结构,模型扩展的拓扑结构,模型扩展的拓扑结构,模型扩展的拓扑结构,其中其中其中其中Q Q Q Q被定义为查询术被定义为查询术被定义为查询术被定义为查询术语节点,语节点,语节点,语节点, 定义为文档定义为文档定义为文档定义为文档节点,节点,节点,节点, 定义为索引术定义为索引术定义为索引术定义为索引术语节点,语节点,语节点,语节点, 有一条指向有一条指向有一条指向有一条指向被它索引的文档被它索引的文档被它索引的文档被它索引的文档 的的的的弧。弧。弧。弧。2024/8/8知知识管理与数据分析管理与数据分析实验室室36Q QT2T2T3

58、T3T4T4T5T5R1R1R2R2R3R3R4R4R5R5D1D1T T1 1D2D2四、算例信息检索中的应用用两个术语层来挖掘文档用两个术语层来挖掘文档用两个术语层来挖掘文档用两个术语层来挖掘文档索引术语之间的关系,完索引术语之间的关系,完索引术语之间的关系,完索引术语之间的关系,完全复制初始术语节点层全复制初始术语节点层全复制初始术语节点层全复制初始术语节点层r,r,r,r,得到另一个属于节点层得到另一个属于节点层得到另一个属于节点层得到另一个属于节点层t t t t。对于查询术语。对于查询术语。对于查询术语。对于查询术语Q Q Q Q,在索,在索,在索,在索引术语层引术语层引术语层引术

59、语层t t t t查找他的同义查找他的同义查找他的同义查找他的同义词词词词 ,则从,则从,则从,则从Q Q Q Q 到到到到 有一有一有一有一条弧;条弧;条弧;条弧; 从从从从 指向指向指向指向 的的的的弧,就是从弧,就是从弧,就是从弧,就是从 指向指向指向指向 ,其中总有从,其中总有从,其中总有从,其中总有从 指指指指向向向向 的弧,的弧,的弧,的弧, 是在一是在一是在一是在一定衡量方法定衡量方法定衡量方法定衡量方法2024/8/8知知识管理与数据分析管理与数据分析实验室室37Q QT2T2T3T3T4T4T5T5R1R1R2R2R3R3R4R4R5R5D1D1T T1 1D2D2下与下与下

60、与下与 最相关的术语集合。最相关的术语集合。最相关的术语集合。最相关的术语集合。四、算例信息检索中的应用在确定了贝叶斯网络模型之后,通过计算在确定了贝叶斯网络模型之后,通过计算索引术语与术语之间、索引术语与文档之索引术语与术语之间、索引术语与文档之间的条件概率与文档节点的后验概率,就间的条件概率与文档节点的后验概率,就能够获得全部文档节点的概率,并根据概能够获得全部文档节点的概率,并根据概率大小排序获得与查询节点最匹配的检索率大小排序获得与查询节点最匹配的检索结果。结果。2024/8/8知知识管理与数据分析管理与数据分析实验室室38四、算例信息检索中的应用考虑一种更简单的考虑一种更简单的考虑一

61、种更简单的考虑一种更简单的情况,即在查询节情况,即在查询节情况,即在查询节情况,即在查询节点和文档节点以外,点和文档节点以外,点和文档节点以外,点和文档节点以外,只有一层术语节点只有一层术语节点只有一层术语节点只有一层术语节点的简单贝叶斯网络的简单贝叶斯网络的简单贝叶斯网络的简单贝叶斯网络检索模型,如右图检索模型,如右图检索模型,如右图检索模型,如右图所示。所示。所示。所示。2024/8/8知知识管理与数据分析管理与数据分析实验室室39Q QT2T2T3T3T4T4T5T5D1D1T T1 1D2D2D3D3T6T6四、算例信息检索中的应用例例4.2 4.2 如图如图4-34-3所示,假设查询

62、节点为所示,假设查询节点为Q Q,术语节点集合为术语节点集合为 ,文档,文档节点集合为节点集合为 。根据图中。根据图中弧线所对应的关系,计算查询节点弧线所对应的关系,计算查询节点Q Q更接近更接近于文档节点集合中的哪一个?于文档节点集合中的哪一个?要求查询节点要求查询节点 更接近哪一个文档节点,即更接近哪一个文档节点,即分别求分别求 ,选择其中概率值最大,选择其中概率值最大的文档节点为所求。的文档节点为所求。2024/8/8知知识管理与数据分析管理与数据分析实验室室40四、算例信息检索中的应用根据朴素贝叶斯算法的原则,所有术语节根据朴素贝叶斯算法的原则,所有术语节点相互独立。且由图可知,除去查

63、询节点点相互独立。且由图可知,除去查询节点层,所有术语节点均为根节点。所以定义层,所有术语节点均为根节点。所以定义每一个术语每一个术语 相关的先验概率相关的先验概率 ,则不相关的概率,则不相关的概率 ,其中,其中M M为为集合中术语的数目(本例中集合中术语的数目(本例中M=6M=6)。一般情)。一般情况下,任意根术语节点相关的先验概率很况下,任意根术语节点相关的先验概率很小,且与索引术语节点集合的规模成反比。小,且与索引术语节点集合的规模成反比。2024/8/8知知识管理与数据分析管理与数据分析实验室室41四、算例信息检索中的应用对于文档节点可知,任意文档节点对于文档节点可知,任意文档节点 的

64、的父节点集合由该文档的所有索引术语节点父节点集合由该文档的所有索引术语节点组成,即组成,即 。令。令 为为 中每个术语变量取值(相关或不相中每个术语变量取值(相关或不相关)后的一个组合,利用一般正则模型的关)后的一个组合,利用一般正则模型的概率函数,定义文档概率函数,定义文档 相关的条件概率相关的条件概率为为2024/8/8知知识管理与数据分析管理与数据分析实验室室42四、算例信息检索中的应用其中,其中, 为文档为文档 的索引术语的索引术语 的权重,的权重, ,且,且 。这意味着。这意味着 中相关术语越多,中相关术语越多, 的相关概率值就越大。的相关概率值就越大。关于权重关于权重 的计算,本例

65、不作介绍,仅给的计算,本例不作介绍,仅给出相应数值如下表:出相应数值如下表:2024/8/8知知识管理与数据分析管理与数据分析实验室室43T1T1T2T2T3T3T4T4T5T5T6T6D1D10.20.20.150.150.050.050.10.10.350.350.150.15D2D20.30.30.050.050.150.150.20.20.150.150.150.15D3D30.050.050.350.350.20.20.050.050.150.150.20.2四、算例信息检索中的应用所以根据贝叶斯公式,可以得到下式:所以根据贝叶斯公式,可以得到下式:由于术语节点相互独立,根据条件独立

66、性由于术语节点相互独立,根据条件独立性得:如果得:如果 ,则,则 。否。否则,则, 。那么,上式可化简为:。那么,上式可化简为:2024/8/8知知识管理与数据分析管理与数据分析实验室室44四、算例信息检索中的应用2024/8/8知知识管理与数据分析管理与数据分析实验室室45四、算例信息检索中的应用则,代入数值得:则,代入数值得:2024/8/8知知识管理与数据分析管理与数据分析实验室室46四、算例信息检索中的应用同理:同理:可见可见 : ,即查询节点,即查询节点Q Q更接近文档节点更接近文档节点 D D D D3 3 3 3。2024/8/8知知识管理与数据分析管理与数据分析实验室室47五、

67、贝叶斯网络论文情况整理20102010年年2 2月月1818日,选择检索日,选择检索“主题主题”中含有中含有“Bayesian networkBayesian network”(中文为(中文为“贝叶斯贝叶斯网络网络”)的论文,检索)的论文,检索SCISCI数据库,返回结数据库,返回结果果29522952篇;检索中国期刊全文数据库,返篇;检索中国期刊全文数据库,返回结果回结果11351135篇;检索中国博士学位论文全篇;检索中国博士学位论文全文数据路,返回结果文数据路,返回结果112112篇。其中,大部分篇。其中,大部分文章涉及工业控制、故障诊断、模式识别、文章涉及工业控制、故障诊断、模式识别、

68、数据挖掘等技术或领域。数据挖掘等技术或领域。2024/8/8知知识管理与数据分析管理与数据分析实验室室48五、贝叶斯网络论文情况整理通过考察论文的被引频次等相关因素,可以认为通过考察论文的被引频次等相关因素,可以认为通过考察论文的被引频次等相关因素,可以认为通过考察论文的被引频次等相关因素,可以认为在贝叶斯网络分类领域比较具有影响力的是来自在贝叶斯网络分类领域比较具有影响力的是来自在贝叶斯网络分类领域比较具有影响力的是来自在贝叶斯网络分类领域比较具有影响力的是来自美国加州大学伯克利分校的美国加州大学伯克利分校的美国加州大学伯克利分校的美国加州大学伯克利分校的FriedmanFriedmanFr

69、iedmanFriedman,他于,他于,他于,他于1997199719971997年较早的提出了贝叶斯网络分类器的概念,并采年较早的提出了贝叶斯网络分类器的概念,并采年较早的提出了贝叶斯网络分类器的概念,并采年较早的提出了贝叶斯网络分类器的概念,并采用了朴素贝叶斯的方法进行了深入的探讨与研究。用了朴素贝叶斯的方法进行了深入的探讨与研究。用了朴素贝叶斯的方法进行了深入的探讨与研究。用了朴素贝叶斯的方法进行了深入的探讨与研究。2000200020002000年,他还将贝叶斯网络与生物学研究中的基年,他还将贝叶斯网络与生物学研究中的基年,他还将贝叶斯网络与生物学研究中的基年,他还将贝叶斯网络与生物

70、学研究中的基因识别等问题相关联,取得了有益的成果。此外,因识别等问题相关联,取得了有益的成果。此外,因识别等问题相关联,取得了有益的成果。此外,因识别等问题相关联,取得了有益的成果。此外,还有来自微软公司的还有来自微软公司的还有来自微软公司的还有来自微软公司的HeckermanHeckermanHeckermanHeckerman和美国麻省理工学和美国麻省理工学和美国麻省理工学和美国麻省理工学院的院的院的院的LauffenburgerLauffenburgerLauffenburgerLauffenburger,他们将贝叶斯网络方法成功,他们将贝叶斯网络方法成功,他们将贝叶斯网络方法成功,他们

71、将贝叶斯网络方法成功运用到了数据挖掘和机器学习领域。运用到了数据挖掘和机器学习领域。运用到了数据挖掘和机器学习领域。运用到了数据挖掘和机器学习领域。2024/8/8知知识管理与数据分析管理与数据分析实验室室49五、贝叶斯网络论文情况整理在中国博士学位论文方面,论文主要集中在贝叶在中国博士学位论文方面,论文主要集中在贝叶在中国博士学位论文方面,论文主要集中在贝叶在中国博士学位论文方面,论文主要集中在贝叶斯网络与应用学科的结合,如数据挖掘技术、模斯网络与应用学科的结合,如数据挖掘技术、模斯网络与应用学科的结合,如数据挖掘技术、模斯网络与应用学科的结合,如数据挖掘技术、模式识别技术等。式识别技术等。

72、式识别技术等。式识别技术等。同时还有部分论文则与生物、化学或工程领域的同时还有部分论文则与生物、化学或工程领域的同时还有部分论文则与生物、化学或工程领域的同时还有部分论文则与生物、化学或工程领域的具体问题相结合,将贝叶斯网络作为一种分析方具体问题相结合,将贝叶斯网络作为一种分析方具体问题相结合,将贝叶斯网络作为一种分析方具体问题相结合,将贝叶斯网络作为一种分析方法或数据处理工具,应用到解决问题的过程中。法或数据处理工具,应用到解决问题的过程中。法或数据处理工具,应用到解决问题的过程中。法或数据处理工具,应用到解决问题的过程中。 2024/8/8知知识管理与数据分析管理与数据分析实验室室50五、

73、贝叶斯网络论文情况整理数据挖掘与分析领域:数据挖掘与分析领域:数据挖掘与分析领域:数据挖掘与分析领域: 浙江大学王金龙浙江大学王金龙浙江大学王金龙浙江大学王金龙全局和局部相结合的数据挖掘方法全局和局部相结合的数据挖掘方法全局和局部相结合的数据挖掘方法全局和局部相结合的数据挖掘方法及应用研究及应用研究及应用研究及应用研究 浙江大学王明怡浙江大学王明怡浙江大学王明怡浙江大学王明怡微阵列数据挖掘技术的研究微阵列数据挖掘技术的研究微阵列数据挖掘技术的研究微阵列数据挖掘技术的研究 清华大学吕雪松清华大学吕雪松清华大学吕雪松清华大学吕雪松基因芯片数据处理方法及在乳腺癌基因芯片数据处理方法及在乳腺癌基因芯片

74、数据处理方法及在乳腺癌基因芯片数据处理方法及在乳腺癌数据中的应用数据中的应用数据中的应用数据中的应用故障诊断领域:故障诊断领域:故障诊断领域:故障诊断领域: 中国科学技术大学杨昌昊中国科学技术大学杨昌昊中国科学技术大学杨昌昊中国科学技术大学杨昌昊基于不确定性理论的机械基于不确定性理论的机械基于不确定性理论的机械基于不确定性理论的机械故障智能诊断方法研究故障智能诊断方法研究故障智能诊断方法研究故障智能诊断方法研究 浙江大学蒋荣欣浙江大学蒋荣欣浙江大学蒋荣欣浙江大学蒋荣欣多机器人编队导航若干关键技术研多机器人编队导航若干关键技术研多机器人编队导航若干关键技术研多机器人编队导航若干关键技术研究究究究

75、2024/8/8知知识管理与数据分析管理与数据分析实验室室51五、贝叶斯网络论文情况整理模式识别领域:模式识别领域:模式识别领域:模式识别领域: 华中科技大学陈振学华中科技大学陈振学华中科技大学陈振学华中科技大学陈振学基于特征显著性的目标识别方基于特征显著性的目标识别方基于特征显著性的目标识别方基于特征显著性的目标识别方法及其研究法及其研究法及其研究法及其研究 清华大学任海兵清华大学任海兵清华大学任海兵清华大学任海兵非特定人自然的人体动作识别非特定人自然的人体动作识别非特定人自然的人体动作识别非特定人自然的人体动作识别 中国科技大学吴国全中国科技大学吴国全中国科技大学吴国全中国科技大学吴国全基

76、于模式的复合服务监管关键基于模式的复合服务监管关键基于模式的复合服务监管关键基于模式的复合服务监管关键技术研究技术研究技术研究技术研究决策控制领域:决策控制领域:决策控制领域:决策控制领域: 华中科技大学雷杰华中科技大学雷杰华中科技大学雷杰华中科技大学雷杰网络安全威胁与态势评估方法研网络安全威胁与态势评估方法研网络安全威胁与态势评估方法研网络安全威胁与态势评估方法研究究究究 国防科学技术大学孙兆林国防科学技术大学孙兆林国防科学技术大学孙兆林国防科学技术大学孙兆林基于贝叶斯网络的态势估基于贝叶斯网络的态势估基于贝叶斯网络的态势估基于贝叶斯网络的态势估计方法研究计方法研究计方法研究计方法研究2024/8/8知知识管理与数据分析管理与数据分析实验室室52THE END2024/8/8知知识管理与数据分析管理与数据分析实验室室53

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 教学/培训

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号