朴素贝叶斯分类ppt课件

上传人:m**** 文档编号:587471034 上传时间:2024-09-06 格式:PPT 页数:35 大小:409.50KB
返回 下载 相关 举报
朴素贝叶斯分类ppt课件_第1页
第1页 / 共35页
朴素贝叶斯分类ppt课件_第2页
第2页 / 共35页
朴素贝叶斯分类ppt课件_第3页
第3页 / 共35页
朴素贝叶斯分类ppt课件_第4页
第4页 / 共35页
朴素贝叶斯分类ppt课件_第5页
第5页 / 共35页
点击查看更多>>
资源描述

《朴素贝叶斯分类ppt课件》由会员分享,可在线阅读,更多相关《朴素贝叶斯分类ppt课件(35页珍藏版)》请在金锄头文库上搜索。

1、篮球比赛是根据运动队在规定的比赛时间里得分多少来决定胜负的,因此,篮球比赛的计时计分系统是一种得分类型的系统朴素贝叶斯分类第九章1篮球比赛是根据运动队在规定的比赛时间里得分多少来决定胜负的,因此,篮球比赛的计时计分系统是一种得分类型的系统1. 定义 ABAB条件概率若 是全集,A、B是其中的事件(子集),P表示事件发生的概率,则 为事件B发生后A发生的概率。2篮球比赛是根据运动队在规定的比赛时间里得分多少来决定胜负的,因此,篮球比赛的计时计分系统是一种得分类型的系统乘法定理注:当P(AB)不容易直接求得时,可考虑利用P(A)与P(B|A)的乘积或P(B)与P(A|B)的乘积间接求得。3篮球比赛

2、是根据运动队在规定的比赛时间里得分多少来决定胜负的,因此,篮球比赛的计时计分系统是一种得分类型的系统乘法定理的推广4篮球比赛是根据运动队在规定的比赛时间里得分多少来决定胜负的,因此,篮球比赛的计时计分系统是一种得分类型的系统1. 集合(样本空间)的划分二、全概率公式5篮球比赛是根据运动队在规定的比赛时间里得分多少来决定胜负的,因此,篮球比赛的计时计分系统是一种得分类型的系统2. 全概率公式全概率公式6篮球比赛是根据运动队在规定的比赛时间里得分多少来决定胜负的,因此,篮球比赛的计时计分系统是一种得分类型的系统图示证明化整为零各个击破7篮球比赛是根据运动队在规定的比赛时间里得分多少来决定胜负的,因

3、此,篮球比赛的计时计分系统是一种得分类型的系统说明 全概率公式的主要用途在于它可以将一个复杂事件的概率计算问题,分解为若干个简单事件的概率计算问题,最后应用概率的可加性求出最终结果.8篮球比赛是根据运动队在规定的比赛时间里得分多少来决定胜负的,因此,篮球比赛的计时计分系统是一种得分类型的系统例1 有一批同一型号的产品,已知其中由一厂生产的占 30% , 二厂生产的占 50% , 三厂生产的占 20%, 又知这三个厂的产品次品率分别为2% , 1%, 1%,问从这批产品中任取一件是次品的概率是多少设事件 A 为“任取一件为次品”,解9篮球比赛是根据运动队在规定的比赛时间里得分多少来决定胜负的,因

4、此,篮球比赛的计时计分系统是一种得分类型的系统由全概率公式得30%20%50%2%1%1%AB1B2B310篮球比赛是根据运动队在规定的比赛时间里得分多少来决定胜负的,因此,篮球比赛的计时计分系统是一种得分类型的系统贝叶斯公式11篮球比赛是根据运动队在规定的比赛时间里得分多少来决定胜负的,因此,篮球比赛的计时计分系统是一种得分类型的系统Bayes公式的意义假设导致事件A发生的“原因”有Bi (i=1,2,n) 个。它们互不相容。现已知事件A确已经发生了,若要估计它是由“原因”Bi所导致的概率,则可用Bayes公式求出.即可从结果分析原因.12篮球比赛是根据运动队在规定的比赛时间里得分多少来决定

5、胜负的,因此,篮球比赛的计时计分系统是一种得分类型的系统证明乘法定理:13篮球比赛是根据运动队在规定的比赛时间里得分多少来决定胜负的,因此,篮球比赛的计时计分系统是一种得分类型的系统例2 贝叶斯公式的应用14篮球比赛是根据运动队在规定的比赛时间里得分多少来决定胜负的,因此,篮球比赛的计时计分系统是一种得分类型的系统解15篮球比赛是根据运动队在规定的比赛时间里得分多少来决定胜负的,因此,篮球比赛的计时计分系统是一种得分类型的系统(1) 由全概率公式得(2) 由贝叶斯公式得16篮球比赛是根据运动队在规定的比赛时间里得分多少来决定胜负的,因此,篮球比赛的计时计分系统是一种得分类型的系统17篮球比赛是

6、根据运动队在规定的比赛时间里得分多少来决定胜负的,因此,篮球比赛的计时计分系统是一种得分类型的系统由以往的数据分析得到的概率, 叫做先验概率.而在得到信息之后再重新加以修正的概率 叫做后验概率.先验概率与后验概率18篮球比赛是根据运动队在规定的比赛时间里得分多少来决定胜负的,因此,篮球比赛的计时计分系统是一种得分类型的系统贝叶斯分类贝叶斯分类器是一个统计分类器。它们能够预测类别所属的概率,如:一个数据对象属于某个类别的概率。贝叶斯分类器是基于贝叶斯定理而构造出来的。对分类方法进行比较的有关研究结果表明:简单贝叶斯分类器(称为基本贝叶斯分类器)在分类性能上与决策树和神经网络都是可比的。在处理大规

7、模数据库时,贝叶斯分类器已表现出较高的分类准确性和运算性能。19篮球比赛是根据运动队在规定的比赛时间里得分多少来决定胜负的,因此,篮球比赛的计时计分系统是一种得分类型的系统20贝叶斯分类定义:设X是类标号未知的数据样本。设H为某种假定,如数据样本X属于某特定的类C。对于分类问题,我们希望确定P(H|X),即给定观测数据样本X,假定H成立的概率。贝叶斯定理给出了如下计算P(H|X)的简单有效的方法:P(H)是先验概率,或称H的先验概率。P(X|H)代表假设H成立的情况下,观察到X的概率。P(H| X )是后验概率,或称条件X下H的后验概率。20篮球比赛是根据运动队在规定的比赛时间里得分多少来决定

8、胜负的,因此,篮球比赛的计时计分系统是一种得分类型的系统21贝叶斯分类先验概率泛指一类事物发生的概率,通常根据历史资料或主观判断,未经实验证实所确定的概率。而后验概率涉及的是某个特定条件下一个具体的事物发生的概率21篮球比赛是根据运动队在规定的比赛时间里得分多少来决定胜负的,因此,篮球比赛的计时计分系统是一种得分类型的系统22贝叶斯分类例如:P(x1)=0.9: x1-为正常细胞的概率0.9(先验概率) P(x2)=0.1: x2-为异常细胞的概率0.1(先验概率)对某个具体的对象y,P(x1|y):表示y的细胞正常的概率是0.82(后验概率)P(x2|y):表示y的细胞异常的概率是0.18(

9、后验概率)22篮球比赛是根据运动队在规定的比赛时间里得分多少来决定胜负的,因此,篮球比赛的计时计分系统是一种得分类型的系统朴素贝叶斯分类朴素贝叶斯分类的工作过程如下:(1) 每个数据样本用一个n维特征向量X= x1,x2,xn表示,分别描述对n个属性A1,A2,An样本的n个度量。(2) 假定有m个类C1,C2,Cm,给定一个未知的数据样本X(即没有类标号),分类器将预测X属于具有最高后验概率(条件X下)的类。也就是说,朴素贝叶斯分类将未知的样本分配给类Ci(1im)当且仅当P(Ci|X) P(Cj|X),对任意的j=1,2,m,ji。这样,最大化P(Ci|X)。其P(Ci|X)最大的类Ci称

10、为最大后验假定。根据贝叶斯定理23篮球比赛是根据运动队在规定的比赛时间里得分多少来决定胜负的,因此,篮球比赛的计时计分系统是一种得分类型的系统24朴素贝叶斯分类(续)(3)由于P(X)对于所有类为常数,只需要P(X|Ci)*P(Ci)最大即可。如果Ci类的先验概率未知,则通常假定这些类是等概率的,即P(C1)=P(C2)=P(Cm),因此问题就转换为对P(X|Ci)的最大化(P(X|Ci)常被称为给定Ci时数据X的似然度,而使P(X|Ci)最大的假设Ci称为最大似然假设)。否则,需要最大化P(X|Ci)*P(Ci)。注意,类的先验概率可以用P(Ci)=si/s计算,其中si是类Ci中的训练样本

11、数,而s是训练样本总数。24篮球比赛是根据运动队在规定的比赛时间里得分多少来决定胜负的,因此,篮球比赛的计时计分系统是一种得分类型的系统25朴素贝叶斯分类(续)(4)给定具有许多属性的数据集,计算P(X|Ci)的开销可能非常大。为降低计算P(X|Ci)的开销,可以做类条件独立的朴素假定。给定样本的类标号,假定属性值相互条件独立,即在属性间,不存在依赖关系。这样联合概率分布25篮球比赛是根据运动队在规定的比赛时间里得分多少来决定胜负的,因此,篮球比赛的计时计分系统是一种得分类型的系统26朴素贝叶斯分类(续)(5)对未知样本X分类,也就是对每个类Ci,计算P(X|Ci)*P(Ci)。样本X被指派到

12、类Ci,当且仅当P(Ci|X) P(Cj|X),1jm,ji,换言之,X被指派到其P(X|Ci)*P(Ci)最大的类。 26篮球比赛是根据运动队在规定的比赛时间里得分多少来决定胜负的,因此,篮球比赛的计时计分系统是一种得分类型的系统“打网球”的决定No.天气气温湿度风类别1晴热高无N2晴热高有N3多云热高无P4雨适中高无P5雨冷正常无P6雨冷正常有N7多云冷正常有PNo.天气气温湿度风类别8晴适中高无N9晴冷正常无P10雨适中正常无P11晴适中正常有P12多云适中高有P13多云热正常无P14雨适中高有N之前用ID3算法求解的一个例子27篮球比赛是根据运动队在规定的比赛时间里得分多少来决定胜负的

13、,因此,篮球比赛的计时计分系统是一种得分类型的系统No.天气气温湿度风类别1晴热高无N2晴热高有N3多云热高无P4雨适中高无P5雨冷正常无P6雨冷正常有N7多云冷正常有PNo.天气气温湿度风类别8晴适中高无N9晴冷正常无P10雨适中正常无P11晴适中正常有P12多云适中高有P13多云热正常无P14雨适中高有N实例统计结果天气温度湿度有风打网球 P N PN PN PNPN晴 2/93/5热 2/92/5高 3/94/5否 6/92/59/145/14云 4/90/5暖 4/92/5正常 6/91/5是 3/93/5雨 3/92/5凉 3/91/528篮球比赛是根据运动队在规定的比赛时间里得分多

14、少来决定胜负的,因此,篮球比赛的计时计分系统是一种得分类型的系统统计结果天气 E1温度 E2湿度 E3有风 E4打网球 P N PN PN PNPN晴 2/93/5热 2/92/5高 3/94/5否 6/92/59/145/14云 4/90/5暖 4/92/5正常 6/91/5是 3/93/5雨 3/92/5凉 3/91/5对下面的情况做出决策:天气温度湿度有风打网球晴凉高是?29篮球比赛是根据运动队在规定的比赛时间里得分多少来决定胜负的,因此,篮球比赛的计时计分系统是一种得分类型的系统统计结果天气 E1温度 E2湿度 E3有风 E4打网球 D P N PN PN PNPN晴 2/93/5热

15、2/92/5高 3/94/5否 6/92/59/145/14云 4/90/5暖 4/92/5正常 6/91/5是 3/93/5雨 3/92/5凉 3/91/5对下面的情况做出决策:天气温度湿度有风打网球晴凉高是?模型:决策:?贝叶斯公式:E为第二个表中的取值、分别计算D=yes/no的概率30篮球比赛是根据运动队在规定的比赛时间里得分多少来决定胜负的,因此,篮球比赛的计时计分系统是一种得分类型的系统统计结果天气 E1温度 E2湿度 E3有风 E4打网球 D P N PN PN PNPN晴 2/93/5热 2/92/5高 3/94/5否 6/92/59/145/14云 4/90/5暖 4/92/

16、5正常 6/91/5是 3/93/5雨 3/92/5凉 3/91/5对下面的情况做出决策:天气温度湿度有风打网球晴凉高是?31篮球比赛是根据运动队在规定的比赛时间里得分多少来决定胜负的,因此,篮球比赛的计时计分系统是一种得分类型的系统已经计算出:同理可计算:利用公式:最后得到:决策:32篮球比赛是根据运动队在规定的比赛时间里得分多少来决定胜负的,因此,篮球比赛的计时计分系统是一种得分类型的系统天气 E1温度 E2湿度 E3有风 E4打网球 D P N PN PN PNPN晴 2/93/5热 2/92/5高 3/95/5否 6/92/59/145/14云 4/90/5暖 4/92/5正常 6/9

17、0/5是 3/93/5雨 3/92/5凉 3/91/5对下面的情况做出决策:天气温度湿度有风打网球云凉正常是?33篮球比赛是根据运动队在规定的比赛时间里得分多少来决定胜负的,因此,篮球比赛的计时计分系统是一种得分类型的系统作业 (下周一交)No.天气气温湿度风类别1晴热高无N2晴热高有N3多云热高无P4雨适中高无P5雨冷正常无P6雨冷正常有N7多云冷正常有PNo.天气气温湿度风类别8晴适中高无N9晴冷正常无P10雨适中正常无P11晴适中正常有P12多云适中高有P13多云热正常无P14雨适中高有N前10个样本作为训练样本,后4个作为测试样本,用Bayes方法进行决策。34篮球比赛是根据运动队在规定的比赛时间里得分多少来决定胜负的,因此,篮球比赛的计时计分系统是一种得分类型的系统作业2按毕业设计论文格式撰写Apriori算法的上机报告下次上机课之后交35

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 教学/培训

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号