贝叶斯决策规则课件

上传人:我*** 文档编号:141314453 上传时间:2020-08-06 格式:PPT 页数:56 大小:2.86MB
返回 下载 相关 举报
贝叶斯决策规则课件_第1页
第1页 / 共56页
贝叶斯决策规则课件_第2页
第2页 / 共56页
贝叶斯决策规则课件_第3页
第3页 / 共56页
贝叶斯决策规则课件_第4页
第4页 / 共56页
贝叶斯决策规则课件_第5页
第5页 / 共56页
点击查看更多>>
资源描述

《贝叶斯决策规则课件》由会员分享,可在线阅读,更多相关《贝叶斯决策规则课件(56页珍藏版)》请在金锄头文库上搜索。

1、Ch 02. 贝叶斯决策论,符号表示,表示类别的随机变量 类别标记 例如: :鲑鱼; :鲈鱼 类别先验概率 当所有类别互斥并且完备的情况下 类条件概率密度函数,进行观察之前,问题 给定所有可能类别的先验概率,在不进行观察的情况下,预测下一个可能出现的模式的类别 最佳决策规则 在没有对新出现的模式进行任何观察情况下,该决策规则造成错误的概率最小,因此为最优决策规则; 如果先验概率不变,则每次的预测均相同。 如果有更多的信息,是否可以做出更好的预测?,如果 ,则预测下一个模式为,在类别为 的情况下,观察到特征 的概率为 可用于分类的特征x在类别不同的情况下,其概率分布应有所不同,进行观察之后,目标

2、:在观察到 的情况下,类别为 的概率 判决规则,从样本中观察到 的情况下, 如果 , 则预测该模式为,根据观察到的特征做出预测,利用先验概率(观察到x之前)计算后验概率(观察到x之后),贝叶斯公式,可被视为常量约掉!,贝叶斯公式,已知,未知,贝叶斯公式,贝叶斯决策的特例,特例1 均匀先验概率: 决策仅仅依赖于,从样本中观察到 的情况下, 如果 , 则预测该模式为,贝叶斯决策的特例,特例2 相同的类条件概率密度函数: 决策仅仅依赖于先验概率,如果 ,则预测模式为,例子(1),类条件概率密度函数图,后验概率图,例子(2),问题 有某种医学测试方法,在患有某种癌症的病人身上测试,返回阳性的概率为98

3、%,在没有这种癌症的病人身上测试,返回阴性的概率为97%。经专家统计,所有人口中患这种癌症的概率为约0.8%。请问,如果某人的检测结果为阳性,他到底有没有得这种癌症? 解答 已知 计算 由于 ,根据贝叶斯决策规则,该病人没有得癌症,如何确定概率?,应用贝叶斯决策规则,需已知如下概率 对于某个具体问题,常常需要通过实验统计相对频率,或者利用概率密度估计技术来确定如上概率,例子,问题: 在某大学校园内,根据轿车车身高度判断其价格是否超过5万美元? C1: price $50K C2: price $50K Feature x: height of car 解答: 贝叶斯规则 需计算:P(C1),

4、P(C2), p(x|C1), p(x|C2),例子,计算先验概率P(C1), P(C2): 方式:在校园里随机挑选1209辆车,询问车主车价,并且测量车身高度 结果: 1209 samples: #C1=221 #C2=988,例子,计算类条件概率密度p(x|C1), p(x|C2): 方式:将车身高度x离散化为16个区间(每个区间宽度0.1m),对每个类别C1,C2 ,统计每个区间内的样本个数占类内样本总数的比例,例如: C1( price $50K)中共有221个样本, 其中,0.95x1.05(离散化后即x=1.0)的样本有46个样本,则:,例子,车身高度为1米的轿车价格是否高于5万美

5、元?,结论:低于5万美元,贝叶斯决策的最优性,从最小化误差概率的意义上讲,贝叶斯决策是最优决策 先来看两类情况 条件误差概率 平均误差概率 在贝叶斯决策中,对每一个x,P(error | x)都能被最小化,因此P(error)被最小化。,贝叶斯决策的最优性,对问题作如下泛化: 允许多类情况; 允许其他行为而不仅仅是判定类别; 引入更一般的损失函数来替代误差概率。 损失函数 当真实类别为 时,采取行动 所带来的损失 允许某种分类错误的代价高于其他分类错误 条件风险(期望损失) 当观察到x的时候,采取行动 造成的期望损失,贝叶斯决策的最优性,判决规则函数 将观察到的特征x映射到应采取的行动的函数

6、总风险 某个判决规则的期望损失 最优决策 使得总风险最低的判决规则 对任意给定的特征x,如果判决规则 选择的的行动能够最小化条件风险 ,那么总风险将最小化 贝叶斯决策规则:对所有i=1,2,a,计算条件风险 ,选择行动 使得条件风险 最小化 贝叶斯决策得到的最小总风险被称为贝叶斯风险,表示为R*,两类分类问题,行动 :判决为类别 :判决为类别 损失 条件风险 最小风险决策规则,如果 ,则模式为,两类分类问题,等价的最小风险决策规则 通常情况下,分类错误的损失要大于正确的损失(正确时往往无损失) 似然比,两类分类问题,基于似然比的贝叶斯决策规则,如果 ,则模式为 否则,模式为,例子,不同的损失函

7、数决定了不同的判决阈值 和 :“0-1”损失 : 每一类的判决域可能是不连续的,损失函数的特例:“0-1损失”,“0-1”损失(对称损失)函数 决策正确时无损失,任何一种错误的损失都等于一个单位,即所有误判都是等价的 “0-1”损失的条件风险 该条件风险即误差率(error rate) 最小化条件风险 等于最大化后验概率,最小误差率分类,最小误差率分类是采用“0-1”损失函数时的最小风险分类 两类情况下的最小误差率分类判决规则 多类情况下的最小误差率分类判决规则,如果 ,则模式为 否则,模式为,如果 , 则预测该模式为,极小化极大准则,最小风险分类器依赖于先验概率 在先验概率未知的情况下,如何

8、设计风险较小的分类器? 使先验概率取任何一种值时所引起的总风险的最坏情况尽可能小最小化最大可能的总风险 极小化极大(Minimax)准则,极小化极大准则,总风险 对两类问题来讲:,代入 以及 ,可重写总风险公式: R与 成线性关系 选择使 的 和 ,则总风险与 无关,此时的总风险称为极小化极大风险,极小化极大准则,极小化极大准则,极小化极大风险 通过交换两种类别,极小化极大风险也可表示为 例子,极小化极大风险(不依赖于先验概率),判别函数,分类器最常用的表述方式为判别函数 ,每个类别对应一个判别函数 基于判别函数的判决规则,如果 ,则模式为,判别函数,基于最小总风险的贝叶斯分类器 基于最小误差

9、概率的贝叶斯分类器 表达同样的判决规则可能采用不同的判别函数,只要满足如下条件: 用 替换 ,其中 为单调递增函数 例如 ,其中k为正数常数 ,其中k为任意常数,判别函数,两类情况下 仅需要一个判别函数 判决规则 例如,如果 ,则模式为 ,否则为,判决区域和判决边界,判决区域 判决区域 是特征空间中的一个子空间,判决规则将所有落入 的样本x分类为类别 判决边界 判决边界是特征空间中划分判决区域的(超)平面 在判决边界上,通常有两类或多类的判别函数值相等,多元高斯密度函数,d-维高斯(正态)密度函数 为d维均值向量 为 的协方差矩阵,通常为对称半正定矩阵 表示为 取log,正态分布的判别函数,类

10、条件概率密度函数 基于最小误差概率分类的判别函数,可忽略的常量,特例,情况1:均匀先验概率 情况1a:均匀先验概率,并且 各特征统计独立 所有特征具有相同的方差,平方欧几里德距离,特例,情况1:均匀先验概率 情况1b:均匀先验概率,并且 各类数据具有相同的协方差矩阵,平方Mahalanobis距离(马氏距离),情况1a和1b可被视为最小距离分类器,即将x划分为最近的均值 所属的类别,特例,情况2:,对所有i均相同,令 ,则得到线性判别函数,采用线性判别函数的分类器称为线性分类器(线性机器),第i个方向上的阈值(偏置),特例,情况2: 一个线性机器的判决面是一些超平面,其中每一个超平面是由具有最

11、大后验概率的两种类别的判别函数相等确定的:,该超平面通过x0,并且垂直于 ,即两类均值点之间的连线,x0,特例,R1,R2,R3,特例,回到情况1a:均匀先验概率,并且 判别函数仅与各类均值有关 判决面,判决面为连接两类均值点连线的垂直中分线,特例,回到情况1a:均匀先验概率,并且,特例,如果先验概率不同?一维情况,特例,如果先验概率不同?二维情况,特例,如果先验概率不同?三维情况,特例,情况3:,对所有i均相同,特例,情况3: 判决面由如下形式的超平面组成,x0,该超平面通过x0,并且一般情况下不垂直于,特例,回到情况1b:均匀先验概率,并且 判决面,判决面通过连接两类均值点连线的中点,特例,回到情况1b:均匀先验概率,并且,特例,如果先验概率不同?,一般情况,任意高斯密度函数,令 , ,则得到二次型判别函数,一般情况,任意高斯密度函数 两类情况下,判决面为超二次曲面,一般情况,任意高斯密度函数(多类情况下),例子,判决边界,判决边界并未经过1,2的中点 ,而是偏下一点,小结,贝叶斯规则 基于观察值,将类先验概率 和类条件密度 转化为后验概率 贝叶斯决策 最小化总风险 最小化误差概率:选择最大后验概率的类别 贝叶斯决策是理论上的最优决策,贝叶斯风险是理论上的最小风险 判别函数 判决区域和判决边界,小结,多元高斯概率密度函数 假设类条件概率密度满足高斯分布 判别函数 判决面,

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > PPT模板库 > PPT素材/模板

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号