Bayes决策理论－金锄头文库

资源描述

《Bayes决策理论》由会员分享，可在线阅读，更多相关《Bayes决策理论（57页珍藏版）》请在金锄头文库上搜索。

1、章Bayes决策理论最小错误概率的Bayes决策最小风险的Bayes决策Neyman Pearson决策Bayes分类器和判别函数正态分布时的Bayes决策法则引言模式特征的不确定性进行模式识别首先要提取和选择模式特征使这些特征组成的特征向量能很好地代表这个事物但是在实际问题中由于技术或经济上的原因使得提取和选择的特征不一定能准确地描述这个模式比如特征选择的不合适特征的数量不当特征测量的不准确等等使模式具有不确定性因此我们应当把模式向量看成随机变量处理随机变量用什么方法呢概率论与数理统计 1 概率频率如果在n次重复试验中事件A发生了次则称比值是事件A

2、在这n次试验中发生的频率记作概率在相同条件下重复进行同一试验如果随着试验次数n的增加事件A的频率仅在某个数附近有微小变化则称是事件A的概论实际上是不容易得到的常用n较大时的频率作为A的概率 2 条件概率设A B是试验E的两个事件则称为在事件B发生条件下事件A的条件概率 3 Bayes公式含义假设是某个过程的n个事件是各事件出现的概率称为先验概率如果这个过程得到一个结果B 由于B的出现而对各事件的概率要做出重新认识 3 1最小错误概率的Bayes决策1 用先验概率决策假设某个工厂生产两种尺寸和外形都相同的螺钉一种是铁的一种是铜的两种产品混在一起要求对它们进行自

3、动分类设铁的类别状态用表示铜的类别状态用表示因为事先类别状态是不确定的所以是随机变量假设铁螺钉有7万个铜螺钉有3万个那么铁螺钉出现的概率铜螺钉出现的概率如果用概率和来决策规则为如果则螺钉如果则螺钉因为所以螺钉所有螺钉都分到铁螺钉这一类决策错误概率为0 3 用先验概率决策存在的问题与待识别对象的特征没有建立联系没有利用待识别对象本身的信息 2 用后验概率决策先用一个模式特征来分类如果这个特征对分类是有效的那么的概率分布就与类别状态是有联系的例如铜螺钉和铁螺钉的表面亮度是不同的以亮度作为特征亮度用亮度计来测量每个螺钉的亮度在亮度计上可以在一定范围内

4、连续取值由于每个螺钉的亮度可能是不同的所以是一个连续的随机变量对的概率分布记为对的概率分布记为那么和的差别反映了和的类别状态的差别反映了两类模式的差别 X有对属于铜螺钉的分布也有对属于铁螺钉的分布假设已经知道了如何求利用Bayes公式式中Bayes公式表明可以通过特征的观察值把先验概率转化为后验概率图3 1表示了当 a 所示时后验概率随亮度的变化情况因此可以用后验概率进行决策决策规则如果则决策如果则决策这个决策规则被称为最小错误概率的Bayes决策为什么说这个决策规则具有最小错误概率呢 3 最小错误概率的解释在用上述规则决策时有两种可能发生的错误分类将

5、真实属于分到将真实属于分到观察到的x值不同那么后验概率就不同从而分类错误概率也不同所以分类错误概率是随机变量x的函数也是随机变量对于观察到的大量x 对它们作出分类决策的平均错误率应当是的数学期望由概率论可知若已知连续随机变量x的概率密度函数可以计算出的数学期望如果对于每次观察到的特征值x 尽可能小的话则上式的积分也必定是尽可能小的假设H为两类的分界面相应于和将x轴分为两个区域在发生分类错误时总的错误概率为所以总的错误概率是两种分类错误概率的加权和由于和是任意取的所以错误概率不一定是最小的当把决策面左移时我们可以减小代表误分类的三角形区域的面积从而减小分类

6、错误概率若选取决策面H使得则可消除面积A 从而得到最小的分类错误概率这正是上述决策规则得到的结果如果对于某个x 有则把x分到R2中可以使得x对积分贡献增大而对积分的贡献减小相当于使H左移证明假设R1是类的决策域 R2是类的决策域对X分类这时有两种可能发生的分类错误 X的真实状态是却分到R1 X的真实状态是却分到R2 错误率由Bayes公式有则在整个特征空间有所以当时把x分到R1 增加积分值可以使错误率减小同理可得当时把x分到R2 可以使错误率减小对于一般情况即模式向量是维向量要求在类模式情况下进行决策时最小错误概率的Bayes决策法则可表达为

7、设是个类别状态的有限集合特征向量是维随机向量是模式向量在状态下的条件概率密度是的先验概率则根据Bayes法则后验概率就是式中这时决策与上述二类一维模式相似如果对于一切成立则决策 3 2最小风险的Bayes决策 1决策错误的损失与风险对于两类别决策存在两种可能的分类错误 1 把真实状态为的模式分到类 2 把真实状态为的模式分到类显然由于分类错误其结果都会带来损失但是对于有的问题来说损失是不同的比如以癌变细胞的分类识别为例把正常细胞识别成癌变细胞给正常人带来精神负担把癌变细胞识别成正常细胞使早期患者失去治疗机会延误治疗缩短生命因此在决策时就要把由分类错误而

8、引起的损失考虑进去一般情况设是个可能的决策集合是个自然状态集合表示当自然状态为时采取决策所造成的损失决策表损失的数值一般由专家根据经验给出 2 最小风险的Bayes决策设是X在自然状态为下的条件概率是自然状态为的先验概率则由Bayes公式可求得后验概率 X 由Bayes公式后验概率是式中假定观察到一个同时决定采取决策如果真正的状态为就会导致产生损失因为是自然状态为的概率所以与采取的决策有关的损失的数学期望就是是一个平均损失称为条件风险每当观察到一个X时我们总可以选取使条件风险极小的决策如果选取的决策使得平均损失对每一个具体的X都能尽可能小则总风险也会达到极

9、小最小风险的Bayes决策规则为了使风险最小应对于计算条件风险并选择决策使得最小对于二类问题相当于决策真正状态为而相当于决策真正状态为记为当真正状态为而把误作真正状态时所受到的损失有这时最小风险的Bayes决策法则就是如果则判定为真正的状态否则为真正的状态或如果则判定为真正的状态否则为真正的状态上式与最小错误概率的Bayes决策比较有何不同在后验概率上分别乘以一个损失差作为比例因子最小风险的Bayes决策和最小错误概率的Bayes决策的关系 1 在二类问题中若有即所谓对称损失函数的情况二者一致 2 一般的多类问题中在0 1损失函数的情况时即

10、提示问题的一般性和特殊性条件风险为使极小即使极大两种决策的结果相同正确时的条件概率 3 3Neyman Pearson决策对于两类别决策存在两种可能的分类错误 1 把真实状态为的模式分到类 2 把真实状态为的模式分到类两种错误的概率分别为决策应该使都为最小如何做 Neyman Pearson决策所要解决的问题对于二类模式识别问题保持一种错误概率为常数例如而使另一种错误概率达到极小这个问题可以看成在条件下求的极小值问题用什么方法呢采用Lagrange乘数法约束条件为构造Lagrange函数我们的目的就是使达到极小即min 对于二类问题有所以要使极小

11、对于X 如果被积函数将X分到R1 来减少如果将X分到R2 来减小这样可以写出决策规则如果则如果则如何求将决策规则写成如果则如果则可以看出是两种决策的边界也就是选择R1和R2的边界使得L极小达到极小值的必要条件是由此得或这是未知数的方程就是分界的阈值可以用其他数学方法求得 3 6正态分布时的Bayes决策法则单变量正态密度函数它的均值为方差为单变量正态密度可由两个参数即均值和方差完全决定记为它表示是服从均值为方差为的正态分布的随机变量正态分布的样本集中在均值附近其分散的程度正比于方差的平方根即标准差从正态总体中抽取的样本中有95 44 落在区

12、间中多维正态密度函数为其中是维列向量是维均值向量是协方差矩阵它的均值向量为协方差矩阵为是的逆矩阵是的行列式图3 8所示为一个二维正态密度的示意图如果把等概率密度点画出来它们就是一簇同心的椭圆从正态总体中抽取的样本落在一个密集的区域区域中心由均值向量决定形状由协方差矩阵决定用判别函数可以得到最小错误概率的分类当概率密度函数为正态时对上式取自然对数则下面对该式在下述三种不同情况下进行讨论 1 第一种情况这种情况下每类的协方差矩阵都相等而且类内各特征分两间相互独立具有相同的方差协方差矩阵是对角矩阵对角线元素都是几何上这相当于样本落在同样大小的一些超圆球

13、族内第i类样本的超圆球族是以均值为中心的图3 8和3 9的长短轴相等形式这时判别函数可以写成是欧氏距离如果个类的先验概率都相同这时最小错误概率的Bayes决策法则是若要对模式分类只要计算出从待分类模式向量到每一类均值向量的欧氏距离然后把归到距离最近的那个均值向量所属的类别这种分类器称为最小距离分类器模板匹配技术如果个类的先验概率不相同这时对距离的平方必须用方差规范化后减去再用以分类所以如果待分类的模式向量同两类均值向量的欧氏距离相等的话最小错误概率的Bayes决策是把这个模式归到先验概率较大的那一类在实际应用中不必计算欧氏距离把展开后判别函数式就变成式中

14、与模式类别无关可以忽略可得判别函数式中决策面由线性方程所决定在这个具体情况下决策面可化为其中这个方程确定了通过并正交于向量的超平面由于所以划分和的超平面正交于均值向量之间的联线图 3 11 是一个二维二类模式的例子如果则点就离开先验概率较大的那个类的均值向量而朝先验概率较小的那类方向移动但如果方差则先验概率对决策面位置的影响比较小 2 第二种情况各类的协方差矩阵相等这种情况下的判别函数为如果各类的先验概率相等决策法则为只计算它与每一类均值向量间的Mahalanobis距离平方而后把它分到与之最近的均值向量所属的类别中去如果各类的先验概率不同时则决策应有利

15、于先验概率较大的那一类把展开后与类别无关判别函数变成式中若和相邻它们之间的决策面应满足式中图3 12表示二维二类模式情况下的决策界面如果各类的先验概率相等则这个决策面同均值向量联线的交点在联线的中点若各类的先验概率不相等则决策面就离开先验概率较大的那个类的均值向量而朝先验概率较小的那类方向移动例两类二维正态分布的模式的均值向量为其协方差矩阵均为单位矩阵即设求Neyman Pearson决策的阈值取整数是维列向量是维均值向量是的逆矩阵是的行列式由于是边界所以令决策边界Lagrange乘子根据决策规则有因为和之间的关系为所以插值法于是在取不同值时可求得不同的找与0 04最近的对应的值取

展开阅读全文