应用多元统计分析 - 北京大学.ppt

上传人:bao****ty 文档编号:143804550 上传时间:2020-09-02 格式:PPT 页数:28 大小:433KB
返回 下载 相关 举报
应用多元统计分析 - 北京大学.ppt_第1页
第1页 / 共28页
应用多元统计分析 - 北京大学.ppt_第2页
第2页 / 共28页
应用多元统计分析 - 北京大学.ppt_第3页
第3页 / 共28页
应用多元统计分析 - 北京大学.ppt_第4页
第4页 / 共28页
应用多元统计分析 - 北京大学.ppt_第5页
第5页 / 共28页
点击查看更多>>
资源描述

《应用多元统计分析 - 北京大学.ppt》由会员分享,可在线阅读,更多相关《应用多元统计分析 - 北京大学.ppt(28页珍藏版)》请在金锄头文库上搜索。

1、1,应用多元统计分析,第五章 判 别 分 析,有时需要建立一种规则,需要你根据看到性状,来判别个体的属性或类别 比如让你根据人的某些外在特征判别人的年龄组(老中青)或民族 你可能说这很容易,你的判别依据是什么? 如果这活让计算机来完成呢? 可能很困难,即使让计算机判断人的性别也比较困难。,2,3,第五章 判别分析什么是判别分析,在气象学中,由气象资料判断明天是阴天还是晴天, 是有雨还是无雨. 在市场预测中,由调查资料判断下季度(或下个月)产品是畅销、平常或滞销. 在环境科学中,由气象条件,污染浓度等判断该地区是属严重污染,一般污染还是无污染. 在地质勘探中,由岩石标本的多种特征判断地层的地质年

2、代,是有矿还是无矿,是富矿还是贫矿. 在体育运动中,由运动员的多项运动指标来判定游泳运动员的苗子是适合练蛙泳,仰泳还是自由泳等,样本数据,4,xi1,xi2,xin表示个体性状 yi表示个体类别,取有限个值。,判别分析的目的,根据样本数据建立模型 y=f(x1,x2,xm) 根据这个模型对未来个体的类别进行判别 使得预测的准确率较高 判别的思想就是看一个样品和那个类长得比较“象”,和哪个类“象”就判别为哪一类。 但是“象”与“不象”,确是仁者见仁,智者见智。不同的人来说,结果可不完全相同。 但是还是能认同“较为合理”的结果。,5,6,第五章 判别分析目 录 ,5.1 距离判别 5.2 Baye

3、s(贝叶斯)判别法及 广义平方距离判别法 5.3 Fisher(费歇)判别 5.4 判别效果的检验及 各变量判别能力的检验 5.5 逐步判别,7,第五章 5.1 距离判别法,距离判别的基本思想是: 样品和哪个总体距离最近,就判它属哪个总体. 距离判别也称为直观判别法. 我们在具体讨论距离判别法之前,应给出合理的距离的定义.,8,第五章 5.1 距离判别法 马氏距离,已知有两个类G1和G2,比如G1是设备A生产的产品,G2是设备B生产的同类产品.设备A的产品质量高(如考察指标为耐磨度X),其平均耐磨度1=80,反映设备精度的方差2(1)=0.25;设备B的产品质量稍差,其平均耐磨度2=75,反映

4、设备精度的方差2(2)=4.今有一产品X0,测得耐磨度x0=78,试判断该产品是哪一台设备生产的? 直观地看, x0 与1(设备A)的绝对距离近些,按距离最近的原则是否应把该产品X0 判断为设备A生产的?,9,第五章 5.1 距离判别法 马氏距离,考虑一种相对于分散性的距离.记X0与G1, G2的相对平方距离为d21(x0)或d22(x0),则: d21(x0)= = = 16=42 d22(x0)= = =2.25=1.52 因为d2(x0)=1.54= d1(x0) ,按这种距离准则应判X0为设备B生产的.,(x0 -1)2,2(1),(78 - 80)2,0.25,(x0 -2)2,2(

5、2),(78 - 75)2,4,10,第五章 5.1 距离判别法 马氏距离,设备B生产的产品质量较分散,出现x0为78的可能性仍较大; 而设备A生产的产品质量较集中,出现x0为78的可能性较小. 判X0为设备B的产品更合理. 这种相对于分散性的距离就是本节介绍的马氏距离.,11,第五章 5.1 距离判别法马氏距离,一般地,我们假设G1的分布为N(1),21),G2的分布为 N(2),22),则利用相对距离的定义,可以找出分界点*(不妨设 (2)(1),当(2)x(1)时,令,而按这种距离最近的判别准则为:,12,第五章 5.1 距离判别法利用马氏距离对两个一维正态总体判别归类示意图,利用马氏距

6、离对两个一维正态总体判别归类 令:,(* =79为到两总体相 对距离相等的分界点),x0=78*=79 判x0G2.,13,第五章 5.1 距离判别法 两总体判别:简例1,简例1 :记二维正态总体N2(i), )为Gi(i=1,2)(两总体协差阵相同),已知来自Gi(i=1,2)的样本数据阵为,(1) 试求两总体的样本组内离差阵A1, A2和合并样本协差阵S. (2) 今有样品x0 =(2,8),试问按马氏距离准则样品x0应判归哪一类.,14,第五章 5.1 距离判别法 两总体判别:简例1,(1)解:,15,第五章 5.1 距离判别法 两总体判别:简例1,而且,16,第五章 5.1 距离判别法

7、 两总体判别:简例1,(2)解一:计算马氏距离,17,第五章 5.1 距离判别法 两总体判别:简例1,(2)解二:计算线性判别函数W(X),18,第五章 5.1 距离判别法 应用例子,例5.1.1(盐泉含钾性判别) 某地区经勘探证明A盆地是一个钾盐矿区,B盆地是一个钠盐矿区,其他盐盆地是否含钾盐有待作出判断.今从A,B两盆地各抽取5个盐泉样品;从其他盆地抽得8个盐泉样品, 18个盐泉的特征数值见表5.1.试对后8个待判盐泉进行含钾性判别.,19,第五章 5.1 距离判别法 应用例子,20,第五章 5.1 距离判别法 应用例子,解一 A盆地和B盆地看作两个不同的总体,并假定两总体协差阵相等.本例

8、中变量个数m=4, 两类总体各有5个训练样品(n1= n2=5),另有8个待判样品. 用SAS/STAT软件中的DISCRIM过程进行判别归类. (1)首先用DATA步生成SAS数据集D511. SAS程序如下:,21,第五章 5.1 距离判别法 应用例子的sas程序,data d511; input x1-x4 group $; cards; 13.85 2.79 7.80 49.60 A 2.18 1.06 1.22 20.60 B 8.85 3.38 5.17 26.10 . 15.00 2.70 5.02 64.00 . ; proc print ; run;,22,第五章 5.1 距

9、离判别法 应用例子的sas程序,(2) 调用DISCRIM过程对含钾和不含钾的A、B两类盆地的10个样品特征测量值用距离判别的方法,建立线性判别函数,并对已知类别的样品和待判样品进行判别归类. ,proc discrim data=d511 simlpe pcov wsscp psscp distance list; class group; var x1-x4; run;,23,第五章 5.1 距离判别法 应用例子中sas程序的选项,选项SIMPLE要求输出各类的简单描述统计量 (如两类各变量的均值、标准差等); 选项WSSCP要求输出各类的组内离差阵; 选项WCOV要求输出各类样本协差阵;

10、 选项PCOV要求输出合并样本协差阵; 选项PSSCP要求输出合并的样本组内离差阵; 选项DISTANCE要求输出各组间的距离等统计量 (平方距离,F统计量值, p值等) ; 选项LIST要求输出按距离准则的判别结果.,24,第五章 5.1 距离判别法 应用例子的结果分析,选项WSSCP 产生的结果,两总体的样本离差阵A1和A2,25,第五章 5.1 距离判别法应用例子的结果分析,选项PSSCP 产生的结果,选项PCOV 产生的结果,合并的样本组内离差阵 A=A1+A2,合并样本协差阵S=A/(n1+n2-2),26,第五章 5.1 距离判别法应用例子的结果分析 ,组间马氏距离 d2(1,2)=37.03,检验H0: (1) =(2) 的F统计量 F=14.46,p=0.0059,27,第五章 5.1 距离判别法应用例子的结果分析,线性判别函数Y1(X),Y2(X),线性判别函数 W(X)=Y1(X)-Y2(X),W(X)= -37.08458 + 4.74305 X1 + 4.19183 X2 - 8.58924 X3 + 0.72548 X4,28,第五章 5.1 距离判别法应用例子的结果分析,第2,3,6,7,8 五个盐泉为 含钾盐泉,第1,4,5为 不含钾盐泉,

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号