判别分析-实例课件

上传人:枫** 文档编号:568035695 上传时间:2024-07-23 格式:PPT 页数:65 大小:1.11MB
返回 下载 相关 举报
判别分析-实例课件_第1页
第1页 / 共65页
判别分析-实例课件_第2页
第2页 / 共65页
判别分析-实例课件_第3页
第3页 / 共65页
判别分析-实例课件_第4页
第4页 / 共65页
判别分析-实例课件_第5页
第5页 / 共65页
点击查看更多>>
资源描述

《判别分析-实例课件》由会员分享,可在线阅读,更多相关《判别分析-实例课件(65页珍藏版)》请在金锄头文库上搜索。

1、判别分析潜在购买者的特性分析一、问题提出:一、问题提出:在市场研究中经常会遇到根据所调查的数据资料,对所在市场研究中经常会遇到根据所调查的数据资料,对所研究的对象进行分类判别。研究的对象进行分类判别。如:消费者对某些新产品如:消费者对某些新产品“喜欢喜欢”与与“不喜欢不喜欢”之判别之判别 医学诊断中病因的判别等医学诊断中病因的判别等采用多元统计分析中的判别分析可以解决这类问题。采用多元统计分析中的判别分析可以解决这类问题。分类:分类:1 1)二级判别)二级判别2 2)多级判别)多级判别3 3)逐步判别)逐步判别设:设: Y Y 表示购买者或非购买者(状态)表示购买者或非购买者(状态) X1 X

2、1 表示产品的价格(指标)表示产品的价格(指标) X2 X2 表示消费者的收入表示消费者的收入对光顾该商店的顾客进行对光顾该商店的顾客进行n n次观察。次观察。设:设:n1n1组数据为购买者(组数据为购买者(A A) n2 n2组数据为非购买者(组数据为非购买者(B B) 由已知变量由已知变量X1X1,X2X2,将,将n1+n2=nn1+n2=n组数据分成两大类;组数据分成两大类; 购买者(购买者(A A) (I=1,2,n1)I=1,2,n1)非购买者(非购买者(B B) (j=1,2,n2)j=1,2,n2)若将这n1+n2组数据散点图方法绘图:X1X2(B)(A)L“ ”购买者,“ ”非

3、购买者, L作为分界线 散点图方式直线的划定不那么散点图方式直线的划定不那么客观、合理,况且当有两个因素影客观、合理,况且当有两个因素影响时,无法直观地划出这条直线。响时,无法直观地划出这条直线。 判断分析判断分析提供了依据历史提供了依据历史资料,根据一定区别准则,比较客资料,根据一定区别准则,比较客观的寻求一条观的寻求一条A A、B B两类的最佳分界两类的最佳分界线,使线,使A A、B B两类点能被此直线最大两类点能被此直线最大限度地区别开来的一种统计方法限度地区别开来的一种统计方法。2)P个指标的二类判别函数假定:采用假定:采用P P个指标(上例两个指标个指标(上例两个指标X1X1、X2X

4、2,P=2P=2) 解决一个判别两类状态的问题(上例购买者、非解决一个判别两类状态的问题(上例购买者、非 购买者)购买者)对第一种状态(购买者)假定调查对第一种状态(购买者)假定调查n1次共有次共有p*n1个数据,个数据,写成数据矩阵写成数据矩阵对第二种状态(非购买者)假定调查对第二种状态(非购买者)假定调查n2次共有次共有p*n2个数据,个数据,写成数据矩阵写成数据矩阵步骤简述:判别分析的任务,就是根据这两个数据矩步骤简述:判别分析的任务,就是根据这两个数据矩阵,在最优判别准则下,确定判别函数阵,在最优判别准则下,确定判别函数使两类状态能被最大限度地区别开来。使两类状态能被最大限度地区别开来

5、。由于已有由于已有n1几个属于第一类状态的样本几个属于第一类状态的样本代入判别函数代入判别函数 后,得到后,得到由于已有由于已有n1几个属于第二类状态的样本几个属于第二类状态的样本代入判别函数代入判别函数 后,得到后,得到令:令:分别来自第一、第二状态的分别来自第一、第二状态的n1、n2个样本个样本所对应的函数值的平均值。所对应的函数值的平均值。为了使得这个判别函数不清能最大限度地区分来自两为了使得这个判别函数不清能最大限度地区分来自两类不同状态的样本,当然要求来自两类不同状态的两类不同状态的样本,当然要求来自两类不同状态的两个平均值个平均值 与与 极差愈大愈好:极差愈大愈好:来自第一类状态的

6、来自第一类状态的 要求它们要求它们的的离差平方和离差平方和 愈小愈好愈小愈好来自第一类状态的来自第一类状态的 要求它们要求它们的的离差平方和离差平方和 愈小愈好愈小愈好等于使下式等于使下式愈大愈好愈大愈好由于当两批数据给定后,由于当两批数据给定后,I就是判别系数就是判别系数 的的函函数,因此要使数,因此要使I最大,就选择最大,就选择 使得该多元函使得该多元函数数达到最大。达到最大。比较关键的系数比较关键的系数(利用多元函数求(利用多元函数求极值点的办法)极值点的办法)3)判别与检验)判别与检验根据实测的根据实测的 确定了判别函数确定了判别函数后,如何作出判别呢?就需要寻求一个判别指标。后,如何

7、作出判别呢?就需要寻求一个判别指标。这指标只需取这指标只需取 和和 这两组数的加权平均即可这两组数的加权平均即可其中:其中:可验证:可验证:因此,对于因此,对于P个指标为个指标为 的样品。如果的样品。如果则判定这个样品来自第一状态,否则就判定来自第则判定这个样品来自第一状态,否则就判定来自第二状态。二状态。应用实例:应用实例: 某外贸公司为推销某一新产品,将该新产品之样品某外贸公司为推销某一新产品,将该新产品之样品寄往十二个国家的进口代理商,并附意见调查表,要求寄往十二个国家的进口代理商,并附意见调查表,要求对该产品给予评估。评估的因素有式样、包装及耐久性对该产品给予评估。评估的因素有式样、包

8、装及耐久性三项。评分表用三项。评分表用10分制。最后并要求说明是否愿意购买,分制。最后并要求说明是否愿意购买,调查结果如表调查结果如表产品特性产品特性式样式样X1 包装包装X2 耐久性耐久性X3购购买买者者 非非购购买买者者 9 8 7 7 6 6 10 7 8 8 4 5 9 9 3 8 6 7 7 5 6 4 4 4 3 6 6 6 3 3 2 4 5 1 2 2 123456712345求判别函数(求判别函数(n1=7,n2=5,p=3)1、计算、计算2、计算各、计算各第一、二第一、二组式样、组式样、包装、耐包装、耐久性平均久性平均数数第一与第二组式样、第一与第二组式样、包装、耐久性的平

9、包装、耐久性的平均差值均差值3、计算各、计算各4、将上各计算结果代入方程组得、将上各计算结果代入方程组得写成矩阵形式为写成矩阵形式为SC=D即:即:由上述系数矩阵可得逆矩阵为由上述系数矩阵可得逆矩阵为5、得判别函数为、得判别函数为6、计算判别指标、计算判别指标判别指标为判别指标为7、判别:、判别: 欲判别任何一潜在购买者究竟应归属于购买者或非购欲判别任何一潜在购买者究竟应归属于购买者或非购买者,只需将该潜在购买者对产品的三种特性所给予的分买者,只需将该潜在购买者对产品的三种特性所给予的分数代入判别函数中,即得该潜在购买者之判别值。数代入判别函数中,即得该潜在购买者之判别值。8、显著性检验、显著

10、性检验首先计算首先计算Malalanobis距离距离得检验统计量得检验统计量查查F分布临界值表(分布临界值表(F0.01)由于由于F=9.831647.59,故认为,故认为1,2两组变量的平均两组变量的平均值高度显著,用上述判别函数作出的判断是有效的。值高度显著,用上述判别函数作出的判断是有效的。为研究舒张期血压与血浆胆固醇对冠心病的作用,在某工为研究舒张期血压与血浆胆固醇对冠心病的作用,在某工厂测定了厂测定了50-59岁女工冠心病人岁女工冠心病人15例(例(G=1)和正常人)和正常人16例(例(G=2)的舒张血压()的舒张血压(A1)mmHg和血浆胆固醇和血浆胆固醇(A2)mg%,试作判别分

11、析。,试作判别分析。输出结果输出结果给出原始分类及协方差矩阵的信息给出原始分类及协方差矩阵的信息给出两组间的广义平方距离给出两组间的广义平方距离 GROUP=1; 给出判别方程:给出判别方程:当有新的样本需要确定类别时,则需将该样本的观察项目当有新的样本需要确定类别时,则需将该样本的观察项目分别代入两个判别方程,看分别代入两个判别方程,看G1和和G2谁大,此样本就归为哪谁大,此样本就归为哪组。组。例:样本例:样本A,舒张血压为,舒张血压为75mmHg,血浆胆固醇为,血浆胆固醇为150mg%,分别代入方程后,分别代入方程后 G1=1.12364*75+0.21222*150-72.60310=4

12、3.5029 G2=0.94031*75+0.16755*150-49.34373=46.31202由于由于G1小于小于G2,所以样本,所以样本A判为正常人组(判为正常人组(G=2)。)。新样本判别新样本判别对全部对全部31个样本进行回代判别后结果与实际情况的比较个样本进行回代判别后结果与实际情况的比较错判率错判率横向横向1,2为判别结果分类,纵向为判别结果分类,纵向1,2为实际分类,为实际分类,冠心病组冠心病组正确判别率正确判别率为为80%,假阴性率为,假阴性率为20%,正常组正确判别率正常组正确判别率为为81.25%,假阳性率为,假阳性率为18.75%.待判样品与前例区别是用逐步判别法。重

13、要的因素保留,其余删除。保留两个因素判别公式:D1=-2.516-0.033pa+0.008alpha_at D2=-4.419+0.120pa+0.005alpha_at判别公式:D1=-2.516-0.033pa+0.008alpha_atD2=-4.419+0.120pa+0.005alpha_at验证数据表第一行数据(13.73,327.13)代入D1与D2得到(-0.352,-1.136)是第3类。是一个判错例。是分类的重心某公司在招聘人才时,出了3类题目(敬业类、智力类、人际类题目)对应聘者的测试。一年后,在对已录用的12位人才类型的研究中发现,其中部分人是团队工作型人才,部分人是独立研究型人才。现在用这三类题目,对一位新应聘者测试,得到相应的3个分值。请预先判断这位应聘者,是什么类型的人才?判别分析判别分析判别函数的最大特征根的说明检验有显著差异判别函数的系数重心判别函数的系数每个个体实际所在的类,未分类的按计算结果判断的类别

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 建筑/环境 > 施工组织

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号