列联表ppt课件

上传人:汽*** 文档编号:567602482 上传时间:2024-07-21 格式:PPT 页数:34 大小:753.50KB
返回 下载 相关 举报
列联表ppt课件_第1页
第1页 / 共34页
列联表ppt课件_第2页
第2页 / 共34页
列联表ppt课件_第3页
第3页 / 共34页
列联表ppt课件_第4页
第4页 / 共34页
列联表ppt课件_第5页
第5页 / 共34页
点击查看更多>>
资源描述

《列联表ppt课件》由会员分享,可在线阅读,更多相关《列联表ppt课件(34页珍藏版)》请在金锄头文库上搜索。

1、第二章 信息分类分析第一节 列联表1逻辑分类法 在分解方法中,分类方法是使用很早,应用很广的一种方法。分类方法的基本思路是:按照事物属性的异同将事物区别、划分为不同的种类,因此,类是具有某种共同属性的集合。 分类作为一种认识事物、区别事物的方法已有几千年的历史了。一般来说,实用的分类方法都是将事物区别为具有一定从属关系的不同层次的大小类别,形成概念系统,反映客观事物的联系和区别。2逻辑分类的原则 从方法的角度看,逻辑分类法所规定的逻辑原则是进行分类的基础。进行分类,应遵循以下逻辑原则:每个层次的分类必须按同一标准或准则进行。必须按照事物的属种包含关系分层次进行。分类得到的种与种之间必须是不相容

2、的,即相互独立的。分类所产生的种的概念外延之和必须等于概念的外延。3属性数据n为了某种目的通过调查表进行社会调查得到的数据调查数据一般是属性数据即在许多调查研究中,所得到的信息是样本中个体的分类,而不是定量变量的值n例如,在某次市场调查中,根据人们的性别、学历、对某种商品的喜好等,将他们分类n在某次政府调查中,根据公司的产品类型、公司的所在地区、及产品是否出口,将这些公司分为不同组4一维多项分类分析一维多项分类分析 n将总体按照某种特性分为A1,A2,Ak,计k个类型,每一个体仅属于其中一个类型,总体中属于k个类型的比例P1,P2,Pk。现从总体中随机抽查n个样本单位,其中属于类Ai有ni个,

3、i=1,2,k。现作原假设: P1 = P2 = Pk 。 5一维多项分类分析一维多项分类分析 n定义统计量当n 充分大时,统计量服从自由度为k-1的的2分布。式中, 为属于类的期望频数,pi为属于Ai类的样本频率。6一维多项分类分析一维多项分类分析n给定显著性水平a,如果 , 则拒绝H0,即k个类型之间有显著差异(或者说至少有一个类型与其他类型不同);如果 ,则接受H0 ,即k个类型之间没有显著差异。7一维多项分布的性质 多项分布是二项分布的扩展,可以看成是多项试验得到的分布。有若干性质:n多项试验由n个相同的试验组成n每个试验的结果都落在k组中的某一组内n某个试验的结果落在某一特定组的概率

4、在试验之间保持不变。且有 n试验是独立的n试验者关心的n1,n2,nk,这里ni等于试验落在组i的数目。注意,n1+n2+nk=n8例2.1n某信息咨询公司受委托调查了解顾客对甲、乙、丙三种品牌矿泉水的喜好程度,随机观察了150名购买者的购买情况,并作如下统计。 问顾客对这三种品牌矿泉水的喜好是否存有差异? 品牌甲乙丙人数6153369n解 本题是一维三项概率分布。 令p1、p2、p3分别表示顾客喜好甲、乙、丙品牌的比例,若顾客对这三种品牌矿泉水的喜好没有差异,则意味着顾客中喜好每种品牌的概率均为1/3,因此,可作假设 n1=61,n2=53,n3=36,n=150 同理 10n此例中,k=3

5、,当=0.05时 由于 ,拒绝 H0,即认为顾客对三种品牌的矿泉水喜好确实是有差异的。实际案例(冰茶) 11列联表分析列联表分析(Contingency Table Anlysis)n按两个及以上特性(标志)对同一事物进行分类,每一特性将事物分为若干个组,利用这样的数据分析特性之间有无关系,称为多维多项分析,由于它常借助于列联表进行,所以又称为列联表分析。n列联表主要用于判断定性变量之间是否存在相关关系。 12举例n不同文化程度的人对某一些政策的态度?n不同地区的人与不同的工作作风的态度?n不同培训方法与培训后的业绩增长是否相干?n不同经历的人与他们对事物的看法是否一致?n不同民族与某种习惯是

6、否相关?n不同层面的客户偏好与产品不同包装是否相关?n不同收入阶层对猪肉涨价的态度?13列联表原理n在利用列联表进行分析时,首先表示出列联表,列联表实际上是一个交叉的频数表,利用所给频数构造一个卡方统计量,根据样本数据计算得来的卡方值与一定自由度下卡方临界值进行对比,从而判断是否接受原假设。n实质上是品质相关的问题14n列联表分析在处理两个或几个定性变量间是否有真正意义上的独立问题是独具魅力。其原因有三:n1、不必假定所感兴趣的总体服从何种分布;n2、列联分析适合于处理分类型变量间的关系而且简单直观;n3、社会调查等大样本正好与列联分析的要求相吻合.n主要介绍二维列联表分析15二维列联表分析n

7、设特性A可以分为a类, 特性B可分为b类。随机观察n个个体,把那些个体的属性A处于类型i,属性B处于类型j的个体数在表中记为nij 。并且, 分别是属性A 处于类型j的个体数(列)和属性B处于类型i的个体数(行)。 pij记为属性A、B分别处于类型i、j的概率数,现作原假设H0:A、B两特性独立。如果为真,则H0: (i=1,2,a; j=1,2,b)n其中, 为属性A处于类型i的概率, 为属性B处于类型j的概率。 16特征A合计A1A2 Aj Aa特征BB1n11n12 n1j n1an1.B2n21n22 n2j n2an2.:Bbnb1nb2 nbj nbanb. 合计n.1n.2 n.

8、j n.an列联表17特征A合计A1A2 Aj Aa特征BB1p11p12 p1j p1ap1.B2p21p22 p2j p2ap2.:Bbpb1pb2 pbj pbapb. 合计p.1p.2 p.j p.a1概率分布表18二维列联表分析n统计上已经证明,在n很大并且 5时候,有统计量 式中,期望频数 ,且H0成立时 。19二维列联表分析n 由于、未知,常用估计值 代替,则理论期望 频数为 。 给定显著性水平a, 当 时,拒绝H0,属性、不独立,存在相关关系;当 时,接受H0,属性、相独立,不存在相关.20二维列联表分析n例2.2一个建筑装饰公司对一个城市三个地区的乔迁居民喜好地板的比例感兴趣

9、,目的是为了决定对这些地区应采用何种营销策略.这个公司的调研部门进行了一项调查,结果见下表,试证明该城市不同地区的居民对地板的喜好比例是否独立.21首先,应该考虑设定假设:H0:居民对地板的喜好与地区无关H1:居民对地板的喜好与地区有关地 区合计123地板面料地板6912616211其他789927204 合计1472254341522n如果H0成立,说明居民对地板的喜好与地区无关,即居民对地板是否喜好与地区独立.n记:A=居民来自地区1, B=居民喜好地板,则P(AB)=p11,如果H0成立,则A与B独立,于是P(AB)=P(A) P(B),而P(A) =p.1, P(B)=p1. ,从而H

10、0成立,必须有p11 = p1. p.1n同理p12 = p1. p.2 , p21 = p2. p.1n故H0可表达成: H0: p ij = pi. p.j H1:上述等式至少有一个不成立23得到的期望频数(红色数字)矩阵地 区合计123地板面料地板6974.74126114.41621.86其他7872.2699110.62721.14 合计24然后根据前面分类数据的 统计量来比较每一类的观察频数和估计的期望频数.25n如果 统计量很大,则拒绝零假设.而 统计量接近服从 分布,自由度为(b-1)(a-1),其中b和a分别为列联表的行和列.因此,比较计算得到的统计量和临界值.n结论为:居民

11、对地板的喜好程度在不同地区是不一样的,从而销售部门应有针对性地进行宣传.26n例2.3某市商业系统为提高商业服务质量,对本市的四大商场进行调查,收回有效问卷443张。每张问卷对各商场按照优中差三种服务质量评价,其结果用34列联表表示出来,如表所示。试分析四个商场的服务质量评价是否一致? 27二维列联表分析 商场绩效ABCD合计优81464967243中38333926136差257201264合计1448610810544328二维列联表分析 期望频数估计表绩效ABCD合计优7947.259.257.6243中44.226.433.233.2136差20.812.415.615.264合计14

12、48610810544329n由上表可以结果计算 ,得到 也算得上很大。故在0.05显著水平上否定H0,即认为四个商场的服务质量的评价是显著不一样的。 EXCEL软件实现过程 SPSS软件实现过程30操作过程如下:操作过程如下: n选择DataWeight Cases,进入Weight Cases对话框。把“频数f”放入Frequency栏中,单击OK按钮。 n从从AnalyzeDescriptiveCrosstabs,进入,进入Crosstabs对话框。对话框。把“商场”放入Row(s)栏:把“经营情况”放入Column(s)栏。 n单击单击Statistics按钮,进入按钮,进入Stati

13、stics对话框对话框。选择Chi-square,单击continue按钮,返回Crosstabs主对话框。 n单击单击Cell按钮,进入按钮,进入Cell Display(格子显示)对话框。(格子显示)对话框。选择Observe、Expected、Row、Column,单击Continue按钮,返回Crosstabs主对话框。 n在主对话框中,单击OK按钮,提交运行Crosstabs过程。 31二维列联表分析n例2.4 在一次社会调查中,以问在一次社会调查中,以问卷方式调查了卷方式调查了901901人的年收入以及对人的年收入以及对工作的满意程度。其中,年收入分工作的满意程度。其中,年收入分为

14、小于为小于90009000元、元、90009000元至元至2400024000元、元、2400024000元至元至3600036000元以及超过元以及超过3600036000元元四档;对工作的满意程度四档;对工作的满意程度B B分为很不分为很不满意、较不满意、基本满意和很满满意、较不满意、基本满意和很满意意4 4档。调查结果可以用档。调查结果可以用4 44 4列联表列联表表示如下:表示如下: 32例2.4 工作满意程度年收入很不满意较不满意基本满意很满意合计360007185492171合计6210831941290133nSPSS软件实现n补充说明:列联表各单元格中期望频数大小的问题。若有两个单元格,则每个单元格期望频数必须是5或5以上。若有两个以上单元格,如果20%的单元期望频数小于5,则不能应用2检验。否则,根据2统计量构造公式可知:若期望频数过小,则2统计量会不适当地增大,造成错误结论。处理方法是将较小期望频数的单元格合并。 34

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 其它相关文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号