统计心理-第十章-卡方检验-PPT课件

上传人:枫** 文档编号:567620728 上传时间:2024-07-21 格式:PPT 页数:56 大小:664.50KB
返回 下载 相关 举报
统计心理-第十章-卡方检验-PPT课件_第1页
第1页 / 共56页
统计心理-第十章-卡方检验-PPT课件_第2页
第2页 / 共56页
统计心理-第十章-卡方检验-PPT课件_第3页
第3页 / 共56页
统计心理-第十章-卡方检验-PPT课件_第4页
第4页 / 共56页
统计心理-第十章-卡方检验-PPT课件_第5页
第5页 / 共56页
点击查看更多>>
资源描述

《统计心理-第十章-卡方检验-PPT课件》由会员分享,可在线阅读,更多相关《统计心理-第十章-卡方检验-PPT课件(56页珍藏版)》请在金锄头文库上搜索。

1、 第十章第十章 单因素因果关系研究单因素因果关系研究自变量自变量数据类型数据类型因变量因变量数据类型数据类型统计方法统计方法连续连续连续连续连续连续连续连续类别(类别(2水平)水平)平均数差异检验(平均数差异检验(t, Z)点二列相关,二列相关点二列相关,二列相关类别(类别(3水平)水平)方差分析(方差分析(F检验)检验)多列相关多列相关类别类别类别类别积差相关积差相关一元回归一元回归 第十章第十章 心理学研究中,有时研究变量是按一定的性质划分为心理学研究中,有时研究变量是按一定的性质划分为不同类别,然后统计不同类别,然后统计各类别中的人数或个数各类别中的人数或个数,即需要用到,即需要用到计数

2、资料计数资料。例如,将人按照。例如,将人按照性别性别划分为划分为“男男”、“女女”;将学习成绩划分为将学习成绩划分为“优优”、“良良”、“中中”、“差差”四个四个等级等级等,然后对各类别分别有多少、占多大比例等问题进等,然后对各类别分别有多少、占多大比例等问题进行分析。行分析。 对这些对这些计数资料计数资料的统计分析,不能用前几章的统计方法,的统计分析,不能用前几章的统计方法,则需要使用本章所介绍的则需要使用本章所介绍的 。应用。应用 分析计数数分析计数数据时,据时,对计数数据总体的分布形态不作任何假设对计数数据总体的分布形态不作任何假设,因此,因此 被视为是被视为是非参数检验非参数检验方法的

3、一种。方法的一种。第一节第一节 检验检验 概述概述一、一、 和和 检验的意义检验的意义 方法能处理方法能处理一个因素一个因素两项或多项分类的实际两项或多项分类的实际观察频数与理论频数分布是否相一致问题,或者说有无显观察频数与理论频数分布是否相一致问题,或者说有无显著差异问题。著差异问题。 所谓所谓实际频数实际频数简称实计数或实际数,是指在实验或调简称实计数或实际数,是指在实验或调查中得到的计数资料,又称为观察频数。查中得到的计数资料,又称为观察频数。 理论次数理论次数是指根据概率原理、某种理论、某种理论次是指根据概率原理、某种理论、某种理论次数分布或经验次数分布计算出来的次数,又称为期望次数。

4、数分布或经验次数分布计算出来的次数,又称为期望次数。第一节第一节 检验检验 概述概述第一节第一节 检验检验 概述概述第一节第一节 检验检验 概述概述第一节第一节 检验检验 概述概述第一节第一节 检验检验 概述概述第一节第一节 检验检验 概述概述第二节第二节 配合度检验配合度检验一、配合度检验的意义一、配合度检验的意义 配合度检验是应用配合度检验是应用 检验方法的一种,主要用于检验方法的一种,主要用于检验实检验实际观测次数与某理论次数是否有差别的情况际观测次数与某理论次数是否有差别的情况。它适用一个因素。它适用一个因素多项分类的计数资料,所以又称做单因素分类多项分类的计数资料,所以又称做单因素分

5、类 检验或单向表检验或单向表的的 检验。检验。第二节第二节 配合度检验配合度检验一、配合度检验的意义一、配合度检验的意义 进行配合度检验,应当注意进行配合度检验,应当注意自由度的确定自由度的确定和和理论次数的理论次数的计算计算。1. 配合度检验自由度确定与下列两个因素有关:配合度检验自由度确定与下列两个因素有关: 一是实验或调查中分类的项数;一是实验或调查中分类的项数; 二是计算理论次数时,用到的统计量的个数。二是计算理论次数时,用到的统计量的个数。 自由度自由度=资料分类数目计算理论次数时所用的统计量个数资料分类数目计算理论次数时所用的统计量个数2. 理论次数的计算,一般是根据某种理论,按一

6、定的概率通理论次数的计算,一般是根据某种理论,按一定的概率通过样本即观测次数计算。通常用到无差假说、正态分布、二过样本即观测次数计算。通常用到无差假说、正态分布、二项分布等理论模型。项分布等理论模型。二、无差假说的检验二、无差假说的检验无差假说无差假说是指各项分类的次数没有差异,即假是指各项分类的次数没有差异,即假设各项分类之间的机会均等,或概率相等。因设各项分类之间的机会均等,或概率相等。因此,理论次数完全按概率相等的条件计算,其此,理论次数完全按概率相等的条件计算,其公式为:公式为:例例8 随机抽取随机抽取60名学生,问他们高中要不要文理分科,回答赞名学生,问他们高中要不要文理分科,回答赞

7、成的成的39人,反对的人,反对的21人,问对分科的意见有无显著差异?人,问对分科的意见有无显著差异?解:解:例例9 大学某系大学某系54位老年教师中,健康状况属于好的有位老年教师中,健康状况属于好的有15人,中等的有人,中等的有23人,差的有人,差的有16人,问该校老年教师中三人,问该校老年教师中三种健康状况的人数是否一样?种健康状况的人数是否一样?解:解:三、频数分布是否符合正态性的三、频数分布是否符合正态性的 检验检验 检验还可以检验某些实得次数是否合乎正态分布。检验还可以检验某些实得次数是否合乎正态分布。不过,在计算时,要注意把正态分布的概率,转换为不过,在计算时,要注意把正态分布的概率

8、,转换为理论次数的数值。即要用正态分布的概率乘以总次数理论次数的数值。即要用正态分布的概率乘以总次数得出理论次数的分配。得出理论次数的分配。例例10 对对50名学生进行操行评定,分优、良、中、差四名学生进行操行评定,分优、良、中、差四等,评定的结果是:优等,评定的结果是:优7人,良人,良22人,中人,中18人,差人,差3人,人,试检验其分布的形式是否合乎正态分布?试检验其分布的形式是否合乎正态分布?例例10 的计算:的计算:概率P优良中差合计解:正态分布的基线上四等份,每等份解:正态分布的基线上四等份,每等份=(3+3)/4=1.5例例10 的计算:的计算:概率P优73.53.53.5良222

9、1.50.50.01中0.431821.5-3.50.57差0.0733.5-0.50.07合计50504.15解:正态分布的基线上四等份,每等份解:正态分布的基线上四等份,每等份=(3+3)/4=1.5例例10的计算的计算(续续)由上表得由上表得:四、连续变量分布的拟合度检验四、连续变量分布的拟合度检验理论次数:理论次数:自由度:自由度:例例11 表表12-5所列资料是所列资料是552名中学生的身高次数分。名中学生的身高次数分。问这些学生的身高是否符合正态分布?问这些学生的身高是否符合正态分布?例例11解解:表表12-5 理论曲线的配合度检验理论曲线的配合度检验身高分组组中值XC实际次数离差

10、Z分数查表Y169-166-163-160-157-154-151-148-145-142-139-例例11解解:表表12-5 理论曲线的配合度检验理论曲线的配合度检验身高分组组中值XC实际次数离差Z分数查表Y169-166-163-160-157-154-151-148-145-142-139-17016716416115815515214914614314027225711012411280258415.3812.389.386.383.380.38-2.62-5.62-8.62-11.62-14.623.032.441.851.260.67.07-0.52-1.11-1.70-2.29-

11、2.880.004.00203.0720.1840.3187.3979.3484.2154.0940.0289.0067.00237.01201.04260.10888.18858.23544.20615.12746.05562.01710.00396172460104130114703192.167.150.471.277.0351.4291.161例例11 解(续)解(续)如果两端的组中的理论次数均有小于如果两端的组中的理论次数均有小于5的,则需要将相的,则需要将相邻的理论次数合并至大于邻的理论次数合并至大于5。本题共分。本题共分11组,两端均有组,两端均有理论次数小于理论次数小于5,上端

12、二组合并为一组,下端二组合并,上端二组合并为一组,下端二组合并为一组,然后将实际次数也相应合并之后,再求为一组,然后将实际次数也相应合并之后,再求 值,值,本题由上面解得:本题由上面解得: 。df=9-3=6,查,查 值表得:值表得:因为因为3.9030.05,差异不显著。,差异不显著。故这故这552名中学生的身高分布符合正态分布。名中学生的身高分布符合正态分布。五、两项分类且某类理论次数小于五、两项分类且某类理论次数小于5的校正的校正当只有两项分类(自由度为当只有两项分类(自由度为1)并且某项的理论次数小于)并且某项的理论次数小于5时,若用时,若用 检验,就要运用耶茨(检验,就要运用耶茨(Y

13、ates)连续性校正法,)连续性校正法,即在每一组实际频数与理论频数差数的绝对值平方之前,即在每一组实际频数与理论频数差数的绝对值平方之前,各减去各减去0.5,用公式表示:,用公式表示: 例例12 有一学校共评出有一学校共评出10名优秀学生班干部,其中男生名优秀学生班干部,其中男生3名,名,女生女生7名,问优秀学生班干部是否存在男女性别差异?名,问优秀学生班干部是否存在男女性别差异?解:假设无性别差异,则解:假设无性别差异,则p=q=0.5,那么男女应各有,那么男女应各有5人,这人,这时需要使用耶茨校正公式。时需要使用耶茨校正公式。例例13 历年优秀学生干部中男女比例为历年优秀学生干部中男女比

14、例为2:8,今年优秀学生干,今年优秀学生干部中有部中有3个男生,个男生,7个女生,问今年的优秀干部比率与往年是个女生,问今年的优秀干部比率与往年是否有显著差异?否有显著差异?第三节第三节 独立性检验独立性检验独立性检验也是独立性检验也是 检验的又一重要应用,它检验的又一重要应用,它主要用于两个或两个以上因素多项分类的计数主要用于两个或两个以上因素多项分类的计数资料分析。如果想研究两个(或两个以上因素)资料分析。如果想研究两个(或两个以上因素)之间是否具有独立性或有无关联,就要用之间是否具有独立性或有无关联,就要用 检验独立性检验。检验独立性检验。如果两个因素是独立的,即无关联,就意味着如果两个

15、因素是独立的,即无关联,就意味着当其中一个因素变化时,另一个因素的变化是当其中一个因素变化时,另一个因素的变化是在取样误差的范围之内;反之,如果两个因素在取样误差的范围之内;反之,如果两个因素是非独立,即有关联或称有交互作用存在,当是非独立,即有关联或称有交互作用存在,当其中的一个自变量(因素)变化时,另一个因其中的一个自变量(因素)变化时,另一个因素的变化就超过了取样误差的范围。素的变化就超过了取样误差的范围。一、独立性检验的一般问题一、独立性检验的一般问题 检验主要研究两个因素或两个以上因素多项分类的计数资料的独立性问题。如果两个因素中的一个因素有R类,另一个因素有C类,这种表称之为RC表

16、,即二维列联表。特殊的列联表是22表。因素若是多于两个,这种表称为多维表,多维列联表的分析较为复杂,本节从略,这里仅介绍二维列联表的 检验。一、独立性检验的一般问题一、独立性检验的一般问题二维列联表的独立性检验的一般步骤:1.建立假设:H0:二因素之间是独立的或无关联;H1:二因素之间是有关联的或者说差异显著。(一般多用文字表述而很少用统计符号)2.计算理论次数:3.确定自由度:4.计算统计量:具体方法下面逐一介绍之。5.统计决断二、22列联表(四格表)独立性检验独立样本四格表的 检验:四格表独立样本,即从总体中随机取样,然后按两个因素对个体进行分类,将观测结果分别填入四个格内,便得到独立样本

17、四格表,当各格的理论次数 时,可用基本公式(12-11),即:例14 今随机抽取90人,按男女不同性别和学生学习水平两个因素进行分类,结果如下表所示,问男女学生学业水平有无显著 差异?或问性别与学业之间有无关联?中等以上中等以下合 计男23(a)17(b)40(a+b)女28(c)22(d)50(c+d)合计51(a+c)39(b+d)90(a+b+c+d=N)例14的计算解:二、22列联表(四格表)独立性检验相关样本四格表的 检验:相关样本比率差异的显著性检验公式:当df=1时,式中:b、c是四格表中分类项目不同的格内数字故相关样本四格表 检验公式为:例15 124个学生1000公尺长跑,训

18、练一个月后前后两次测验达标情况如下表,问一个月的训练是否有显著性效果 第二次测验达标未达标第一次测验达标61(a)19(b)未达标33(c)11(d)例15计算解:建立假设:H0:一个月长跑训练无显著效果; H1:一个月长跑训练有显著效果计算检验统计量:统计决断:查表得:因为3.770.05,接受H0,差异不显著。故一个月长跑训练无显著效果。(三)四格表 的校正当四格表中任一格的理论次数小于5时,用亚茨连续性校正公式:对于独立样本四格表:对于相关样本四格表:例16某校将参加课外阅读活动的15名学生与未参加课外阅读活动的15名学生,根据各方面条件基本相同的原则进行配对,测得他们的阅读理解能力如下

19、表,问课外阅读活动对提高阅读理解能力是否有良好的作用。参加课外阅读活动良非良未参加课外阅读活动良3(a)1 (b)非良9 (c)2 (d)例16的计算解:建立假设:H0:课外活动对阅读理解能力的提高没有什么作用;H1:课外活动对阅读理解能力的提高有良好作用。计算检验统计量:统计决断:查表得:因为4.903.84,所以P0.05,拒绝H0,而接受H1,差异显著。故课外活动对阅读理解能力的提高有良好作用。(四)四格表的费舍精确概率检验方法在理论次数小于5时,除可以用使用 校正公式外,还可以采用费舍(Fisher)精确概率检验法。费舍精确概率检验法的基本原理是:在边缘次数固定的情况下,观测数据的精确

20、概率分布为超几何分布。如果两个变量是独立的,当边缘次数保持不变时,各格内的实计数a,b,c,d。任何一特定排列概率p是:四格表的费舍精确概率检验方法在边缘次数不变的情况下,用公式(12-18)计算出各格内实计数排列的概率,以及实计数最小的那一格的数字依次变化至零时, 所有排列的概率和。然后将概率和与显著性水平相比较,若p,则说明超过了独立性样本各格实计数的取样范围,就可以推论说,两样本独立的假设不成立,可说两样本之间存在相关。下面以表12-9的数据来说明四格表的费舍(Fisher)精确概率检验法。(四)四格表的费舍精确概率检验方法P=p0+p1+p2+5276247 6 (A) 6176157

21、 6 (B)7076067 6 (C)四格表的费舍精确概率检验方法概率和为:三、 列联表独立性检验上述四格表检验是 列联表独立性检验的一个特例,一般情况下是 列联表的独立性检验。其目的是判断两种分类特征是否有依存关系。例17 家庭经济状况属于上、中、下的高三毕业生,对于是否愿意报考师范院校有三种不同的态度(愿意、不愿意、未定),其人数分布如下表。问学生是否愿意报考师范院校与家庭经济状况有无关系?家庭经济状况对报考师范院校的态度总和愿意不愿意未定上18(20.53)27(19.43)10(15.03)55中20(22.03)19(20.85)20(16.13)59下18(13.44)7(12.7

22、2) 11(9.84) 36总和565341150例17的计算解:建立假设:H0:学生是否愿意报考师范院校与家庭经济状况没有关系; H1:学生是否愿意报考师范院校与家庭经济状况有关系计算检验统计量:例17的计算(续)统计决断:df=(R-1)(C-1)=(3-1)(3-1)=4,查表得:四、品质相关(一)四分相关1.适用资料两因素本身都是连续的正态变量人为划分两种不同类别这类四格表大都用于同一个被试样本中,分别调查四个不同因素两项分类的情况。(相关四格表) A 非Aa+bc+d B 非Babcd a+c b+d2.计算公式皮尔逊余弦法:或:(书上有误)例18 下表所列数据是调查378名学生两科

23、测验成绩,设两科成绩分布为正态,只是人为地将其按一定标准划分为及格、不及格两类。求两科成绩的关联程度。物理成绩A总和及格不及格数学成绩B及格a=125b=68193不及格c=85d=100185 总和210168378例18的计算解:(二) 相关1.适用条件1.除四分相关之外的四格表资料2.计算公式:或:例19 有研究者想了解不同性别的学生对某项教育措施的评价态度,调查了358人,结果如下,问性别与评价态度是否有关?相关度如何? 评价态度总和拥护反对性别男66106172女28158186 总和94264358例19的计算解:先计算 值,即将上表的数据代入公式(12-14):(三)列联相关v1.概念及适用条件v两个因素至少有一个被多项分类v2.相关系数计算:v或:例20 有研究者想研究眼优势与手优势之间是否有关,调查结果如下表所示: 眼优势总和左眼平衡右眼手优势左手346228124平衡27282075右手5710552214 总和118195100413例20的计算解:先计算 值:

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 建筑/环境 > 施工组织

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号