第 章 计数数据的统计分析:二项式检验及卡方分析

上传人:桔**** 文档编号:489969252 上传时间:2023-08-23 格式:DOCX 页数:20 大小:61.22KB
返回 下载 相关 举报
第 章 计数数据的统计分析:二项式检验及卡方分析_第1页
第1页 / 共20页
第 章 计数数据的统计分析:二项式检验及卡方分析_第2页
第2页 / 共20页
第 章 计数数据的统计分析:二项式检验及卡方分析_第3页
第3页 / 共20页
第 章 计数数据的统计分析:二项式检验及卡方分析_第4页
第4页 / 共20页
第 章 计数数据的统计分析:二项式检验及卡方分析_第5页
第5页 / 共20页
点击查看更多>>
资源描述

《第 章 计数数据的统计分析:二项式检验及卡方分析》由会员分享,可在线阅读,更多相关《第 章 计数数据的统计分析:二项式检验及卡方分析(20页珍藏版)》请在金锄头文库上搜索。

1、第章计数数据的统计分析:二项式检验及2分析第一节二项实验与二项分布一二项实验二项实验的任务是,让被试根据某种原则把两类事物分开,或者把事物分为两种类别。 例如,呈现给被试两条长度相差不多的线段,让被试选出较长的一条;呈现两个强度相差不 大的声音,让被试分辨哪个声音强一些。在这样的实验中,研究者想明确被试的正确判断是 反映出他真的具有某种辨别能力,还是反映出猜测的结果。二项实验通常需要进行多次,每 次实验结果只有两种可能,即正确与错误或者是某种情况与非某种情况。当多次实验结果的 正确次数超过一定数量,即仅凭机遇得到这种结果的概率很小的时候,我们就有理由相信被 试具备某种判断力。假定某人声称自己有

2、“千里眼”功能,可以看到封闭容器里的东西。心理学家要对此进 行验证,可以使用二项实验方法,每次向被试呈现两个一模一样的密封盒子,其中一只盒子 里有东西,让被试判断东西在哪只盒子里。如果被试没有其声称的“千里眼”功能,他仅凭 机遇一次判断正确的概率为1/2,二次实验都判断正确的概率为1/2*1/2, n次实验都正确的 概率为(1/2)n。假设我们做了 5次这样的实验,仅凭机遇,5次判断都正确的概率已经小 于0.05。如果被试5次都正确的话,我们就可以相信他有“千里眼”功能了。对上述二项实验,我们可以改变设计方法,用多个密封盒子,比如用3个,其中有一只 盒子里放东西,让被试判断东西在哪只盒子里。这

3、时,仅凭机遇,被试一次判断正确的概率 变为1/3, n次都正确的概率为(1/3户。另外,我们也可以用多个密封盒子,比如5个,在其 中两个盒子里放东西,让被试选择出一只放有东西的盒子。这时,仅凭机遇,被试一次选择 正确的概率为2/5, n次选择都正确的概率为(2/5)兀二二项实验的基本条件二项实验每次呈现的实验刺激并非一定要求是两个,可以是一个,二个或者多个,被试 任何一次的反应只能有两种结果,即成功与失败,或者A与非A。上述是二项实验的基本 条件之一。二项实验第二个基本条件是,要有n次实验,n是预先给定的任一正整数。心理学家要 通过二项实验及二项分布知识进行假设检验工作,通常需要将设计好的二项

4、实验进行反复多 次的实验,然后根据二项实验结果随机分布的概率模型,计算被试反应结果凭机遇可能性的 大小,从而推测被试是否具有某种判断能力。二项实验第三个基本条件是,各次实验之间要相互独立,也就是说各次实验之间不能相 互产生影响。如果实验假设某此实验被试选择了刺激1或对刺激1做出了反应,那么接下来 的实验就不能再选择刺激1或对刺激1做出反应。这样的设定造成实验之间的相互影响,不 符合二项实验的基本条件。二项实验第四个基本条件是,每次实验其成功或失败概率恒定,即n次实验的成功概率 或失败概率相同,并且每次实验成功与失败概率和为1。这个条件很重要,如果每次实验成 功概率不等,那么实验结果就无法用二项

5、分布公式来解释。例如在“千里眼”问题的实验中, 如果我们设计了 5只盒子,只在其中一只里放东西,并让被试做判断,那么在接下来的各项 试验中,就不能再做变化,保证各次实验成功概率都为1/5。根据二项实验的条件,能力测验或知识测试的选择题通常也可以设计为二项实验,用二 项分布知识回答被试是否具有某项能力或者某方面的知识。例如有10道单选题,每题都有 相同数量的选项,假如5项仅有一个选项正确,仅凭机遇选对一题的概率都为1/5,这10 道单选题测验可以看成一个n=10的二项实验。再例如,有10道多选题,每题都有相同数 量的选项,假定有5个选项,每项只有一种正确选择,仅凭机遇选对一题的概率都为 1宁(C

6、1 + C2 + C3 + C4 + C5)=1/31,这10道多选题测验也可以看成一个n=10的二项实验。55555三二项实验各种成功次数的概率分布二项分布是用来描述二项实验各种成功次数的概率分布情况的,例如有一个重复n次的 二项实验,仅凭机遇对0次至n次的概率所形成的分布为二项分布。由于二项分布描述自然 数的概率,因此属于离散型数据概率分布。二项分布有何规律性?让我们首先看看n=2和 n=3的二项实验情形。设定p为二项实验每次仅凭机遇判断正确的概率,q为失败概率,当p=q=1/2并且n=2 时,凭机遇该二项实验有下述各种可能结果:对对(第一次对、第二次也对)对错、错对、 错错。因此,仅凭机

7、遇两次都对的概率为l/2X1/2=1/4,对一次的概率为1/2X1/2+1/2X 1/2=1/2,对0次的概率为(即两次皆错的概率)l/2X1/2=1/4。对2次、1次、0次的概率 正好分别是二项式(1/2+1/2) 2展开的三项值,即(1/2+1/2) 2=1/4+1/2+1/40当p=q=l/2并且n=3时,凭机遇此二项实验有下述各种可能结果:对对对、对对错、对 错对、错对对、错错对、错对错、对错错、错错错8种情况,3次实验对3次的概率为1/2 X 1/2 X 1/2=1/8,对 2 次的概率为 1/2x1/2x1/2 +1/2x 1/2x1/2 +1/2x 1/2x 1/2=3x 1/8

8、, 对1次的概率也为3x1/8,对0次的概率为1/8,对3次、2次、1次和0次的概率正好分 别是二项式(1/2+1/2)3展开的四项值,即:1 1 1 1 (p + q)3 =C0p3 + C1 p2q1 + C2piq2 + C3q3 = - + 3 x - + 3 x - + -。对于任何二项实验,设定p和q,以及实验的次数n,仅凭机遇对n次至0次的概率正 好是二项式(p + q) n展开式对应的各项值,即:(p + q)n = C0 pnq 0 + C1 pn-1q1 + . + Cn-1 p1qn_1 + C n p 0 qn = Cxpn_xqx (x=0,1.n )。nnnnnx=

9、0四二项分布的应用以“千里眼”问题为例,为明确某人是否有“千里眼”功能,心理学家设计4只密封盒 子,在1只盒子里放东西,让被试判断东西在哪只盒子里,实验共做10次,凭机遇每次判 断正确的概率为1/4,即p=1/4, q=3/4。根据二项分知识,10次皆对的概率为:C;0p10q0=(1/4)10=0.00000095, 9 次对的概率为 0.000029, 8 次对的概率为 0.00039, 7 次对 的概率为0.0031 , 6次对的概率为0.016, 5次对的概率为0.058。被试判断正确6次及以上 的概率为 0.016+0.0031+0.00039+0.000029+0.00000095

10、=0.0195,即被试仅凭机遇能够判断 6 次及以上正确的概率仅为0.0195,低于0.05显著水平。通过实验,如果被试判断正确次数 为6次或者超过6次,我们就可以做出统计结论:被试具有“千里眼”功能。当然,被试也 有可能凭机遇碰巧猜对6次或6次以上,但这样可能性很小,概率低于5%。如果被试真的 是碰巧猜对6次或6次以上,那么我们就犯下统计错误,但犯下这种错误的概率很低,小于 5%。第二节用正态分布模型求解二项分布概率一二项实验数据符合正态分布的条件二项实验数据可以用二项分布知识解释,二项分布是离散型数据分布,其概率直方图是 跃阶式的。当p=q时,图形对称,当p工q时,直方图呈偏态。如果二项分

11、布满足pvq,且np、5 (或者pq,且nq 5)时,二项分布接近正态分布, 可以用正态分布知识求解二项分布的概率。这时x变量(即n次二项实验仅凭机遇正确判断 的次数)具有如下性质:无数被试参与该二项实验,总体正确判断次数的平均值卩=np,标 准差=npq,且x变量的分布于卩=np, npq的正态分布接近。在此需要提示注意 的是,接近的概念不是说x变量的分布与对应卩=np,=5,所以二项分布接近正态分布,对应正态分布的卩=np=10x 1/2=5, = npq=1.58。依据正态分布概率(查表可知)Z=1.645时,该点一下包含了全体的95%,该点的原始分值x=卩+1.645 =7.6。这意味

12、,在此正态分布中,大于7.6分值的概率小于5%。由于二项分布为离散分布,不可能有7.6次正确判断次数,取x值为8时,在此二项分布中, 大于8分值的概率同样小于5% (取x值为7时,大于7分的概率大于5%,因此不能取x 值为7)。通过正态分布计算,被试猜对8次及以上的概率小于5%,因此,可以推测说,猜 对8次及以上者,仅凭机遇的可能性小于5%,此概率很小,我们有理由相信这样的人有“千 里眼”功能。利用正态分布求解二项分布概率,只有在满足相关条件的时候才可以这么做。如果条件 不满足,我们只能老老实实通过二项分布求解概率。例如在二项分布应用的题目中,=1/4, n=10, np=2.5 5,此时二项

13、分布与正态分布相差甚远,不能再用正态分布求解概率了。第三节百分比及百分比差值检验二项实验的数据,有时是用比例来表示的。另外,在二分变量的调查研究中,属于定义 情况的个案数量通常也是用比例来反映的。上述比例表示的变量都是只有两种类别的分类变 量,本节内容主要介绍此类型数据的推论分析。一百分比检验百分比检验适用于处理单一样本或一种条件下二分变量比例的研究结果。例如,有人声称大白鼠有右转弯的偏好。动物心理学家用T型迷津做研究,发现一只大白鼠64次实验中, 有42次向右转,右转百分比为65.6%。根据这个二项实验结果,能不能说大白鼠有右转弯 偏好(注:实验控制好了其他额外变量)。再例如,某糖果厂为孩子

14、试制了两种图案不同的 糖果包装纸去征求孩子的意见,在一个包含200个孩子的样本中,有140个孩子喜欢甲种包 装纸,喜欢甲种包装纸的人数占调查总人数的70%。根据这个调查结果,是否可以说孩子 对甲种包装纸有所偏爱呢?上述两个例子就涉及到百分比分析问题。(一)样本百分比分布比例和频数是可以互换的,比例分布实际上属于二项分布。当样本容量较小时,可以 用频数进行二项式检验,比例进行的检验通常用于处理大样本情况。在大样本情况下,常用 正态分布表示二项分布的近似值。假设总体具有某种属性的比例为p,不具有某种属性的概率为q,从该总体随机抽取容 量为n的样本,可以计算出样本具有某种属性的个案比例,用p,表示容

15、量为n的样本中具 有某种属性的个案所占比例,当nP5(pq)时,样本比率p的分布接近一个 正态分布,该正态分布的平均数和标准差的计算方法见公式(6.1)和(6.2)。公式(6.1) 和(6.2)同频数表示的二项分布接近的正态分布参数计算公式有联系,是在原公式的右边 分别除以n,完成将频数转换为比率。(6.1)(6.2)(二)总体比例的区间估计对于一个无限总体或非常大的总体,要想了解其总体具有某特征的比例,我们通常采取 随机抽样的方法抽取一个样本并计算出样本比例,然后根据样本比例符合的统计模型来说明 总体比例的置信区间,这点很像平均数的区间估计。前面我们刚刚介绍了,当样本量足够大 时,nP5时,样本比例分布可以借助正态分布模型来说明。根据正态分布的知识,总体比 例的置信区间可由公式(6.3)计算。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文 > 其它学术论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号