《假设的检定两个变量的相关》由会员分享,可在线阅读,更多相关《假设的检定两个变量的相关(76页珍藏版)》请在金锄头文库上搜索。
1、第十章第十章假设的检定假设的检定 两个变量的相关两个变量的相关第第一一节节n两两个个定定类类变变项项定类或定序ppt上考至少考一个例题定距n 倘若要研究倘若要研究X X与与Y Y这两个变项是否相关,则在这两个变项是否相关,则在抽取了一个随机样本以后便首先运用前面所介绍抽取了一个随机样本以后便首先运用前面所介绍的方法,简化样本中的资料,从而计算的方法,简化样本中的资料,从而计算X X与与Y Y的相的相关程度和方向。但是,即使在样本中关程度和方向。但是,即使在样本中X X与与Y Y是相关是相关的,却可能是由的,却可能是由抽样误差抽样误差所引起,不一定是在总所引起,不一定是在总体中也相关。由于我们所
2、关心的是总体的情况不体中也相关。由于我们所关心的是总体的情况不是样本的情况,因此,需要作统计推论,本章的是样本的情况,因此,需要作统计推论,本章的目的是目的是介绍怎样运用样本的资料来检定假设,在介绍怎样运用样本的资料来检定假设,在总体中总体中X X与与Y Y是相关的。是相关的。n 在介绍计算相关系数时,我们强调要特别注在介绍计算相关系数时,我们强调要特别注意变项的测量层次,同样,在选用相关的检定法意变项的测量层次,同样,在选用相关的检定法时,也要特别注意该检定法所要求的时,也要特别注意该检定法所要求的测量层次测量层次。一、交互分类表中变量的相互独立性一、交互分类表中变量的相互独立性 研究定类变
3、量之间的关系,实际上就是通过研究定类变量之间的关系,实际上就是通过条件分布条件分布的的比较进行的,下面我们首先通过条件分布表来看一看两变项比较进行的,下面我们首先通过条件分布表来看一看两变项的相互独立性。的相互独立性。老老 年年中中 年年青青 年年边缘和边缘和戏曲戏曲20/27=0.7420/27=0.7410/40=0.2510/40=0.252/57=0.042/57=0.0432/124=0.2632/124=0.26歌舞歌舞5/27=0.185/27=0.1820/40=0.5020/40=0.5035/57=0.6135/57=0.6160/124=0.4860/124=0.48球赛
4、球赛2/27=0.082/27=0.0810/40=0.2510/40=0.2520/57=0.3520/57=0.3532/124=0.2632/124=0.26问题是,如何进行比较呢?问题是,如何进行比较呢? 根据上表中的根据上表中的每一行每一行,可以比较三代人的喜爱是,可以比较三代人的喜爱是否有所不同,首先对戏曲来说,三代人的百分比分别否有所不同,首先对戏曲来说,三代人的百分比分别是:是:0.740.740.250.250.040.04; 歌舞为:歌舞为:0.180.180.500.500.610.61; 球赛为:球赛为:0.080.080.250.250.350.35。 可见,随着代际
5、的年轻化,对戏曲喜爱逐渐下降,可见,随着代际的年轻化,对戏曲喜爱逐渐下降,而歌舞和球赛越来越受到欢迎,从而得出节目的喜爱而歌舞和球赛越来越受到欢迎,从而得出节目的喜爱与代际相关的结论,也就是变量与代际相关的结论,也就是变量Y(Y(节目的喜爱节目的喜爱) )与变量与变量X(X(代际代际) )是有关的。是有关的。相关系数计算结果是否如此?相关系数计算结果是否如此?n 现在设想,如果统计的结果显示,三代人的现在设想,如果统计的结果显示,三代人的百分比是不变的,即:百分比是不变的,即:n 戏曲:戏曲:0.740.74、0.740.74、0.740.74n 歌舞:歌舞:0.180.18、0.180.18
6、、0.180.18n 球赛:球赛:0.080.08、0.080.08、0.080.08n 那么,又该作出什么结论呢?那么,又该作出什么结论呢?n 显然,如果选择显然,如果选择“喜爱节目喜爱节目”的比例对于三的比例对于三代人都是一样的话,那就表示变量代人都是一样的话,那就表示变量“节目节目”与变与变量量“代际代际”之间没有关系的,这种情况称变量之之间没有关系的,这种情况称变量之间是间是相互独立的相互独立的。如果变量间是相互独立的话,。如果变量间是相互独立的话,通过上例可以看出,必须存在通过上例可以看出,必须存在变量的条件分布和变量的条件分布和它的边缘分布相同它的边缘分布相同。即:即: X X Y
7、 YX X1 1X X2 2X X3 3 X XC CY Y1 1N N1111N N2121N N3131 N NC1C1N N*1*1Y Y2 2N N1212N N2222N N3232 N NC2C2 N N*2*2Y Yr rN N1r1rN N2r2rN N3r3rN NCrCrN N*r*rN N1 1* *N N2*2*N N3*3*N NC*C*N N用一个通式来表示用一个通式来表示 ,即:,即:(i=1,2(i=1,2 r r,j=1,2j=1,2 c)c) 上式分子分母均乘以上式分子分母均乘以N N: 可见,如果交互类表中的变量是相互独立的,可见,如果交互类表中的变量是相
8、互独立的,边缘分布和条件分布存在以下关系。边缘分布和条件分布存在以下关系。 二、交互分类表二、交互分类表的原假设的原假设n交交互互分分类类表表检检验验是是将将总总体体中中变变量量间间无无关关系系,或或相相互互独独立立作为检验的原假设。即:作为检验的原假设。即:n H H0 0:变量变量x x与与变量变量y y无关(总体)无关(总体)n H H1 1:变量变量x x与变量与变量y y有关(总体)有关(总体)n H H0 0:p pijij =p =pi*i*.p.p*j *j (i=1,2i=1,2c c;j=1,2j=1,2r r)n 由于由于p pi i和和p pj j是总体的边缘分布,一般
9、都是未知的,因此,是总体的边缘分布,一般都是未知的,因此,可以可以用样本中的边缘频率分布作为它的点估计值用样本中的边缘频率分布作为它的点估计值: n 列边缘:列边缘: i=1,2i=1,2c cn 行边缘:行边缘: j=1,2j=1,2c cn 这里小写字母这里小写字母n ni i,n nj j,n n表示样本频次。表示样本频次。三、交互分类表检验的统计量三、交互分类表检验的统计量X X2 2n 运运用用统统计计量量 2 2来来进进行行检检验验。 2 2检检验验要要求求:1 1)样样本本是是用用随随机机方方法法抽抽取取的的;2 2)两两个个变变量量都是有定类的性质。都是有定类的性质。n 交互分
10、类检验的程序和单变量检验是相同交互分类检验的程序和单变量检验是相同的:确定原假设;选择适当的统计量,定出显的:确定原假设;选择适当的统计量,定出显著性水平后根据样本值进行判断。著性水平后根据样本值进行判断。n 交互分类表统计量的确定是通过在原假设交互分类表统计量的确定是通过在原假设成立的条件下,用总体和样本一系列值的比较成立的条件下,用总体和样本一系列值的比较来进行的,具体步骤是:来进行的,具体步骤是:n求出列联表中各格的期望频次求出列联表中各格的期望频次n1 1)原假设:)原假设:H H0 0:p pijij=p=pi*i*.p.p*j*jn用样本的边缘和求出用样本的边缘和求出p pi*i*
11、和和p p*j*jn(式中的第二个符号是根据原假设(式中的第二个符号是根据原假设H H0 0得来的。得来的。n第三个近似是根据边缘频率分布的点估计值得来的。)第三个近似是根据边缘频率分布的点估计值得来的。)E Eijij= =npnpijij= =npnp* *i i.p.p*j*j 于是,在原假设于是,在原假设H H0 0成立条件下成立条件下的期望频次交互分类表有下表的期望频次交互分类表有下表1 1: X X Y YX X1 1X X2 2X XC CY Y1 1Y Y2 2Y Yr rE E1111E E2121E EC1C1E E1212E E2222E EC2C2E E1r1rE E2
12、r2rE ECrCr 不仿设想,在不仿设想,在H H0 0成立的条件下,作无数成立的条件下,作无数次抽样,每次抽样可得到一个实例的频次交次抽样,每次抽样可得到一个实例的频次交互分类表,如下表互分类表,如下表2 2: X X Y Y X X1 1X X2 2X XC CY Y1 1N N1111N N2121N Nc c1 1Y Y2 2N N1212N N2222N Nc c2 2Y Yr rN N1r1rN N2 2r rN Nc cr r 比较表比较表1 1和表和表2 2,可以想象如果总体中,可以想象如果总体中H H0 0为真为真的话,那么实例频次列联表的格值和期望频次列的话,那么实例频次
13、列联表的格值和期望频次列联表中的格值相差不多的可能性较大。反之,如联表中的格值相差不多的可能性较大。反之,如果两表的格值差距很大。果两表的格值差距很大。 上述的讨论可用以下的统计量来表示:上述的讨论可用以下的统计量来表示: 分子取平方是为了取其绝对分子取平方是为了取其绝对差值,而分母差值,而分母E Eijij是为了平衡是为了平衡E Eijij数值本身的大小,否则,如数值本身的大小,否则,如果果E Eijij本身数值很小的话,则本身数值很小的话,则即使即使(n(nijij-E-Eijij) )2 2与与E Eijij 相比已经相比已经很大,但在总平方和中仍然是很大,但在总平方和中仍然是微不足道。
14、微不足道。n 上述统计量,经过数学计算可知,当上述统计量,经过数学计算可知,当n n很大,很大,每格每格E Eijij都不太小,服从自由度都不太小,服从自由度K=(r-1)(c-1)K=(r-1)(c-1)的的 2 2分分布。布。n注意,注意,下面就交互分类表的统计量进行讨论下面就交互分类表的统计量进行讨论:n 1.1.对于对于2 2 2 2表,由于格数过少,为减少偏差,表,由于格数过少,为减少偏差,要作连续性修正,尤其在有某一个或多个格的预期要作连续性修正,尤其在有某一个或多个格的预期次数等于或小于次数等于或小于5 5时必须修正:时必须修正: 2 2. .以上以上 2 2检验的讨论,也适用于
15、单变检验的讨论,也适用于单变量二项总体或多项总体的假设检验。量二项总体或多项总体的假设检验。 n(1 1)二项总体。)二项总体。n 在单总体假设检验中,曾谈到对于大在单总体假设检验中,曾谈到对于大样本总体成数的假设检验,可用:样本总体成数的假设检验,可用:n Z= Z= 作为总体成数的原假设作为总体成数的原假设 nH H0 0:P=PP=P0 0的统计量。的统计量。n 但是通过列联表的讨论,可引出另一件与但是通过列联表的讨论,可引出另一件与 2 2等价的检验方式:改等价的检验方式:改H H0 0:P=PP=P0 0(P(P0 0为总体成数为总体成数) )。n 于是对于样本容量为于是对于样本容量
16、为n n的抽样,其理论上的抽样,其理论上期望频次为:期望频次为:E E1 1=np=np0 0 n 而理论上非期望出现的频次为:而理论上非期望出现的频次为:E E2 2=n(1-=n(1-p p0 0) )。n 与此同时,相对应的实际观测值为与此同时,相对应的实际观测值为n n1 1和和n n2 2(n(n1 1+n+n2 2=n)=n)。n 引用引用 2 2检验有:检验有: n 可以证明,当可以证明,当n n较大时,较大时, 2 2分布近似地为分布近似地为自由度自由度K=1K=1的的 2 2分布,根据连续修正,上述分布,根据连续修正,上述 2 2为:为:(2)多项总体)多项总体n 多项分布是
17、单项二项分布的自然扩展,如果变量多项分布是单项二项分布的自然扩展,如果变量A A共共有有R R类:类:A A1 1、A A2 2、A Ar r。n 设总体种各类的概率为:设总体种各类的概率为:P P1 1、P P2 2、P Pr r。于是总体。于是总体的原假设的原假设H H0 0为:为:H H0 0:P:Pi i=P=Pi0 i0 (i=1,2i=1,2r r)n 对于样本容量为对于样本容量为n n的抽样,其理论是期望频次分布为:的抽样,其理论是期望频次分布为:E Ei i=np=npi0i0。n 与此同时,相对应的各类实际观测值为:与此同时,相对应的各类实际观测值为:n n1 1、n n2
18、2n nr r。 则则 2 2值为:值为:n 可以证明,可以证明, 2 2近似地满足自由度近似地满足自由度K=r-1K=r-1的的 2 2分布。分布。 3.3. 使用统计量使用统计量 2 2对对RCRC表进行检验,每一格表进行检验,每一格值值的的E Eijij要保持在一定数目上。要保持在一定数目上。q 如果其中有的格值如果其中有的格值E Eijij过小,在计算过小,在计算q值时,值时, 2 2值的波动就会过大。值的波动就会过大。q E Eijij应该取多大,根据要求的精确程度不同,不应该取多大,根据要求的精确程度不同,不同研究者给出的限制不同。同研究者给出的限制不同。q 对于二项总体,要求对于
19、二项总体,要求npnp 5 5,n(1-p)n(1-p) 5 5。也就也就是如果只有两个格值的话,必须要求所有是如果只有两个格值的话,必须要求所有E Eijij 5 5。q 有的研究者认为有的研究者认为E Eijij 5 5的要求适合所有的要求适合所有r r c c的交的交互分类表。但也有人认为对于互分类表。但也有人认为对于r r c c 交互分类表,交互分类表,E Eijij 3 3就可以了。另外,还有人指出就可以了。另外,还有人指出E Eijij小于小于5 5的格数的格数不应超过总格数不应超过总格数20%20%,当小于,当小于5 5的格值过多会引起判的格值过多会引起判断的失误。断的失误。举
20、例:设实例值和期望值共有举例:设实例值和期望值共有7 7个格值个格值 。Eij 321138724241nij 301108623554 从直现来判断,实例值和期望值相差不大,从直现来判断,实例值和期望值相差不大,可以接受原有假设。但如何用可以接受原有假设。但如何用 2值进行显著性值进行显著性检验呢?(检验呢?( =0.05=0.05)。)。 检验表明:有显著性差异。检验表明:有显著性差异。 为什么会出现感觉和为什么会出现感觉和X X2 2检验不符的情况呢?主要检验不符的情况呢?主要因为在因为在7 7个格值中就有个格值中就有3 3个期望值小于个期望值小于5 5,占总数的,占总数的43%43%。
21、因此因此 2 2计算值偏大当出现上述情况时,可将期望值偏计算值偏大当出现上述情况时,可将期望值偏小的格值合并。小的格值合并。Eij 32 113 8724 7 nij 30 110 86 23 14 2=临界值:临界值: 接受接受H H0 0,作出直观感觉和作出直观感觉和 2 2检验相符的结论。检验相符的结论。 例:例:某镇研究职业代际流动,调查了某镇研究职业代际流动,调查了共共140人,其结果如下:人,其结果如下:解解:H H0 0:子辈职业与父辈职业无关子辈职业与父辈职业无关 H H1 1:子辈职业与父辈职业有关子辈职业与父辈职业有关得期望频次表得期望频次表4.4. 2 2检验就其检验的内
22、容来看是双边检验,检验就其检验的内容来看是双边检验,就检验的形式来看,又象右边检验。就检验的形式来看,又象右边检验。n 从从上上面面所所举举例例中中的的H H0 0和和H H1 1就就可可以以看看出出,它它所所判判断断的的内内容容仅仅是是变变量量间间是是否否存存在在关关系系。至至于于关关系系的的方方向向,由由于于列列联联表表属属定定类类变变量量,因因此此是是不不存存在在的的。但但从从列列联联表表 2 2的的统统计计量量的的公公式式来来看看,只只有有期期望望频频次次和和实实测测频频次次的的绝绝对对值值愈愈大大,才才能能否否定定变变量量间间关关系系的原假设即:的原假设即: 2 2 2 2。n 因此
23、,列联表检验从形式来看,却又很像右侧单边检验:因此,列联表检验从形式来看,却又很像右侧单边检验:X2(r-l)(c-1)5. 交互分类的检验是通过频次而不是通过相交互分类的检验是通过频次而不是通过相对频次的比较进行的。对频次的比较进行的。表表1 1的的 2 2值:值:表表2 2的的 2 2值值表表3 3的的 2 2值值n如果选择如果选择a=0.05a=0.05,查表得:,查表得: n X X2 20.050.05(1)=3.841=3.84(1)=3.841=3.84n 则表则表1 1判断为无显著性差异,表判断为无显著性差异,表2 2和表和表3 3则判断为有显著性差异,可见,相对频次则判断为有
24、显著性差异,可见,相对频次相同的交互分类表,在统计检验中,其显相同的交互分类表,在统计检验中,其显著性并不相同,特别是当总体中两变量相著性并不相同,特别是当总体中两变量相关并不很大时,如果样本容量较小,很可关并不很大时,如果样本容量较小,很可能呈现无显著性差异,但当样本容量增大能呈现无显著性差异,但当样本容量增大时,时, 2 2将增大,这时虽然列联表的相对频次将增大,这时虽然列联表的相对频次没有改变,但很可能呈现有显著性差异,没有改变,但很可能呈现有显著性差异,这时因为这时因为 2 2的临界值并不变化。的临界值并不变化。 通过上面的例子,可以看出,当样通过上面的例子,可以看出,当样本容量增加本
25、容量增加K K倍时,倍时,由此可见如果相对由此可见如果相对频次不变,当样本容量增加频次不变,当样本容量增加K K倍时,倍时, 2 2值将增加值将增加K K倍。倍。 实际上,这也是容易理解的,因为当样本容量增加之后,实际上,这也是容易理解的,因为当样本容量增加之后,如果仍然保持原有的比例的关系,则说明它出于随机误差的可如果仍然保持原有的比例的关系,则说明它出于随机误差的可能性减少,也就是确认其比例关系的把握增大。这也是为什么能性减少,也就是确认其比例关系的把握增大。这也是为什么相对频次的统计表必须注明调查总数的缘故。相对频次的统计表必须注明调查总数的缘故。例:例:某工厂为了解职工对厂内福某工厂为
26、了解职工对厂内福利是否满意,作如下抽样调查:利是否满意,作如下抽样调查:依依H H0 0及样本边缘次数分布,计算期望频及样本边缘次数分布,计算期望频数数临界值:由于临界值:由于a=0.05 ,k=(2-1)(2-1)=1a=0.05 ,k=(2-1)(2-1)=1nX X2 20.050.05(1)=3.84(1)=3.84n X X2 2=9.27X=9.27X2 20.050.05(1)=3.84(1)=3.84n 拒拒绝绝H H0 0,接接受受H H1 1,即即男男女女职职工工对对厂厂内内福福利利的的满满意意与与否否是是有有显显著著差差异的,显著性水平达到异的,显著性水平达到0.050.
27、05。作业:1 1根根据据某某摊摊贩贩的的上上报报,每每天天平平均均营营业业额额为为5555元元。经经过过6 6天天的的抽抽查查,其其营营业业额额为为(设设营业额满足正态分布):营业额满足正态分布): 59.259.2,68.368.3,57.857.8,36.536.5,63.763.7,57.3 57.3 单位为元单位为元 问问:原原摊摊贩贩上上报报的的数数字字是是否否可可信信 显显著著性水平为性水平为0.050.05?作业 2 2某学校对新生数学成绩进行摸底检查,某学校对新生数学成绩进行摸底检查,自自100100名经济专业的学生中抽出名经济专业的学生中抽出1212份考卷,份考卷,得平均分
28、数为得平均分数为7070分,标准差分,标准差3 3分;自分;自5050名管名管理专业的学生中抽取理专业的学生中抽取1010份考卷,得平均分份考卷,得平均分数为数为6060分,标准差分,标准差4 4分,若已知总体服从正分,若已知总体服从正态分布且方差相等,问两专业学生之数学态分布且方差相等,问两专业学生之数学成绩是否有显著差别成绩是否有显著差别 显著性水平为显著性水平为0.010.01。3 3、为研究两种教学方法的效果,选择了、为研究两种教学方法的效果,选择了6 6对智商、对智商、年龄、阅读能力、家庭条件都相同的儿童进行了实年龄、阅读能力、家庭条件都相同的儿童进行了实验,结果如下表。问:能否认为
29、新教学法优于原教验,结果如下表。问:能否认为新教学法优于原教学法(显著度水平学法(显著度水平=0.05=0.05)配对号配对号新新教学法教学法原教学法原教学法1 1838378 78 2 2696965653 3878788 88 4 4939391915 5787872 72 6 6595959 59 作业4 4、为了研究饮食习惯与地区之关系。作了共为了研究饮食习惯与地区之关系。作了共100人人的随机抽样调查的随机抽样调查资料如下表资料如下表,问饮食习惯是否,问饮食习惯是否与地区有关与地区有关(=0.05)?关系程度如何?关系程度如何?地区饮食习惯南方北方边缘和面食米食10304020406
30、0边缘和5050100第二节第二节等级相关等级相关两个定序变量两个定序变量一、一、r rs s的统计检验的统计检验n斯皮尔曼等级相关系数斯皮尔曼等级相关系数: :n 其中,其中,ddi i2 2=(x=(xi i-y-yi i) )2 2 n n 当当r rs s是是根根据据抽抽样样数数据据计计算算得得来来时时,必必须须进进行行假假设设检检验验,以以确确定定总总体体中中也也存存在在等等级级相关。相关。r rs s的统计检验步骤的统计检验步骤n HoHo:总体中变量总体中变量x x与变量与变量y y等级无关,等级无关,P Ps s=0=0n H1 H1:总体中变量总体中变量x x与变量与变量y
31、y相关,相关,P Ps s00n 根据根据HoHo变量的条件下,不妨设想从总体中抽取无数个样变量的条件下,不妨设想从总体中抽取无数个样本容量为本容量为n n的样本。根据每一个样本,都可以计算出一个样本的样本。根据每一个样本,都可以计算出一个样本的等级相关系数的等级相关系数r rs s。由于抽样误差的存在,各次样本的由于抽样误差的存在,各次样本的r rs s是是不等的,不等的,r rs s是随机变量。可以证明:当是随机变量。可以证明:当n n 1010时,统计量:时,统计量: n 自由度自由度k kf f=n-2=n-2n 正如一般正如一般t t分布所具有的性质,分布所具有的性质,n n 303
32、0,r rs s也可使用统计量也可使用统计量Z Z进行检验,在要求不进行检验,在要求不十分严格的情况下,十分严格的情况下,n n 1010亦可使用亦可使用Z Z值。值。说明说明:n 等级相关适用于等级相关适用于定序变量定序变量,研究的是变量间,研究的是变量间的等级是否存在相互关系。但对于的等级是否存在相互关系。但对于定距变量定距变量,在,在计算相关系数时,如果某些计算相关系数时,如果某些基本条件基本条件不能满足不能满足(如要求变量分布满足正态分布),这时可以降如要求变量分布满足正态分布),这时可以降低变量层次,作为定序变量处理,因为低变量层次,作为定序变量处理,因为等级相关等级相关系数对总体变
33、量分布不作要求的系数对总体变量分布不作要求的。n 斯皮尔曼等级相关是斯皮尔曼等级相关是以变量没有相同等级为以变量没有相同等级为前提前提的,但如果相同等级不太多,可采用的,但如果相同等级不太多,可采用平均等平均等级的方法级的方法计算斯皮尔曼等级相关。计算斯皮尔曼等级相关。 例:例:为了研究生育率与平均受教育程度之间的关系,为了研究生育率与平均受教育程度之间的关系,设随机抽查了设随机抽查了1010个县,以下是按等级设计的结果,问生个县,以下是按等级设计的结果,问生育率与受教育程度之间是否相关?(育率与受教育程度之间是否相关?( =0.05=0.05)县号县号生育率等级生育率等级受教育等级受教育等级
34、等级差等级差didi didi2 21 16 63 33 39 92 24 41 13 39 93 39 97.57.51.51.52.252.254 48 87.57.50.50.50.250.255 51 15 5-4-416166 62.52.52 20.50.50.250.257 72.52.56 6-3.5-3.512.2512.258 87 71010-3-39 99 910109 91 11 110105 54 41 11 1解:解:d di i2 2=60=60。r rs s不具有不具有PREPRE性质,属对称测量。性质,属对称测量。 H H0 0:Ps=0 (Ps=0 (总体
35、中生育率与平均受教育无关总体中生育率与平均受教育无关) ) H H1 1:Ps0Ps0 临界值临界值t t0.05/20.05/2(10-2)(10-2)=2.306=2.306 因为因为 t=2.334tt=2.334t0.05/20.05/2=2.306=2.306 因因此此,拒拒绝绝H H0 0,接接受受H H1 1,即即可可认认为为生生育育率率与平均受教育是有关的,相关系数为与平均受教育是有关的,相关系数为0.6360.636。二、二、GammaGamma系数的检验系数的检验 n H H0 0:总体中总体中G=0G=0n H H1 1:总体中总体中G0G0(或或G0G0或或G0G0G0
36、或或G0GZZ=14.05Z0.05/20.05/2=1.96=1.96。 所所以以拒拒绝绝H H0 0,接接受受H H1 1,即即文文化化程程度度与与代代际际流流动动相相关关,用用文文化化程程度度解解释释代代际际流流动动可可消消减减78%78%的的误差,误差,a=0.05a=0.05。注意:注意: n G G的的Z Z检检定定公公式式较较为为保保守守,通通常常略略为为低低估估了了检检定定值值(Z)(Z)。当当所所算算得得的的检检定定值值非非常常接接近近所所要要求求的的否否定定域域数数值值,就就要要用用较较为为精精确确的的S S因因子子检检验公式验公式。n 较较为为精精确确的的做做法法是是不不
37、用用理理会会G G值值,而而直直接接检检定定(Ns-Ns-NdNd)这这个个称称为为S S因因子子的的数数值值。因因为为G G分分数数的的公公式式是是以以S=Ns-S=Ns-NdNd作作为为分分子子,因因此此S=0S=0,即即G=0G=0。n 研研究究假假设设H H1 1为为S0(S0(或或S0S0或或S0),S0S0 由于由于n=44n=44,r=2r=2,c=4c=4,则,则 Z Z0.001/20.001/2=3.09=3.09,Z=4.31ZZ=4.31Z0.001/20.001/2=3.09=3.09所以拒绝所以拒绝H H0 0,接受接受H H1 1。又因为:又因为: A A2 2=
38、8=8 14+814+8 12+812+8 10+1410+14 12+1412+14 10+1210+12 10=71610=716 B B2 2=20=20 24=48024=480 A A3 3=8=8 1414 12+812+8 1414 10+810+8 1212 10+1410+14 1212 10=510410=5104 B B3 3=0=0 ?因这只有两个边缘次数。因这只有两个边缘次数。同上题,如果用同上题,如果用Z Z检验:检验:注意注意n 许多定序相关测量法如许多定序相关测量法如dydy系数和肯德系数和肯德尔的尔的tautau系数,其公式都是以系数,其公式都是以“S=Ns-
39、S=Ns-NdNd”作为分子的,因此它们都可以通过作为分子的,因此它们都可以通过S S的检定的检定来推论总体的情况。来推论总体的情况。n 由于都是以由于都是以S S作分子,故此在总体中如作分子,故此在总体中如果果S=0S=0,则,则G=G=dydy=tau=0=tau=0,可见这三种相关系可见这三种相关系数的检定是有共同性的。数的检定是有共同性的。 第三节第三节两个定距变量的检验两个定距变量的检验不考一、回归方程的检验一、回归方程的检验n 用用最小二乘法最小二乘法求直线回归的方法,求直线回归的方法,是基于是基于线性回归模型的基本假定线性回归模型的基本假定进行的。进行的。因此在配置回归直线之前,
40、必须对总体因此在配置回归直线之前,必须对总体变量间是否存在线性相关关系进行检验。变量间是否存在线性相关关系进行检验。对于不存在线性关系的总体,配置回归对于不存在线性关系的总体,配置回归直线是毫无意义的。直线是毫无意义的。 1 1、检验的原假设、检验的原假设n总总体体变变量量x x和和总总体体变变量量y y存存在在线线性性关关系系,即即存在关系式:存在关系式:E(yE(yi i)=)= + + x xi in 因因此此,总总体体的的线线性性回回归归指指的的是是当当x=xx=xi i时时,y y的均值的均值E(yE(yi i) )是线性函数:是线性函数:E(yE(yi i)= )= + + x x
41、i i关于关于 X X与与Y Y关系式的基本假定关系式的基本假定:n 自自变变量量x x可可以以是是随随机机变变量量,也也可可是是非非随随机机变变量量。x x值值的的测测量量可以认为是没有误差的,或者说误差是可以忽略不计的。可以认为是没有误差的,或者说误差是可以忽略不计的。n 由由于于x x和和y y之之间间存存在在的的是是非非确确定定性性的的相相关关关关系系。因因此此,对对于于x x的的每每一一个个值值x xi i,y yi i是是随随机机变变量量,或或称称作作是是y y的的子子总总体体。要要求求y y的的所所有有子总体子总体y y1 1、y y2 2y yi iy yn n,其方差都相等。
42、其方差都相等。 D(yD(y1 1)=D(y)=D(y2 2)=)=D(yD(yn n) )n 如如果果y y的的所所有有子子总总体体,其其均均值值E(yE(y1 1) );E(yE(y2 2) )E(yE(yn n) )都都在在一一条条直直线线上上,则则称称作作线线性性假假定定,其其数数学学表表达达式式为为:E(yE(yi i)=)= + + x xi i。由由于于 、 对对所所有有总总体体都都一一样样,所所以以 和和 是是总体参数。总体参数。n 要要求求随随机机变变量量 y yi i是是统统计计独独立立的的,即即y y1 1的的数数值值不不影影响响y y2 2的数值,各的数值,各y y值值
43、之间都没有关系。之间都没有关系。n 出出于于检检验验的的需需要要,除除了了上上述述假假定定或或要要求求外外,还还要要求求y y值值的每一个子总体都满足正态分布。的每一个子总体都满足正态分布。上述总体假定的数据结构为上述总体假定的数据结构为n (1 1)随随机机变变量量y yi i是是统统计计独独立立的的,具具有有:均均值值E(yE(yi i)=)= + + x xi i;方方 差差 D(yD(yi i)=)= 2 2;( 2 2) y yi i与与 x xi i有有 如如 下下 关关 系系 式式 : y y1 1= = + + x x1 1+e+e1 1;y y2 2= = + + x x2
44、2+e+e2 2;.y yn n= = + + x xn n+e+en n。其其中中e e1 1、e e2 2e en n是是随随机机变变量量,它们相互独立,具有:它们相互独立,具有:E(eE(ei i)=0)=0,D(eD(ei i)=)= 2 2。 根据前面的基本假设根据前面的基本假设,对于总体线对于总体线性检验的假设可写成如下形式性检验的假设可写成如下形式 : 当总体具有上述假定时,即根据样本运用最小二乘法所求解的方程:当总体具有上述假定时,即根据样本运用最小二乘法所求解的方程:g=g=a+bxa+bx将是总体线性回归方程:将是总体线性回归方程:E(yE(y)= )= + + x x的最
45、佳线性无偏估计方程,的最佳线性无偏估计方程,a a和和b b是是 和和 的最佳无偏估计量。的最佳无偏估计量。 另外,另外,e1e1、e2ene2en是随机变量,它们相互独立,具都服从相同的正是随机变量,它们相互独立,具都服从相同的正态分布态分布N(0N(0, 2 2) ) 2 2未知。未知。nH H0 0: : =0=0nH H1 1: 0 0n依据假设,可以根据平方和分解求出检验的统计量。依据假设,可以根据平方和分解求出检验的统计量。 2 2、线性回归的平方和分解、线性回归的平方和分解 n 总偏差平方和总偏差平方和TSSTSSn TSSTSS反映了观测值反映了观测值y yi i围绕均值围绕均
46、值 n TSSTSS同时还是同时还是PREPRE中的中的E E1 1,当不知当不知y y和和x x及及关系时,对关系时,对y y的的最佳估计只能是最佳估计只能是y y,而每一个真实而每一个真实的的y yi i值和估计值值和估计值y y之差,就之差,就构成首次估计的误差。构成首次估计的误差。 剩余平方和剩余平方和RSSRSSn 其中其中i i由回归直线,由回归直线,= =a+bxa+bx所确定所确定n RSSRSS反映了反映了y yi i偏离回归直线偏离回归直线i i的程度的程度, ,也就是也就是PREPRE定义中的定义中的E E2 2。RSSRSS反映了知道反映了知道y y与与x x有关系后,
47、估有关系后,估计计y y值时所产生的总误差,即通过回归直线进行估值时所产生的总误差,即通过回归直线进行估计之后,仍然未能消除或未被解释的误差,又称残计之后,仍然未能消除或未被解释的误差,又称残差平方和。它的存在,说明了除差平方和。它的存在,说明了除X X对对y y的线性影响外,的线性影响外,还有其它未被考虑的因素,这些因素往往是十分复还有其它未被考虑的因素,这些因素往往是十分复杂的。杂的。 回归平方和回归平方和RSSRRSSR n RSSR=TSS-RSS n TSS=RSS+RSSR 3 3、统计量、统计量n 设总体满足原假设:设总体满足原假设:H H0 0 : =0=0,即分即分别从别从
48、=0=0的总体中,如果无数次进行样本容的总体中,如果无数次进行样本容量为量为n n的抽样,可以证明:的抽样,可以证明:n统计量统计量:n统计量:统计量:n统计量统计量:对统计量对统计量 n 当样本几个观察点当样本几个观察点(x(xi i、y yi i) )确定后确定后,TSSTSS则为定值。因此若剩余平方和则为定值。因此若剩余平方和RSSRSS大,则回归平方和大,则回归平方和RSSRRSSR必小。反之,必小。反之,若剩余平方和若剩余平方和RSSRSS小,则回归平方和小,则回归平方和RSSRRSSR必大。而必大。而RSSRRSSR大,则说明引入回大,则说明引入回归直线后,所能解释掉的误差大。归直
49、线后,所能解释掉的误差大。 例:例:为了研究受教育年限和职业声望之为了研究受教育年限和职业声望之间的关系,设以下是间的关系,设以下是8 8名抽样的名抽样的 结果,进行结果,进行回归直线的检验回归直线的检验( ( =0.05) =0.05) :调查对象调查对象X(年年)Y(声望声望)11270216803950419865219061065754481275解:解: 因为因为F=57.8FF=57.8F0.050.05=5.99=5.99 所以拒绝所以拒绝H H0 0,接受,接受H H1 1,即可认为配置回归直线是有意义的。,即可认为配置回归直线是有意义的。二、相关系数检验二、相关系数检验 n
50、H H0 0:总体相关系数总体相关系数r=0r=0n H H1 1:总体相关系数总体相关系数r r 0 0 如果从满足如果从满足H H0 0的总体中,作无数次容量的总体中,作无数次容量为为n n的抽样,并计算出样本的相关系数的抽样,并计算出样本的相关系数r r。可可以证明:以证明: 例:受教育年限与职业声望例:受教育年限与职业声望:r=0.95r=0.95,N=8N=8。解:解:H H0 0:总体中总体中r=0 Hr=0 H1 1:总体中总体中r r 0 0 三、相关系数三、相关系数r r的检验与回的检验与回归系数归系数 的检验关系的检验关系 确认总体线性相关的存在,也就是确认配置线性回归方确
51、认总体线性相关的存在,也就是确认配置线性回归方程是有意义的。因此假设程是有意义的。因此假设H H0 0:r=0r=0和假设和假设H H0 0: =0=0是等价是等价的,的,r r通过检验,必然导致通过检验,必然导致 (F(F检验检验) )通过检验。通过检验。F F公式公式和和r r公式是对应公式是对应关系:关系:第四节第四节 综合综合 n相关测量法目的是要理解两个相关测量法目的是要理解两个变项有变项有“样本样本”(随机与非随机样随机与非随机样本均可本均可)中的相关中的相关“强弱强弱”程度。程度。本章所介绍的检定假设的方法,则本章所介绍的检定假设的方法,则是根据是根据“随机样本随机样本”的资料来
52、推论的资料来推论两个变项在两个变项在“总体总体”中中“是否是否”相相关。关。 总结总结n(1) (1) 要要求求随随机机抽抽样样,不不能能用用于于分分析析非非随机样本随机样本n (2) (2) 所所关关心心的的是是总总体体的的情情况况,不不是是样样本的情况本的情况n (3) (3) 所所要要知知道道的的是是在在总总体体中中相相关关还还是是不相关,不是相关的强弱程度不相关,不是相关的强弱程度n (4)(4)任任何何的的假假设设检检定定法法,都都是是样样本本愈愈大大时愈容易否定原假设时愈容易否定原假设H Ho o 归纳归纳n 定类定类- -定类定类n 定类定类- -定序定序n 定序定序- -定序定
53、序Z Z、T T检定检定n 定类定类- -定距定距n 定序定序- -定距定距 F F检定检定n 定距定距- -定距定距 2 2检定检定 在研究报告中,一般不用写在研究报告中,一般不用写出条件次数表,但最好写出条件出条件次数表,但最好写出条件百分表。最好是在条件百分表内百分表。最好是在条件百分表内写出相关系数,再加上检定值及写出相关系数,再加上检定值及其显著度其显著度 。说明:说明:表表1 1:住户人口密度与婆媳冲突关系:住户人口密度与婆媳冲突关系 (N=200)(N=200) 婆媳冲突婆媳冲突住户密度住户密度高高中中低低高高54.854.819.619.67.17.1中中26.226.253.953.950.050.0低低19.019.026.526.542.942.9总数总数42421021025656G=+0.463G=+0.463Z=3.346 P0.001(Z=3.346 P0.001(一端检定一端检定) )