统计假设检验(1)1教育统计统计假设检验统计假设检验 统计假设检验是依据一定的原理,利用样本信息,根据一定概率,对总体参数或分布的某一假设做出拒绝或保留的决断 Z检验,t检验,F检验,x2检验一、统计假设检验的一般原理(一)统计假设检验的逻辑思想 一般科学研究的逻辑思想 提出假设 检验假设(根据已知进行运算,看运算结果与提出的假设的符合程度而做出推断)2教育统计统计假设检验 统计假设检验的逻辑思想 提出假设 检验假设(根据已知在概率和抽样分布理论下进行运算,看运算结果与提出的假设的符合程度而做出推断) 1、假设 假设检验一般提出两个相互对立的假设 虚无假设(原假设或零假设)指当前样本所属的总体与假设总体无区别的假设,往往是研究着根据样本信息希望拒绝的假设用H0表示 备择假设(研究假设)指当前样本所属的总体与假设总体相反的假设,往往是研究着根据样本信息希望证实的假设用H1表示 举例:3教育统计统计假设检验 2、小概率事件 样本统计量的值在抽样分布上出现的概率小于或等于事先规定的水平(一般取0.05或0.01),这时,就认为小概率事件发生。
样本统计量的值和总体参数值之间总会有差异,那么差异的原因是什么? 总体下一切样本统计量的值,应当以总体参数值为中心形成该种统计量的一个抽样分布,如果样本统计量的值在其抽样分布上出现的概率较大,我们认为这个样本来自于这个总体,样本统计量的值和总体参数值之间的差异是由抽样误差所致;如果这个样本统计量的值在其抽样分布上出现的概率极小,根据小概率事件在一次随机抽样中几乎不可能发生这一理论,我们否认这个样本来自于这个总体4教育统计统计假设检验 例:某县抽样检查小学五年级数学学科教学质量,每个学校按照1:10的比例从本校的五年级学生考试成绩中随机抽取一部分学生的成绩某校按比例从本校五年级学生中随机抽取36名,这36名学生的平均成绩为86分,而全校五年级学生本次考试的平均成绩为82分,标准差为10分,问抽出的36名学生成绩与全校五年级学生成绩是否一致 H0: ;H1: 为36名学生所在的真正水平总体的平均数, 是它的代表值; 是目前该校五年级学生所在总体的平均数学成绩 5教育统计统计假设检验 如果检验结果 成立,则说明这两个总体是一个水平的总体,4分差距是由随机因素造成的;如果检验结果拒绝 ,则说明这36名学生成绩与全校五年级学生成绩不一致,不属于同一水平的总体。
H0成立与否,也就是要看一下这36名学生组成的这个样本的平均成绩在其抽样分布上是否属于小概率事件 当取 时, 故36名学生组成的这个样本的平均成绩在其抽样分布上属于小概率事件,36名学生成绩与全校五年级学生成绩不一致6教育统计统计假设检验 显著性水平的确定,根据实际情况或问题需要确定,一般取(二)统计假设检验的两种方式 双尾检验 对两总体参数间差异的方向无法确定或根本不关心其差异方向时,用双尾检验 H0: ;H1: 单尾检验 如果在检验前根据某些理论或经验已知其中一总体参数大于另一总体参数时,用单尾检验 或7教育统计统计假设检验(三)统计假设检验中的两类错误 统计假设检验的四种可能: 其中四种可能中有两种判断正确,两种判断错误如下表 控制两类错误常采用的三种方法: 选取适当的显著性水平; 合理安排单尾或双尾检验; 适当增加样本容量。
真实情形所作判断接受H0拒绝H0H0为真正确概率等于 第一类错误概率等于H0为伪第二类错误概率等于正确概率等于8教育统计统计假设检验(四)统计假设检验的一般步骤 1、建立假设 在确定单尾检验还是双尾检验的基础上建立虚无假设H0和备择假设H1 2、选择和计算统计量 在虚无假设成立的前提下选择合适的抽样分布和统计量,并计算统计量的值 常用的抽样分布及相对应的检验方法 3、确定显著性水平及显著性水平下抽样分布的临界值 4、进行统计决断,判断结果并解释二、单总体假设检验 单总体假设检验是指对样本统计量与已知总体参数之间差异的显著性检验9教育统计统计假设检验(一)总体平均数的显著性检验 总体平均数的显著性检验是指对样本平均数与已知总体平均数之间的差异进行的显著性检验 差异原因:①② 检验目的:确定差异由哪种原因造成 1、总体正态分布,总体标准差已知 无论样本大小,均采用Z检验 例:某小学历届毕业生汉语拼音测验平均分数为66分,标准差为11.7分。
现以同样试题测验应届毕业生(假定两届毕业生条件基本相同),并从中抽取18份试卷,算得的平均分为69分,问该校应届与历届毕业生的汉语拼音测验成绩是否一致10教育统计统计假设检验 练习:某小学三年级学生期末语文考试平均成绩为77分,标准差为9分甲班参加该考试的有25人,平均成绩为80分问该班学生成绩是否与全校成绩一致 例:某市高中入学考试数学平均分数为68分,标准差为8.6分,其中某所中学参加此次考试的46名学生的平均分数为63,过去的资料表明,该校数学成绩低于全市平均水平,问此次考试该校数学平均分数是否仍显著低于全市平均分数 2、总体正态分布,总体标准差未知 A、大样本时可用Z检验11教育统计统计假设检验 例:某年高考某市数学平均分为60分,现从此次参加考试的文科学生中,随机抽取94份试卷,算得平均分为58分,标准差为9.2分,问文科考生数学成绩与全市考生的成绩是否一致 练习:某市调查表明,一年级儿童的平均身高为116.5厘米,某调查组从该市的一所小学一年级中随机抽取49名儿童,测得他们的身高如下问该校一年级学生的平均身高是否与全市儿童的平均身高一致。
113,109,112,107,109,120,117,100,119,122,108,135,111,125,108,110,170,130,120,131,119,99,122,115,98,106,118,105,119,120,118,129,134,94,123,125,99,114,116,121,110,115,120,99,127,100,124,128,11812教育统计统计假设检验 B、小样本时抽样分布服从自由度为n-1的t分布,用t检验 例:某区初三英语统一测验平均分为65分,该区某校随机抽取20分试卷的分数为:72、76、68、78、62、59、64、85、70、75、61、74、87、83、54、76、56、66、68、62问该校初三英语平均分数与全区是否一致 练习:某地区五年级英语统一考试平均成绩为68分,该区某小学五年级22份试卷的分数分别为:72、74、65、80、83、60、78、59、63、76、81、67、54、70、75、55、88、73、69、66、50、68问该校五年级英语平均成绩是否与全区一致13教育统计统计假设检验 例:某校上一届初一学生自学能力测验平均分数为38,这一届初一24名学生自学能力测验的平均分数为42,标准差为5.7分,假定两届学生学习条件相同,问这一届初一学生的自学能力是否高于上一届。
练习:某小学上届四年级学生自学能力测验平均分为30分,这一届四年级20名学生自学能力测验的平均分为38分,标准差为6分,假定两届学生学习条件相同,问这一届四年级学生的自学能力是否高于上一届学生 3、总体非正态分布的大样本 可以近似的看作正态分布,用Z检验14教育统计统计假设检验 例:某小学三年级一班有学生49人,语文教师在该班进行语文教法改革试验,通过语文教学培养学生的阅读能力期末全校三年级学生阅读能力测验的平均成绩为68分,而一班学生的平均成绩为71分标准差为12分,问该班阅读成绩是否高于该年级的平均成绩二)总体比率的显著性检验 总体比率的显著性检验就是检验样本比率与总体比率之间的差异是否显著 当 时,( 的较小者)二项分布近似服从正态分布,故可用Z检验来检验比率之间的差异是否显著15教育统计统计假设检验 例:某市中学教师中大学本科毕业的比率为0.60,现从某区随机抽取50名中学教师,其中大学本科毕业的有32人,问该区中学教师大学本科毕业的比率与全市中学教师大学本科毕业的比率是否有显著差异。
练习:某市幼儿患龋齿的比率为0.62,现从该市某幼儿园随机抽取40名幼儿进行检查,结果发现其中29名幼儿患有龋齿问该幼儿园幼儿患龋齿的比率与全市幼儿患龋齿的比率是否一致16教育统计统计假设检验(三)总体相关系数的显著性检验 总体相关系数的显著性检验就是检验所求得的相关系数 r 与总体相关系数 之间是否有显著性差异17教育统计统计假设检验 相关系数抽样分布的形态随总体相关系数和样本容量的大小而变化 相关系数检验的基本原理 因为样本相关系数 r的抽样分布随总体相关系数 和样本容量 n 的大小而变化当 时,样本相关系数的抽样分布是对称的——大样本时服从正态分布,小样本时服从t分布;当 时,样本相关系数的分布一般为偏态因此,实际推断时,常根据原假设 两种情况分布采取不同的检验方法 1、原假设为H0: (1)直接查表 通过查相关系数临界值表找到 (df=n-2),然后比较计算出的r值与查表得到的临界值 的大小。
18教育统计统计假设检验 如果 ,则拒绝原假设,说明样本相关系数与零相关有显著差异; 如果 ,则保留原假设,说明样本相关系数与零相关无显著差异 (2)利用公式 标准误 故当原假设为H0: 时,检验样本相关系数与总体相关系数之间的差异,可以用t检验,其公式为 (df=n-2)19教育统计统计假设检验 然后通过查t值表找到 ,然后比较计算出的t值与查表得到的 的大小 如果 ,则拒绝原假设,说明样本相关系数与零相关有显著差异; 如果 ,则保留原假设,说明样本相关系数与零相关无显著差异 以上两种方法主要适用于积差相关系数检验和斯皮尔曼等级相关系数检验 例:10名学生初一数学分数与初二数学分数的相关系数r=0.78,问从总体上来说,初一与初二数学分数是否存在相关? 练习:某数学老师从自己班中随机抽取38名学生的期中、期末数学成绩,其相关系数为0.7。
从总体上来说,学生的期中与期末数学成绩是否存在相关?20教育统计统计假设检验10名高三学生学习潜在能力与自学能力测验成绩等级相关计算表学生序号(1)学习潜在能力自学能力等级差数 D (6)差数平方 D2 (7) X(2)等级(3) Y(4)等级(5)12345678910908476717171696866641235557891032578687109 2 1 3 5.5 7.5 4 7.5 5.5 10 9 -1 1 0 -0.5 -2.5 1 -0.5 2.5 -1 1 1 1 0 0.25 6.25 1 0.25 6.25 1 1总和 1821教育统计统计假设检验 例:10名高三学生学习潜在能力测验与自学能力测验成绩如上表,问从总体上说,两者是否存在相关? 练习:某小学两名领导对本校10名教师的工作情况进行综合评定,每人的评定结果以等级记录。
问这两位领导对这10名教师的评定结果是否一致? 2、原假设为H0: 此时,r的抽样分布呈偏态,不过我们可以对其进行转换,将r值转换成 Zr 值,由于 Zr 服从正态分布,故可以采用Z检验,公式为:22教育统计统计假设检验 例:29名学生期中与期末考试成绩的相关系数r=0.30,问这一相关系数是否来自于全年级期中与期末考试成绩的相关系数为0.64的总体? 练习:某小学三年级语文测试,随机抽取该年级39名学生的期中与期末考试成绩的相关系数为r=0.25问这一相关系数是否来自全年级学生期中与期末语文考试成绩的相关系数为0.34的总体? 3、其他相关系数的显著性检验 A、肯德尔和谐系数的显著性检验 肯德尔和谐系数的检验主要是检验相关系数是否来自零相关的总体可分为两种情况:23教育统计统计假设检验 (1)当3≤N≤7时,可直接查肯德尔和谐系数临界值表,判断R的离散性 方法:求R的离差平方和,即 然后查表,根据一定的显著性水平及K和N的数目,查对应的 值,并与SSR比较做出决断。
例:某小学进行作文比赛,下面是6位教师对7名参赛学生的评定成绩6位教师对7名学生作文的评定是否一致,并检验 (2)当N>7时,用公式为: 若计算的值达到一定的显著性水平临界值,则肯德尔和谐系数不是来自于零相关总体,肯德尔和谐系数有意义 例:同一位教师对8份语文试卷先后评定3次的肯德尔和谐系数rW=0.75,请检验这名教师对试卷评定的一致性程度24教育统计统计假设检验6位教师对7名小学生作文的评定等级 教师作文 1 2 3 4 5 6RR21234567 3 1 2 2 7 6 5 4 7 7 6 7 2 3 3 1 1 1 1 2 1 4 3 2 4 5 6 3 5 3 6 7 5 6 2 5 7 6 4 5 4 421361113263130 441 1296 121 169 676 961 900∑ 168 456425教育统计统计假设检验学生1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16总分 68 97 90 75 92 74 93 89 95 78 77 60 80 64 89 88 第4题得分 0 1 1 0 1 1 0 1 1 0 1 0 1 0 1 0 B、点二列相关系数的显著性检验 点二列相关系数的检验主要是检验相关系数是否来自零相关的总体。
一般有三种方法: (1)查积差相关系数临界值表 方法:求 ,即 然后查表,根据一定的显著性水平及自由度df=n-2,查对应的 值,并与rpb比较做出决断16名小学生数学期中考试第四题得分与总分资料表26教育统计统计假设检验(2)用积差相关系数检验 (df=n-2) 然后通过查t值表找到 ,然后比较计算出的t值与查表得到的 的大小 如果 ,则拒绝原假设,说明样本相关系数与零相关有显著差异; 如果 ,则保留原假设,说明样本相关系数与零相关无显著差异 例:18名幼儿性别与投掷沙袋成绩的点二列相关系数为0.910,问从总体上说,幼儿性别与投掷成绩是否存在相关?27教育统计统计假设检验 (3)利用两个平均数间差异的t检验法 例:18名五岁男女幼儿掷沙袋(150克)成绩如下表,问从总体上说,性别与投掷成绩是否存在相关?五岁幼儿性别与掷沙袋点二列相关系数计算表学生序号 (1)投掷成绩 (2) 男 1 (3)女 0 (2)学生序号 (1)投掷成绩 (2)男 1 (3)女 0 (4)1234567891011124.03.63.53.24.44.83.85.24.73.44.93.71111110000001314151617183.34.74.83.12.93.4110000分数总和71.40037.50033.900人数总和18 810人数比率 0.444 0.556平均数 3.967 4.688 3.390标准差 0.709 0.333 0.26228教育统计统计假设检验 C、 系数的显著性检验 独立样本四格表 值计算公式 若计算的值达到一定的显著性水平临界值,则 系数不是来自于零相关总体,与零相关差异显著;否则差异不显著。
29教育统计统计假设检验。