第九章 参数检验——两均数差检验 课时安排:6课时教学课型:理论课,课堂同步练习教学目的要求:理解差异显著性检验的原理;熟练掌握平均数差异显著性检验的方法 教学重点与教学难点:重点——两均数之差的检验;难点——假设检验的原理教学方法、手段、媒介:教科书、板书、多媒体教学过程与教学内容第一节 假设检验的原理与方法 1 第二节 两均数差检验的条件与问题 5 第三节 单总体均数之差的显著性检验 5 第四节 双总体均数之差的检验 8 作业题 12 综合练习二 13 第一节 假设检验的原理与方法一、差异及差异显著性检验(一)差异产生的可能情况所谓差异是指两个或多个事物之间出现差别或不同差异问题主要来自两大方面一种是事物本身存在着差异,称为真实的差异或实质性差异;一种是因抽样的随机性而出现的抽差误差抽样误差在统计上是忽略不计的,被视为不存在真正的差异二)差异显著性检验事物出现差异,可能是误差,也可能是实质性差异究竟属于哪种情况,必须借助统计方法进行分析、权衡,才能作出合乎逻辑的结论若经统计检验发现差异超过了所规定的某一误差限度,表示差异已不属误差了,这在统计上称差异显著若未达到规定的误差限度,表明属误差,亦称差异不显著。
这种对事物差异所进行的检验就是差异显著性检验三)差异显著的界限差异需要达到什么样的误差界限才算显著呢?统计中得利用小概率原理作拒绝假设或接受假设的依据,若抽样结果是小概率事件就拒绝假设,否则就接受假设通常把概率不超过0.05(即5%)或0.01(即1%)作为抽样误差的限度二、假设与假设检验科学理论的建立需经过四个阶段,即发现问题、提出假设、形成假说、建立理论各阶段之间的关系如图9-1所示 实践检验 自由思索 假设Ⅰ 理论论证 实践检验 科学问题 假设Ⅱ 科学假说 科学理论 大胆想象 假设Ⅲ 否 定 否 定图9-1 科学研究的基本阶段在假设过程中一般需要提出两个基本假设,一是研究假设,二是与之对立的虚无假设一)研究假设(alternative hypothesis)研究假设就是实验人员希望证实的假设。
从内容上看,研究假设是假设两个样本统计(或两个总体参数)之间,又或者是样本统计量与总体参数之间存在真实的差异,是一种有差假设表达方式有二,即或; 或二)虚无假设虚无假设是研究人员为了证实研究假设是真的而利用概率论的反证法所进行的假设,即从研究假设的反面进行假设,用符号表示建立起虚无假设目的是希望通过检验说明虚无假设是假的,以此来证明研究假设是真的因此,假设检验都是从虚无假设开始的从内容上看,虚无假设是假设两个总体参数之间或样本统计量与总体参数之间不存在真正的差异,其现存的表面差异是由抽样所造成的误差,是一种无差假设,又称零假设或原假设表达方式有二,即或表示; 或三、 三、显著性水平(一)显著性水平的意义显著性水平指拒绝虚无假设的小概率值从理论上说,显著性水平的理论依据来自小概率事件来统计中一般认为概率小于或等于0.05的随机事件属小概率事件若随机样本统计量的数值在抽样分布上出现的概率等于或小于这些小概率值,就以小概率事件拒绝虚无假设从直观上看,当两个总体均数相等时,和会落在Z轴的同一点上,即处,当和有差异时,则会产生差距,其差距在Z轴上达到或超出±1.96时,就被认为出现显著差异,因此±1.96之内称接受虚无假设的概率区,其包含的面积达95%。
只要两均数差异检验的值落入该区域,就认为差异不显著,这时应接受虚无假设而拒绝研究假设而±1.96之外称则拒绝虚无假设的小概率区,其包含面积为5%,称小概率值,即只要两均数差异检验的值落入这一区域,就认为存在显著差异这时应拒绝虚无假设而接受研究假设二)差异显著性的判断规则表9-1 Z值、值与差异显著性的关系值显著性符号表示<1.96>0.05不显著 ≥1.96≤0.05显 著*≥2.58≤0.01极显著**表9-2 值、P值与差异显著性的关系表值差异显著性符号<t(n’)0.05>0.05不显著 ≥t(n’)0.05≤0.05显 著*≥t(n’)0.01≤0.01极显著** 值得注意的是,显著性水平的取值实际上是因事物的性质、统计的要求及研究者的需求不同确定的虽然我们比较习惯取α=0.05和α=0.01,但也可以取其它的显著性水平值,如0.005或0.001小概率值α越小,表明显著性水平越高;反之,显著性水平越低三)显著性水平与与置信水平的关系 假设检验和参数估计都试图回答两个相同的问题,一是样本信息能告诉我们关于总体的什么信息,二是据此我们能推论出什么结论假设检验是当样本统计量超过一定的标准(如0.05的显著性水平)时,就说统计显著(即拒绝零假设),而参数估计则是要找到总体值所落入的可靠范围。
而作为两者代表性指标——显著性水平和置信水平也是从不同的角度回答相同的问题,因此,两者一起使用比单独使用更能清楚地显示数据的情况四、差异显著性的检验方法 (一)双尾检验双尾检验是把拒绝性的概率值置于理论分布的两端或两侧,也称双侧检验双尾检验是在研究人员还不能确定两种处理所得结果谁优谁劣,检验的目的只是确定事物之间是否存在明显差异时所采取的检验方法这时只要≥1.96或|t|≥,即实际计算的值落在拒绝区域,就可以推断两个均数之间的差异是显著的所以,双尾检验的实际意义是只推断差异是否存在,而不大断言差异的方向双尾检验时其显著性水平值的标记方法为α=0.05/2或α=0.01/2二)单尾检验单尾检验是把拒绝性概率值置于理论分布的一尾或一侧,也称单侧检验这种检验方法是研究者根据已有的资料事先能够预料到谁优谁劣,检验只是为了进一步确证而选择的方法单尾检验因拒绝性概率是置于理论分布的右侧还是与左侧,又分为左尾检验和右尾检验1.右侧检验右侧检验是把拒绝性概率值置于理论分布的右侧,见图9-4当研究人员能够预料到一个总体的参数(如μ1)大于另一个总体的参数(μ2)时,可采用右侧检验其假设形式为H0:μ1≤μ2 或 μ1≯μ2 Ha:μ1>μ22.左侧检验。
左侧检验是把拒绝性概率值置于理论分布的左侧当研究者能够预料一个总体参数(μ1)小于另一个总体参数(μ2),可采用左侧(尾)检验其假设形式为H0:μ1>μ2 Ha:μ1<μ2注意:在同一个显著性水平上,单尾检验和双尾检验的临界值()是不同的表9-3 两种检验方法临界值、 值和显著性水平的比较表双侧检验的单侧检验的差异显著性<1.96<1.645>0.05不显著≥1.96≥1.645≤0.05显著≥2.58≥2.33≤0.01极显著五、统计决策的两类错误(一)错误和错误错误是指虚无假设本身是正确的,但由于抽样的随机性而使检验值落入了拒绝虚无假设的区域,致使我们作出了拒绝虚无假设的结论,又称I型错误(type Ⅰ error)犯错误的概率是检验之前经过深思熟虑所选定的显著性水平值错误是指虚无假设本身不正确,但由于抽样的随机性而使检验值落入了接受虚无假设的区域,致使我们作出了接受虚无假设的结论,说明事物之间没有显著的差异,又称Ⅱ型错误(type Ⅱ error) 接受拒绝为真正确决策错误为假错误正确决策(二)错误和错误的关系及控制如前所述,建立虚无假设的目的并不在于证明它的正确性,而是随时准备拒绝它。
因此在拒绝待检验的虚无假设(H0)的同时,我们就在冒犯错误的风险因为虚无假设的客观真伪性我们并不知道,显著水平值标志着冒这种风险的可能性大小所以理想的办法就是把冒这种风险的可能性尽量减小然而显著性水平值和犯错误的概率之间又存在着一种密切关系,即减小了犯错误的风险,必定会增大犯错误的风险;同样,减小犯错误的风险,又会增大犯错误的风险,详见图9-6由此可见,想要同时减小犯两类错误的风险是不切实际的详见图9-6对于错误来说,可以通过控制显著性水平来减小犯错误的概率一般而言,如果实验条件控制的较好的话,可以取=0.05;如果实验条件难以控制,则可以取=0.01或更高的显著性水平值错误与错误不同,它并不是检验之前规定的影响的因素主要有三一是在参数检验中,依赖于参数的实际值与假设值之间的距离实际值与假设值相差越大,会越小二是与检验前选定的有关,越小,越大,因此要同时降低和,需要增加样本容量()三是当和固定时,根据研究问题性质选择适当的检验类型可以减小由此可见,对于错误而言,控制是比较困难的因此一般在规定的下,采用增大样本容量的方法来尽量减小六、假设检验的基本步骤(一)提出(或建立)假设即同时建立虚无假设Ho和研究假设Ha。
二)规定或选择显著性水平在教育与心理统计中常选择α=0.05和α=0.01所以在实际检验中,这一步骤可省略三)计算检验值计算假设检验中的各种统计量四)比较与决策将计算的检验值与相应的临界值进行比较做出统计决策 第二节 两均数差检验的条件与问题一、均数之差检验的前提条件(一)统计量来自随机样本(二)总体呈正态分布(三)总体的方差齐性总体方差齐性是指两个总体之间的方差相等或一致,即二、检验两均数差应考虑的问题(一)总体情况总体方面,一要考虑总体的分布情况,是正态的还是非正态的;二要考虑总体方差值,是已知的还是未知的;三要考察总体方差的一致性,是齐性的还是不齐性的这些内容的不同,其检验方法也不同二)样本类型1.独立样本独立样本是指从两个无关的总体中随机抽取的两个或多个样本,或者说是独立抽取的,彼此间的数据不存在对应关系的样本2.相关样本相关样本是从具有一定程度相关的总体中抽取的两个或多个样本,亦即彼此的观测值之间存在一一对应关系的样本在相关样本中,常见的形式有两种:一是同组比较,即同一组被试先后接受两种不同的实验处理,得到两组具有对应关系的数据二是配对比较,即先将同质的被试两两配对,再把各对中的两个被试分别分开,让其接受不同的实验处理,这样也可以得到两组一一对应的数据。
这种用配对方式得到的相关样本称配对样本 (三)总体情况、样本含量与数学模型的关系在两个均数的检验中,常用数学模型是正态分布模型,分布模型和近似正态分布表9-4 总体情况、样本情况、数学模型及检验方法的关系表 检 验 方 法检验检验检验总体情况 正态分布,σ2已知n不论大小 n>30σ2未知正 态n>30n不论大小n>30非正态 n>30n>30数学模型正态分布模型分布模型近似正态模型另外,当总体非正态,且样本容量小于30时,上述理论分布模型均不适用可进行非参数检验,或是进行数据转化再进行参数检验 第三节 单总体均数之差的显著性检验一、检验方法单总体平均数差异的显著性检验是指检验一个样本均数与相应总体均。