第七章体育统计学剖析

上传人:今*** 文档编号:106159271 上传时间:2019-10-14 格式:DOC 页数:30 大小:631KB
返回 下载 相关 举报
第七章体育统计学剖析_第1页
第1页 / 共30页
第七章体育统计学剖析_第2页
第2页 / 共30页
第七章体育统计学剖析_第3页
第3页 / 共30页
第七章体育统计学剖析_第4页
第4页 / 共30页
第七章体育统计学剖析_第5页
第5页 / 共30页
点击查看更多>>
资源描述

《第七章体育统计学剖析》由会员分享,可在线阅读,更多相关《第七章体育统计学剖析(30页珍藏版)》请在金锄头文库上搜索。

1、第七章 假 设 检 验在前面的章节中阐明了第一类统计推断方法 估计,在本章中将论述第二类统计推断方法,即假设检验。从中可看到假设检验和区间估计之间的某些相似点和相异点。在这两章中,让人感兴趣的都是同一些参数,不过在七章中将从下述的角度去分析样本数据,即看看这些数据是否支持对某些参数的大小所做的假设。而在上一章中,却并未涉及对参数的假设进行后分析,相反,倒是利用样本数据来帮助人们形成对参数值的看法。假设检验的目的同估计一样,在于帮助研究人员通过考察对来自某总体的样本数据做出有关该总体的统计决策。第一节 基 本 概 念一、假设检验的意义在统计研究工作中常常要对一些统计量进行分析比较。人们经常会遇到

2、两个统计量的差异问题,如两个平均数的差异、两个率的差异等待。两个样本统计量之间的差异,可能由两种原因造成:一是由于抽样误差而造成,抽样误差而造成的差异是不可避免的,但样本仍来自同质的总体,所以这种差异没有本质的区别。二是由于实验因素或观察条件的改变而造成的差异,这种误差叫做条件误差,此时样本可能会来自不同质的总体,其差别是本质性的差别。人们当然希望能正确地区分出样本统计量之间的差异是由哪种原因造成的。假设检验就是帮助人们去区分差异是由抽样误差还是由条件误差造成的一种科学方法。二、假设检验的基本原理在实际工作中,无论假设多么复杂,进行检验的基本思想却很简单,就是某种带来有概率性质的反证法,即按“

3、小概率事件在一次观察中实际上不可能发生的”的统计原则,拒绝在一次具体实践中竟然发生了小概率事件的不合理的假设。但是如果实践所导致的结果没有发现小概率事件的不合理现象,则不能拒绝原假设H0 ,因而接受它。什么算是“小概率事件”?通常人们把概率不超过5% 的事件称为小概率事件,其概率记作 。在假设检验中,称 为显著性水平。如经过检验,在 = 0.05 水平拒绝无效假设H0 ,则称差异有显著性意义;如在 = 0.01水平拒绝H0 ,则称差异有非常显著性意义。三、假设检验中的两类错误在假设检验中,并不能证明一个统计假设是否正确。当检验结果已经得出,就有两种可能采取的行动;(1)否定H0 ;(2)不否定

4、H0 。一个未被否定的假设可能的真实的,也可能是不真实的。同样,一个被否定的假设也可能是真实的或不真实的。于是,在检验一个假设时将出现四种可能的结果:(一)不否定真实的无效假设;(二)不否定不真实的无效假设;(三)否定真实的无效假设;(四)否定不真实的无效假设。以上,(一)和(四)的正确的行动,而(三)犯了“弃真”的错误,称这为第类错误;(二)犯了“取伪”的错误,称这为第类错误。表7 1 双向分类表可能的行动假设的可能状态真非 真不 否 定对错()否 定错()对 在统计分析时,是以显著性水平 检验假设,若当H0 为真时否定H0 ,则犯第类错误的概率明显正是 。通常把犯第类错误的概率记作 。当然

5、,人们总希望这两类错误的概率都尽可能的小。但不理想的是,在样本含量n 不变时,减小 将引起 增大,减小 将引起 增大。同时减小犯两类错误的概率的唯一途径是增加样本含量,但要注意这样会增大工作量,会多耗费人力物力。所以在实际工作中,要全面考虑,选定适当的n、。必须强调指出,在研究工作中必须及早选定 。要是等到算出检验统计量的数值之后再选 ,则选择就可能受到计算结果的影响,从而会在相当程度上损害研究的客观性。四、单侧检验与双侧检验(一)双侧检验问题双侧检验的目的在于检验两个参数是否相等,如总体均数 还是 ,这时,研究人员关心两均数之间的绝对差别,而不关心差别的方向。 图7 1 双侧检验示意图如(图

6、71)所示:是把 的临界值 X1,X2分配在的两侧。由于要求(X1,X2)间的概率是置信度1,这相当于把 分配在H0 分布两侧的尾部,每一侧占 的二分之一。“双侧检验”这个名称就是这样来的。(二)单侧检验问题在许多情况下,研究人员根据理论分析或实践经验可预知某一均数不大于(或不小于)另一均数,这时可作无效假设H0 :(或H0 :)。因此在拒绝接受H0 时,就只接受(或,这时要把 全部放在分布的一侧。即所谓“单侧检验”图 7 2 单侧检验示意图单侧检验比双侧检验容易得出差别有显著意义的结论,所以对于同一批资料,有时双侧检验无显著意义,而单侧检验却有显著意义。但要采用单侧检验还是双侧检验必须在作研

7、究设计时根据客观实际及专业知识事先选定。五、假设检验的一般步骤(一)建立无效假设H0 ;(二)识别选择检验统计量;(三)选定显著性水平 ;(四)收集数据、完成计算;(五)按决策规则作出统计决策。如果检验统计量的计量值落在否定域之内,则否定无效假设;如其值落在接受域之内,则接受无效假设;当检验统计量的计算值等于临界值或接近临界值时,则一般也否定无效的假设,但此时下结论要慎重,最好扩大样本含量重新再作检验。图 7 3 假设检验一般步骤框图第二节 一个正态总体均数的假设检验一、总体方差已知时,总体均数与某指定数之间差别的假设检验已知被研究的总体服从正态分布N(, ),且参数已知,但未知,现要对进行统

8、计检验。从第六章中知道,当被抽样总体服从正态分布时,的抽样分布服从平均值为、方差为斩正态分布。为了检验是否等于已知 数 ,建立无效假设H0 : ,从而能从样本数据算出的检验统计量应为 (7 1)这个统计量服从标准正态分布。对于选定的显著性水平,有P |U| 所以选择 |U| 为否定域;即当该不等式成立时,就否定H0 。类似地,有 P|U| 1即 |U| ,为接受域。换句话说,规定了之后,也就取定了接受域和否定域的分界线。如取 0.05 ,与标准正态分布曲线下两尾侧面积 0.025 相对应的 u 值分别为 1.96 和 1.96 。 否定域由大于或等于 1.96 和小于或等于 1.96 的所有

9、u 值构成。如(图7 4)所示。图74 标准正态分布下0.05时的接受域和否定域例 7 1 根据医学统计,我国健康成年男子在安静时的平均心率为72次/分,标准差为6.4次/分。今对某体育系男生随机抽测36人,其安静时平均心率为69.5次/分,试问该体育系男生的心率是否与国内一般健康成年男子不同?(0.05)解:(1)建立无效假设H0 :72(即假设该体育系男生心率与一般健康男子相同,其差别是由抽样误差造成的。)(2)计算统计量U值:2.34(3)取0.05,查表可知临界值 (4)判断结果:因为|U|2.341.96,所以拒绝无效假设H0 ,认为该体育系男生的心率和一般健康成年男子的心率有显著性

10、差异。这种差异显然是因为体育系学生经常进行体育训练造成的。在上面例子中,取 = 0.05。在有些实际问题中,还应当把显著性水平取得更小些。同一问题采用不同的显著性水平处理,常可能得到不同的结论。如在上例中,若取= 0.01 ,则临界值2.58,此时,|U|2.342.58,应接受H 0 。二、总体方差 未知,且为大样本时,总体均数与某指定数之间差别的假设检验。在很多情况下,感兴趣的总体可能并非正态分布,这时若把分析建立在正态分布的基础之上,就会得出错误的结论。因此,当被抽样总体不服从正态分布时,就必须知道样本平均值的抽样分布的性质。当从非正态分布总体进行抽样时,关于 的抽样分布的知识将来自一条

11、重要的数学定理,即“中心极限定理”。这条定理的内容陈述如下:给出一个具有任意函数形式的总体,其平均值为,方差有限。如从这一总体抽出容量为n的样本,则当样本容量很大时,由这些样本算出的 的抽样分布将近似服从平均值为、方差为的正态分布。在取大样本的情形下,中心极限定理既能从非正态分布总体抽样,又能保证得到与正态分布总体抽样时近似相同的结果。这结果对于统计推断方法的应用来说十分有用。在实际问题中,常需要在总体方差未知的条件下对总体均数进行假设。对于这种情形,不好采用统计量因为未知。这时,通常用S代替,这将会有误差,但对大样本来说,误差不大,由中心极限定理可知分布近似正态分布。所以,此时检验统计量为

12、N(0 , 1) (7 2)取定后,|U| 为H0 :的否定域;|U| 为H0 :的接受域。例7 2 由全国青少儿体质调查资料知:全国城市7岁男生身高平均数为117.3厘米,北京市205名7岁男生身高平均为118.3厘米,标准差为4.8厘米,问北京市7岁男生的身高与全国7岁男生的身高之间有无显著性差异? (0.01)解:(1)无效假设H0 :117.3(2)计算统计量值:|U|2.98(3)因为取0.01,则2.58,(4)判断结果:|U|2.982.58,拒绝H0 ,认为北京市7岁男生的身高与全国城市7岁男生的身高之间有非常显著性差异。三、总体方差未知,且为小样本时,总体均数与某指定数之间差

13、别的假设检验在大样本时,用样本标准差S近似替代总体标准差,的分布近似正态分布,误差不大。但在小样本时,中心极限定理的条件不满足,同样用S替代不能保证的分布近正态分布。此时,适当的检验统计量应取t t(n1) (7 3)而且正如前述那样,这个统计量服从自由度为n1的t分布。对于选定的显著性水平;无效假设H 0 :的否定域为|t|;无效假设H 0 :的否定域为tt;无效假设H 0 :的否定域为tt。例7 3 已知某体育大学篮球专业男生100米跑的平均成绩为13.3秒。该专业三年级一班的12名男生100米跑平均成绩为13秒,标准差为0.5秒,问该班男生100米跑成绩与该专业男生100米跑成绩之间是否

14、有显著性差异? (0.05)解:(1)无效假设H0 :13.3(2)计算统计量值:|t|2.072(3)取0.05,nn112111 ,查t值表知t0.05(11) 2.201(4)判断结果:|t|t0.05(11) P( H 0 )0.05 ,接受H 0 ,认为三年级一班男生100米跑成绩与该专业男生100米跑成绩无显著性差异。例7 4 已知某运动饮料中,维生素C含量服从正态分布。按规定,维生素C的平均含量不得少于21毫克。现从一批饮料中抽取17罐,算知维生素C含量的平均值23毫克,S3.98毫克,问该饮料维生素C含量是五湖四海合格? (0.05)解:(1)无效假设H 0 : 21(假设维生素C含量不合格)(2)计算t值:t2.072(3)0.05, nn117116, 查t值表知t0.05(16)1.746 (按 P(1)查表)(4)判断结果:t2.0721.746,小概率事件竟然发生了,所以拒绝H0 ,从而认为该批饮料合格。第三节 两个正态总体均数的假设检验在实际工作中,两个总体平均值之差是研究人员常常感兴趣的一个参数,在对这个参数的真值缺乏直接了解的情况下,

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号