生物统计附试验设计第五章t检验(2017)

资源描述

《生物统计附试验设计第五章t检验(2017)》由会员分享，可在线阅读，更多相关《生物统计附试验设计第五章t检验(2017)（125页珍藏版）》请在金锄头文库上搜索。

1、第五章均数差异显著性检验 t检验难点与重点抽样研究的目的是用样本信息来推断总体特征这就是我们将重点讨论的统计推断问题统计推断主要包括假设检验和参数估计两个内容统计假设测验又叫显著性检验其方法很多常用的有t检验 F检验和 2测验等尽管这些检验方法的用途及使用条件不同但其检验的基本原理是相同的本章通过t测验介绍统计假设测验的原理介绍几种t测验的方法参数估计有点估计和区间估计总体与样本间的关系从总体到样本从样本到总体统计推断目的抽样分布基础假设测验参数估计 t检验 F检验 2检验区间估计点估计样本平均数的抽样分布 t分布第一节显著性检验的基本原理第二

2、节样本均数与总体均数的差异显著性检验第三节两样本平均数的差异显著性检验第四节二项性质的百分数资料差异显著性检验第五节总体参数的区间估计第一节显著性检验的基本原理一显著性检验的意义二样本平均数的抽样分布与t分布三显著性检验的基本步骤四显著水平与两类错误五双侧检验与单侧检验第一节显著性检验的基本原理本节的内容主要是解决这样几个问题即进行显著性检验的目的检验对象基本思想和基本前提是什么下面结合具体例子来说明一检验的目的长白猪大白猪例如下面两个品种经产母猪产仔数相同吗问题能否仅凭这两个平均数的差值1 8头立即得出长白与大白两品种经产母猪产仔数不同的结论呢统计学认为

3、这样得出的结论是不可靠的这是因为试验指标既受处理因素的影响又受试验误差或抽样误差的影响现实中试验又不可能无限作下去怎样通过样本来推断总体呢这正是假设测验要解决的问题二检验对象在进行显著性检验时只能以样本平均数作为检验对象更确切地说以作为检验对象这是因为样本平均数具有下述特征 1 离均差的平方和最小说明样本平均数与样本各个观测值最接近平均数是资料的最佳代表数 2 样本平均数是总体平均数的无偏估计值 3 根据统计学中心极限定理样本平均数服从或逼近正态分布所以以样本平均数作为检验对象由两个样本平均数差异的大小去推断两个样本所属总体平均数是否相同是有其依据的三

4、基本思想两个样本均数之差试验的表面效应试验的处理效应试验误差样本一样本二进行假设测验就是要分析表面差异主要由处理效应引起的还是主要由试验误差所造成虽然处理的真实差异未知但试验的表面差异是可以计算的借助数理统计方法试验误差又是可以估计的所以可从试验的表面差异与试验误差的权衡比较中间接地推断真实差异是否存在这就是假设测验的基本思想四基本前提合理进行试验设计收集到正确完整而又足够的资料目的降低试验误差避免系统误差二显著性检验的基本步骤一首先对试验样本所在的总体作假设本例假设即假设长白猪和大白猪两品种经产母猪产仔数的总体平均数相等其意义是试验的

5、表面效应是试验误差处理无效这种假设称为无效假设 nullhypothesis 记作H0 无效假设是被直接测验的假设通过测验可能被接受也可能被否定提出无效假设的同时相应地有一对应假设称为备择假设记作HA 备择假设是在无效假设被否定时准备接受的假设本例为备择假设即假设长白猪与大白猪两品种经产母猪产仔数的总体平均数不相等其意义是指试验的表面效应除包含试验误差外还含有处理效应在内二在无效假设成立的前提下构造合适的统计量并研究试验所得统计量的抽样分布计算无效假设正确的概率对于上述例子在无效假设成立的前提下经统计学研究统计量的抽样分布服从t分布其中均数差异标准误

6、为两样本的含量平均数均方根据前面两个样本的数据计算得下面进一步估计出查附表3 在时两尾概率为0 05的临界t值两尾概率为0 01的临界t值即由于根据两样本数据计算所得的t值为2 426 介于二个临界t值之间 t 2 426的两尾概率所以 t 2 426的概率P介于0 01和0 05之间即说明试验处理效应不存在试验的表面效应为试验误差的可能性在0 01 0 05之间三根据小概率事件实际不可能性原理否定或接受无效假设根据这一原理当试验的表面效应是试验误差的概率小于0 05时可以认为在一次试验中试验表面效应是试验误差实际上是不可能的因而否定原先所作的无效假设

7、HO 接受备择假设HA 即认为试验的处理效应是存在的认为长白猪与大白猪两品种经产母猪产仔数总体平均数不相同差异显著综上所述显著性检验从提出无效假设与备择假设到根据小概率事件实际不可能性原理来否定或接受无效假设这一过程实际上是应用所谓概率性质的反证法对试验样本所属总体所作的无效假设的统计推断三显著水平与两类错误一显著水平在显著性检验中否定或接受无效假设的依据是小概率事件实际不可能性原理用来确定否定或接受无效假设的概率标准叫显著水平 significancelevel 记作在生物学研究中常取 0 05或 0 01 若则说明试验的表面差异属于试验误差的概率P 0 0

8、5 即表面效应属于试验误差的可能性大不能否定H0 这时称差异不显著记为 ns 或不标记在均数显著性检验 t检验中若则说明试验的表面差异属于试验误差的概率P在0 01 0 05之间即0 01 P 0 05 亦即表面差异属于试验误差的可能性较小应否定H0 接受HA 这时称差异显著记为若则说明试验的表面效应属于试验误差的概率P不超过0 01 即P 0 01 亦即表面效应属于试验误差的可能性更小应否定H0 接受HA 这时称差异极显著记为因为显著性检验是根据小概率事件实际不可能性原理来否定或接受无效假设的所以不论是接受还是否定无效假设都没有100 的把握也就是

9、说在检验一个假设时可能犯两类错误二两类错误第一类错误H0成立却否定了它犯了弃真错误也叫型错误犯型错误的概率不会超过型错误也叫错误在医学上还称为假阳性错误第二类错误是H0实际不成立却接受了它了纳伪错误也叫型错误犯型错误的概率记为型错误又叫错误在医学上还称为假阴性错误犯型错误可能性的大小与取值的大小两均数差异大小等因素有关由图不难看出当值变小时值变大反之值变大时值变小也就是说型错误的降低必然伴随着型错误的升高两类错误示意图因此在检验选用显著水平时应考虑到这两种错误推断后果的严重性大小还应考虑到试验的难

10、易试验结果的重要程度三降低两类错误的措施选择合适的显著水平增大样本含量可以同时降低犯两类错误的可能性小结因为显著性检验是根据小概率事件实际不可能性原理来否定或接受无效假设的所以不论是接受还是否定无效假设都没有100 的把握若经t检验差异显著对此结论有95 的把握同时要冒5 下错结论的风险差异极显著对此结论有99 的把握同时要冒1 下错结论的风险差异不显著是指在本次试验条件下无效假设未被否定差异不显著并一定是没有差异这有两种可能或者这两个样本所在的总体确实没有差异或者这两个样本所在总体平均数有差异而因为试验误差大被掩盖了因而不能仅凭统计推断就

11、作出绝对肯定或绝对否定的结论有很大的可靠性但有一定的错误率这是统计推断的基本特点四两尾检验与一尾检验一双侧检验 two sidedtest 在显著性检验中无效假设为备择假设为此时备择假设包括了或两种可能这个假设的目的在于判断有无差异而不考虑谁大谁小此时在水平上否定域为两个对称地分配在分布曲线的两侧尾部这种利用两尾概率进行的检验叫双侧检验也叫双尾检验一尾检验两尾检验二一尾检验 one sidedtest 无效假设应为备择假设应为这时的否定域在分布曲线的右尾如图A所示若无效假设为备择假设为此时的否定域在分布曲线的左尾如图B所示一尾检验两

12、尾检验这种利用一尾概率进行的检验叫单侧检验也叫单尾检验若对同一资料进行双侧检验也进行单侧检验所得的结论不一定相同双侧检验显著单侧检验一定显著反之单侧检验显著双侧检验未必显著在水平上单侧检验显著相当于双侧检验在2 水平上显著三应用选用单侧检验还是双侧检验应根据专业知识及问题的要求分析的目的在试验设计时就确定一般情况下如不作特殊说明均指双侧检验第二节样本平均数与总体平均数差异的显著性检验检验一个样本均数与已知总体均数是否有显著差异即检验某一处理是否有效这里的一般为一些公认的指标确定值如畜禽正常生产性能指标经大量调查所得的平均值经验数或规定的某种指标值

13、检验的基本步骤 1 建立假设其中为样本所在总体均值 2 在无效假设成立的条件下计算t值其中 n为样本含量为样本标准误 3 根据计算出的自由度查得临界值将计算所得t值的绝对值与其比较作出推断若则P 0 05 不能否定H0 表明样本均数与总体均数差异不显著若则0 01 P 0 05否定H0 接受HA 表明样本均数与总体均数差异显著若则P 0 01 否定H0 接受HA 表明样本均数与总体均数差异极显著例在鱼塘中10个点取水样测定水中含氧量得数据 4 33 4 62 3 89 4 14 4 78 4 64 4 52 4 48 4 55 4 26 mg l 能否认为该鱼

14、塘中平均含氧量为4 50 mg l 显然本例应进行双侧t检验 1 建立假设 2 计算t值经计算得 4 421 S 0 267 所以3 查临界t值并作出推断由df 10 1 9查t值表附表2 得 2 262 因为 P 0 05 故不能否定可以认为该鱼塘中平均含氧量为4 50 mg l 第三节两样本均数的差异显著性检验对于两样本均数的显著性检验因条件或试验设计不同一般可分为两种情况一是完全随机设计非配对设计两样本平均数的比较成组数据的平均数比较二是配对设计两样本平均数的比较成对数据的平均数比较一非配对设计两样本均数的差异显著性检验 1 概念非配对设计或成组设计是指当进

15、行只有二个处理的试验时将试验单位完全随机地分成两个组然后对两组随机施加一个处理在这种设计中两组的试验单位相互独立所得到的两个样本相互独立其含量不一定相等表5 2非配对设计资料的一般形式 2 步骤建立假设计算t值均数差异标准误为两样本的含量平均数均方根据df n1 1 n2 1 或2 n 1 查表得临界t值将计算所得t值的绝对值与其比较作出统计推断例5 3 某种猪场分别测定长白后备种猪和蓝塘后备种猪90kg时的背膘厚度测定结果如表5 3所示设两品种后备种猪90kg时的背膘厚度值服从正态分布且方差相等问该两品种后备种猪90kg时的背膘厚度有无显著差异表5 3

16、长白与蓝塘后备种猪背膘厚度其中分别代表长白与蓝塘后备种猪背膘厚度的总体平均数计算t值此例n1 12 n2 11 经计算得于是df 11 1 12 1 21 查临界t值作出推断查t值表由df 21得 t 2 831 P 0 01 否定H0 接受HA 表明长白后备种猪与蓝塘后备种猪90kg背膘厚度差异极显著这里表现为长白后备种猪的背膘厚度极显著地低于蓝塘后备种猪的背膘厚度二配对设计两样本平均数的差异显著性检验非配对设计要求试验单位尽可能一致如果试验单位变异较大若采用上述方法就有可能使处理效应受到系统误差的影响而降低试验的准确性与精确性为了消除试验单位不一致对试验结果的影响正确地估计处理效应减少和降低试验误差提高试验的准确性与精确性可采用配对设计配对设计是指先根据配对的要求将试验单位两两配对然后将配成对子的两个试验单位随机地分配到两个处理组中配对的要求配成对子的两个试验单位对子内的初始条件尽量一致不同对子间试验单位的初始条件允许有差异每一个对子就是试验处理的一个重复配对的方式自身配对与同源配对 1 自身配对同一试验单位在二个不同时间上分别接

展开阅读全文