生物统计附试验设计第五章t检验(2017)

上传人:go****e 文档编号:131366734 上传时间:2020-05-07 格式:PPT 页数:125 大小:2.22MB
返回 下载 相关 举报
生物统计附试验设计第五章t检验(2017)_第1页
第1页 / 共125页
生物统计附试验设计第五章t检验(2017)_第2页
第2页 / 共125页
生物统计附试验设计第五章t检验(2017)_第3页
第3页 / 共125页
生物统计附试验设计第五章t检验(2017)_第4页
第4页 / 共125页
生物统计附试验设计第五章t检验(2017)_第5页
第5页 / 共125页
点击查看更多>>
资源描述

《生物统计附试验设计第五章t检验(2017)》由会员分享,可在线阅读,更多相关《生物统计附试验设计第五章t检验(2017)(125页珍藏版)》请在金锄头文库上搜索。

1、第五章均数差异显著性检验 t检验 难点与重点 抽样研究的目的是用样本信息来推断总体特征 这就是我们将重点讨论的统计推断问题 统计推断主要包括假设检验和参数估计两个内容 统计假设测验又叫显著性检验 其方法很多 常用的有t检验 F检验和 2测验等 尽管这些检验方法的用途及使用条件不同 但其检验的基本原理是相同的 本章通过t测验介绍统计假设测验的原理 介绍几种t测验的方法 参数估计有点估计和区间估计 总体与样本间的关系 从总体到样本 从样本到总体 统计推断 目的 抽样分布 基础 假设测验 参数估计 t检验 F检验 2检验 区间估计 点估计 样本平均数的抽样分布 t分布 第一节显著性检验的基本原理第二

2、节样本均数与总体均数的差异显著性检验第三节两样本平均数的差异显著性检验第四节二项性质的百分数资料差异显著性检验第五节总体参数的区间估计 第一节显著性检验的基本原理一 显著性检验的意义二 样本平均数的抽样分布与t分布三 显著性检验的基本步骤四 显著水平与两类错误五 双侧检验与单侧检验 第一节显著性检验的基本原理本节的内容主要是解决这样几个问题 即进行显著性检验的目的 检验对象 基本思想和基本前提是什么 下面结合具体例子来说明 一 检验的目的长白猪大白猪 例如 下面两个品种经产母猪产仔数相同吗 问题 能否仅凭这两个平均数的差值1 8头 立即得出长白与大白两品种经产母猪产仔数不同的结论呢 统计学认为

3、 这样得出的结论是不可靠的 这是因为试验指标既受处理因素的影响 又受试验误差 或抽样误差 的影响 现实中 试验又不可能无限作下去 怎样通过样本来推断总体呢 这正是假设测验要解决的问题 二 检验对象在进行显著性检验时只能以样本平均数作为检验对象 更确切地说 以作为检验对象 这是因为样本平均数具有下述特征 1 离均差的平方和最小 说明样本平均数与样本各个观测值最接近 平均数是资料的最佳代表数 2 样本平均数是总体平均数的无偏估计值 3 根据统计学中心极限定理 样本平均数服从或逼近正态分布 所以 以样本平均数作为检验对象 由两个样本平均数差异的大小去推断两个样本所属总体平均数是否相同是有其依据的 三

4、 基本思想 两个样本均数之差 试验的表面效应 试验的处理效应 试验误差 样本一 样本二 进行假设测验就是要分析 表面差异主要由处理效应引起的 还是主要由试验误差所造成 虽然处理的真实差异未知 但试验的表面差异是可以计算的 借助数理统计方法试验误差又是可以估计的 所以 可从试验的表面差异与试验误差的权衡比较中间接地推断真实差异是否存在 这就是假设测验的基本思想 四 基本前提 合理进行试验设计 收集到正确 完整而又足够的资料目的 降低试验误差 避免系统误差 二 显著性检验的基本步骤 一 首先对试验样本所在的总体作假设本例假设 即假设长白猪和大白猪两品种经产母猪产仔数的总体平均数相等 其意义是试验的

5、表面效应是试验误差 处理无效 这种假设称为无效假设 nullhypothesis 记作H0 无效假设是被直接测验的假设 通过测验可能被接受 也可能被否定 提出无效假设的同时 相应地有一对应假设 称为备择假设 记作HA 备择假设是在无效假设被否定时准备接受的假设 本例 为备择假设 即假设长白猪与大白猪两品种经产母猪产仔数的总体平均数不相等 其意义是指试验的表面效应 除包含试验误差外 还含有处理效应在内 二 在无效假设成立的前提下 构造合适的统计量 并研究试验所得统计量的抽样分布 计算无效假设正确的概率对于上述例子 在无效假设成立的前提下 经统计学研究统计量的抽样分布服从t分布 其中均数差异标准误

6、 为两样本的含量 平均数 均方 根据前面两个样本的数据 计算得 下面进一步估计出查附表3 在时 两尾概率为0 05的临界t值 两尾概率为0 01的临界t值 即 由于根据两样本数据计算所得的t值为2 426 介于二个临界t值之间 t 2 426的两尾概率 所以 t 2 426的概率P介于0 01和0 05之间 即说明试验处理效应不存在 试验的表面效应为试验误差的可能性在0 01 0 05之间 三 根据 小概率事件实际不可能性原理 否定或接受无效假设 根据这一原理 当试验的表面效应是试验误差的概率小于0 05时 可以认为在一次试验中试验表面效应是试验误差实际上是不可能的 因而否定原先所作的无效假设

7、HO 接受备择假设HA 即认为试验的处理效应是存在的 认为长白猪与大白猪两品种经产母猪产仔数总体平均数不相同 差异显著 综上所述 显著性检验 从提出无效假设与备择假设到根据小概率事件实际不可能性原理来否定或接受无效假设 这一过程实际上是应用所谓 概率性质的反证法 对试验样本所属总体所作的无效假设的统计推断 三 显著水平与两类错误 一 显著水平在显著性检验中 否定或接受无效假设的依据是 小概率事件实际不可能性原理 用来确定否定或接受无效假设的概率标准叫显著水平 significancelevel 记作 在生物学研究中常取 0 05或 0 01 若 则说明试验的表面差异属于试验误差的概率P 0 0

8、5 即表面效应属于试验误差的可能性大 不能否定H0 这时称 差异不显著 记为 ns 或不标记 在均数显著性检验 t检验 中 若 则说明试验的表面差异属于试验误差的概率P在0 01 0 05之间 即0 01 P 0 05 亦即表面差异属于试验误差的可能性较小 应否定H0 接受HA 这时称 差异显著 记为 若 则说明试验的表面效应属于试验误差的概率P不超过0 01 即P 0 01 亦即表面效应属于试验误差的可能性更小 应否定H0 接受HA 这时称 差异极显著 记为 因为显著性检验是根据 小概率事件实际不可能性原理 来否定或接受无效假设的 所以不论是接受还是否定无效假设 都没有100 的把握 也就是

9、说 在检验一个假设时可能犯两类错误 二 两类错误 第一类错误H0成立 却否定了它 犯了 弃真 错误 也叫 型错误 犯 型错误的概率不会超过 型错误也叫 错误 在医学上还称为假阳性错误 第二类错误是H0实际不成立 却接受了它 了 纳伪 错误 也叫 型错误 犯 型错误的概率记为 型错误又叫 错误 在医学上还称为假阴性错误 犯 型错误可能性 的大小与 取值的大小 两均数差异大小等因素有关 由图不难看出 当 值变小时 值变大 反之 值变大时 值变小 也就是说 型错误 的降低必然伴随着 型错误 的升高 两类错误示意图 因此 在检验选用显著水平时 应考虑到这两种错误推断后果的严重性大小 还应考虑到试验的难

10、易 试验结果的重要程度 三 降低两类错误的措施选择合适的显著水平 增大样本含量可以同时降低犯两类错误的可能性 小结 因为显著性检验是根据 小概率事件实际不可能性原理 来否定或接受无效假设的 所以不论是接受还是否定无效假设 都没有100 的把握 若经t检验 差异显著 对此结论有95 的把握 同时要冒5 下错结论的风险 差异极显著 对此结论有99 的把握 同时要冒1 下错结论的风险 差异不显著 是指在本次试验条件下 无效假设未被否定 差异不显著 并一定是 没有差异 这有两种可能 或者这两个样本所在的总体确实没有差异 或者这两个样本所在总体平均数有差异而因为试验误差大被掩盖了 因而不能仅凭统计推断就

11、作出绝对肯定或绝对否定的结论 有很大的可靠性 但有一定的错误率 这是统计推断的基本特点 四 两尾检验与一尾检验 一 双侧检验 two sidedtest 在显著性检验中 无效假设为 备择假设为 此时备择假设包括了或两种可能 这个假设的目的在于判断有无差异 而不考虑谁大谁小 此时 在 水平上否定域为两个 对称地分配在分布曲线的两侧尾部 这种利用两尾概率进行的检验叫双侧检验 也叫双尾检验 一尾检验 两尾检验 二 一尾检验 one sidedtest 无效假设应为 备择假设应为 这时的否定域在分布曲线的右尾 如图A所示 若无效假设为 备择假设为 此时的否定域在分布曲线的左尾 如图B所示 一尾检验 两

12、尾检验 这种利用一尾概率进行的检验叫单侧检验也叫单尾检验 若对同一资料进行双侧检验也进行单侧检验 所得的结论不一定相同 双侧检验显著 单侧检验一定显著 反之 单侧检验显著 双侧检验未必显著 在 水平上单侧检验显著 相当于双侧检验在2 水平上显著 三 应用选用单侧检验还是双侧检验应根据专业知识及问题的要求 分析的目的 在试验设计时就确定 一般情况下 如不作特殊说明均指双侧检验 第二节样本平均数与总体平均数差异的显著性检验检验一个样本均数与已知总体均数是否有显著差异 即检验某一处理是否有效 这里的一般为一些公认的指标 确定值 如畜禽正常生产性能指标 经大量调查所得的平均值 经验数或规定的某种指标值

13、 检验的基本步骤 1 建立假设其中 为样本所在总体均值 2 在无效假设成立的条件下 计算t值其中 n为样本含量 为样本标准误 3 根据计算出的自由度 查得临界值 将计算所得t值的绝对值与其比较 作出推断 若 则P 0 05 不能否定H0 表明样本均数与总体均数差异不显著 若 则0 01 P 0 05否定H0 接受HA 表明样本均数与总体均数差异显著 若 则P 0 01 否定H0 接受HA 表明样本均数与总体均数差异极显著 例 在鱼塘中10个点取水样 测定水中含氧量 得数据 4 33 4 62 3 89 4 14 4 78 4 64 4 52 4 48 4 55 4 26 mg l 能否认为该鱼

14、塘中平均含氧量为4 50 mg l 显然 本例应进行双侧t检验 1 建立假设 2 计算t值经计算得 4 421 S 0 267 所以3 查临界t值 并作出推断由df 10 1 9查t值表 附表2 得 2 262 因为 P 0 05 故不能否定 可以认为该鱼塘中平均含氧量为4 50 mg l 第三节两样本均数的差异显著性检验 对于两样本均数的显著性检验 因条件或试验设计不同 一般可分为两种情况 一是完全随机设计 非配对设计 两样本平均数的比较 成组数据的平均数比较 二是配对设计两样本平均数的比较 成对数据的平均数比较 一 非配对设计两样本均数的差异显著性检验 1 概念非配对设计或成组设计是指当进

15、行只有二个处理的试验时 将试验单位完全随机地分成两个组 然后对两组随机施加一个处理 在这种设计中两组的试验单位相互独立 所得到的两个样本相互独立 其含量不一定相等 表5 2非配对设计资料的一般形式 2 步骤 建立假设 计算t值 均数差异标准误 为两样本的含量 平均数 均方 根据df n1 1 n2 1 或2 n 1 查表得临界t值 将计算所得t值的绝对值与其比较作出统计推断 例5 3 某种猪场分别测定长白后备种猪和蓝塘后备种猪90kg时的背膘厚度 测定结果如表5 3所示 设两品种后备种猪90kg时的背膘厚度值服从正态分布 且方差相等 问该两品种后备种猪90kg时的背膘厚度有无显著差异 表5 3

16、长白与蓝塘后备种猪背膘厚度其中分别代表长白与蓝塘后备种猪背膘厚度的总体平均数 计算t值此例n1 12 n2 11 经计算得 于是df 11 1 12 1 21 查临界t值 作出推断查t值表 由df 21得 t 2 831 P 0 01 否定H0 接受HA 表明长白后备种猪与蓝塘后备种猪90kg背膘厚度差异极显著 这里表现为长白后备种猪的背膘厚度极显著地低于蓝塘后备种猪的背膘厚度 二 配对设计两样本平均数的差异显著性检验 非配对设计要求试验单位尽可能一致 如果试验单位变异较大 若采用上述方法就有可能使处理效应受到系统误差的影响而降低试验的准确性与精确性 为了消除试验单位不一致对试验结果的影响 正确地估计处理效应 减少和降低试验误差 提高试验的准确性与精确性 可采用配对设计 配对设计是指先根据配对的要求将试验单位两两配对 然后将配成对子的两个试验单位随机地分配到两个处理组中 配对的要求 配成对子的两个试验单位 对子内 的初始条件尽量一致 不同对子间试验单位的初始条件允许有差异 每一个对子就是试验处理的一个重复 配对的方式 自身配对与同源配对 1 自身配对 同一试验单位在二个不同时间上分别接

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 幼儿/小学教育 > 其它小学文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号