《精编》显著性检验的原理

上传人:tang****xu4 文档编号:133424451 上传时间:2020-05-27 格式:PPT 页数:26 大小:216.50KB
返回 下载 相关 举报
《精编》显著性检验的原理_第1页
第1页 / 共26页
《精编》显著性检验的原理_第2页
第2页 / 共26页
《精编》显著性检验的原理_第3页
第3页 / 共26页
《精编》显著性检验的原理_第4页
第4页 / 共26页
《精编》显著性检验的原理_第5页
第5页 / 共26页
点击查看更多>>
资源描述

《《精编》显著性检验的原理》由会员分享,可在线阅读,更多相关《《精编》显著性检验的原理(26页珍藏版)》请在金锄头文库上搜索。

1、第三章显著性检验 第一节显著性测验的原理第二节测验两样本均数差异 含两样本观察值配对和非配对的数据 第三节测验二项资料的百分数 针对单个样本百分数和两样本百分数 第四节测验次数资料的卡方值 包括适合性测验和独立性测验两类 第三章要点提示 显著性检验反映了调查或试验研究与上一章抽样分析的不同点 又是学习统计分析方法的基础 学习时 应充分理解检验的原理和特点 熟悉两尾检验与一尾检验的异同 重点掌握检验 和 1 2时依据的抽样分布类型及标准误 S 和差数标准误 1 2 S 1 2的计算公式 并与检验 时依据的差数的抽样分布和计算差数平均数的标准误 S 的公式相区别 对于百分数的检验 要注意应用u t

2、est的条件和不符合这些条件时进行连续性矫正的必要性 掌握依据 2变量SS 2服从的理论分布进行适合性检验和独立性检验时计算 2值的方法 涉及教材内容 第五章前三节 第七章前四节 作业布置 教材第五章第四节内容自习 教材P97T2 T3 T4 T7 T11 P144T4 T6 T7 T8 第一节显著性检验的原理 一 什么是显著性检验 在由样本研究总体时 先提出关于总体的统计假设 Ho 然后利用样本提供的信息去反证它是否成立 这种证明Ho是否成立的过程就叫统计假设测验 简称假设测 检 验 如果假设测验只针对一个Ho 并不同时研究其它假设 则称为显著性检验 还有一些假设测验问题 需要研究两个或更多

3、的统计假设 必须采取包括多重比较在内的方差分析法才能解决 因而不再一般化地称之为假设测验 所以假设测验大多局限于显著性测验 例3 1某地小麦亩产一般 o 300kg 并从多年种植的经验知 75kg 今引进一新品种得n 25个亩产量观察值 算得 327kg 如何评价其表面效应 解本例表面效应 27kg产量差异 要区分它是本质差别还是抽样误差1 先假定表面效应是抽样误差 Ho o或 300kg2 按误差理论计算获此抽样误差的概率 P 27 P o 27 P u 27 75 25 2P u 9 5 2 1 8 2 0 036 0 0723 根据小概率原理推断Ho是否成立 按惯例 0 05 故Ho成立

4、 第一节显著性检验的原理 0 05也叫显著水平 是一个概率临界值 它是根据 小概率事件在当前这次试验 观察 中实际不可能发生 这种 道德确定性 基于农业和生物学领域的行业要求而规定的小概率标准 0 05只能理解为否定Ho时容许犯错误的概率 本例获得27kg抽样误差的概率虽然很小 但尚未小到否定Ho时规定的显著水平 反过来讲就是没有95 以上的把握来认定其表面效应是 本质差别 而不是抽样误差 或者说表面效应虽然较大 但还没有大到有95 以上的把握来排除它是抽样误差的可能性 上述通过计算两尾概率评价其表面效应的做法通常针对的提问方式是 新品种的单产与当地品种有无显著差异 实际上评价表面效应还有一种

5、问法 新品种的单产是否高于当地品种 解这样提问往往是根据专业方面的信息已明知新品种的单产不可能低于当地品种 于是检验方法由两尾测验变成一尾测验 1 仍假定表面效应是抽样误差 Ho o或 300kg2 计算获此抽样误差的一尾概率 P 27 P o 27 P u 9 5 1 8 0 0363 根据小概率原理推断 Ho不成立 第一节显著性检验的原理 二 显著性检验的特点1 是一种概率反证法 先假定 单向 成立 再计算标准误 然后将表面效应转换成标准化变量后查算其属于抽样误差的概率是否为小概率 是则接受Ho 否则拒绝Ho 2 用了小概率原理 否定Ho有95 以上的把握 但不可能为100 即表面效应只要

6、大到视其为抽样误差时的两尾或一尾概率小到显著水平就能否定Ho 不然就暂且接受Ho 决不意味着接受Ho时有95 以上的把握 3 不同的场合依据不同的抽样分布 三 关于t分布定义 t S 其中S S n叫样本标准误参数 t 0 t 2 曲线特性 以 t 0处的纵轴对称 并以之为曲线最高点位置 而后往两侧递降 不同的 决定一条特异的t分布曲线 曲线形状随着 的增加 峰顶由下往上朝标准曲线的峰顶逼近 两尾由上往下朝标准曲线的两尾收拢 而当 120 时 t分布曲线与标准曲线N 0 1 重合 4 附表4与t分布的关系 第一节显著性检验的原理 附表4所列为9种两尾概率对应的 t 如右图所示 当n 1 7时

7、0 05和0 10栏目下的2 365和1 895就表明所得标准化变量t在n 8时绝对值超过2 365的概率 两尾面积 为0 05 超过1 895的概率 两尾面积 为0 10 按照显著性检验原理 计算获得某抽样误差的概率只是为了确认它是否为小概率 那反过来也就可以根据0 05的显著水平确定标准化变量u或t的 临界值 再和抽样误差标准化的结果相比较就是了 由此而来的显著性检验步骤见下例 0 90 0 05 0 025 0 025 1 895 2 365 t f t 7 第一节显著性检验的原理 f t t 2 7 4 N 0 1 第一节显著性检验的原理 四 显著性检验的步骤例3 2某地春小麦良种的千

8、粒重 0 34克 现自外地引进一高产品种 8个小区种植得平均千粒重为 35 2克 S 1 64克 则测验该品种的千粒重是否显著高于当地良种的步骤为 H0 o或 34g S S n 1 64 8 0 58t S 1 2 0 58 2 07按自由度 7查得 一尾t0 05 两尾t0 10 1 895 4 推断 t t0 05H0不成立 本次测验的显著水平 0 05 本例是按照题目要求进行一尾测验 实际应用中这种提问方式必须有所谓的 附加知识 为依据 即有来自专业方面的信息表明外地品种的千粒重不可能低于当地良种 否则就只能用两尾测验 H0 o或 34g S S n 1 64 8 0 58t S 1

9、2 0 58 2 07 3 按自由度 7查得两尾t0 05 2 365 4 推断 t t0 05H0成立 意即外地品种的千粒重与当地良种无显著差异 本例两尾测验对H0的态度与一尾测验截然不同 但实际研究中有相同的 第二节两个样本平均数 一 测验 1 2例3 3根据以往资料 某小麦品种每m2产量的 2 0 4 kg2 今在该地的一块地上以A B两法取样 A法取12个样点 得每m2产量 1 1 2kg B法取8个样点 得 2 1 4kg 试问两法差异是否显著 解题意指两种取方法得到的单产有无本质差别 即表面效应能否视为抽样误差 1 H0 1 2或 1 2 0 2 12 22 2 0 4 kg2 1

10、 2 0 4 12 0 4 8 0 2887kgu 1 2 1 4 0 2887 0 69 3 查得两尾u0 05 1 96 4 推断 u u0 05 H0成立表明两种取样方法无本质差别 关于原始数据用不同的单位对显著性检验过程的影响问题 要具体步骤具体分析 本例若以 斤 或500g为单位 则 2 4 0 4 斤2 1 2 2 0 2887 斤 而u 0 69不变 第二节两个样本平均数 例3 4调查某地每亩30万苗和35万苗的稻田各5块 得到 1 428kg SS1 1930kg2 2 440kg SS2 550kg2 测验两种密度单产差异显著性的步骤为 1 H0 1 2或 1 2 0 2 F

11、 S大2 S小2 1930 4 550 4 3 57ns查得右尾F0 05 4 4 6 39 于是有 Se2 SS1 SS2 1 2 2480 8 1S12 2S22 1 2 310S 1 2 Se2 1 n1 1 n2 11 14t 1 2 1 2 S 1 2 1 2 1 2 S 1 2 428 440 11 14 1 08 3 按 4 4 8查得两尾t0 05 2 306 4 推断 t t0 05H0成立 本例属于实际应用中普遍遇到的参数 12及 22未知的情形 不可能用u test而只能用t test 由于S 1 通过合并均方Se2计算时必须以两样本均方经F test证实无显著差异 齐性

12、检验 为先决条件 故要在用加权法合并两个样本方差前插入一个F test过程 倘若经F test证实有显著差异 表明 12 22 那就不能计算Se2而只能仿照中心极限定理有关结论计算 S 1 2 S12 n1 S22 n2 只是以它为标准误转换出来的标准化变量已不再是严格意义上的 t 变量 还是先了解一下F分布 第二节两个样本平均数 关于F的定义及其分布从一个母总体N 2 中随机抽取两个独立样本 算得两个样本均方依次为S12 S22 则定义 F S12 S22 抽样研究的结果证明 F是一个连续性随机变量 理论上存在着抽样分布 这就是F分布 它具有平均数为 F 2 2 2 F分布是由自由度 1 2

13、决定的曲线系统 因为受F 0的限制 任一条限于纵坐标右侧 F分布曲线不对称往左倾斜 左倾程度随着 1 2的一齐增加而减小 2 时 F的取值从大于1的那边由右往左 1 曲线峰顶向上 向右往 F 1的垂线逼近 附表5 右尾F临界值表 与F分布的关系 第二节两个样本平均数 F f F 1 1 2 7 1 1 2 4 1 1 2 2 5 59 7 71 18 51 这里只显示 1 1的反J型曲线 1 2时也是如此 当 1 3时 F分布曲线就转为偏态 呈现反S型 第二节两个样本平均数 例3 5在抽穗期间测定喷矮壮素玉米8株 得到株高 1 176 3cm SS1 3787 5cm2 对照区玉米9株 得株高

14、 2 233 3cm SS2 18400cm2 试测验矮化效果 1 H0 1 2或 1 2 0F S大2 S小2 2300 541 1 4 25 查得F0 05 8 7 3 73 2 S 1 2 S12 n1 S22 n2 67 64 255 56 18 t 1 2 S 1 2 176 3 233 3 18 3 17 3 k S2 1 S2 1 S2 2 1 k 0 79 67 64 323 2 0 21 故 1 k2 1 1 k 2 2 12 1 0 212 7 0 792 8 11 85 按 查得一尾t0 05 两尾t0 10 1 782 4 推断 t t0 05H0不成立本例经F tes

15、t知两个样本所属的总体方差 12 22 因此不能计算合并Se2而只能模仿中心极限定理计算S 1 2 由于以它为标准误转换出来的标准化变量已不再是严格意义上的 t 所以查表时不能简单地根据合并自由度15即 1 2 而必须予以修正 这就是 Aspin Welch检验 第二节两个样本平均数 例3 6一个容量为6的样本来自一个正态总体 得平均数为 1 30 均方S12 40 另一个容量为11的样本来自一个正态总体 其平均数为 2 22 均方为S22 45 测验H0 1 2 4 1 F S大2 S小2 45 40 1 125ns查得右尾F0 05 10 5 4 74 2 Se2 1S12 2S22 1

16、2 650 15 43 33S 1 2 Se2 1 n1 1 n2 43 33 17 66 3 34t 1 2 1 2 S 1 2 30 22 4 3 34 1 2 3 按 15 查得一尾t0 05 1 753 4 推断 t t0 05H0成立 本例有一个特别之处 即不是测验两个样本所属的总体平均数 1与 2是否相等 而是测验其相差是否超过 小于 某一常数 我们把这一类H0称为 非零假设 相应地称前者为 零假设 用非零假设往往能使H0更有实用性 因为针对它进行检验后获得信息更充分 如本例只检验零假设 t 8 3 34 2 4显然超过一尾t0 05而否定H0 用非零假设时常数则是根据实际应用的要求而设定 并且多为一尾测验 如 1 2为产量差异 常数就可按高产者多投入的成本换算出所属的总体平均数必须超过低产方多大的幅度 才有效益 来确定 值得普遍推行 第二节两个样本平均数 二 测验 例3 7选生长期 发育进度等方面一致的番茄配对 共得7组 每组中随机安排一株接种A病毒 另一株接种B病毒 试验结果得每组中B处理产生的病痕数分别比A处理15 1 6 12 7 7 12个 故测验B法产生的病痕数

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号