生物统计学课件 2、抽样分布及应用㈠

上传人:tia****nde 文档编号:70811027 上传时间:2019-01-18 格式:PPT 页数:30 大小:520.81KB
返回 下载 相关 举报
生物统计学课件 2、抽样分布及应用㈠_第1页
第1页 / 共30页
生物统计学课件 2、抽样分布及应用㈠_第2页
第2页 / 共30页
生物统计学课件 2、抽样分布及应用㈠_第3页
第3页 / 共30页
生物统计学课件 2、抽样分布及应用㈠_第4页
第4页 / 共30页
生物统计学课件 2、抽样分布及应用㈠_第5页
第5页 / 共30页
点击查看更多>>
资源描述

《生物统计学课件 2、抽样分布及应用㈠》由会员分享,可在线阅读,更多相关《生物统计学课件 2、抽样分布及应用㈠(30页珍藏版)》请在金锄头文库上搜索。

1、第二章 抽样分布及其应用,第一节 单个母总体抽样 第二节 显著性检验的原理 第三节 两个母总体抽样 第四节 检验两个样本平均数差异 (含F分布、方差的齐性检验) 第五节 配对数据的显著性检验,第二章要点提示,抽样分布既是本课程的基础,又是本课程的难点,学习时要注意抽样分布的特点及其与上一章正态分布的统一性;要注意样本统计量如 、 y 、 、 的概率分布类型(正态分布)及其参数与母总体概型及其参数的联系和区别(中心极限定理); 应充分理解显著性检验的原理和特点,熟悉两尾检验与一尾检验的异同;重点掌握检验和12时依据的抽样分布类型及标准误、S和差数标准误1- 2、S1- 2的计算公式,并与检验时依

2、据的差数的抽样分布和计算差数平均数的标准误 、S的公式相区别。 涉及教材内容:第四章第六、七节,第五章第一、二、三节。 作业布置:P56 P57 T6、 T7、 T10、 T11、 T12、 T13、 T15、 T16;教材P78 T9、 T11、 T12。,第一节 单个母总体抽样,例2.1 给定一有限总体2,3,3,4,即 N = 4,= 3,2 = 1/2;现从中以n = 2进行 复置抽样,则所有可能的样本数为 Nn = 16 个,计算各样本的统计量并整理成右表 。 解 视为变量的衍生总体参数: = / Nn = 4816 = 3 2 =148 48 2 16/ 16 = 1/4 视y为变

3、量的衍生总体参数: y = (y) / Nn = 9616 = 6 2y =592 96 216/16 = 1 以上两个衍生总体均由“一切可能的抽 样观察结果组成”,并且实际应用中遇到的 多为无限总体,可以想象得到,但“看不见, 也摸不着” 。,2,3,3,4,2,2,2,3,2,3,2,4,3,2,3,3,3,3,3,4,第一节 单个母总体抽样,第一节 单个母总体抽样,前例可归纳出抽样研究的部分结论: 由Nn个构成的衍生总体; N( ,2 )且有: = , 2 = 2 /n 并有: u =( ) 由Nn个y构成的衍生总体; y N( y ,2y )且有: y = n, 2y = n2 又有:

4、 u = (y y ) y 和表明抽样分布的类型实质上 还是正态分布,只是其变量特殊罢了。 只有以自由度 n 1算得的样本方差 S2才是2 的无偏估计值。 (但 S 不是的无偏估计值),( S2 / Nn = 816 = 1/2 = 2 ),第一节 单个母总体抽样,例2.2 调查336个平方米的小地老虎 虫危害结果,= 4.73头 ,= 2.63头。 求抽样 n = 30时 4.37头的概率。 解 由上述结论知,须先求标准误: = /n = 2.6330 = 0.48头 u =()/n = - 0.75 =(4.374.73)0.48 P( 4.37 ) = ( - 0.75) = 0.226

5、6 查附表2表明本例所求结果实际为 获得 | -0.36 |这种抽样误差的两尾概率 (之和)为20.2266 = 0.4532。,fN(),n = 1,n =4,n = 9,第一节 单个母总体抽样,回眸例1.5求获得抽样误差的概率: =43.5g ,=4.65g,N =623; = 44.05 g,S = 4.523g,n = 25 解 按惯例所求两尾概率即抽样误差 的绝对值达到0.55的概率,因此有: = /n = 4.6525 = 0.93g u =0.55/n = 0.59 反查附表2或顺查附表1可得: P( | |0.55) = P(|u| 0.59) = 2 P(u - 0.59)

6、= 2 (- 0.59) = 2 0.2776 = 0.5552 0.56,以上两例已由总体标准差深化到总 体标准误 ,使连续性变量的概率分布研 究从误差y 升华到抽样误差 , 即 。 但这还不够,历史上也没有因此避免 正态分布在应用上的危机,因为要获得 的准确数值,其难度比大得多。到1908 年W.S.Gosset公开发表一篇论文才使抽样 误差的研究走出应用上的困境。 如例2.1中定义样本标准误S = S /n, 则可将抽样误差转换成另一个标准化变量 t = ( )S/n = 0.55 0.9 = 0.61 查附表3可知获得0.55的两尾概率 当在0.5以上(n1 = 24)。,第二节 显著

7、性检验的原理,一、什么是显著性检验? 在由样本研究总体时,先提出关于 总体的统计假设 ( Ho ) ,然后利用样本 提供的信息去反证它是否成立。 这种证明 Ho 是否成立的过程就叫 统计假设测验,简称假设测(检)验。 如果假设测验只针对一个 Ho , 并不 同时研究其它假设, 则称为显著性检验。 还有一些假设测验问题,需要研究 两个或更多的统计假设, 必须采取包括 多重比较在内的方差分析法才能解决, 因而不再一般化地称之为假设测验, 所 以假设测验大多局限于显著性测验。,例如某地小麦亩产一般o= 300kg, 并从多年种植的经验知= 75kg,今引 进一新品种得 n = 25个亩产量观察值,

8、算得=327kg ,如何评价其表面效应? 解 本例表面效应 “27kg产量差异”,要区分它是本质差别还是抽样误差 1. 先假定表面效应是抽样误差; Ho: = o或 = 300kg 2.按误差理论计算获此抽样误差的概率; P( | | 27 ) = P( | o| 27 ) = P( |u|2775/25 ) = 2 P(u -9/5) = 2 (- 1.8)= 2 0.036 = 0.072 3.根据小概率原理推断Ho是否成立; 按惯例= 0.05,故Ho成立。,第二节 显著性检验的原理,= 0.05也叫显著水平,是一个概率 临界值,它是根据“小概率事件在当前 这次试验(观察) 中实际不可能

9、发生”这 种“道德确定性”、基于农业和生物学领 域的行业要求而规定的小概率标准。 = 0.05只能理解为否定 Ho时容许犯 错误的概率, 本例获得27kg抽样误差的 概率虽然很小, 但尚未小到否定Ho时规 定的显著水平, 反过来讲就是没有95% 以上的把握来认定其表面效应是“本质 差别”而不是抽样误差; 或者说表面效应 虽然较大, 但还没有大到有95%以上的 把握来排除它是抽样误差的可能性。,上述通过计算两尾概率评价其表面效 应的做法通常针对的提问方式是:“新品 种的单产与当地品种有无显著差异?” 实际上评价表面效应还有一种问法: “新品种的单产是否高于当地品种?” 解 这样提问往往是根据专业

10、方面的信息 已明知新品种的单产不可能低于当地品种, 于是检验方法由双侧检验变成单侧检验。 1. 仍假定表面效应是抽样误差; Ho: o或 300kg 2.计算获此抽样误差的单侧概率; P( 27 ) = P( o 27 ) = P( u9/5) = (- 1.8) = 0.036 3.根据小概率原理推断:Ho不成立。,第二节 显著性检验的原理,二、显著性检验的特点 1. 是一种概率反证法; 先假定 (单向) 成立,再计算标准误, 然后将表面效应转换成标准化变量后查 算其属于抽样误差的概率是否为小概率, 是则拒绝Ho; 否则接受Ho。 2. 用了小概率原理; 否定Ho有95%以上的把握,但不可能

11、 为100%,即表面效应只要大到视其为抽 样误差时的双侧或单侧概率小到显著水 平就能否定Ho,不然就暂且接受Ho ,决 不意味着接受Ho时有95%以上的把握。 3. 不同的场合依据不同的抽样分布。,三、关于 t 分布 定义:t = ( ) S 其中S = S /n 叫样本标准误 参数: t = 0, t = / (-2 ) 曲线特性: 以t = 0 处的纵轴对称,并以之为曲 线最高点位置, 而后往两侧递降;不同的 决定一条特异的 t 分布曲线; 曲线形 状随着的增加, 峰顶由下往上朝标准 曲线的峰顶逼近, 两尾由上往下朝标准 曲线的两尾收拢; 而当 (120) 时, t 分布曲线与标准曲线N(

12、0, 1)重合。 4. 附表 3与 t 分布的关系。,第二节 显著性检验的原理,附表3所列为9种双侧概率对应的 | t | , 如右图所示, 当 n 1= 9时, 0.05 和0.10栏目下的2.262和1.833就表明 所得标准化变量 t 在 n =10时绝对值 超过2.262的概率(双侧面积)为0.05, 超过1.833的概率(双侧面积)为0.10。 按照显著性检验原理,计算获 得某抽样误差的概率只是为了确认 它是否为小概率,那反过来也就可 以根据0.05的显著水平确定标准化 变量 u 或 t 的“临界值”,再和抽样 误差标准化的结果相比较就是了, 由此而来的显著性检验步骤见下例。,0.9

13、0,0.05,0.025,0.025,1.833 ,2.262 ,t,f ( t ),= 9,第二节 显著性检验的原理,f ( t ),t,=,= 2,= 7,= 4,N(0, 1),第二节 显著性检验的原理,四、显著性检验的步骤 例2.3 已知某品种母猪的怀孕期为 0 = 114d,现抽查其10头母猪得怀孕期 平均日数 = 114.5d,S = 1.581d,则检 验所得样本的怀孕期是否显著超过114d 的步骤为: H0: o或 114d ; S = S/n = 1.58110 = 0.50 t = ( )S =0.50.50 = 1.00 按自由度 = 9 查得: 单侧 t0.05 = 双

14、侧 t0.10 = 1.833 推断:t t0.05 , H0 成立。即所得样本的怀孕期没有显著超过114d 本次测验的显著水平: = 0.05,本例是按照题目要求进行单侧检验, 实际应用中这种提问方式必须有所谓的 “附加知识”为依据,即有来自专业方面 的信息表明所得样本的怀孕期不可能低 于114d,否则就只能用双侧检验。 H0: = o或 = 114d ; S = S/n = 1.58110 = 0.50 t = ( )S =0.50.50 = 1.00 (3) 按自由度 = 9 查得两尾 t0.05 = 2.262 (4) 推断:tt0.05 , H0 成立。意即所得 样本的怀孕期与114

15、d无显著差异。 本例双侧检验对 H0 的态度与单侧检 验相同,但实际研究中有不相同的。,第二节 显著性检验的原理,例2.4 按饲料配方规定,每1000kg某 种饲料中维生素C不得少于0 = 247g, 现从某工厂的产品中随机抽查12份样品 得平均含量 = 252g,S = 9.115g,则检 验所得样本的Vc含量是否显著超过247g 的步骤为: H0: o或 247g ; S = S/n = 9.11512 = 2.631 t = ( )S =52.631 = 1.90 按自由度 = 11 查得: 单侧 t0.05 = 双侧 t0.10 = 1.796 推断:t t0.05 , H0 不成立。即 所得样本的Vc含量显著超过247g 本次检验的显著水平: = 0.05,本例

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号