[数学]统计推断

上传人:豆浆 文档编号:49512073 上传时间:2018-07-29 格式:PPT 页数:63 大小:896KB
返回 下载 相关 举报
[数学]统计推断_第1页
第1页 / 共63页
[数学]统计推断_第2页
第2页 / 共63页
[数学]统计推断_第3页
第3页 / 共63页
[数学]统计推断_第4页
第4页 / 共63页
[数学]统计推断_第5页
第5页 / 共63页
点击查看更多>>
资源描述

《[数学]统计推断》由会员分享,可在线阅读,更多相关《[数学]统计推断(63页珍藏版)》请在金锄头文库上搜索。

1、生物统计学第五章 统计推断 概论总体与样本之间的关系包括两个方面:一方面,已知 总体,研究样本的分布;第三章和第四章分别讲述了随机 变量的分布规律和样本统计量与总体参数的关系,这些都 属于从总体到样本的研究。本章讨论如何通过样本去推断 总体。由样本推断总体是以各种样本统计量的抽样分布为 基础的(即第四章内容)。对总体做统计推断可以通过两 条途径进行:一是统计假设检验-首先对所估计的总体提 出一个假设,例如假设所抽取的样本来源于某个平均数为 的总体,然后,通过样本数据去推断这个假设是否可以接 受。如果可以接受,样本很可能抽自这个总体;否则,很 可能不是抽自这个总体;二是总体参数估计-通过样本统

2、计量估计总体参数。 统计推断的内容很广泛,以后还要讲列两种特定类型 的统计推断方法,即方差分析和回归分析。本章重点讲解 统计推断的一般原理以及对总体平均数及标准差的推断; 第六章将介绍总体参数估计的方法。5.1单个样本的统计假设 检验5.1.1统计推断的一般原理及统计推断 过程的两种类型错误以检验平均数相等为例,进行统计推断需要进行四个步骤: (1)提出假设 先假设总体平均数= 0,这样的假设称为零假设或者无效假设,记作 H0;零假设对应的是备择假设,记作HA。 (2)确定显著水平 提出了假设之后,确定显著水平,显著水平是指是否否定零假设的概率 标准,也称为概率水平,记作 。 是人为规定的小概

3、率临界值,生物统计 通常取=0.05或者=0.01作为为假设检验设检验 的显显著水平。 (3)计计算概率 在提出假设设的基础础上,确定显显著水平之后,根据相应应的分布计计算概率 。以平均数相等的假设检验设检验 而言,根据平均数抽样样分布,计计算正态态分布概 率。(4)推断是否接受假设根据小概率原理作出是否接受H0的判断(推断)。小概率原 理指出:如果假设一些条件,并在假设的条件下能够准确地算出 事件A出现的概率为很小,则在假设条件下的n次独立重复试验 中,事件A将按预定的概率发生,而在一次试验中则几乎不可能发 生。统计学中,常把概率小于0.05或0.01作为小概率。如果计算的 概率大子0.05

4、或0.0l,则认为不是小概率事件, H0假设可能是正确 的,应该接受,同时否定HA;反之,所计算的概率小于0.05或0.01 ,则否定H0,接受HA。通常把概率等于或小于0.05叫做差异显著 标准,或差异显著水平;等于或小于0.01叫做差异极显著标准,或 差异极显著水平。一殷差异达到显著水平,则在资料的右上方标 以“*”,差异达到极显著水平,则在资料有上方标以“*”。例题:一批动物,经过一段时间饲养,预计其体重达到10g。根据 以往经验,该动物体重标准差为0.4g,现从中随机抽样得到10只个体, 计算其平均体重为10.23,问1、该批动物体重是否超过10g;2、该批动 物体重是否等于10g。解

5、答:问题1(1)提出假设H0:10只动物来自总体平均数为10的总体,即=10;10只动物来自总体平均数大于10的总体,即10(2)确定显著水平:0.05(3)计算概率:根据抽样平均数的分布符合正态分布,计算概率 :查正态分布表,得P(u1.82)=1-0.96563=0.034371.82)+P(u0.05不属于小概率事件,在0.05的显著水平下,双尾检验不排除 u=10。选择做单尾检验还是做双尾检验,应该根据问题的要求而定。 假若问题只要求判断是否等于0,而不是大于0或小于0时,应 该做双尾检验。如果事先可以断定0大于0或者必小于0,则可做 单尾检验。因为单尾检验的辨别力更强,所以可能的情况

6、下尽量做 单尾检验。拒绝域、接受域与临界值在统计假设检验的实际应用中,通常并不直接算出 零假设成立的实际概率,而是只计算u值,将求得的u值 与显著水平对应的u值(即u)比较,会有以下三种情况 : 单尾检验0:若u u ,则否定H0,接受HA,U u的区域称为拒绝域;若u -u的区域为接受域。 双尾检验0:显著水平对应的临界值为u/2 ,Uu/2的区域为拒绝域, -u/20HA:0或者0 (即379.2 3.3 377.2?)(2)确定显著水平=0.05,u0.05=1.645(3)计算检验统计 量(4)作出统计推断,1.821.645,即uu0.05,拒绝H0,接受HA, 说明栽培条件改善后,

7、豌豆籽粒重量显著提高5.1.4 总体标准差未知,单单个样样 本平均数的显显著性检验检验 t检验检验大多数试验或者调查,总体的标准差是未知的。在这种情况下,需要 用样本标准差估计总体标准差。用样本标准差估计总体标准差计算所得 的“标准正态离差”,即t值,服从自用度为n-1的t分布(参见4.4),因此 总体标准差未知的情况下,单个样本平均数的差异显著性使用t检验进行 统计推断。t检验的程序与u检验类似,不同之处在于计算t值作为检验统计量,相 应地,用临界值t代替u检验的临界值u 。例题:已知某玉米品种平均穗重0=300g,喷药后,随机抽取9个玉 米穗,其穗重为:308、305、311、298、31

8、5、300、321、294、320g。 问喷药后与喷药前的穗重,差异是否显著?解:(1)提出假设:H0: =0(300g)HA: 0(300g)(2)确定显著水平=0.05,相应的临界值t8,0.05(双尾)=2.306;(3)计算检验统计量t值(4)做出统计推断,并分析所得的专业结论 :因为本例计算所得t值大于显著水平0.05对应的 检验统计量t自由度为8时临界值,说明从=300g 的总体中得到本例样本是小概率事件,因此否定 零假设H0,接受备择假设HA。从专业角度来解 释,说明喷药后,该玉米品种穗重在0.05的检 验水平上与喷药前有显著差异。水产养殖应用实例某贝类养殖公司养殖太平洋牡蛎,2

9、006年放养二倍 体苗种,经过三个月生长期,牡蛎平均壳长8.9cm。 2007年,该公司在中国海洋大学贝类教研室技术支持 下,采用多倍体育苗技术,采用曾获得教育部科技进 步一等奖的多倍体苗种培育技术,放养三倍体太平洋 牡蛎苗种,经过三个月生长期,采样10只个体,测量 其壳长,结果为10.1,10.2,9.5,8.9,8.5,9.8,9.1, 10.5,9.7,10.5cm。问2007年采用多倍体苗种培育技 术能否显著改善太平洋牡蛎的生长状况。解:(1)提出假设:H0: =0(8.9cm) HA: 0(8.9cm)(2)确定显著水平=0.05,查表得自由度为9 时,显著水平0.05对应的单尾t临

10、界值t9,0.05(单尾)=1.833; (3)计算检验统计量t值(4)做出统计推断,分析统计结果:计算所得t值落 于t分布的拒绝域内,否定零假设H0,接受备择假设HA ,结论采用多倍体苗种培育技术的确能够显著改善太平 洋牡蛎的生长状况。本例若设定显著水平0.01,查表得t9,0.01(单尾)=2.821,计 算所得检验统计量t值3.622大于2.821,说明在0.01的显 著水平上,采用多倍体苗种培育技术的确能够极显著改 善太平洋牡蛎的生长状况。5.1.5 单个样本变异性(方差 )的差异显著性检验2检验单个样本方差的差异显著性检验是建立在2分布的基础上(参照 4.5)。从标准正态总体抽出n个

11、样本,其标准正态离差u2定义为2 。即用样本平均数估计总体平均数,则又所以有即样本方差与总体方差的比例乘以n-1服从自由度n-1的2分布2检验仍然遵循假设检验的四个步骤,详述如下:(1)提出假设:零假设H0: = 0;备择假设HA可能为以下3种情况之一: HA: 0 HA: 2 2 2/2(3)计算检验统计量2值(4)比较计算所得2值与显著水平对应的2 临近值,做出统计推断,是否接受H0。例题:一个混杂的小麦品种,株高标准差014cm,经提 纯后随机抽出10株,它们的株高为:90、105、101、95、100 、100、101、105、93、97cm,考查提纯后的群体是否比原 群体整齐? 解:

12、(1)提出假设:H0:=0(14cm)HA: 22或12Fdf1,df2, ,或FFdf1,df2, /2及F22(2)确定显著水平=0.05,因为HA: 1222,所 以对应的F临界值应为右尾检验的F临界值,即 F19,19,0.05=2.18;(3)计算检验统计量F19,19=s12/s22=937.7/193.7=4.84;(4)比较计算所得F值与显著水平=0.05 在df1=19 ,df2=19时对应的右尾F临界值,即4.842.18,计算所得 F值落于拒绝域内,否定H0,接受HA:1222,即老年 人血压标准差大于年轻人,或者说,老年人个体间血 压的波动性高于年轻人。两种解法的结论是

13、一样的。对照以上两种解法,可以看到,如果以方 差较大的样本作为样本1,在显著水平为0.05或 者0.01时,则在F检验过程中只会涉及到右尾F 临界值,可以省去对左尾F值的计算步骤。这是 因为无论df1,df2为多少,显著水平为0.01或者 0.05,右尾F临界值永远大于1,所以s12/s22得拒 绝域只会落到右尾区。因此通常以F检验检验两 个样本方差的差异显著性以方差较大的样本作 为样本1,可以简化计算。关于F临界值的计算方法:(1)左尾F临界值的计算:对于确定的显著水平, 对单尾检验,其左尾拒绝域为F2或者12(2)确定显著水平=0.05,查表得右尾检验对 应的临界值u0.05右尾=1.64

14、5,拒绝域为u1.645;(3)计算检验统计量(4)因为计算所得检验统计量u=0.57小于临界值 u0.05=1.645,接受H0: 1=2 ,说明一号渔场调查 所得马面鲀体长并不显著大于二号渔场。5.2.3 两个样本标准差未知但相 等,样本平均数的差异显著性检验 独立样本t 检验;与u检验基本相同,不同之处在于,因为总体方 差未知,需要用样本方差估计总体方差,因而数据 服从t分布,因此检验统计量以t值代替u检验的u值, 并且用两个样本方差s12、s22的加权平均作为合并方 差,估计总体方差,自由度df=(n1-1)+(n2-1) =n1+n2-2。检验统计量t计算公式如下:若n1=n2=n,

15、t值计算公式可作如下简化:若n1、n2都很大(一般大于50),则n1-1n1, n2-1n2,则t值计算公式可简化如下:与u检验类似,独立样本的t检验假设的提出为H0 :1=2不同的备则假设下,H0的拒绝域分别为:HA:12,则H0拒绝域为tt;HA:1t/2例题一:调查两个小麦品种从播种到抽穗所需 要的天数,均调查10株,平均抽穗天数分别为 99.2天和98.9天,方差分别为0.84天和0.77天, 问两个小麦品种的抽穗天数是否有显著区别。解:1、方差同质性检验计算所得F值位于H0接受域内,即两个样本方差 差异不显著,通过方差同质性检验。2、平均数差异显著性检验(1)提出假设:H0:1=2及

16、HA:12(2)确定显著水平=0.05,t临界值t18,0.05双尾 =2.101;(3)计算检验统计量,因为n1=n2=9,(4)做出统计推断:因为计算所得检验统计 量t18=0.752.160,说明在0.05 的显著水平上,两种药物对对肾组织切片氧 消耗的影响差异刚刚达到显著5.2.4 总体标准差未知且不等时, 两平均数间差异显著性的检验进行两个平均数的差异显著性检验时 ,如果经过F检验,发现两个样本的方差 差异显著,此时根据总体标准差相等所计 算得到的检验统计量并不服从t分布,此时 则需要使用改进的t检验法Aspin-Welch检 验进行比较检验。与总体标准差相等时的t检验相比,总体标准 差不等时,两平均数间差异显著性检验使用的 Aspin-Welch检验具有以下不同:(

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号