第五章 统计假设测验-统计推断

上传人:飞*** 文档编号:48663514 上传时间:2018-07-19 格式:PPT 页数:89 大小:1.02MB
返回 下载 相关 举报
第五章 统计假设测验-统计推断_第1页
第1页 / 共89页
第五章 统计假设测验-统计推断_第2页
第2页 / 共89页
第五章 统计假设测验-统计推断_第3页
第3页 / 共89页
第五章 统计假设测验-统计推断_第4页
第4页 / 共89页
第五章 统计假设测验-统计推断_第5页
第5页 / 共89页
点击查看更多>>
资源描述

《第五章 统计假设测验-统计推断》由会员分享,可在线阅读,更多相关《第五章 统计假设测验-统计推断(89页珍藏版)》请在金锄头文库上搜索。

1、第五章 统计假设测验-统计推断第一节 统计假设测验的基本原理第二节 平均数的假设测验第三节 二项资料的百分数假设测验第四节 参数的区间估计第一节 统计假设测验的基本原理一、统计假设的基本概念二、统计假设测验的基本方法三、两尾测验与一尾测验。四、假设测验的两类错误一、统计假设的基本概念所谓统计假设(statistical hypothesis) 是指有关某一总体参数的假设。例如假设某小麦新品种的产量和原地方品种的产量一样,或者比旧地方品种更好。 单个平均数的假设适于统计测验的假设 两个平均数相比较的假设 (一) 单个平均数的假设一个样本是从一个具有平均数 的总体中随机抽出的,记作: 。例如:(1

2、) 某一小麦品种的产量具有原地方品种的产量,这指新品种的产量表现乃原地方品种产量表现的一个随机样本,其平均产量 等于某一指定值 ,故记为 。(2) 某一棉花品种的纤维长度( )具有工业上某一指定的标准( ),这可记为 。 (二) 两个平均数相比较的假设两个样本乃从两个具有相等参数的总体中随机抽出的,记为 或 。例如:(1)两个小麦品种的产量是相同的。(2)两种杀虫药剂对于某种害虫的药效是相等的。上述两种假设称为无效假设(null hypothesis)。因为假设总体参数(平均数)与某一指定值相等或假设两个总体参数相等,即假设其没有效应差异,或者说实得差异是由误差造成的。 和无效假设相对应的应有

3、一个统计假设,叫对应假设或备择假设( alternative hypothesis ),记作 或 。如果否定了无效假设,则必接受备择假设;同理,如果接受了无效假设,当然也就否定了备择假设。 二、统计假设测验的基本方法 -步骤(一) 对所研究的总体首先提出一个统计假设(二) 在承认上述无效假设的前提下,获得平均数的抽样分布,计算该假设正确的概率(三) 根据“小概率事件实际上不可能发生”原理接受或否定假设下面以一个例子说明假设测验方法的具体内容。设某地区的当地小麦品种一般667m2产300kg,即当地品种这个总体的平均数 =300(kg),并从多年种植结果获得其标准差=75(kg),而现有某新品种

4、通过25个小区的试验,计得其样本平均产量为每667m2330kg, 即=330,那么新品种样本所属总体与 =300的当地品种这个总体是否有显著差异呢?以下将说明对此假设进行统计测验的方法。(一) 对所研究的总体首先提出一个无效假设通常所做的无效假设常为所比较的两个总体间无差异。 测验单个平均数,则假设该样本是从一已知总体(总体平均数为指定值 )中随机抽出的,即 。如上例,即假定新品种的总体平均数 等于原品种的总体平均数=300kg,而样本平均数和之间的差数:330300=30(kg)属随机误差;对应假设则为 。 如果测验两个平均数,则假设两个样本的总体平均数相等,即 ,也就是假设两个样本平均数

5、的差数 属随机误差,而非真实差异;其对应假设则为 。 (二) 在承认上述无效假设的前提下,获得平均数的抽样分布,计算假设正确的概率 先承认无效假设,从已知总体中抽取样本容量为n=25的样本,该样本平均数的抽样分布具正态分布形状,平均数 =300(kg),标准误 =15(kg)。通过试验,如果新品种的平均产量很接近300 kg,例如301kg或299kg等,则试验结果当然与假设相符,于是应接受H0。如果新品种的平均产量为500kg,与总体假设相差很大,那当然应否定H0 。但如果试验结果与总体假设并不相差悬殊 , 就要借助于概率原理,具体做法有以下两种:1. 计算概率 在假设 为正确的条件下,根据

6、的抽样分布算出获得 =330kg的概率,或者说算得出现随机误差 =30(kg)的概率:在此,根据u 测验公式可算得: 因为假设是新品种产量有大于或小于当地品种产量的可能性,所以需用两尾测验。查附表3,当u=2时,P(概率)界于0.04和0.05之间,即这一试验结果: =30(kg),属于抽样误差的概率小于5%。2. 计算接受区和否定区 在假设H0为正确的条件下,根据 的抽样分布划出一个区间,如 在这一区间内则接受H0,如 在这一区间外则否定H0 。 如何确定这一区间呢?根据上章所述 和 的分布,可知:因此,在 的抽样分布中,落在( )区间内的有95%,落在这一区间外的只有5%。 如果以5%概率

7、作为接受或否定H0的界限,则上述区间( )为接受假设的区域,简称接受区( acceptance region ); 和 为否定假设的区域,简称否定区( rejection region )。 同理,若以1%作为接受或否定H0的界限,则( )为接受区域, 和 为否定区域。所以在测验时需先计算1.96 或2.58 ,然后从 加上和减去1.96 或2.58 ,即得两个否定区域的临界值。 如上述小麦新品种例,=300, ,1.96 =29.4(kg)。因之,它的两个2.5%概率的否定区域为 30029.4和 300+29.4,即大于329.4(kg)和小于270.6(kg)的概率只有5%(见图5.1)

8、。图5.1 5%显著水平假设测验图示 (表示接受区域和否定区域)(三) 根据“小概率事件实际上不可能发生”原理接受或否定假设当 由随机误差造成的概率小于5%或1%时,就可认为它不可能属于抽样误差,从而否定假设。如果因随机误差而得到某差数的概率P0.05。 推断:接受H0: 34g,即新引入品种千粒重与当地良种千粒重指定值没有显著差异。三、两个样本平均数相比较的假设测验由两个样本平均数的相差,以测验这两个样本所属的总体平均数有无显著差异。 测验方法 成组数据的平均数比较 成对数据的比较 (一) 成组数据的平均数比较 如果两个处理为完全随机设计的两个处理,各供试单位彼此独立,不论两个处理的样本容量

9、是否相同,所得数据皆称为成组数据,以组(处理)平均数作为相互比较的标准。 成组数据的平均数比较又依两个样本所属的总体方差( 和 )是否已知、是否相等而采用不同的测验方法。(1) 在两个样本的总体方差 和 为已知时,用u测验由抽样分布的公式知,两样本平均数 和 的差数标准误 ,在 和 是已知时为: 并有:在假设 下,正态离差u值为 ,故可对两样本平均数的差异作出假设测验。例5.2 据以往资料,已知某小麦品种每平方米产量的 。今在该品种的一块地上用A、B两法取样,法取 12个样点,得每平方米产量 =1.2(kg);B法取8个样点,得 =1.4(kg)。试比较A、B两法的每平方米产量是否有显著差异

10、?假设H0: A、B两法的每平方米产量相同,即 系随机误差;对 显著水平 因为实得|u|0.05推断:接受 , 即A、B两种取样方法所得的每平方米产量没有显著差异。 (2) 在两个样本的总体方差 和 为未知,但(样本方差同质),而两个样本又为小样本时,用t 测验。 从样本变异算出平均数差数的均方 , (56) 其两样本平均数的差数标准误为:当 时, 于是有:由于假设 故 自由度 (57) (58) (59A)(59B)例5.3 调查某农场每亩30万苗和35万苗的稻田各5块,得亩产量(单位:kg)于表5.2,试测验两种密度亩产量的差异显著性。 表5.2 两种密度的稻田亩产亩产 (kg)y1(30

11、万苗)y2(35万苗)400450420440435445460445425420假设H0:两种密度的总体产量没有差异,即 对显著水平 =0.05 测验计算: =428kg =440kgSS1=1930 SS2=550 故 查附表4,v=4+4=8时, t0.05=2.306。现实得|t|=1.080.05。推断:接受假设 ,两种密度的亩产量没有显著差异。 例5.4 研究矮壮素使玉米矮化的效果,在抽穗期测定喷矮壮素小区8株、对照区玉米9株,其株高结果如表5.3。试作假设测验。表5.3 喷喷矮壮素与否的 玉米株高(cm)y1(喷喷矮壮素 )y2(对对照)160170 160270 200180

12、160250 200270 170290 150270 210230 170矮壮素只可能矮化无效而不可能促进植侏长高,因此假设H0:喷矮壮素的株高与未喷的相同或更高,即 对 即喷矮壮素的株高较未喷的为矮,作一尾测验。显著水平 =0.05。测验计算: =176.3cm =233.3cmSS1=3787.5 SS2=18400故有 按 v=7+8=15,查t表得一尾 t0.05 =1.753(一尾测验t0.05等于两尾测验的t0.10),现实得 t =3.053.106,故Pt0.01,故P0.05。推断:接受 ,即认为新肥料较原肥料每亩增收皮棉不超过5kg。 成对数据和成组数据平均数比较的不同:

13、(1)成对数据和成组数据平均数比较所依据的条件是不相同的。前者是假定各个配对的差数来自差数的分布为正态的总体,具有N(0, );而每一配对的两个供试单位是彼此相关的。后者则是假定两个样本皆来自具有共同(或不同)方差的正态总体,而两个样本的各个供试单位都是彼此独立的。(2)在实践上,如将成对数据按成组数据的方法比较,容易使统计推断发生第二类错误,即不能鉴别应属显著的差异。故在应用时需严格区别。 第三节 二项资料的百分数假设测验许多生物试验的结果是用百分数或成数表示的,如结实率、发芽率等,这些百分数系由计数某一属性的个体数目求得, 属间断性的计数资料.在理论上,这类百分数的假设测验应按二项分布进行,即从二项式(p+q)n的展开式中求出某项属性个体百分数的概率 。这样虽精确但麻烦。如样本容量n 较大,p不过较小,而np和nq又均不小于5时, (p+q)n的分布趋近于正态。因而可以将百分数资料作正态分布处理,从而作出近似的测验。适于用u测验所需的二项样本容量n见表5.6。 (样样本百分数)(较较小组组次数)n (样本容量)0.5015300.4020500.3024800.20402000.10606000.05701400表5.6 适于用正态离差测验的二项样

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号