生物统计与田间试验统计假设测验

资源描述

《生物统计与田间试验统计假设测验》由会员分享，可在线阅读，更多相关《生物统计与田间试验统计假设测验（211页珍藏版）》请在金锄头文库上搜索。

1、第五章统计假设测验,第一节统计假设测验的基本原理第二节平均数的假设测验第三节二项资料的百分数假设测验第四节参数的区间估计,第一节统计假设测验的基本原理,一、统计假设的基本概念二、统计假设测验的基本方法三、两尾测验与一尾测验。四、假设测验的两类错误,一、统计假设的基本概念,所谓统计假设(statistical hypothesis) 是指有关某一总体参数的假设。例如假设某小麦新品种的产量和原地方品种的产量一样，或者比旧地方品种更好。,单个平均数的假设,适于统计测验的假设,两个平均数相比较的假设,(一) 单个平均数的假设一个样本是从一个具有平均数的总体中随机抽出的，记作：

2、。例如：(1) 某一小麦品种的产量具有原地方品种的产量，这指新品种的产量表现乃原地方品种产量表现的一个随机样本，其平均产量等于某一指定值，故记为。(2) 某一棉花品种的纤维长度( )具有工业上某一指定的标准( )，这可记为。,(二) 两个平均数相比较的假设两个样本乃从两个具有相等参数的总体中随机抽出的，记为或。例如：(1)两个小麦品种的产量是相同的。(2)两种杀虫药剂对于某种害虫的药效是相等的。,上述两种假设称为无效假设(null hypothesis)。因为假设总体参数(平均数)与某一指定值相等或假设两个总体参数相等，即假设其没有效应差异，或者说实得差异是由误差造成的。,和无效

3、假设相对应的应有一个统计假设，叫对应假设或备择假设( alternative hypothesis )，记作或。如果否定了无效假设，则必接受备择假设；同理，如果接受了无效假设，当然也就否定了备择假设。,二、统计假设测验的基本方法,(一) 对所研究的总体首先提出一个统计假设(二) 在承认上述无效假设的前提下，获得平均数的抽样分布，计算该假设正确的概率(三) 根据“小概率事件实际上不可能发生”原理接受或否定假设,下面以一个例子说明假设测验方法的具体内容。设某地区的当地小麦品种一般667m2产300kg，即当地品种这个总体的平均数 =300(kg)，并从多年种植结果获得其标准差=75(kg)，而

4、现有某新品种通过25个小区的试验，计得其样本平均产量为每667m2330kg, 即=330，那么新品种样本所属总体与 =300的当地品种这个总体是否有显著差异呢？以下将说明对此假设进行统计测验的方法。,(一) 对所研究的总体首先提出一个无效假设通常所做的无效假设常为所比较的两个总体间无差异。测验单个平均数，则假设该样本是从一已知总体(总体平均数为指定值 )中随机抽出的，即。如上例，即假定新品种的总体平均数等于原品种的总体平均数=300kg，而样本平均数和之间的差数：330300=30(kg)属随机误差；对应假设则为。如果测验两个平均数，则假设两个样本的总体平均数相等，即，也就是假设

5、两个样本平均数的差数属随机误差，而非真实差异；其对应假设则为。,(二) 在承认上述无效假设的前提下，获得平均数的抽样分布，计算假设正确的概率先承认无效假设，从已知总体中抽取样本容量为n=25的样本，该样本平均数的抽样分布具正态分布形状，平均数 =300(kg)，标准误 =15(kg)。通过试验，如果新品种的平均产量很接近300 kg，例如301kg或299kg等，则试验结果当然与假设相符，于是应接受H0。如果新品种的平均产量为500kg，与总体假设相差很大，那当然应否定H0 。但如果试验结果与总体假设并不相差悬殊 , 就要借助于概率原理，具体做法有以下两种：,1. 计算概率在假设为正

6、确的条件下，根据的抽样分布算出获得 =330kg的概率，或者说算得出现随机误差 =30(kg)的概率：在此，根据u 测验公式可算得：,因为假设是新品种产量有大于或小于当地品种产量的可能性，所以需用两尾测验。查附表3，当u=2时，P(概率)界于0.04和0.05之间，即这一试验结果： =30(kg)，属于抽样误差的概率小于5%。,2. 计算接受区和否定区在假设H0为正确的条件下，根据的抽样分布划出一个区间，如在这一区间内则接受H0，如在这一区间外则否定H0 。如何确定这一区间呢？,根据上章所述和的分布，可知：,因此，在的抽样分布中，落在( )区间内的有95%，落在这一区间外的只有

7、5%。,如果以5%概率作为接受或否定H0的界限，则上述区间( )为接受假设的区域，简称接受区( acceptance region )；和为否定假设的区域，简称否定区( rejection region )。,同理，若以1%作为接受或否定H0的界限，则( )为接受区域，和为否定区域。,所以在测验时需先计算1.96 或2.58 ，然后从加上和减去1.96 或2.58 ，即得两个否定区域的临界值。,如上述小麦新品种例，=300， , 1.96 =29.4(kg)。因之，它的两个2.5%概率的否定区域为 30029.4和 300+29.4，即大于329.4(kg)和小于270.6(kg

8、)的概率只有5%(见图5.1)。,图5.1 5%显著水平假设测验图示（表示接受区域和否定区域）,(三) 根据“小概率事件实际上不可能发生”原理接受或否定假设,当由随机误差造成的概率小于5%或1%时，就可认为它不可能属于抽样误差，从而否定假设。如果因随机误差而得到某差数的概率P0.05，则称这个差数是显著的。如果因随机误差而得到某差数的概率P0.01，则称这个差数是极显著的。而这种假设测验也叫显著性测验。用来测验假设的概率标准5%或1%等，称为显著水平( significance level )。一般以表示，如 =0.05或 =0.01。,综合上述，统计假设测验的步骤可总结如下：(1)

9、对样本所属的总体提出统计假设，包括无效假设和备择假设。(2) 规定测验的显著水平值。(3) 在为正确的假定下，根据平均数( )或其他统计数的抽样分布，如为正态分布的则计算正态离差u值。由u值查附表3即可知道因随机抽样而获得实际差数(如等)由误差造成的概率。或者根据已规定概率，如 =0.05,查出u=1.96,因而划出两个否定区域为: 和 (4) 将规定的值和算得的u值的概率相比较，或者将试验结果和否定区域相比较，从而作出接受或否定无效假设的推断。,三、两尾测验与一尾测验,如果统计假设为 , 则备择假设为 , 在假设测验时所考虑的概率为曲线左边一尾概率(小于 )和右边一尾概率(大于 )的

10、总和。这类测验称为两尾测验( two-tailed test )，它具有两个否定区域。,如果统计假设为 , 则其对应的备择假设必为。因而，这个对应的备择假设仅有一种可能性,而统计假设仅有一个否定区域，即曲线的右边一尾。这类测验称一尾测验( one-tailed test )。一尾测验还有另一种情况，即， , 这时否定区域在左边一尾. 作一尾测验时，需将附表3列出的两尾概率乘以1/2，再查出其u值。,四、假设测验的两类错误,表5.1 假设测验的两类错误,第一类错误的概率为显著水平值。第二类错误的概率为值。值的计算方法就是计算抽样平均数落在已知总体的接受区的概率(这里的已知总体是假定的)

11、。,例：已知总体的均值 =300，其平均数抽样标准误为15，被抽样总体的平均数 315kg、标准误也为15，由此可以画出这两个总体的分布曲线如图5.2，图中标出了已知总体的接受区域在c1和c2之间。由于两个总体的平均数不同，这种可能性正是第二类错误的概率值，其一般计算方法为：,查附表2，P(u12.96)=0.0015，P(u20.96)=0.8315，故有 =P(u20.96)P(u1 2.96)=0.83150.0015=0.83或83%,图5.2 ： =300是错误时的值,关于两类错误的讨论可总结如下：(1) 在样本容量n固定的条件下，提高显著水平 (取较小的值)，如从5%变为1%则

12、将增大第二类错误的概率值。(2) 在n和显著水平相同的条件下，真总体平均数和假设平均数的相差(以标准误为单位)愈大，则犯第二类错误的概率值愈小。(3) 为了降低犯两类错误的概率，需采用一个较低的显著水平，如 =0.05；同时适当增加样本容量，或适当减小总体方差，或两者兼有之。(4) 如果显著水平已固定下来，则改进试验技术和增加样本容量可以有效地降低犯第二类错误的概率。,第二节平均数的假设测验,一、t 分布二、单个样本平均数的假设测验三、两个样本平均数相比较的假设测验,一、t 分布,从一个平均数为、方差为的正态总体中抽样，,(2)当样本容量不太大(n30)而为未知时，以

13、样本均方估计，则其标准化离差的分布不呈正态，而作 t 分布，具有自由度DF=n-1。,(1) 样本平均数的分布必趋向正态分布，,并且遵循正态分布N(0，1)。,(51),为样本平均数的标准误，,s为样本标准差，n为样本容量。,t 分布(t-distribution)是1908年.S. Gosset首先提出的，又叫学生氏分布(students t distribution)。它是一组对称密度函数曲线，具有一个单独参数以确定某一特定分布。v 是自由度。在理论上，当v 增大时，t 分布趋向于正态分布。,t 分布的密度函数为：,t 分布的平均数和标准差为：,(54),(53),t 分布曲线是对称的，围绕其平均数向两侧递降。和正态曲线比较，t 分布曲线稍为扁平，峰顶略低，尾部稍高(图5.5)。t 分布是一组随自由度v 而改变的曲线，但当v30时接近正态曲线，当v=时和正态曲,线合一。由于t 分布受自由度制约，所以t 值与其相应的概率也随自由度而不同。,t 分布的概率累积函数为：,(55),和正态概率累积函数一样，t 分布的概率累积函数也分一尾表和两尾表。计算于给定 t0 值时,

展开阅读全文