五章节统计假设测验讲解学习

资源描述

《五章节统计假设测验讲解学习》由会员分享，可在线阅读，更多相关《五章节统计假设测验讲解学习（89页珍藏版）》请在金锄头文库上搜索。

1、第五章统计假设测验,第一节统计假设测验的基本原理第二节平均数的假设测验第三节二项资料的百分数假设测验第四节参数的区间估计,第一节统计假设测验的基本原理,一、统计假设的基本概念二、统计假设测验的基本方法三、两尾测验与一尾测验。四、假设测验的两类错误,一、统计假设的基本概念,所谓统计假设(statistical hypothesis) 是指有关某一总体参数的假设。例如假设某小麦新品种的产量和原地方品种的产量一样，或者比旧地方品种更好。,单个平均数的假设,适于统计测验的假设,两个平均数相比较的假设,(一) 单个平均数的假设一个样本是从一个具有平均数的总体中随机抽出的，记作：

2、。例如： (1) 某一小麦品种的产量具有原地方品种的产量，这指新品种的产量表现乃原地方品种产量表现的一个随机样本，其平均产量等于某一指定值，故记为。 (2) 某一棉花品种的纤维长度( )具有工业上某一指定的标准( )，这可记为。,和无效假设相对应的应有一个统计假设，叫对应假设或备择假设( alternative hypothesis )，记作或。如果否定了无效假设，则必接受备择假设；同理，如果接受了无效假设，当然也就否定了备择假设。,二、统计假设测验的基本方法,(一) 对所研究的总体首先提出一个统计假设 (二) 在承认上述无效假设的前提下，获得平均数的抽样分布，计算该假设正确的概

3、率 (三) 根据“小概率事件实际上不可能发生”原理接受或否定假设,下面以一个例子说明假设测验方法的具体内容。设某地区的当地小麦品种一般667m2产300kg，即当地品种这个总体的平均数 =300(kg)，并从多年种植结果获得其标准差=75(kg)，而现有某新品种通过25个小区的试验，计得其样本平均产量为每667m2330kg, 即 =330，那么新品种样本所属总体与 =300的当地品种这个总体是否有显著差异呢？以下将说明对此假设进行统计测验的方法。,(一) 对所研究的总体首先提出一个无效假设通常所做的无效假设常为所比较的两个总体间无差异。测验单个平均数，则假设该样本是从一已知总体(总体平

4、均数为指定值 )中随机抽出的，即。如上例，即假定新品种的总体平均数等于原品种的总体平均数=300kg，而样本平均数和之间的差数：330300=30(kg)属随机误差；对应假设则为。如果测验两个平均数，则假设两个样本的总体平均数相等，即，也就是假设两个样本平均数的差数属随机误差，而非真实差异；其对应假设则为。,(二) 在承认上述无效假设的前提下，获得平均数的抽样分布，计算假设正确的概率先承认无效假设，从已知总体中抽取样本容量为n=25的样本，该样本平均数的抽样分布具正态分布形状，平均数 =300(kg)，标准误 =15(kg)。通过试验，如果新品种的平均产量很接近300 kg，例

5、如301kg或299kg等，则试验结果当然与假设相符，于是应接受H0。如果新品种的平均产量为500kg，与总体假设相差很大，那当然应否定H0 。但如果试验结果与总体假设并不相差悬殊 , 就要借助于概率原理，具体做法有以下两种：,1. 计算概率在假设为正确的条件下，根据的抽样分布算出获得 =330kg的概率，或者说算得出现随机误差 =30(kg)的概率：在此，根据u 测验公式可算得：,因为假设是新品种产量有大于或小于当地品种产量的可能性，所以需用两尾测验。查附表3，当u=2时，P(概率)界于0.04和0.05之间，即这一试验结果： =30(kg)，属于抽样误差的概率小于5%。,2. 计算接

6、受区和否定区在假设H0为正确的条件下，根据的抽样分布划出一个区间，如在这一区间内则接受H0，如在这一区间外则否定H0 。如何确定这一区间呢？,根据上章所述和的分布，可知：,因此，在的抽样分布中，落在( )区间内的有95%，落在这一区间外的只有5%。,如果以5%概率作为接受或否定H0的界限，则上述区间( )为接受假设的区域，简称接受区( acceptance region )；和为否定假设的区域，简称否定区( rejection region )。,同理，若以1%作为接受或否定H0的界限，则( )为接受区域，和为否定区域。,所以在测验时需先计算1.96 或2.58 ，然后

7、从加上和减去1.96 或2.58 ，即得两个否定区域的临界值。,如上述小麦新品种例， =300， , 1.96 =29.4(kg)。因之，它的两个2.5%概率的否定区域为 30029.4和 300+29.4，即大于329.4(kg)和小于270.6(kg)的概率只有5%(见图5.1)。,图5.1 5%显著水平假设测验图示（表示接受区域和否定区域）,(三) 根据“小概率事件实际上不可能发生”原理接受或否定假设,当由随机误差造成的概率小于5%或1%时，就可认为它不可能属于抽样误差，从而否定假设。如果因随机误差而得到某差数的概率P0.05，则称这个差数是显著的。如果因随机误差而得到某差数

8、的概率P0.01，则称这个差数是极显著的。而这种假设测验也叫显著性测验。用来测验假设的概率标准5%或1%等，称为显著水平( significance level )。一般以表示，如 =0.05或 =0.01。,综合上述，统计假设测验的步骤可总结如下： (1) 对样本所属的总体提出统计假设，包括无效假设和备择假设。 (2) 规定测验的显著水平值。 (3) 在为正确的假定下，根据平均数( )或其他统计数的抽样分布，如为正态分布的则计算正态离差u值。由u值查附表3即可知道因随机抽样而获得实际差数(如等)由误差造成的概率。或者根据已规定概率，如 =0.05,查出u=1.96,因而划出两个否

9、定区域为: 和 (4) 将规定的值和算得的u值的概率相比较，或者将试验结果和否定区域相比较，从而作出接受或否定无效假设的推断。,三、两尾测验与一尾测验,如果统计假设为 , 则备择假设为 , 在假设测验时所考虑的概率为曲线左边一尾概率(小于 )和右边一尾概率(大于 )的总和。这类测验称为两尾测验( two-tailed test )，它具有两个否定区域。,如果统计假设为 , 则其对应的备择假设必为。因而，这个对应的备择假设仅有一种可能性,而统计假设仅有一个否定区域，即曲线的右边一尾。这类测验称一尾测验( one-tailed test )。一尾测验还有另一种情况，即， , 这时否定区域在左

10、边一尾. 作一尾测验时，需将附表3列出的两尾概率乘以1/2，再查出其u值。,四、假设测验的两类错误,表5.1 假设测验的两类错误,第一类错误的概率为显著水平值。第二类错误的概率为值。值的计算方法就是计算抽样平均数落在已知总体的接受区的概率(这里的已知总体是假定的)。,例：已知总体的均值 =300，其平均数抽样标准误为15，被抽样总体的平均数 315kg、标准误也为15，由此可以画出这两个总体的分布曲线如图5.2，图中标出了已知总体的接受区域在c1和c2之间。由于两个总体的平均数不同，这种可能性正是第二类错误的概率值，其一般计算方法为：,查附表2，P(u12.96)=0.0015，P(u

11、20.96)=0.8315，故有 =P(u20.96)P(u1 2.96)=0.83150.0015=0.83或83%,图5.2 ： =300是错误时的值,关于两类错误的讨论可总结如下： (1) 在样本容量n固定的条件下，提高显著水平 (取较小的值)，如从5%变为1%则将增大第二类错误的概率值。 (2) 在n和显著水平相同的条件下，真总体平均数和假设平均数的相差(以标准误为单位)愈大，则犯第二类错误的概率值愈小。 (3) 为了降低犯两类错误的概率，需采用一个较低的显著水平，如 =0.05；同时适当增加样本容量，或适当减小总体方差，或两者兼有之。 (4) 如果显著水平已固定下来

12、，则改进试验技术和增加样本容量可以有效地降低犯第二类错误的概率。,第二节平均数的假设测验,一、t 分布二、单个样本平均数的假设测验三、两个样本平均数相比较的假设测验,一、t 分布,从一个平均数为、方差为的正态总体中抽样，,(2)当样本容量不太大(n30)而为未知时，以样本均方估计，则其标准化离差的分布不呈正态，而作 t 分布，具有自由度DF=n-1。,(1) 样本平均数的分布必趋向正态分布，,并且遵循正态分布N(0，1)。,(51),为样本平均数的标准误，,s为样本标准差，n为样本容量。,t 分布(t-distribution)是1908年.S. Gosset首先提出的

13、，又叫学生氏分布(students t distribution)。它是一组对称密度函数曲线，具有一个单独参数以确定某一特定分布。v 是自由度。在理论上，当v 增大时，t 分布趋向于正态分布。,t 分布的密度函数为：,t 分布的平均数和标准差为：,(54),(53),t 分布曲线是对称的，围绕其平均数向两侧递降。和正态曲线比较，t 分布曲线稍为扁平，峰顶略低，尾部稍高(图5.5)。t 分布是一组随自由度v 而改变的曲线，但当v30时接近正态曲线，当v=时和正态曲,线合一。由于t 分布受自由度制约，所以t 值与其相应的概率也随自由度而不同。,t 分布的概率累积函数为：,(55),和正态概率累

14、积函数一样，t 分布的概率累积函数也分一尾表和两尾表。计算于给定 t0 值时,因而t 分布曲线右尾从 t 到的面积为1Fv(t)，而两尾面积则为21Fv(t),在t 表中，若v相同，则P越大，t 越小；P越小，t 越大。因此在假设测验时，若算得的|t | ，则接受无效假设。,二、单个样本平均数的假设测验,测验某一样本所属总体平均数是否和某一指定的总体平均数相同。,例5.1 某春小麦良种的千粒重 34g，现自外地引入一高产品种，在8个小区种植，得其千粒重(g)为：35.6、37.6、33.4、35.1、32.7、36.8、35.9、34.6，问新引入品种的千粒重与当地良种有无显著差异？,这里

15、总体为未知，又是小样本，故需用t 测验；又新引入品种千粒重可能高于也可能低于当地良种，故需作两尾测验。测验步骤为：,H0：新引入品种千粒重与当地良种千粒重指定值相同，即 34g；或简记作H0： 34g；对HA： 34g。,显著水平 =0.05。,测验计算：,查附表4，v=7时，t0.05=2.365。现实得|t|0.05。,推断：接受H0： 34g，即新引入品种千粒重与当地良种千粒重指定值没有显著差异。,三、两个样本平均数相比较的假设测验,由两个样本平均数的相差，以测验这两个样本所属的总体平均数有无显著差异。,测验方法,成组数据的平均数比较,成对数据的比较,(一) 成组数据的平均数比较,如果两个处理为完全随机设计的两个处理，各供试单位彼此独立，不论两个处理的样本容量是否相同，所得数据皆称为成组数据，以组(处理)平均数作为相互比较的标准。,成组数据的平均数比较又依两个样本所属的总体方差( 和 )是否已知、是否相等而采用不同的测验方法。,(1) 在两个样本的总体方差和为已知时，用u测验,由抽样分布的公式知，两样本平均数和的差数标准误，在和是已知时为：,

展开阅读全文