概率统计:第九章 假设检验(第三节)

上传人:cl****1 文档编号:513897450 上传时间:2023-12-21 格式:DOC 页数:13 大小:619.50KB
返回 下载 相关 举报
概率统计:第九章 假设检验(第三节)_第1页
第1页 / 共13页
概率统计:第九章 假设检验(第三节)_第2页
第2页 / 共13页
概率统计:第九章 假设检验(第三节)_第3页
第3页 / 共13页
概率统计:第九章 假设检验(第三节)_第4页
第4页 / 共13页
概率统计:第九章 假设检验(第三节)_第5页
第5页 / 共13页
点击查看更多>>
资源描述

《概率统计:第九章 假设检验(第三节)》由会员分享,可在线阅读,更多相关《概率统计:第九章 假设检验(第三节)(13页珍藏版)》请在金锄头文库上搜索。

1、第三节 二正态总体均值差和方差比的假设检验一:二正态总体均值差的假设检验。在实际问题中,我们还常遇到两个总体均值的比较问题。设总体XNYN,且X与Y相互独立。为来自于X的样本,样本均值为,样本方差为;为来自于Y的样本,样本均值为,样本方差为。下面分类进行讨论。1:已知和,检验假设选取U作为检验统计量,且在假设成立的条件下知UN(0,1)。于是对给定的,查标准正态分布表得,使于是,得到检验的拒绝域,即, (9.11)在由样本值算出统计量U的值,若,则拒绝;若,则接受。1 未知和,但,检验:这时,我们选用T=作为检验统计量,且在成立下知Tt(m+n-2)。于是对给定的,查t分布表得,使,于是,得到

2、检验的拒绝域,即,由样本值算出T的值,若,则拒绝;否则,接受。例1 为研究正常成年男、女血液红细胞的平均数的差别,检查某地正常成年男子156名,正常成年女子74名,计算得男性红细胞平均数为465.13万/mm;样本标准差为54.80万/mm;女性红细胞平均数为422.16万/mm,样本标准为49.20万/mm。根据经验知道正常成年男性红细胞数X和女性红细胞数Y都服从正态分布,且方差相等。试检验该地正常成年人的红细胞平均数是否与性别有关(取)解,本例要求检验,这里m=156,n=74,465.13万/mm,422.16万/mm54.80万/mm,49.20万/mm由此算出T=查标准正态分布表得,

3、于是有,故拒绝假设,即认为正常成年男性红细胞数与女性红细胞数有显著差别。2 已知和,检验对给定的,若 (9.13)则拒绝;否则,接受。若和未知,但=,则当 (9.14)时,拒绝;否则,接受。3 检验;若和已知,则对于给定的,当时,拒绝;否则,接受。若和未知,但=,则对于给定的,当1.645=,故接受,即不能认为使用第二种工艺生产的产品的平均质量较使用第一种工艺的大。值得提出,在实际问题中,如没有明确告诉我们方差是否相等,则必须先进行方差相等的检验,方差不等时,不能应用上述检验法,关于方差相等的检验问题将在下一部分讨论。例3:某校从甲班随机抽取8个学生,从乙班抽7个学生,他们的物理测验成绩,甲班

4、为78、66、64、84、70、67、82、52;乙班为76、57、62、69、65、68、71。已知甲、乙两班物理测验成绩的方差相同,问甲、乙两班的物理测验的平均成绩有无差异?并求出两总体均值差的置信区间。解:本题已知两总体方差相等,但未知方差的值,因为没有资料表明甲、乙两班物理测验成绩的均值那个高,故采用双边检验,问题归结为检验:根据样本值算得,代入统计量得对于,查分布表得,因为,故在检验水平下接受,即认为甲、乙两班的物理成绩没有多大差异,由于故的95%置信区间为。注意:上面介绍的两个总体均值差的U检验法、t检验法(包括相应的区间估计法)只适用于两总体独立的情况,对两总体不独立的场合不能适

5、用,但如果获取的两总体样本是成对样本:,我们就可以把它转换成单个总体进行研究。也就是我们下面要提到的问题3:成对数据的比较方法我们通过例子来进行分析。例4:银行经理的方案是否有效?成对数据的比较方法。问题:某银行经理认为现行的储蓄机制有点片面地强调顾客的存款数而对减少顾客取款数缺乏一些激励措施。为此,他设计了一种将存款数与存款期限相乘的指数,然后在不太影响银行效益的前提下设计了一些有吸引力的存款有奖措施以尽量减少顾客的取款数。为了比较此方案的有效性,随机地选择了该银行的15位储户,得到他们在新方案实施前后的指数,结果如表1。对,检验该经理的方案是否有效。解:初看起来,这是两总体均值的比较问题,

6、即将新方案实施前后的指数分别看作两个总体,将15位储户在新方案实施前后的指数看做来自这两个总体的样本,若进一步假定这两个总体服从正态分布,便可利用t检验法检验二者的均值是否有显著性差异。但仔细想想,发觉这样做有点欠妥,因为每位储户的家庭经济状况,消费水平,理财策略等等会有很大的差异,从而各户的存款指数存在较大差异,这使得各户之间的存款指数缺乏一致性,因而看成来自同一总体的样本是不妥当的。表1 15位储户在新方案实施前后的存款指数储户方案实施前方案实施后差()123456789101112131415100207209105106239054401810012011847685346028452

7、1826740237810540780945315733962467382051245895974444982883164869692408520603485115727210544711259138037946622930如果我们将同一储户在新方案实施前后的存款指数相减,由于各储户在新方案实施前后的经济状况、消费水平、理财策略等方面不会有太大的变化,则该差值不是由于各储户的家庭状况的差异而来,而是反映了新方案的实施对存款指数的影响,因而将这些差值看成是来自某一总体的样本就比较合理了。若进一步假定这些差值服从,则的大小反映了新方案实施前后对存款指数的平均影响程度,检验新方案是否有效,等价于检验

8、假设该假设便可由正态总体均值的t检验法来检验。以分别表示新方案实施前后各储户的存款指数,令则可看做来自正态总体的一个容量为15的样本观测值(具体数值见表1最后一列)。由此可求得:由正态总体均值的t检验统计量及上述假设可得其拒绝域为(注意此处)代入具体数据可求得。由于,故拒绝,即所给观测结果显著地支持新方案有效。本例关于原假设的选择,体现了我们在前面部分所指出的如何选择零假设和备则假设的精神,即我们“希望”证实某方法有效果时,我们“有意”将“该方法无效”作为零假设,因为如果这时还能拒绝零假设(特别是在较小时),则“有效果”的断言就得到更有力的支持。反之,若把“新方法有效果”作为零假设,则当它被接

9、受时,只是说明有效果的断言“能与观测数据相容”,这并不能说明它受到观测数据的有力支持。本例中所介绍的方法称为成对数据比较的参数性检验方法。能用此方法检验的问题在现实世界中大量存在。例如:为了比较两个玉米品种的平均亩产量,如果要利用两正态总体均值比较的检验方法,我们应设计如下的试验;选择块形状面积相同的地块,其中m块种植品种A,得亩产量,n块种植品种B,得亩产量,然后将这两组数据看成是来自两正态总体的样本,利用两正态总体均值比较的检验方法检验A,B两品种的平均亩产量是否有显著差异。但仔细想想,若用该方法检验,必须要求这个地块的土质肥沃程度和地质、气候等条件(如灌溉条件、日照条件等等)相同,不然的

10、话,假如种植A品种的那m块天地比较肥沃,或其他条件比较好,则即使A品种不优于B品种,但试验的结果也可能有利于A品种,而选择块各种条件一致的田块在实际中(尤其当m,n较大时)是很难做到的。但如果我们取n块田地,将其一分为二,其中一小块种植A品种,另一小块种植B品种(哪一小块种植A可随机决定),这样即使n块田地的土质、气候等条件很不一致,哪一个品种也不会占地利之便,每块田地上A,B两品种的亩产量之差正好反映了两个品种对产量的影响程度,将看成来自某总体的样本,检验其均值是否为零就比较合理了。又如,为了比较一种新的降血压药品A与以往使用的降血压药品B的疗效(以一定时间内血压降低量作为比较标准),可以取

11、个患者,其中m个服用药品A,另n个服用药品B,若将服用A的疗效和服用B的疗效看做来自两总体的样本比较,以检验新药品的疗效是否优于原药品,这样又产生了与上述相类似的问题:病人 的情况不一,有的病情较重,身体条件差,用药难以见效,有的患者则相反,为了避免这种误差,我们可选取n对患者,使每对在各种条件上尽可能一致,各对中任选一名服用A,另一名服用B,而不同对患者的条件可以有很大差异,这样设计不但比要求所有个患者的条件一致更易于实现,而且对各对内两患者的疗效之差较确切地反映了这两种药品的疗效差异。从而可利用成对数据的比较方法较好地解决这两种药品疗效的比较问题,进一步,如果这两种药品的降压效果可在一定的

12、时间内消失,则可只选n个人,在充分长的时间间隔下分别服用药品A和B,测定其疗效,用其差值检验两种药品的疗效差异,这可使得各对数据之间更具有可比性,这种试验设计方法是医学统计中临床试验设计的一个常用方法之一,但它要求药品的疗效无后效性,否则,这种方法是不可取的。再如,在双胞胎中先出生与后出生者在某个时期的一些指标(如智商,身高等)的比较中,假如我们抽取了n对双胞胎,由于各对双胞胎所处的家庭环境及社会环境不同,将先出生的n个双胞胎与后出生的n个双胞胎分别看做来自两个总体的样本对所关心的指标作比较是不妥的,而将每对双胞胎的该项指标之差看做来自某总体的样本,便可较好地解决其比较问题。总结上述思想,我们

13、可提出成对数据比较的一般模型如下:设要比较两种处理方法的效果,这里“处理方法”的含义可以很广泛,如银行经理的新的储蓄方案和原方案,两种玉米品种,两种药品,先后出生的双胞胎等等;选择n对试验对象,每对中两个试验对象的条件也尽可能一致,而不同对之间则不要求一致;在每对试验对象中,随机地指定其中之一给处理方法A,另一个给处理方法B,经试验可观测得到对每个试验对象的处理效果度量值,列表如表2:表2 成对数据的记录试验对象对处理方法A处理方法B差Y12n这里是在第i对试验对象中,所观测到的处理方法B的处理效果优于A的量(为了确定起见,我们假定观测值越大,处理效果越好)。这个量不受试验对象的条件差别影响,

14、因为每对内两个试验对象的条件已尽量一致了。我们假定为来自某个总体(通常假定为正态总体N)的样本,则该总体的均值就表示处理方法B的处理效果平均优于处理方法A的量,这样一来,两处理方法的效果比较就归结为的检验问题,例如:要检验两处理方法的效果是否一样等价于检验是否为零;要检验处理方法A不优于B,等价于检验是否可被接受;要检验处理方法B的效果平均优于A的量不小于,等价于检验是否有,等等。例5:将智力水平、爱好等基本条件相同的学生匹配成10对,然后每一对中各抽取一人组成甲组,余下10人组成乙组。甲组由专业地理老师讲授地理课,乙组则由数学老师兼讲地理课,经过一个阶段学习后采用统一试卷进行测试,其成绩如下:配对号12345678910甲组X93729165817789847370乙组Y76748052636282856472试问两组成绩是否存在差异?解:本

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 其它相关文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号