贾俊平版统计学课件第8章

上传人:人*** 文档编号:589166212 上传时间:2024-09-10 格式:PPT 页数:112 大小:1.43MB
返回 下载 相关 举报
贾俊平版统计学课件第8章_第1页
第1页 / 共112页
贾俊平版统计学课件第8章_第2页
第2页 / 共112页
贾俊平版统计学课件第8章_第3页
第3页 / 共112页
贾俊平版统计学课件第8章_第4页
第4页 / 共112页
贾俊平版统计学课件第8章_第5页
第5页 / 共112页
点击查看更多>>
资源描述

《贾俊平版统计学课件第8章》由会员分享,可在线阅读,更多相关《贾俊平版统计学课件第8章(112页珍藏版)》请在金锄头文库上搜索。

1、第8 8章假设检验 8.1 假设检验的基本问题 8.2 一个总体参数的检验 8.3 两个总体参数的检验 8.4 假设检验中的其他问题假设检验在统计方法中的地位8.1 假设检验的基本问题n8.1.1 假设问题的提出n8.1,2 假设的表达式n8.1.3 两类错误n8.1.4 假设检验的流程n8.1.5 利用 P 值进行决策n8.1.6 单侧检验8.1.1 假设问题的提出例8.1 已知某地1989年新生儿的平均体重为3190g,从1990年的新生儿中随机抽取100人,测得其平均体重为3210g.问1990年的新生儿与1989年相比,体重有无显著差异. 解:1990年的新生儿体重与1989年是否相等

2、,或有无显著差异这一问题可归结为检验假设其中 表示1990年新生儿平均体重,而 则表示1989年新生儿平均体重.然后根据1990年的新生儿样本数据对假设作出判断. 如果假设成立,称1990年的新生儿体重与1989年没有显著差异. 如果假设不成立,称1990年的新生儿体重与1989年有显著差异.什么是假设? 对总体参数的的数值所作的一种陈述总体参数包括总体均值、比例、方差等分析之前必需陈述我认为该地区新生婴儿我认为该地区新生婴儿的平均体重为的平均体重为31903190克克! !什么是假设检验? 事先对总体参数或分布形式作出某种假设,然后利用样本信息来判断原假设是否成立.3. 采用逻辑上的反证法,

3、依据统计上的小概率原理.假设检验的基本思想:小概率原理小概率原理:如果对总体的某种假设是真实的,那么不利于或不能支持这一假设的事件A(小概率事件)在一次试验中几乎不可能发生,要是在一次试验中小概率事件A竟然发生了,就有理由怀疑该假设的真实性,拒绝这一假设。 概率是从0到1之间的一个数,因此小概率就应该是接近0的数。著名的英国统计学家费歇把0.05作为小概率,没有任何深奥的理由解释他为什么选择0.05,他说他只是忽然想起来的。假设检验的基本思想m m m m. . . 因此我们因此我们因此我们拒绝假设拒绝假设拒绝假设 = = = 505050. . . 如果这是如果这是如果这是总体的真实均总体的

4、真实均总体的真实均值值值样本均值样本均值样本均值 = 50 = 50抽样分布抽样分布抽样分布H H H0 00这个值不像我这个值不像我这个值不像我们应该得到的们应该得到的们应该得到的样本均值样本均值样本均值 .2020208.1.2 假设的表达式 对新生儿体重这个例子,问题可归结为检验假设 称为原假设. 若1989年新生儿的平均体重记为 ,原假设的一般形式为原假设的对立假设称为备择假设,即原假设与备择假设必互斥. 对新生儿体重这个例子,备择假设为备择假设的一般形式为8.1.3 两类错误1.第一类错误 原假设 为真时拒绝原假设犯第一类错误的概率为 ,即规定的显著性水平2.第二类错误原假设 不真时

5、接受原假设犯第二类错误的概率为 。表8-1 假设检验中各种可能结果的概率实际情况决策 接受 拒绝为真不真H0: 无罪假设检验中的两类错误(决策结果)陪审团审判裁决实际情况无罪有罪无罪正确错误有罪错误正确H0 检验决策实际情况H0为真H0为假接受H0正确决策(1 a)第二类错误(b)拒绝H0第一类错误(a)正确决策(1-b)假设检验就好像一场审判过程假设检验就好像一场审判过程假设检验就好像一场审判过程统计检验过程统计检验过程统计检验过程与的关系对于给定的样本容量 ,如果减少,就会增大 ;同样减少,也会增大 . 要使 和 同时变小,只有增加样本容量 .在假设检验中,只控制犯第一类错误的概率,即规定

6、了显著性. 你不能同时减你不能同时减少两类错误少两类错误! 和和和和 的关系就像的关系就像的关系就像的关系就像翘翘板,翘翘板,翘翘板,翘翘板, 小小小小 就就就就大,大,大,大, 大大大大 就小就小就小就小假设检验中的两类错误(例题分析) 例 某机场的塔台面临一个决策问题:如果荧幕上出现一个小的不规则点,并逐渐接近飞机,工作人员必须作出判断: H0 :一切正常,那只是荧幕上受到一点干扰罢了; H1:可能会发生意外碰撞。在这个问题中,错误地发出警报属于哪一类错误?概率为多少?能不能取得太小? 解:错误地发出警报属于第一类错误,概率为 ,不宜太小。8.1.4 假设检验的流程(1)提出原假设 和备择

7、假设(2)确定检验统计量及其分布(3)规定显著性水平(4)确定 的拒绝域(或接受域)(5)作出统计决策(1)提出原假设和备择假设 原假设用 或表示,记为 与原假设对立的假设称备择假设,记为 ,用或 表示。 对于新生儿体重的例子,可以表示为(2)确定检验统计量及其分布 用于检验假设的统计量称为检验统计量 根据 及相应条件选择适当的统计量,并确定统计量的分布 对于新生儿体重的例子,可利用 构造检验统计量. 若新生儿体重为正态分布,且 已知,则在 为真时,用 z 作为检验统计量,并且(3)规定显著性水平 为真时,拒绝 的概率称为显著性水平,用 表示 值由研究者事先规定,通常取 0.1, 0.05 和

8、 0.01(4)确定 H0 的拒绝域(或接受域)仍考虑新生儿体重的例子,对规定 ,由于 为真时把 z 的所有可能取值范围划分为两部分 当,则拒绝 . 使 的部分称为 的拒绝域. 当,则不能拒绝 ,称接受 . 使 的部分称为 的接受域.(5)作出统计决策根据样本数据计算统计量取值时,当统计量取值落在拒绝域,则拒绝 ,否则就接受.对于新生儿体重的例子,取 时, . 若根据样本数据求得从而 z 值落入拒绝域,则拒绝 .即假设检验的过程总体总体总体总体抽取随机样本抽取随机样本抽取随机样本抽取随机样本均值均值均值均值 X X = 20= 20我认为人口的平我认为人口的平均年龄是均年龄是5050岁岁 提出

9、假设提出假设提出假设提出假设 拒绝假设拒绝假设! 别无选择别无选择.作出决策作出决策作出决策作出决策8.1.5 利用 p 值进行决策n是一个概率值n如果原假设为真,P-值是当原假设为真时,所得到的样本观察结果或更极端结果的概率。n被称为观察到的(或实测的)显著性水平H0 能被拒绝的最小值利用 p 值进行检验对于假设检验的显著性水平 ,若则拒绝 ,否则不能拒绝 ,即接受 . 对于例 8.1,由于并已知 ,则于是双侧检验的P值 / / 2 2 / / 2 2 Z Z拒绝拒绝拒绝拒绝拒绝拒绝拒绝拒绝H HH0 00值值值临界值临界值临界值计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的

10、样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量临界值临界值临界值 P P P 值值值 P P P 值值值左侧检验的P值H HH0 00值值值临界值临界值临界值 样本统计量样本统计量样本统计量拒绝域拒绝域拒绝域抽样分布抽样分布抽样分布抽样分布1 - 1 - 1 - 置信水平置信水平置信水平置信水平计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量P P P 值值值右侧检验的P值H HH0 00值值值临界值临界值临界值 拒绝域拒绝域拒

11、绝域抽样分布抽样分布抽样分布抽样分布抽样分布抽样分布1 - 1 - 1 - 置信水平置信水平置信水平置信水平置信水平置信水平计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量P P P 值值值利用 P 值进行检验(决策准则)1、单侧检验若p-值 ,不能拒绝 H0若p-值 /2, 不能拒绝 H0若p-值 /2, 拒绝 H08.1.6 假设检验的形式假设假设研究的问题研究的问题双侧检验双侧检验左侧检验左侧检验右侧检验右侧检验H0m m = m m0 0m m m m0 0m m m m0 0H1m m m m0 0m m m m0 01、双

12、侧检验双侧检验的原假设与备择假设(以均值检验为例)临界值临界值拒绝域拒绝域接受域图8-3双侧检验示意图双侧检验(显著性水平与拒绝域)H H0 0值值临界值临界值临界值临界值 /2 /2/2 样本统计量样本统计量拒绝域拒绝域拒绝域拒绝域抽样分布抽样分布抽样分布抽样分布1 - 1 - 置信水平置信水平置信水平置信水平双侧检验 (显著性水平与拒绝域)H H0 0值值临界值临界值临界值临界值 /2 /2/2 样本统计量样本统计量拒绝域拒绝域拒绝域拒绝域抽样分布抽样分布抽样分布抽样分布1 - 1 - 置信水平置信水平置信水平置信水平双侧检验 (显著性水平与拒绝域)H H0 0值值临界值临界值临界值临界值

13、 /2 /2/2 样本统计量样本统计量拒绝域拒绝域拒绝域拒绝域抽样分布抽样分布抽样分布抽样分布1 - 1 - 置信水平置信水平置信水平置信水平例 某机床厂加工一种零件,根据经验知道,该厂加工的零件的椭圆度渐近服从正态分布,其总体均值为0.081 mm,总体标准差为 0.025 mm。今另换一种新机床进行加工,取 200 个零件进行检验,得到椭圆度均值为 0.076 mm。试问新机床加工零件的椭圆度总体均值与以前有无显著差别。 解:这里我们所关心的是新机床加工零件的椭圆度是否与以前相等,于是可以假设 也就是说,我们只关心是否成立,而或都属于不相等这一种情况,即。 双侧检验 (例题分析)2、单侧检

14、验单侧检验不仅考虑是否相等,在不等时还要考虑方向。单侧检验有两种情况。()左侧检验左侧检验的原假设与备择假设(以均值检验为例)临界值拒绝域接受域图 8-5左侧检验示意图左侧检验 (显著性水平与拒绝域)H HH0 00值值值临界值临界值临界值 样本统计量样本统计量样本统计量拒绝域拒绝域拒绝域抽样分布抽样分布抽样分布抽样分布抽样分布抽样分布1 - 1 - 1 - 置信水平置信水平置信水平置信水平置信水平置信水平观察到的样本统计量观察到的样本统计量观察到的样本统计量观察到的样本统计量观察到的样本统计量观察到的样本统计量左侧检验 (显著性水平与拒绝域)H HH0 00值值值临界值临界值临界值 样本统计

15、量样本统计量样本统计量拒绝域拒绝域拒绝域抽样分布抽样分布抽样分布抽样分布1 - 1 - 1 - 置信水平置信水平置信水平置信水平例8.2 某批发商欲从厂家购进一批灯泡,根据合同规定, 灯泡的平均使用寿命不能低于1000小时.已知灯泡使用寿命服从正态分布,标准差为200小时.在总体中随机抽取了100 个灯泡,得知样本均值为960小时,批发商是否应该购买这批灯泡?解:批发商是否应该购买这批灯泡,问题在于这批灯泡的使用寿命是否达到合同规定,即平均使用寿命是否低于1000小时,于是应该假设()右侧检验右侧检验的原假设与备择假设(以均值检验为例)临界值拒绝域接受域 图 8-6右侧检验示意图右侧检验(显著

16、性水平与拒绝域)H HH0 00值值值临界值临界值临界值 样本统计量样本统计量样本统计量拒绝域拒绝域拒绝域抽样分布抽样分布抽样分布抽样分布抽样分布抽样分布1 - 1 - 1 - 置信水平置信水平置信水平置信水平置信水平置信水平观察到的样本统计量观察到的样本统计量观察到的样本统计量观察到的样本统计量观察到的样本统计量观察到的样本统计量右侧检验(显著性水平与拒绝域)H HH0 00值值值临界值临界值临界值 样本统计量样本统计量样本统计量抽样分布抽样分布抽样分布抽样分布1 - 1 - 1 - 置信水平置信水平置信水平置信水平拒绝域拒绝域拒绝域例8.3某种袋装食品,按规定每袋重量不得少于250g. 今

17、从一批这种袋装食品中随机抽取50袋,发现有6袋低于250g ,若规定重量不符合标准的比例达到5%以上,就不能出厂,问该批袋装食品能否出厂.解:该批袋装食品能否出厂,问题在于这批袋装食品不符合规定重量的比例是否超过 5% ,因而应该假设8.2 一个总体的参数检验 8.2.1 检验统计量的确定 8.2.2 总体均值的检验 8.2.3 总体比例的检验 8.2.4 总体方差的检验8.2.1 检验统计量的确定z检验(单侧和双侧)t 检验(单侧和双侧)z检验(单侧和双侧)2检验(单侧和双侧)均值一个总体比例方差1.样本量 在大样本条件下,如果总体为正态分布,样本统计量服从正态分布;如果总体为非正态分布,样

18、本统计量渐近服从正态分布。所以在大样本情况下,我们都可以把样本统计量视为正态分布,这时可以使用 统计量。在总体标准差 已知时,而当 未知时即无论 是否已知, 当样本量 较大时都可采用 统计量. 2.总体标准差是否已知 当总体服从正态分布时, 应区分总体标准差 是否已知.当 已知时服从正态分布. 而当 未知时则服从自由度为 的 分布. (8.2)总体均值的检验(检验统计量)总体总体 是否已知是否已知?用样本标用样本标准差准差S代替代替 t 检验检验小小小样本容量样本容量n否否是是是z 检验检验 z 检验检验大大大8.2.2 总体均值的检验1.大样本或 大样本方法只要求样本量较大,而对总体分布和方

19、差都没有要求.当样本量很大时都近似服从正态分布.双侧检验 (1)n 较大 (2) (3)检验统计量(4)根据样本数据求得 z 的取值,对规定,查表得临界值,若则拒绝,否则接受 . 或 例8.4某机床厂加工一种零件,根据经验知道,该厂加工的零件的椭圆度渐近服从正态分布,其总体均值0.081mm. 今另换一种新机床进行加工,取200个零件进行检验,得到椭圆度均值为0.076mm,样本标准差为0.025mm.试问新机床加工零件的椭圆度总体均值与以前有无显著差别.双侧检验双侧检验解:已知 于是取,查表得 ,由于z 值落入拒绝域,所以拒绝 .即认为新机床加工零件的椭圆度总体均值不等于以前均值,有显著差别

20、.p 值的计算与应用第1步:选择【插入】下拉菜单 第2步:点击【函数】 第3步:点击【统计】,在函数名的菜单下选择【NORMSDIST】 第4步:输入 z 的绝对值 2.83,得到的分布函数值为 0.997672537则 p = 2(10.997672537)=0.004654由于p 值远远小于 = 0.05,故拒绝 .图8-8 p 值计算示意图单侧检验(1) n 较大(2) 或(3)检验统计量 (4)根据样本数据求得z 的取值,对规定的 ,查表得临界值 或 . 或续则拒绝 ,否则接受 .若若则拒绝 ,否则接受 . 而对于左侧检验 对于右侧检验例8.5(例8.2)某批发商欲从厂家购进一批灯泡,

21、根据合同规定,灯泡的使用寿命平均不能低于1000小时. 已知灯泡使用寿命服从正态分布,标准差为200小时. 在总体中随机抽取了100个灯泡,得知样本均值为960小时,批发商是否应该购买这批灯泡?单侧检验单侧检验解:已知 于是取,查表得 ,由于z 值落入拒绝域,所以拒绝 . 即认为这批灯泡的平均使用寿命低于1000小时,没有达到合同规定. 所以批发商不应购买这批灯泡. 一个市场研究员从4000个购买某种”特别优惠品“的顾客中随机挑选了100个顾客的样本。这100个人在店中的平均消费额是24.57元,标准差为S=6.60元.在得到这些样本结果之前,营销经理称该类顾客的平均购买额不会小于25.00元

22、。在5%的显著性水平下,是否可以拒绝这个说法呢?练习题解: : 25.00, : 25.00 =1.645, ,所以不能拒绝.2.小样本:总体标准差已知双侧检验(1)总体正态(2) (3)检验统计量 (4)根据样本数据求得z的取值,对规定,查表得临界值 ,若则拒绝 ,否则接受 . 单侧检验 (1)总体正态 (2) 或 (3)检验统计量 (4)根据样本数据求得 z 的取值.续则拒绝 ,否则接受 .则拒绝 ,否则接受 . 而对于左侧检验若若 对于右侧检验例8.6某电子元件批量生产的质量标准为平均使用寿命1200小时,标准差为150小时.某厂宣称他们采用一种新工艺生产的元件质量大大超过规定标准.为了

23、进行验证,随机抽取了20件作为样本,测得平均使用寿命1245小时.能否说该厂生产的电子元件质量显著地高于规定标准?(0.05)单侧检验单侧检验解:已知 取,查表得 ,求得于是 ,z 值落入接受域,所以接受 ,即还不能说该厂产品质量高于规定的标准. 若采用 p 值检验,根据 z 值等于1.34,得 p =1-0.9099 = 0.0901由于 ,从而不能拒绝.3.小样本:总体标准差未知双侧检验(1)总体正态(2) (3)检验统计量(4)根据样本数据求得 t 的取值,对规定 ,查表得临界值 ,若则拒绝 ,否则接受 . 单侧检验 (1)总体正态 (2) 或 (3)检验统计量 (4)根据样本数据求得

24、t 的取值续则拒绝 ,否则接受 .则拒绝 ,否则接受 . 而对于左侧检验若若 对于右侧检验例8.7 某机器制造出的肥皂平均厚度为5cm,今欲了解机器性能是否良好,随机抽取10块肥皂为样本,测得平均厚度为5.3cm,标准差为0.3cm,试以0.05的显著性水平检验机器性能良好(即平均厚薄合乎规定)的假设.双侧检验双侧检验解:已知 得当 时, , 由于从而拒绝 ,认为该机器的性能不好.t 检验时p 值的计算与应用 第1步:选择【插入】下拉菜单 第2步:选择【函数】,并击【统计】. 然后,在函数名的菜单中选择【TDIST】 第3步:在弹出的“X” 栏中录入 t 值3.16 在“自由度(Deg-fre

25、edom)”栏中输入自由度 9 在“Tails”栏中输入 2,表明是双侧检验(单侧检验则在该栏内输入 1) 计算的结果为图8-10 p 值计算示意图练习题 在一大批会计专业的低年级和高年级学生中随机抽取n=12名学生的一个样本,其平均成绩为2.70分(满分4分),s=0.40分。假设这些学生的平均成绩服从正态分布,在0.01的显著性水平下,检验会计专业所有学生的年级平均成绩至少为3分是否成立。解:所以不能拒绝 .即不能否认平均成绩至少为3分。 8.2.3.总体比例的假设检验 (1)总体服从二项分布(非正态) (2)n 较大时,可用正态分布来近似 (3)检验统计量(8.3)例8.8 一项统计结果

26、声称,某市老年人口(年龄在65岁以上)的比重为14.7%,该市老年人口研究会为了检验该项统计是否可靠,随机抽选了400名居民,发现其中有57人年龄在65岁以上. 调查结果是否支持该市老年人口比重为14.7%的看法?( )双侧检验双侧检验解:已知,从而规定,由于所以接受 ,即可以认为该市老年人口比例为0.147.练习题 某大学就业办公室主任称到3月1号为止至少有50%的毕业生签定了最终的就业协议。假设选取了n=30名学生的随机样本,其中只有10人表示在3月1号前已经找到了工作。在0.05的显著性水平下,能否拒绝就业办公室主任的说法?解: ,落入拒绝域,所以拒绝 ,即拒绝主任的说法。8.2.4 总

27、体方差的检验(8.4)(1)检验一个总体的方差或标准差 (2)假设总体服从正态分布 (3)检验统计量某厂商生产出一种新型的饮料装瓶机器,按设计要求,该机器装一瓶一升(1000ml)的饮料误差上下不超过1ml.如果达到设计要求,表明机器的稳定性非常好.现从该机器装完的产品中随机抽取25瓶,分别进行测定(用样本减1000ml),得到如下结果. 检验该机器的性能是否达到设计要求.(=0.05)例8.9绿色绿色绿色绿色健康饮品健康饮品健康饮品健康饮品解:从而从而在 的水平上不能拒绝 ,可以认为该机器的性能达到设计要求. 由于8.3 两个总体的参数检验8.3.1 检验统计量的确定 8.3.2 两个总体均

28、值之差的检验 8.3.3 两个总体比例之差的检验 8.3.4 两个总体方差比的检验 8.3.5 检验的匹配样本8.3.1 检验统计量的确定两个正态总体参数的检验Z 统计量t 统计量Z统计量F 统计量均值之差检验比例之差检验方差比检验已知,或 未知,大样本未知,小样本8.3.2 两个总体均值之差的检验1.12 ,22已知(1)两个总体为正态分布,或 和 都较大(2)两个样本互相独立(3)检验统计量为(8.5)例8.10有两种方法可用于制造某种以抗拉强度为重要特征的产品.根据以往的资料得知,第一种方法生产出的产品其抗拉强度的标准差为8kg,第二种方法的标准差为10kg.从两种方法生产的产品中各抽一

29、个随机样本,样本容量分别为 ,测得 . 问这两种方法生产出来的产品平均抗拉强度是否有显著差别。()双侧检验!双侧检验!解:已知 于是规定,由于所以拒绝 ,认为这两种方法生产的产品其抗拉强度有显著差异. 2.总体方差未知 12、 22 未知但相等(1)两个总体为正态分布, 与 未知,但(2)两个样本互相独立(3)检验统计量(8.8)例 一个车间研究用两种不同的工艺组装某种产品所用的时间是否相同。让一个组的10 名工人用第一种工艺组装该种产品,平均所需时间为 26.1 分钟,样本标准差为 12分钟。另一组 8 名工人用第二种工艺组装,平均所需时间为 17.6分钟,样本标准差为 10.5 分钟。已知

30、用两种工艺组装产品所用时间服从正态分布,且 ,试问能否认为用第二种方法组装比第一种方法更好?两个总体均值之差的检验(例题分析)已知得即 t 值落入接受域,所以接受 ,即不能认为第二种方法组装更好。规定,查表得,由于解:12、 22 未知但不相等(1)两个总体为正态分布, 与 未知,且(2)两个样本互相独立(3)检验统计量(8.11)其中(8.10)例8.11尽管存在争议,但大多数科学家认为,食用含有高纤维的谷类食物有助于降低癌症发生的可能性。然而一个科学家提出,如果人们在早餐中食用高纤维的谷物,那么平均而言,与早餐没有食用谷物的人群相比,食用谷物者在午餐中摄取的热量(大卡)将会减少. 如果这个

31、观点成立,谷物食品的生产商又将获得一个很好的机会,他们会宣传说:“多吃谷物吧,早上也吃,这样有助于减肥。”为了验证这个假设,随机抽取了35人,询问他们早餐和午餐的通常食谱,根据他们的食谱,将其分为二类,一类为经常的谷类食用者(总体1),一类为非经常谷类食用者(总体2). 然后测定每人午餐的大卡摄取量.经过一段时间的实验,得到如下结果.试检验该假设.例8.11 35人大卡摄取量总体1568 681 636 607 555496 540 539 529 562 589 646 596 617 584 总体2 650 569 622 630 596637 628 706 617 624563 580

32、 711 480 688723 651 569 709 632单侧检验单侧检验解:所以拒绝 ,可以认为经常的谷类食用者摄取的热量少于不经常食用者. 本例的 p = 0.009,同样拒绝 .规定,且 查表得 ,由于两个总体均值之差的检验用Excel进行检验 第1步:选择【工具】下拉菜单,并选择【数据分析】选项 第2步:选择【t 检验,双样本异方差假设】 第3步:当出现对话框后 在【变量1的区域】方框内输入数据A1:A15 在【变量2的区域】方框内输入数据B1:B20 在【假设平均差】的方框内输入“0” 在【】框内键入“0.05” 在【输出选项】中选择输出区域 选择【确定】 表8-4 两个总体均值

33、之差的检验8.3.3 两个总体比例之差的检验1. 两个总体比例相等的检验(1)两个总体都服从二项分布(2) 和 都较大(3)两个样本互相独立(4)检验统计量(8.13)其中例8.12人们普遍认为麦当劳的主要消费群体是青少年,但对市场的进一步细分却看法不同。一种观点认为小学生更喜欢麦当劳,另一种观点认为中学生对麦当劳的喜爱程度不亚于小学生。某市场调查咨询公司对此在某地区进行了一项调查,随机抽取了100名小学生和100 名中学生,调查问题是如果有麦当劳和其他中式快餐(如兰州拉面),你会首选哪种作为经常性午餐.调查结果如下: 小学生:100人中有76人把麦当劳首选为经常性午餐 中学生:100人中有6

34、9人把麦当劳首选为经常性午餐能否根据以上调查结果认为小学生与中学生同样喜欢麦当劳?已知 ,得所以接受 ,即认为该地区的中、小学生对麦当劳的偏爱程度没有显著性差异.由于解:2. 两个总体比例不等的检验(1)两个总体都服从二项分布(2) 和 都较大(3)两个样本互相独立(4)检验统计量(8.14)例8.13有一项研究报告说青少年经常上网聊天,男生的比例至少超过女生10个百分点,即 ( 为男生比例, 为女生比例。) 现随机抽取150名男生和150 名女生进行上网聊天的频度调查,调查结果如下: 男生:150人中有68人经常上网聊天 女生:150人中有54人经常上网聊天问调查结果是否支持研究报告的结论?

35、解:已知 所以接受 ,即认为调查结果支持研究报告的结论.由于8.3.4 两个总体方差比的检验(1)两个总体为正态分布(2)两个样本互相独立(3)检验统计量为(8.15)例8.14 在例8.11中,得两个样本的方差分别为 现以 0.05 的显著性水平检验两个总体的方差是否相等.所以接受 ,可以认为这两个总体的方差没有显著差异. 由于解解:查表得8.3.5 假设检验中的匹配样本(1)样本数据配对(2)总体为正态分布,或 较大(3)记,且 (4)检验统计量匹配样本的数据形式 观察序号观察序号样本样本1 1样本样本2 2差值差值1x 11x 21D1 = x 11 - x 212x 12x 22D2

36、= x 12 - x 22MMMMMMMMix 1ix 2iDi = x 1i - x 2iMMMMMMMMnx 1nx 2nDn = x 1n- x 2n例8.15一个以减肥为主要目标的健美俱乐部声称,参加其训练班至少可以使肥胖者平均体重减轻8.5kg以上. 为了验证该宣称是否可信,调查人员随机抽取了10名参加者,得到他们的体重记录如表 8-5. 在 的水平下,调查结果是否支持该俱乐部的声称?表 8-5训练前后的体重记录 单位:kg训练前训练前94.5101110103.59788.596.5101104116.5训练后训练后8589.5101.5968680.58793.593102表 8

37、-6差值样本构造表 样本差值计算表样本差值计算表训练前训练前训练后训练后差值差值Di94.5101110103.59788.596.5101104116.58589.5101.5968680.58793.5931029.511.58.57.51189.57.51114.5合计合计98.5解:根据表 8-6的差值,求得所以拒绝 ,可以认为该俱乐部的宣称成立.规定,查表得,由于从而配对样本的 t 检验用 Excel 进行检验第1步:选择【工具】下拉菜单 第2步:选择【数据分析】选项 第3步:在分析工具中选择【t 检验:平均值的成对二样本分析】 第4步:当出现对话框后 在【变量1的区域】方框内键入第

38、一组数据的区域 在【变量2的区域】方框内键入第二组数据的区域 在【假设平均差】方框内键入“8.5” 显著性水平保持默认值第1步: 依次单击“工具”“数据分析”第2步: 单击“t 检验:平均值的成对二样本分析” 第3步: 在【变量1的区域】方框内键入第一组数据的区域, 在【变量2的区域】方框内键入第二组数据的区域, 在【假设平均差】方框内键入“8.5”。计算结果8.4 假设检验中的其他问题8.4.1 关于检验结果的解释 在选择 作为显著性的标准时,是在 为真的前提进行的,即正常情况下事件结果应该与原假设 相差不远,如果发生了与 不一致的、概率小于显著性水平 的事件,则拒绝 ,否则,不拒绝 。这种反证法的特点,保证了犯第类错误的概率不超过 ,即错误地拒绝 的概率不超过 ,但无法提供有关犯第类错误的信息,即不知道错误的接受 的概率。因此,我们把假设检验中出现接受 的结果解释为“没有发现充足的证据反对 ”,或更严格地解释为“在显著性水平 下没有发现充足的证据反对 ”.8.4.2 单侧检验中假设的建立1、采取“不轻易拒绝原假设”的原则。2、把样本显示的信息(它是我们获取的事实)作为备择假设。3、把想要证明的或想要支持的观点作为备择假设。

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 建筑/环境 > 施工组织

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号