《自考-数量方法-讲义.pdf》由会员分享,可在线阅读,更多相关《自考-数量方法-讲义.pdf(14页珍藏版)》请在金锄头文库上搜索。
1、 第六章 假设检验 打印本页 首先提一个问题,肯定一件事情容易还是否定一件事情容易?要肯定一件事情,如,一个人说他从来没有骂过人,那么需要证明,你是证明他骂过人容易还是证明他没有骂过人容易呢?如果要证明没有骂过人,那么必须出示他从小到大每一时刻的录音录相,所有熟悉的东西等等。还要证明这些物证是完全的、真实的、没有间断的,这简直是不可能的,即使他找到一些证人,比如,他的同学、家人和同事来证明,也只能够证明那些证人在场的某些片刻,他没有被听到骂人。但是反过来,如果要证明这个人骂过人很容易只要有一事被抓住就足够了,所以说,肯定时候很难,而否定却相对容易的多。这就是假设检验背后的基本原理。实际上,可以
2、看到假设检验利用的是反证方法。假设检验是抽样推断的一项重要的内容,是利用样本的实际质量来检验事先对总体某些数量特征所作的假设是否可信的一种方法,因此凡属于研究总体的数量方法是否按照预先的规律性要求的问题都属于假设检验的讨论范围。 在这一章主要讨论的内容:假设检验的基本概念和步骤;参数检验;非参数检验等。 第一节 假设检验的基本概念 假设检验是预先对总体参数的取值作出假定,然后用样本数据来验证,作出接受还是拒绝原来假设的结论。 当然由于样本的随机性,这种推断也同样有一定的风险。先提出假设,后加以论证,再决定取舍是科学研究中常用的方法之一。 例如工业产品的质量管理就是应用了这一方法。质量控制图假设
3、在正常生产的情况下产品的某一指标是围绕其平均值的上下微小变动,然后每隔一段时间抽验一定的产品样本,如果符合假设的要求,就视为正常,继续生产。如果样本数据出现了变化,过高或过低,与原假设不符,那就要停止生产,检查原因,以避免生产次品。 一、假设检验中的一些基本概念 (一)原假设和备择假设 假设一般包括两部分:原假设和备择假设。 原假设常用H0表示。原假设又称为虚拟假设或零假设,设立该假设的动机主要是企图利用人们掌握的反映现实世界的数据来找出与现实之间的矛盾,从而否定这个假设。一般应用中,都是以否定原假设为目标,如果否定不了,那就说明证据不足,无法否定原假设,但这不能说明原假设正确,就像一两次没有
4、听过他骂人还远不能证明他从来没有骂过人一样。 备择假设,常用H1表示。即原假设被否定之后而采取的逻辑对立假设。备择假设应该按照实际事件所代表的方向来决定,它通常是被认为可能比零假设更加符合数据所代表的现实。 检验结果显著意味着有理由拒绝零假设。因此假设检验也被称为显著性检验。 (二)检验统计量 有了两个假设,就要根据数据来对他们进行判断。数据的代表是作为其函数的统计量,对样本数据进行加工并用来判断是否接受原假设的统计量称作检验统计量。 统计量最常用的是Z统计量、t统计量。 统计量的选择要根据研究的参数及其估计量的分布、抽样的方式、总体方差是否已知等多种因素来确定。 (三)接受域和拒绝域 假设检
5、验根据检验统计量的具体结果来判断是否接受原假设,因此在原假设为真的情况下将抽样所有可能结果组成的样本空间划分为两部分,一部分是原假设为真时允许范围内的变动,应该接受原假设,称作接受域;另一部分是超出了一定的界限,当原假设为真时只有很小的概率出现,因而当统计量的结果落入这一区域便应拒绝原假设,这一区域称作为拒绝域。接受域和拒绝域之间的分割点通常称作临界值。 P166如图6.1。临界值如何确定的呢?显然与a有关。 (四)显著性水平 假设检验的基本原理是根据小概率原理。所谓小概率原理是指发生概率很小的事件在一次试验中几乎是不可能的,根据这一原理作出是否接受原假设。 如:有1000件产品,生产者声称只
6、有1个次品,那么随机抽取一个作检验时,通常不会抽到次品,因为抽中次品是千分之一的小概率,但如果在一次抽取中抽中了次品,显然就有理由怀疑生产者的声称,认为1000个中只有一个次品的说法是假的。 例如:判断一件事情的真伪需要用事实说话,在统计方法中事实实际上来源于数据。假设某Page 1 of 14高等教育自学考试网上辅导数量方法2011- 3- 14http:/ 药厂生产的产品有60%的疗效,当实际调查了100名使用药品的患者之后,发现有40名患者服后有效,这个数据是否支持药厂的说法?也就是药厂认为它的药有效率是60%,而我们抽取了100个用该药物的患者,发现有40名患者有效,问这个数据是否支持
7、这个药厂的说法。 此实验是前面讲过的贝努利实验。它服从于二项分布,n是100,P是0.6,这个药厂的观点就是药是60%的成功,基于这一观点, 我们可以计算100名患者中小于或等于40名患者治疗有效的概率,此概率为0.000042。结果说明,如果药厂结果判断正确,只有40名患者有效的事实是一个小概率事件,也就是小于或等于40名患者有效的可能只有十万分之四多一点。而现在抽取的样本正好属于这个范围。也就是说得到的结果与事实是相矛盾的。那么事实准确还是药厂准确?人们一般不会认为药厂的说法可以接受。 在假设检验中,落入拒绝域就是个小概率事件,一旦落入拒绝域,就要拒绝原假设而接受备择假设。那么应该确定多大
8、的范围算作小概率呢?这要根据不同的研究问题来确定,有的选择0.05,有的选择0.01等,通常用a表示,显然,a愈小愈不容易推翻原假设。 显著性水平是在进行假设检验时事先确定一个可允许的作为判断界限的小概率标准。 检验中,依据显著性水平大小把概率划分为二个区间,小于给定标准的概率区间称为拒绝区间,大于这个标准则为接受区间。 (五)双侧检验与单侧检验 1.双侧检验指当我们所关心的问题是指标过大和过小都不符合要求,因此都需要加以检验,这时检验的拒绝域位于图形的两侧。如要检验样本平均数和总体平均数,或样本比例与总体比例有没有显著差异而不问差异的方向是正差或负差时,所采用的一种统计检验方法,这时检验的拒
9、绝域是两侧。如图6.1,当显著性水平为a时,两边的拒绝域发生的概率各为a/2。 2.单侧检验是指当我们的所要检验的是样本所取的总体其参数值是大于或小于某个特定值时,所选择使用的一种单方面检验方法。 在实际问题中有些现象的指标要求愈低愈好,例如产品次品率。当超过某一临界点就要拒绝原假设,这就是单侧的假设检验,其拒绝域在图形的右侧,称作右侧检验。另外一些指标值则是愈高愈好,如灯管的使用寿命,药物的有效成分等。当低于某一临界值就要拒绝原假设,这时拒绝域在图形的左侧,称作左侧检验。 图6.2 (六)假设检验中的两类错误 从假设检验的原理与规则可以看到,它是根据小概率原理来判断的,因此有可能会判断错误,
10、因为在假设为真的情况下,很可能有些样本统计量的估计值会落入小概率的拒绝域内而按决策规则加以拒绝。另外在原假设非真的情况下也有可能有一些统计量的估计值落入接受域的范围之内而接受原假设。因此把这些情况归结为两类错误。 当我们把真实的原假设当成假的加以拒绝,称为第一类错误,也称弃真错误、错误,犯第一类错误的概率就是显著性水平;当我们把不真实的原假设当作真的加以接受,称为第二类错误,也称取伪错误、错误,犯第二类错误的概率是不确定的。在检验决策时,我们当然希望所有真实的原假设都能做到接受,所有不真实的原假设都被拒绝,做到既降低犯第一类错误的可能性,也减少犯第二类错误的概率水平,但事实上这两类错误是一对矛
11、盾,因此,在样本容量不变的情况下,要想同时减少两类错误是不可能的,只有通过扩大样本容量办法才能同时减少犯两类错误的可能性。 假设检验的可能结果可见表6.1。 也称为生产者风险:在生产者将产品售给消费者时,通常要进行产品的质量检验,原假设总是产品是合格的,但是检验时生产者总是担心把合格品检验为不合格品,也就是第一类错误,所以也称为生产者风险。 也称为消费者风险:在消费者一方总恐怕把不合格品检验不出来而当作合格品接受,因而也称为消费者风险。 二、假设检验的一般步骤 Page 2 of 14高等教育自学考试网上辅导数量方法2011- 3- 14http:/ 第一步:建立统计假设;三种情况;希望证明的
12、假设常常作为备择假设。 第二步:确定检验统计量及其分布,并依据样本信息计算检验统计量的实际值。 假设检验是根据检验统计量的具体结果落入接受域还是拒绝域而定。这就要确定什么是检验统计量及该统计量服从什么分布。 第三步:选择检验的显著性水平。不同显著水平对检验结果有影响(见图6.4),拒绝域是与显著性水平相关的。 图6.4 显著性水平的大小影响假设检验的结果 第四步:确定决策规则。拒绝或没有拒绝原假设的决策是建立在由样本数据来进行统计检验并将其与假设的抽样分布比较。抽样分布被分成两个部分,拒绝域和非拒绝域。如果原假设是真实的,那么统计检验不可能落入拒绝域。因此,如果统计检验落入了拒绝域,我们拒绝原
13、假设;否则,我们不能拒绝它。 第五步:将实际求得的检验统计量取值与临界值进行比较,做出拒绝或接受原假设的决策。如果超过临界值拒绝原假设,小于临界值则不能拒绝原假设。 第二节 参数的假设检验 一、单个总体的均值检验 总体平均数的假设检验就是通过抽样平均数与原检验总体平均数的对比,来判断所要检验的总体平均数与原平均数是否发生显著性差异。 一种情况是检验某一客观现象已知服从正态分布,方差为2,但均值未知,现从中抽取一个样本欲检验其总体均值是否等于某个均值0。 另一种情况是检验某一样本是否抽自一个均值为0,方差为2的总体。 (一)已知总体为正态分布且方差已知 1.检验统计量 p170公式6.1 2.例
14、题分析:p170例6.1 【例6.1】一个生产宇航飞行器的工厂需要经常购置一种耐高温的零件,要求抗热的平均温度是1250,在过去,供货者提供的产品都符合要求,并从大量的数据获知零件抗热的标准差是150,在最近的一批进货中随机测试了100个零件,其平均的抗热为1200,能否接受这批产品?工厂希望对实际产品符合要求而错误地加以拒绝的风险为0.05(即a=0.05)。 解:检验的步骤如下: (1)建立假设。由于检验的目的是希望产品零件抗热的均值高于1250,而把低于1250的加以拒绝,因此是一个单侧的假设检验问题。 (2)这个检验中适当的检验统计量是: (3)根据工厂的要求,显著性水平a=0.05,
15、在这里是指当=1250时而被拒绝的概率为a。 (4)根据单侧检验a=0.05时,Z统计量拒绝域的临界值为。 (5)计算统计量的数值 因为,表明这一批产品零件的抗高温性能低于1250而不符合要求,因此不能接受这批产品。 (二)未知总体分布及总体方差,大样本 1.检验总体均值的统计量 p171公式6.2 2.例题分析: p171例6.2 【例6.2】有一空调机的零件需用打孔机打孔,要求孔径为10厘米,太大太小都对装配有问题。为了测试打孔机是否正常,需要取样进行检验,在打孔的结果中随机取了100件进行测量,得,s=1cm,试以a=0.05,检验打孔机的操作是否正常,抑或如何调整。 解:先建立假设,由
16、于检验结果过大或过小均不合适,因此应该是双侧检验,拒绝域在两侧。 Page 3 of 14高等教育自学考试网上辅导数量方法2011- 3- 14http:/ 根据检验的结果,故拒绝H0接受H1,说明孔径不等于10厘米而且是偏小,所以应对打孔机进行调整,使其孔径大一些。 假设检验与区间估计是相对应的,不难看出假设检验的接受域就是相应问题的置信区间,因此我们也可以用求置信区间的方法来作假设检验。就以例6.2的数据来说明,若a=0.05,即要求以95%的置信水平来估计总体参数,已知在H0为真的条件下,置信的系数为,故的置信区间为 由于的上限仍然小于10厘米,上述置信区间不可能包括均值为10厘米,其结
17、论也是拒绝H0,与前面假设检验的结论相同 。 3.假设检验与区间估计的关系:对应关系。假设检验的接受域就是相应问题的置信区间。 (三)总体为正态分布、方差未知、小样本 1. 检验统计量 p172公式6.3 2. 拒绝域的临界值 可以根据双侧检验还是单侧检验来确定拒绝域的临界值。当为双侧检验,显著性水平a时,临界值为;当为右侧检验时,显著性水平a,监界值为;当为左侧检验时,显著性水平为a,临界值为-。 3. 例题分析:p173例6.3 【例6.3】一个轮胎制造厂声称它的轮胎在正常行驶的条件下平均行驶里程至少在40000公里以上,通常已知轮胎在正常行驶的条件下,其行驶里程数服从正态分布。某一推销商
18、要随机抽取15个轮胎作试验,经过测试得到平均行驶里程为42000公里,标准差为5000公里,若显著性水平为a=0.05,能否从这些样本数据使该轮胎制造厂的声称得到证实。 解:这个问题中轮胎的行驶里程是愈多愈好,因此是一个单侧检验的问题。但是这个问题的假设可以有两种情况。 两种假设的结果将会得出两个截然相反结论,我们不妨来计算一下,因为两种假设检验的统计量均是t统计量: 假设1是左侧检验,临界值为拒绝域在临界值左侧,而t值落在右侧,因而是接受H0。假设2是右侧检验,临界值在右侧为,拒绝域在右侧而t值在临界值的左侧,也是接受H0,而这两个H0的内容是不一样的,在假设1中是,而在假设2中是。究竟应该
19、怎样来解释这种现象和选择哪一个假设,这是初学者在单侧假设检验时经常会遇到的问题。 这里我们可以看一下两种假设情况下进行检验决策的图示见图6.5 两种假设的目的是不同的,第一种假设中H1:40000公里是欲检验轮胎的平均行驶里程是否显著高于40000公里,检验的结果接受H0,说明在a=0.05的显著性水平下,轮胎平均行驶里程也没有显Page 4 of 14高等教育自学考试网上辅导数量方法2011- 3- 14http:/ 这样假设2与假设3由于显著性水平不同而得到了不同的结论。当显著水平a=0.05时为接受H0,意味着尚不能以95%的置信水平推翻H0,当显著性水平a=0.1时接受H1,意味着有9
20、0%的置信水平推翻H0。 注意该例题的启示。 关于总体均值的假设检验 二、单一样本比例检验 有时我们希望检验一个总体的比例p是否等于p0,显著性水平为a。在检验时需要从总体中取一个容量为n的样本并计算样本比例P。并假定n p05,nq05(q0=1-p0)。 1.检验统计量及其条件 p175公式6.4 2. 决策规则 例题分析:p175例6.4 【例6.4】某西红柿酱生产厂向供应商购一批西红柿,规定若优质西红柿的比例在40%及以上按一般市场价格收购,若达不到此标准,应低于市场价格收购,现随机抽取了100个西红柿作检验,只有34个优质西红柿,样本比例P=34%因而欲按低于市场价格收购,但供应商认
21、为样本比例不到40%,是随机原因引起的,试用显著水平a=0.05进行检验并加以说明。 解:因为西红柿中优质的比例愈高愈好,主要是把不够标准的检验出来,因此是一个单侧检验问题。其次是根据研究的目的来建立原假设和备择假设,通常是想加以证实的问题放在备择假设H1,因为这时犯错误的概率a是可以知道的。这个例子中供应商相当于生产者,而西红柿酱生产厂相干当于消费者,生产方总是怕将合格品当作不合格品而被拒收,因此要把产品显著低于标准才检验出来,把p 40%放在H1,即H0:p40%,H1:p5,故应用z统计量: 当a=0.05,左侧检验临界值为,因此落入接受域,尚不能认为优质西红柿的比例显著地低于40%,仍
22、应按市场价格收购。但是还须指出在接受H0时并不意味着H0一定是正确的,只是说明根据样本数据尚不能推翻H0。西红柿酱生产厂作为消费者在接受H0时,潜在地存在第二类错误的风险,而这一概率是未知的。如果要兼顾到生产者和消费者的双方利益,应在验收抽样设计中既规定a错误,又规定错误。由于超出了本书要求,这里不作详细介绍。 再次强调:接受H0时并不意味着H0一定是正确的,只是说明根据样本数据尚不能推翻H0 三、两个总体均值之差的检验 1.问题的提出:根据比较鉴别 2.检验形式:三种(教材p176) 3.当两个正态总体方差已知和两个均为大样本时的检验统计量 此时检验统计量是Z统计量,公式p177公式6.5a
23、 ,6.5b。 Page 5 of 14高等教育自学考试网上辅导数量方法2011- 3- 14http:/ 例题分析:p177例6.5,例6.6 【例6.5】一个新建的超市在选择位置时需考虑许多因素,因素之一是有关周围居民的收入水平,现在有A、B两地可供选择,A地的建筑费用较B地低,如果两地居民的平均收入相同,就在A地建筑,但若B地的居民平均收入高于A地则选在B地建筑。现从两地的居民户中各抽取了100户居民,调查并计算其收入水平。A地年平均收入28650元,从其他方面获知总体标准差4740元,B地年平均收入29980元,获知标准差为5365元。用a=0.05的显著性水平推断B地的收入水平是否显
24、著高于A地,然后决策在何地建筑超市。 解:目的是要通过样本比较两个地区居民总体的平均收入之差,要检验的参数是表示B地区的年平均收入,表示A地区年平均收入。 由于两个样本均为大样本且方差已知,可用检验统计量公式,a=0.05,右侧检验,决策规则为时拒绝H0接受H1。 Z1.645拒绝H0接受H1,表明B地的居民平均年收入高于A地,应在B地建设超市。 4.两个正态总体、方差未知,小样本。 此时,用t检验:公式p178 6.6 例题分析:p179例6.7 【例6.7】工厂管理人员对组装新产品的两种方法所需的时间进行测试,他们认为顺序的合理与否是一个关键,顺序合理就能节省时间提高效率。随机抽选采用方法
25、A的6个工人,和采用方法B的8个工人,测试的结果如下: 假设组装的时间服从正态分布,以a=0.05显著性水平比较两种组装方法有否差别。 解:本例是两个正态总体、方差未知、小样本情形,适合用t检验统计量的公式(6.6) 设方法A所需的平均时间为,方法B所需的平均时间为。 根据样本获得的数据计算得 计算合并方差 当a=0.05临界值为 ,t落入接受域,故接受H0,表明方法A与方法B无显著差别。 四、两个总体比例之差的检验 两个总体比例只差的检验与两个总体均值之差的检验类似。只是比较的两个总体都是0-1分布的总体。即两个总体中具有某种特征单元数的比例进行比较。 (一)检验两个总体比例之差是否等于零
26、即H0:P1-P2=0,H1:P1-P20。很自然地样本的估计量为两个样本比例之差,因此其抽样分布的数学期望和方差为: 方法A8.2 5.3 6.5 5.1 9.7 10.8方法B9.5 8.3 7.5 10.9 11.3 9.3 8.8 8.0 Page 6 of 14高等教育自学考试网上辅导数量方法2011- 3- 14http:/ 在原假设为真时(即P1=P2),其方差应为,但pq为待估参数也需要用样本来估计。 若,则合并的估计值(即总共n1+n2个样品中有X1+X2个样品具有指定的特征),因此检验的统计量为: 1.检验统计量的推导:p180公式6.7 2.检验统计量的条件: 以上检验要
27、求两个比例均为大样本,且有n1P1,n1Q1, n2P2,n2Q2,都大于5。 例题分析:p180例6.8 【例6.8】某保险公司在人寿保险中拟对不抽烟的人在交纳保险时提供折扣,作了一项抽烟人犯心脏病的比例和不抽烟的人犯心脏病的比例的比较,调查的对象是50岁的男性,抽烟的人是指每天至少抽一包的人,分别问他们是否犯过心脏病。调查结果80名抽烟者中有20名得过心脏病,120名不抽烟的人中有15人得过心脏病。要求以5%的显著性水平推断抽烟人与不抽烟人犯心脏病的比例是否有显著差别。 解:令p1抽烟人中犯过心脏病的比例; p2不抽烟的人中犯过心脏病的比例; n1抽烟人的样本量; n2不抽烟人的样本量;
28、x1抽烟样本中犯过心脏病人数; x2不抽烟样本中犯过心脏病的人数; P1x1/n2,抽烟样本中犯过心脏病的比例; P2x2/n2,不抽烟样本中犯过心脏病人的比例。研究目的是要了解抽烟群体中犯过心脏病人的比例是否显著高于不抽烟的群体,因此是一个单侧的假设检验。 H0:p1-p20,H1:p1-p20 将要检验的目的放在H1,这样在拒绝H0接受H1时可能犯错误的概率a是可以预先规定的。在本例中a=0.05。 根据提供的数据 P1=x1/n1=20/80=0.25 P2=15/120=0.125 检验的统计量 在a=0.05时,拒绝域在右侧,临界值za=1.645,Z za,拒绝H0接受H1,表明抽
29、烟的人中犯过心脏病的比例要超过不抽烟的人。为公司要对不抽烟的人提供折扣提供了依据。 (二)检验两个总体比例之差不等于0 H0:P1-P2=d0,H1:P1-P2d0 这时即使原假设H0为真时,P1P2,因此对于总体方差不必合并计算,因此检验的统计量为: 1. 检验统计量:公式6.8 例题分析:p182例6.9 【例6.9】有两种方法生产同一种电冰箱零件,分别称为方法一、方法二。方法一的生产费用较高而次品率比较低,方法二生产费用低而次品率高。厂方管理人员在衡量两种方法的利弊时决定对两种方法的次品率作一比较,若第一种方法比第二种方法的次品率低8%以上,可以采用方法一,否则就采用方法二。于是用两种方
30、法进行试验,然后从方法一的产品随机抽取了300个零件,发现有33个次品,从方法二的产品中也随机抽取了300个零件,发现有84个次品。试以1%的显著性水平进行假设检验,说明决定用哪一种方法进行生产。 解:设p1为第一种方法次品率,p2为第二种方法次品率。 Page 7 of 14高等教育自学考试网上辅导数量方法2011- 3- 14http:/ H0: p2- p10.08,H1: p2 - p10.08 由于p1和p2不相等,对总体比例不必合并计算,又n1=n2=300均为大样本,因此适用Z检验统计量公式(6.8),由P1=33/300=0.11,P2=84/300=0.28 这是单侧检验。当
31、a=0.01时,za=0.01=2.33,Z za,故拒绝H0,接受H1,表明方法二的次品率显著高于方法一8%,故可采用方法一。 第三节 非参数假设检验 我们已讨论的假设检验是建立在假定样本来自的总体是正态分布的。当没有这个假定或不成立时,这些检验的结论就可能被质疑。为了解决该问题,统计学家发展了无需上述假定的非参数检验。 一、什么是非参数假设检验 1.非参数检验:它泛指参数假设检验以外的各种检验。 2.非参数检验的特点 非参数检验不依赖于总体分布。 非参数假设检验适用于较低的计量水平,如等级、顺序的计量等。 常常用于参数以外的检验,如随机变量是否服从某种规律、某种分布的拟合优度检验,数据是否
32、随机的游程检验等。 3.由于非参数检验只应用于顺序等计量,没有充分利用信息,其效率不如参数检验,有些数据可以同时使用参数检验和非参数检验。 二、2检验 (一)分类数据的拟合优度检验 1.如何探讨数据规律 显示数据规律性的方法:频数分布表,能否了解数据来自某一分布或与某一理论分布 相一致的程度如何?2检验 直方图和统计量的检测可能给出了一些探索性的假设。然而,这些应该用一些较为正规的方式来加以论证。拟合优度检验给出了统计意义上的证据来检验有关分布的假设。最为通用的拟合优度检验是卡方检验(2)。拟合优度的卡方检验的假设为: H0:抽样数据来自于一个特殊的分布(如正态分布) H1:抽样数据不是来自于
33、这个特殊的分布 2.利用2进行拟合优度检验的步骤: 教材p184 第一步,先将观测到的数据分类,假设分成m类,每类中的频数为,或记为 i(i=1,2,m)。 第二步:根据观测结果似乎服从某一理论分布的规律,需要进一步检验。按照理论分布,各类的频数应为ei=nPi(i=1,2,m),其中Pi为根据理论分布,观测发生在第i类的概率。 第三步:计算统计量 如果理论分布的参数是预先给定的(已知的),则2统计量服从自由度为m-1的2分布。若理论分布的参数是未知的,需要用样本观测值来估计时,2统计量服从自由度为m-r-1的2分布,其中r为需要估计的参数的个数。 第四步:根据显著性水平a查2分布表求相应的临
34、界值2a。 22a时,拒绝原假设,说明样本观测并非来自该理论分布。 例题分析:p184-185例6.10和6.11 【例6.10】某百货公司的电器部下半年各月洗衣机的销售数量如下: 该电器部经理想了解洗衣机的销售数量是否在各月是均匀分布的,也就是说各月中销售数量的差别可以归结为随机原因,这样可以为以后的进货提供依据。要求以a=0.05 的显著性水平进行检验。 解:本例中的观测值以月为组,共分为m=6组,每月的销售台数即为观测的频数vi,观测的总次数为n=150。现欲检验是否服从(离散的)均匀分布,即每月的销售量是否为,i=1,2,6。为此,设 H0:洗衣机销售量服从均匀分布; H1:并不服从均
35、匀分布; 计算2统计量的值: 月份 七月 八月 九月 十月 十一月 十二月 合计销售量(台) 27 28 15 24 36 30 150Page 8 of 14高等教育自学考试网上辅导数量方法2011- 3- 14http:/ 在本例的情况下,2统计量的自由度为m-1=6-1=5。查表得知,所以拒绝H0,说明下半年各月销售量与均匀分布有差别,这些差别尚不能完全归结为随机原因。 【例6.11】在高速公路收费站100分钟内观测到通过收费站的汽车共190辆,每分钟通过的汽车辆数分布如下表: 用显著性水平a=0.05检验这些数据是否来自泊松分布。 解:设 H0:汽车通过收费站的辆数服从泊松分布; H1
36、:不服从泊松分布。 观测值分为5组,且有。 回忆泊松分布 其中 为泊松分布的期望值,是未知的,需要用样本观测值来估计。由于100分钟内观测到190辆汽车,所以平均每分钟观测到190/100=1.9辆汽车,故取。据此,我们可以用参数的泊松分布来计算每分钟内通过收费站的汽车为0辆、1辆、2辆、3辆、4辆或更多的概率。例如, 等等。各概率乘以观测总数n=100,便得到理论频数ei,具体结果见下表: 计算2统计量: 在本例中,2统计量的自由度为m-1-1=5-1-1=3。临界值,所以拒绝H0,说明每分钟通过收费站的汽车辆数不服从泊松分布。 在应用2分布拟合优度检验时,应注意每一类中理论频数不宜过小,通
37、常应不小于5。如果出现理论频数太低,就应当与邻近的类进行合并。 (二)2分布的独立性检验 拟合优度检验是根据样本观测值与一个理论值进行比较来检验的,但是有些数值并不知道服从何种理论分布。因此在双边量的分布中,有时想了解两个变量是相依的还是独立的。卡方检验可用于这样的检验,称作卡方的独立性检验。 这种情况下可以使用列连表进行分析,并用卡方进行独立性检验。列连表是一个表示两个分类变量的r行c列的矩阵。 1.如何探讨两个变量是相依的还是独立的2的独立性检验 2.检验的基础列联表 列联表的构成 理论频数的计算 独立性检验的统计量 P187表6.2 每分钟通过辆数 0 1 2 3 4或更多分钟数 10
38、26 35 24 5每分钟通过辆数 0 1 2 3 4或更多观测频数vi 概率Pi 理论频数ei 10 26 35 24 5 0.1496 0.2482 0.2700 0.1710 0.1252 14.96 28.42 27.0 17.1 12.52Page 9 of 14高等教育自学考试网上辅导数量方法2011- 3- 14http:/ 表6.2是最简单的2行2列的列联表,它可以扩展到rc列联表。f11代表行的第1类和列的第1类所出现的实际频数,依次类推。那么相应于f11理论值如何计算呢?因为f11位于第1行,整个样本量为n,落入第1行的概率根据样本估计应该是r1/n,f11又同时位于第1列
39、,落入第1列的概率根据样本计算应该是c1/n,根据概率论的原理,如果行和列的变量是独立的,那么落入第1行和第1列的概率应该是(r1/n)(c1/n),由于样本量为n,则落入第1行第1列的理论频数应该是 由此可以推广到 在独立性检验中的2统计量为 例题分析:p187 例6.12 【例6.12】某副食品商店欲研究顾客的性别与购物金额大小之间是有关系,还是没有关系(意味着相互独立)。在该商店内随机调查了548位顾客,按金额大小和性别进行分类,取得如下数据(见表6.3): 表6.3顾客的性别与购买金额列联表(括号内是理论频数eij) 要求用a=0.05的显著性水平检验顾客的性别和购买金额是否独立。 解
40、: H0:购物的金额大小与性别无关(独立); H1:购物的金额大小与性别有关。 计算列联表各格的理论值: 并列入列联表各格的括号内。计算2值 23列联表的自由度为(r-1)(c-1)=2,当a=0.05时的 拒绝H0,接受H1,即购物的金额大小与性别有关。 22列联表的2值计算还可以简化,为了说明方便,将列联表每格的数字用字母表示 公式6.10p189 金额 性别10元以下10-50元50元以上合计 男性40(50.29)90(99.64)130(110.07)260 女性66(55.71)120(110.36)102(121.93)288 合计106210232548 列 行 列 合计 1
41、2 行 1 a b a + b 2 c d c + b 合计 a+c b+d nPage 10 of 14高等教育自学考试网上辅导数量方法2011- 3- 14http:/ 例题分析:p189例6.13 【例6.13】某市场调研机构,调查某种光盘的购买者和性别之间是否有关系取得如下数据: 令a=0.05,用2独立性检验推断购买某种光盘与性别是否有关? 解:H0:购买与性别无关,H1:购买与性别有关。现采用两种方法计算2值。 两种方法的计算结果相同,当a=0.05,接受H0,说明买该光盘与性别的关系不显著。 三、秩和检验(等级和检验) 参数中均值检验在小样本时是如何处理的要求总体服从正态分布,当
42、总体不符合正态分布时如何处理?转换成等级,然后检验,这一类的检验统称为秩和检验。 (一)曼-惠特尼U检验 1.什么是曼-惠特尼U检验。它假设两个样本分别来自两个总体,目的是检验这两个总体的均值是否有显著的差别。 2.具体步骤。教材p190-191 第一步:把两组数据混和在一起,按照大小顺序编排等级。最小的为1,其次为2等等,两个数据和三个数据相等如何处理? 若有两个数据相等,且它们在按大小顺序编排好的数列里是第m和第m+1个数据,则它们的等级(也称作秩)都是m+(m+1)/2=2m+1/2。同理,若有3个数据相等,且它们在按大小顺序编排好的数据列里第m,第m+1和第m+2位数据,则它们的等级都
43、是3m+3/3=m+1。 第二步:分别求两个样本的等级和。设第一个样本的等级和为W1,第二个样本的等级和为W2,则有W1+W2=n(n+1)/2。 第三步:计算曼-惠特尼U检验统计量 从U1和U2中选择较小者并称其为U。 第四步:作出判断 对于n1 n2都比较小的情形,可以查附表6得到临界值Ua,在U Ua时拒绝H0: 。 在原假设为真的情况下,可以证明随机变量U的均值和方差分别为 并且当n1和n2都不小于10时,随机变量 近似地服从标准正态分布。 设第一个总体的均值为 ,第二总体的均值为 ,则对于 例题分析:p191例6.14 【例6.14】为了比较两个小学贯彻素质教育的情况,现从甲学校抽1
44、5名学生,乙学校抽25名学生,按素质教育的要求进行测试并评分,按评分高低顺序排队并编上等级,其结果如下: 想买不想买合计男32(26)118(124) 150女20(26)130(124) 150合计 52248300Page 11 of 14高等教育自学考试网上辅导数量方法2011- 3- 14http:/ 要求以显著性水平a=0.05检验两学校的素质教育有没有差别。 解:我们假设两个学校的素质教育除了平均水平以外在其他方面没有差异。我们需要检验 H0:两校素质教育水平无差异。 H1:两校素质教育水平有差异。 计算U值: U的均值和标准差分别为 因为所以我们不能拒绝H0,说明两个学校素质教育
45、的水平没有显著性的差异。 (二)威尔科克森带符号的秩检验 1.什么是威尔科克森带符号的秩检验?它只要求数据之差所服从的分布是对称分布。目的是检验成对观测的数据之差是否来自均值为0的总体,或产生数据的两个总体是否具有相同的均值。 2.具体步骤。教材p193 第一步:求出成对观测数据的差di,并将其绝对值按照大小顺序编排等级。最小的为1,其次为2等等。两个数据和三个数据相等如何处理?同曼-惠特尼U检验。 第二步:编码等级后再恢复其正负号,并将正号的等级与负号的等级分别相加,分别用T+和T-表示。取较小的一个为威尔科克森检验统计量。 第三步:作出判断 对于小样本,根据显著性水平a查数表7,得到临界值
46、Ta若TTa,则拒绝H0。 对于大样本(观测不少于20对),可以证明统计量T的均值和方差分别为 其中n为成对观测的个数,并且 近似地服从标准正态分布。因此,对于单侧检验,若Z-za,则拒绝H0;对于双侧检验,若Z -za/2,则拒绝H0。 例题分析:p193-196例6.15和例6.16 【例6.15】为比较两种轮胎的平均使用里程,在6辆汽车的后轮分别用两种不同的牌号的轮胎,直到用坏后加以记录里程,取得的数据如表6.5。 要求a=0.05,检验两种轮胎的平均行驶里程是否有显著差别。 解:H0:两种轮胎的平均行驶里程无显著差别, H1:两种轮胎的平均使用里程有差别。 Page 12 of 14高
47、等教育自学考试网上辅导数量方法2011- 3- 14http:/ 将成对的差列于表6.5的第4列(di),根据di的绝对值由小到大顺序编号,然后恢复正负号,再将不同符号的等级分别相加,见表6.5最后一列。计算得到正负号的等级和,T-=9,T+=12,用较小的T与临界值Ta相比较,由附表7得到:对于a=0.05的双侧检验,n=6时,T0.025=1,T已超过临界值,因此不能推翻H0,可认为两种轮胎的行驶里程无显著差别。 【例6.16】某饮料商用两种不同的配料方法推出了两种新的饮料,现抽取了20个消费者,让其分别品尝两种饮料并加以评分,从不喜欢到喜欢,评分由110,其评分结果如下: 要求以a=0.
48、05的显著性水平检验对两种饮料的评分是否有显著差别。 解:应用威尔科克森带符号的成对检验,将评分之差变换为等级,再恢复正负号,其计算过程见计算表6.6。将评分相同的样本加以剔除,因此样本量就由20变为18。 表6.6 最后得到T+=154,T-=17,取其中较小的T-=17来检验,在大样本的情况下T近似正态分布 当a=0.05时双侧检验,因此拒绝H0接受H1,说明两种饮料的评分有差别。 四、等级相关系数及其检验 主要用于测量两组变量之间是否存在相关以及相关程度 数值型和非数值型: (一)测定两组等级变量之间的相关系数 1.斯皮尔曼等级相关系数 p196公式6.12 其中di表示两组数据的等级之
49、差,n为样本量。 例题分析:p196例6.17 【例6.17】有一家公司招聘打字员,采用口试与实际操作两种方式。现有6个申请人的口试与实际操作的评分记录如下: 要求测定这些申请人实际操作成绩与口试成绩之间是否存在关系及关系的密切程度。 Page 13 of 14高等教育自学考试网上辅导数量方法2011- 3- 14http:/ 解:首先需要将口试成绩与操作成绩变换为等级,然后计算等级相关系数,见计算表6.7。 表6.7 应用斯皮尔曼等级相关系数 说明口试与操作成绩之间存在着相关,其相关程度0.8857。和一般的相关系数一样,当斯皮尔曼等级相关系数等1时表示完全正相关,当为0时为完全不相关,当等
50、于-1时为完全的负相关。 (二)等级相关系数的检验 1.假设检验的问题 2.小样本和大样本情况的处理 和其他的推断一样,当以样本的数据来说明总体时,由于样本带有随机性,在小样本时有时看来相关,但总体之间则不一定相关。因此也同样有一个假设检验的问题: H0:研究的总体之间无相关() H1:研究的总体之间有相关() 检验的样本估计量为样本的相关系数rSP,在小样本的情况下通常临界值的r已编制成表可以直接查阅(见附表8),但在大样本的情况下可以通过变换 服从t(n-2)的t分布,采用t检验。 本章主要讨论了假设检验的基本原理,参数检验和非参数检验的问题。 Page 14 of 14高等教育自学考试网上辅导数量方法2011- 3- 14http:/