假设检验与方差分析OK

上传人:平*** 文档编号:47558678 上传时间:2018-07-02 格式:PPT 页数:77 大小:893.14KB
返回 下载 相关 举报
假设检验与方差分析OK_第1页
第1页 / 共77页
假设检验与方差分析OK_第2页
第2页 / 共77页
假设检验与方差分析OK_第3页
第3页 / 共77页
假设检验与方差分析OK_第4页
第4页 / 共77页
假设检验与方差分析OK_第5页
第5页 / 共77页
点击查看更多>>
资源描述

《假设检验与方差分析OK》由会员分享,可在线阅读,更多相关《假设检验与方差分析OK(77页珍藏版)》请在金锄头文库上搜索。

1、第六章 假设检验与方差分析第一节 假设检验的基本原理 第二节 总体均值的假设检验 第三节 总体比例的假设检验 第四节 单因子方差分析第五节 双因子方差分析第六节 Excel在假设检验与方差 分析中的应用第一节 假设检验的基本原理一 什么是假设检验二 原假设与备择假设三 检验统计量四 显著性水平、P-值与临界值五 双侧检验和单侧检验六 假设检验的两类错误七 关于假设检验结论的理解一、什么是假设检验先举一个例子 : 例6-1:假定咖啡的分袋包装生产线的装袋重量服从 正态分布N(,2)。生产线按每袋净重150克的技术 标准控制操作。现从生产线抽取简单随机样本 n=100袋,测得其平均重量为 =149

2、.8克,样本标 准差S=0.872克。问该生产线的装袋净重的期望值是 否为150克(即问生产线是否处于控制状态)?所谓假设检验,就是事先对总体的参数或总体分布 形式做出一个假设,然后利用抽取的样本信息来判 断这个假设(原假设)是否合理,即判断总体的真 实情况与原假设是否存在显著的系统性差异,所以 假设检验又被称为显著性检验。一个完整的假设检验过程,包括以下几个步骤: (1)提出假设; (2)构造适当的检验统计量,并根据样本计 算统计量的 具体数值; (3)规定显著性水平,建立检验规则; (4)做出判断。二、原假设与备择假设原假设一般用H0表示,通常是设定总体参数等于某 值,或服从某个分布函数等

3、;备择假设是与原假设 互相排斥的假设,原假设与备择假设不可能同时成 立。所谓假设检验问题实质上就是要判断H0是否正 确,若拒绝原假设H0 ,则意味着接受备择假设H1 。 如在例6-1中,我们可以提出两个假设:假设平均袋 装咖啡重量与所要控制的标准没有显著差异,记为 H0: = 150;假设平均袋装咖啡重量与所要控制的 标准有显著差异,记为H1: 150。 三、检验统计量所谓检验统计量,就是根据所抽取的样本计算的用 于检验原假设是否成立的随机变量。检验统计量中应当含有所要检验的总体参数,以便 在“总体参数等于某数值”的假定下研究样本统计量 的观测结果。检验统计量还应该在“H0成立”的前提下有已知

4、的分 布,从而便于计算出现某种特定的观测结果的概率 。 例6-2 构造例6-1的检验统计量,并计算相应的样本观测值 。 四、显著性水平、P-值与临界值小概率事件在单独一次的试验中基本上不会发生, 可以不予考虑。在假设检验中,我们做出判断时所依据的逻辑是: 如果在原假设正确的前提下,检验统计量的样本观 测值的出现属于小概率事件,那么可以认为原假设 不可信,从而否定它,转而接受备择假设。至于小概率的标准是多大?这要根据实际问题而定 。假设检验中,称这一标准为显著性水平,用来表 示,在应用中,通常取 =0.01, =0.05。一般来 说,犯第一类错误可能造成的损失越大, 的取值 应当越小。 对假设检

5、验问题做出判断可依据两种规则:一是P- 值规则;二是临界值规则。(一)P-值规则 所谓P-值,实际上是检验统计量超过(大于或小于) 具体样本观测值的概率。如果P-值小于所给定的显 著性水平,则认为原假设不太可能成立;如果P-值 大于所给定的标准,则认为没有充分的证据否定原 假设。例6-3假定 =0.05,根据例6-2的结果,计算该问题的P-值 ,并做出判断。 解:查标准正态概率表,当z=2.29时,阴影面积为 0.9890,尾部面积为10.9890=0.011,由对称性可知 ,当z= 2.29时,左侧面积为0.011。 0.011/2=0.025 0.011这个数字意味着,假若我们反复抽取n=

6、100的 样本,在100个样本中仅有可能出现一个使检验统计 量等于或小于2.29的样本。该事件发生的概率小于 给定的显著性水平,所以,可以判断=150的假定 是错误的,也就是说,根据观测的样本,有理由表 明总体的与150克的差异是显著存在的。(二)临界值规则假设检验中,还有另外一种做出结论的方法:根据 所提出的显著性水平标准(它是概率密度曲线的尾 部面积)查表得到相应的检验统计量的数值,称作 临界值,直接用检验统计量的观测值与临界值作比 较,观测值落在临界值所划定的尾部(称之为拒绝 域)内,便拒绝原假设;观测值落在临界值所划定 的尾部之外(称之为不能拒绝域)的范围内,则认 为拒绝原假设的证据不

7、足。这种做出检验结论的方 法,我们称之为临界值规则。显然,P-值规则和临界值规则是等价的。在做检验 的时候,只用其中一个规则即可。P-值规则较之临界值规则具有更明显的优点。这主 要是:第一,它更加简捷;第二,在值规则的检验 结论中,对于犯第一类错误的概率的表述更加精确 。推荐使用P-值规则。例6-4假定=0.05,根据例6-2的结果,用临界值规则做出 判断。 解:查表得到,临界值z0.025= 1.96。由于z= 2.290六、假设检验的两类错误显著性检验中的第一类错误是指:原假设事实上正 确,可是检验统计量的观测值却落入拒绝域,因而 否定了本来正确的假设。这是弃真的错误。发生第 一类错误的概

8、率在双侧检验时是两个尾部的拒绝 域面积之和;在单侧检验时是单侧拒绝域的面积。显著性检验中的第二类错误是指:原假设事实上不 正确,而检验统计量的观测值却落入了不能拒绝域 ,因而没有否定本来不正确的原假设,这是取伪的 错误。发生第二类错误的概率是把来自=1(10) 的总体的样本值代入检验统计量所得结果落入接受 域的概率。根据不同的检验问题,对于和大小的选择有不同 的考虑。例如,在例6-1中,如果检验者站在卖方的 立场上,他较为关心的是不要犯第一类错误,即不 要发生产品本来合格却被错误地拒收这样的事情, 这时, 要较小。反之,如果检验者站在买者的立 场上,他关心的是不要把本来不合格的产品误当作 合格

9、品收下,也就是说,最好不要犯第二类错误, 因此, 要较小。在样本容量n不变的条件下,犯两类错误的概率常 常呈现反向的变化,要使和都同时减小,除非增 加样本的容量。为此,统计学家奈曼与皮尔逊提出 了一个原则,即在控制犯第一类错误的概率情况 下,尽量使犯第二类错误的概率小。在实际问题 中,我们往往把要否定的陈述作为原假设,而把拟 采纳的陈述本身作为备择假设,只对犯第一类错误 的概率加以限制,而不考虑犯第二类错误的概率 。七、关于假设检验结论的理解这就是说,在假设检验中,相对而言,当原假设被 拒绝时,我们能够以较大的把握肯定备择假设的成 立。而当原假设未被拒绝时,我们并不能认为原假 设确实成立。 第

10、二节 总体均值的假设检验一 单个总体均值的检验二 双总体均值是否相等的检验一、单个总体均值的检验(一)总体为正态分布,总体方差已知 来自总体的样本为(x1, x2, , xn)。对于假设: H0: = 0,在H0成立的前提下,有检验统计量 (二)总体分布未知,总体方差已知,大样本 来自总体的样本为(x1, x2, , xn)。对于假设: H0: = 0,在H0成立的前提下,如果样本足够大( n30),近似地有检验统计量 (三)总体为正态分布,总体方差未知来自总体的样本为(x1, x2, , xn)。对于假设: H0: = 0,在H0成立的前提下,有检验统计量 若自由度(n-1)30,该t统计量

11、近似服从标准正态分 布。(四)总体分布未知,总体方差未知,大样本来自总体的样本为(x1, x2, , xn)。对于假设: H0: = 0,在H0成立的前提下,如果总体偏斜适度 ,且样本足够大,近似地有检验统计量例6-5 某厂采用自动包装机分装产品,假定每包产品的重 量服从正态分布,每包标准重量为1000克,某日随 机抽查9包,测得样本平均重量为986克,样本标准 差是24克。试问在=0.05的显著性水平上,能否认 为这天自动包装机工作正常?解:第一步:确定原假设与备择假设。 H0: = 1000, H1: 1000第二步:构造出检验统计量,计算检验统计量的观测值 。由于总体标准差未知,用样本标

12、准差代替,相应检验 统计量是t-统计量。第三步:确定显著性水平,确定拒绝域 =0.05,查t-分布表(自由度n-1=8),得临界值是 t0.025(8)=2.306,拒绝域是 2.306 。第四步:判断。 由于 2.306,检验统计量的样本观测值落入接受域, 所以不能拒绝。样本数据没有充分说明这天的自动包装 机工作不正常。二、双总体均值是否相等的检验(一)两个正态总体,方差相等(但未知) 为检验两个总体均值是否相等,我们提出原假设 H0:1 = 2 。可以证明,在原假设成立的条件下, 以下检验统计量服从自由度为n1+n2-2的t-分布。即当n1+n2-2 30时,上述检验统计量近似服从标准正

13、态分布。(二)两个正态总体,方差不相等(也未知) 这时,使用检验统计量 (三)两个非正态总体,样本量足够大 那么,只要n1和n2都足够大,在原假设H0:1 = 2成 立的条件下,以下检验统计量近似服从标准正态分 布。例6-6某工厂为了比较两种装配方法的效率,分别组织了 两组员工,每组9人,一组采用新的装配方法,另外 一组采用旧的装配方法。假设两组员工设备的装配 时间均服从正态分布,两总体的方差相等但未知。 现有18个员工的设备装配时间见表6-2,根据这些数 据,是否有理由认为新的装配方法更节约时间?( 显著性水平0.05) 表6-2 两组员 工设备 的装配时间 单位:小时 新方法(x2)353

14、129253440273231旧方法(x1)323735384144353134解:原假设与备择假设如下: H0:旧 - 新 0H1:旧 - 新 0 该题属于两个正态总体,方差相等(但未知)的情 况。因此,可利用下式计算检验统计量。查表可知,显著性水 平为0.05、自由度为16 的单侧临界值为1.7459 。t 统计量的样本观测 值2.33971.7459,因 此应拒绝原假设,即 认为新的装配方法更 节约时间。第三节 总体比例的假设检验一 单个总体比例的假设检验二 两个总体的比例是否相等的检验一、单个总体比例的假设检验 例6-7一项调查结果声称,某市小学生每月零花钱达到200 元的比例为40%

15、,某科研机构为了检验这个调查是 否可靠,随机抽选了100名小学生,发现有47人每月 零花钱达到200元,调查结果能否证实早先调查40% 的看法?(=0.05)解:由条件充分大,可以利用正态近似的公式进行 计算。H0: = 40% H0: 40%确定拒绝域临界值z0.025=1.96,Z显著水 平标准 = 0.05,所以不能拒绝H0,即没有得到足以表明 四种配方的饲料下小鸡增重水平有差异的显著证据。临界值规则:根据给定的显著水平 = 0.05 ,查表得临界 值为F0.05(3,17)=3.20。因F=1.06F0.05(2,24)=3.40283,拒绝H02 ,有充分 证据说明噪音对产量有显著影响;FAB=7.09259F0.05(6,24)=2.50819,拒绝H03,有充分 证据说明光照与噪音存在交互作用并由此对产量产 生显著影响。 第六节 Excel在假设检验与方差分析 中的应用一 假设检验 二 方差分析 一、假设检验【例6-11】使用例6-1的数据进行假设检验( =0.05,双侧检验)。解:操作步骤如下。 (1)构造工作表,见图6-2。图中方框内为计算所 得数据,方框外为原始输入数据。(2)计算检验统计量Z。在B6单元格

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 中学教育 > 教学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号