假设检验与方差分析

上传人:飞*** 文档编号:48581149 上传时间:2018-07-17 格式:PPT 页数:49 大小:666KB
返回 下载 相关 举报
假设检验与方差分析_第1页
第1页 / 共49页
假设检验与方差分析_第2页
第2页 / 共49页
假设检验与方差分析_第3页
第3页 / 共49页
假设检验与方差分析_第4页
第4页 / 共49页
假设检验与方差分析_第5页
第5页 / 共49页
点击查看更多>>
资源描述

《假设检验与方差分析》由会员分享,可在线阅读,更多相关《假设检验与方差分析(49页珍藏版)》请在金锄头文库上搜索。

1、第五章 假设检验与方差分析一、假设检验(Hypothesis Testing)问题的提出有许多实际问题,需要通过部分信息量,对某种 看法进行判定或估计。例1、某企业生产一种零件,以往的资料显示零 件平均长度为4cm,标准差为0.1cm。工艺改革后, 抽查100个零件发现其平均长度为3.94cm。问:工艺 改革后零件长度是否发生了显著变化?例2、某厂有一日共生产了200件产品,按国家标 准,次品率不得超过3%才能出厂。现从该批产品中 随机抽取10件,发现其中有2件次品,问这批产品能 否出厂。 第一节 假设检验的一般问题例1要判明工艺改革后零件平均 长度是否仍为4cm;例2要判明该批产品的次品率是

2、 否低于3%。进行这种判断 的信息来自 所抽取的样本这两个例子中都是要对某种“陈述”做出判断 :所谓假设检验,就是事先对总体参数或总体分 布形式作出一个假设,然后利用样本信息来判断 原假设是否合理,即判断样本信息与原假设是否 有显著差异,从而决定是否接受或否定原假设 假设检验分两类:(1)参数假设检验;(2) 非参数检验或自由分布检验。1、假设检验采用的逻辑推理方法是反证法为了检某假设是否成立,先假定它正确,然后 根据样本信息,观察由此假设而导致的结果是否合 理,从而判断是否接受原假设;2、判断结果合理与否,是基于“小概率事件不 易发生”这一原理的即在一次抽样中,小概率事件不可能发生。如 果在

3、原假设下发生了小概率事件,则认为原假设是 不合理的;反之,小概率事件没有发生,则认为原 假设是合理的。二、假设检验的基本思想因此,置信度大小的不同,有可能做出不同的 判断。3、假设检验是基于样本资料来推断总体特征 的,而这种推断是在一定概率置信度下进行的, 而非严格的逻辑证明。在例1中,要判断工艺改革后零件平均长度是 否仍为4cm,可先假设仍为4cm,根据样本平均数的抽样 分布理论,则样本点应以较大的可能性(置信 度)落在以4为中心的某一范围内,或者说在给定置信度1-下(比如99%):其中:0为所要检验的假设(这里为4cm)为总体标准差(这里为0.1cm)N为样本容量(这里为100)Z/2为置

4、信度1-下,标准正态分布对应的右尾 临界值如果取置信度为0.99,则显著性水平=0.01,对 应的临界值为Z/2 =2.58换言之,如果原假设为真,则样本测算值将以 99%的可能性落在-2.58,2.58区间内。通过一组(实际)样本计算得:说明小概率事件(标准化后的样本均值只有 1%的可能性落在-2.58,2.58区间外)发生了。这是不合理的,应拒绝原假设。1、提出原假设(null hypothesis)和备择假设 (alternative hypothesis)原假设为正待检验的假设:H0;备择假设为可供选择的假设:H1一般地,假设有三种形式:(1)双侧检验:H0 : 0; H1 :0(2)

5、左侧检验:H0 : 0; H1 :0 或 H0 : 0 三、假设检验的步骤2、选择适当的统计量,并确定其分布形式统计量是根据所涉及的问题而定的,如总体均 值、比例(率)可选取正态分布的Z统计量等。3、选择显著性水平或置信度,确定临界值显著性水平为原假设为真时,样本点落在临界 值外的概率(即抽样结果远离中心点的概率,它 为小概率),也是原假设为真时,拒绝原假设所 冒的风险。临界值将样本点所落区域分为拒绝域与接受 域,临界值“外”为拒绝域,“内”为接受域。通过样本计算统计量的具体值,与临界值比较 ,根据落入拒绝域或接受域的情况来拒绝或接受 原假设。4、作出结论由于假设检验是根据有限的样本信息来推断

6、总体 特征,由样本的随机性可能致使判断出错。(一)第一类错误当原假设为真时,而拒绝原假设所犯的错误,称 为第I类错误或拒真错误。易知犯第I类错误的概率就 是显著性水平:四、假设检验中的两类错误(二)第二类错误当原假设为假时,而接受原假设所犯的错误, 称为第II类错误或采伪错误。犯第II类错误的概率 常用表示:假设检验中的四种可能情况 H0为真 H0不真接受H0 Good Bad/Type II error拒绝H0 Bad/Type I error Good1、犯第一类错误与犯第二类错误的概率存在此消彼长的关系;2、若要同时减少 与 ,须增大样本容量n。3、通常的作法是,取显著性水平较小,即控制

7、犯第一 类错误的概率在较小的范围内;4、在犯第二类错误的概率不好控制时,将“接受原假 设”更倾向于说成“不拒绝原假设”。注意:一、总体均值的假设检验(一)总体方差已知,正态总体,样本大小不限如果总体XN(,2),在方差已知的情况下,对总体均 值进行假设检验。由于第二节 总体均值、比例和方差的假设检验 注意:如果总体方差未知,且总体分布未知,但如果是大样 本(n=30),仍可通过 Z 统计量进行检验,只不过总体 方差需用样本方差 s 替代。因此,可通过构造Z统计量来进行假设检验:例3:根据以往的资料,某厂生产的产品的使用寿命服从正 态分布N(1020, 1002)。现从最近生产的一批产品中随机抽

8、取16 件,测得样本平均寿命为1080小时。问这批产品的使用寿命 是否有显著提高(显著性水平:5%)?由=0.05,查表得临界值:Z=Z 0.05=1.645提出假设:H0:=1020 ,H1: 1020 检验统计量:比较:计算的Z=2.4 Z =1.645判断:拒绝H0 ,接受H1 ,即这批产品的寿命确有提高 。(二)总体方差未知,正态总体,小样本注:如果总体分布也未知,则没有适当的统计量进 行假设检验,唯一的解决办法是增大样本,以使 样本均值趋向于正态分布,从而再采用Z统计量。这时只能用 t 统计量进行假设检验:二、总体比例的假设检验大样本下,样本比例趋向于正态分布,因此 可通过构造Z统计

9、量的方法进行假设检验:注:1、如果总体比例P未知,可用样本比例p替 代。2、Z统计量只适合大样本情况下的总体比 例检验。只讨论限于正态总体方差的检验。设所要检验的原假设为:H0:三、总体方差的假设检验因此,可构造2 统计量进行总体方差 的假设检验。当H0成立时,S2/02 接近于1,2的 值在一个适当的范围内,当H0不成立时,S2/02远离1,2的值 相当大或相当小。由于样本方差 S2是总体方差2的无偏估计量,可通过它们的 对比来构造检验统计量。可以证明,若H0为真,则在例2中,由于所抽样本只为10,为小样本,因 此无法构造Z统 计量进行总体比例的假设检验。但可以通过概率论的知识给予初步的判断

10、:则在任抽10件产品,至少有2件次品的概率为:在任抽10件产品中有一件次品的概率为:在任抽10件产品中无次品的概率为:说明:1、如果该批产品满足不超过3%的次品率,则 从200件中随机抽取10件,至少有2件以上次品的 概率不超过4%,这是一个很小的概率。2、这一小概率事件在一次抽样中出现,因此 原假设这批产品的次品率不超过3%的判断很可能 有错误,而应拒绝。3、因此可以认为这批产品的次品率大于3%, 所以该批产品不能出厂。第三节 假设检验中的其他问题一、区间估计与假设检验的关系1、区别:区间估计是依据样本资料估计总体的未知参数的 可能范围;假设检验是根据样本资料来检验对总体参数的先 验假设是否

11、成立。区间估计通常求得的是以样本为中心的双侧置 信区间;假设检验不仅有双侧检验也有单侧检验。2、联系都是根据样本信息对总体参数进行推断;都是以抽样分布为理论依据;都是建立在概率基础上的推断,推断结果都有 风险;对同一问题的参数进行推断,使用同一样本、 同一统计量、同一分布,因而二者可以相互转换。区间估计立足于大概率,通常以较大的把握程度( 可信度)1- 去估计总体参数的置信区间;假设检验立足于小概率,通常是给定很小的显著性 水平 去检验对总体参数的先验假设是否成立。二、假设检验中的P值假设检验的结论是在给定的显著性水平下作出 的。因此,在不同的显著性水平下,对同一问题 所下的结论可能完全相反(

12、下图)。红点:在0.1的显著性水平下 ,拒绝原假设; 在0.05的显著性水平 下,接受原假设。例3:根据以往的资料,某厂生产的产品的使用寿命服从正 态分布N(1020, 1002)。现从最近生产的一批产品中随机抽取16 件,测得样本平均寿命为1080小时。问这批产品的使用寿命 是否有显著提高(显著性水平:5%)?由=0.05,查表得临界值:Z=Z 0.05=1.645提出假设:H0:=1020 ,H1: 1020 检验统计量:比较:计算的Z=2.4 Z =1.645判断:拒绝H0 ,接受H1 ,即这批产品的寿命确有提高 。在例3中,检验统计量的值 Z=2.4, 由于Z服从正态分布N(0,1),

13、则可求得统计量大于2.4的概率:P(Z2.4)=0.008假设检验P值的提出:通常:把这种“拒绝原假设 的最小显著性水平”称为假 设检验的P值。因此,若选定显著性水平 0.008,则Z=2.4Z ,Z值落入拒绝域若选定显著性水平 P ,则在显著性水平 下拒绝原假设;如果3.24 ,拒绝原假设,从而得出: 颜色对该公司饮料销售有显 著影响。(三)均值的F检验如果同时需考虑两个因素A与B的影响,则可进行 双因素方差分析。双因素方差分析中需假设两个因素不交互作用,即 各自独立地发挥影响作用。(一)数据结构二、双因素方差分析(二)离差平方和的分解其中:可以证明:于是表4.3 双因素方差分析表 误差来源 离差 自由度 均方差 F值平方和A因素 SSA r-1 MSA=SSA/(r-1) FA=MSA/MSEB因素 SSB k-1 MSB=SSB/(k-1) FB=MSB/MSE随机误差 SSE (r-1)(k-1) MSE=SSE/(r-1)(k-1) 合计 SST n-1 SST/(n-1)在饮料销售例中,如果我们还关心不同超市是否对销售有 影响,这时可将5个不同的超市作为因素B考虑,它有5个水 平。双因素分析结果如下:

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 商业/管理/HR > 其它文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号