假设检验与统计推断

上传人:mg****85 文档编号:49909026 上传时间:2018-08-04 格式:PPT 页数:55 大小:490KB
返回 下载 相关 举报
假设检验与统计推断_第1页
第1页 / 共55页
假设检验与统计推断_第2页
第2页 / 共55页
假设检验与统计推断_第3页
第3页 / 共55页
假设检验与统计推断_第4页
第4页 / 共55页
假设检验与统计推断_第5页
第5页 / 共55页
点击查看更多>>
资源描述

《假设检验与统计推断》由会员分享,可在线阅读,更多相关《假设检验与统计推断(55页珍藏版)》请在金锄头文库上搜索。

1、假设检验与重要概率分布计量经济学第一次小组展示 统计方法描述统计推断统计参数估计假设检验一、假设检验1、定义:根据样本信息判断总体分布是否具有 指定特征,这个过程就叫做假设检验。 2、方法:运用“反证法”的思想,即先假定假 设成立,然后根据某种判别准则看能得出什 么样的结果。如果得出合理结果,则自然认 为假设成立;如果得出不合理结果,则认为 假设不成立。在假设检验中,我们首先对总体参数 做一个尝试性的假设。该尝试性的假设被 称为原假设,记作H0。然后,定义义另一个 与原假设设内容完全相反的假设设,记记作H, 称之为备择为备择 假设设。假设检验设检验 的过过程就是 根据样样本数据对这对这 两个对

2、对立的假设设H0和 H进进行检验检验 。一般来说,假设检验是拒绝H0,从而证明H 正确1.等号只能位于原假设H0中;2.单侧检验方向的设定,决定了拒绝规则的选择;3.一般先设定备择假设H ;4. H0与H 应保证相互独立且完备。注意事项:假设检验的两类错误H0正确H正确接受H0结论结论 正确第二类错误类错误接受H第一类错误类错误结论结论 正确表格中的第一行说明,当做出接受H0结论时 所可能发生的情况。这时,如果H0是真的,则 该结论正确;如果H是真的,那么我们发生了 第二类错误,即当H0为假时我们却接受了H0.表格中的第二行说明,当做出拒绝H0结论时 所可能发生的情况。这是,如果H0是真的,那

3、 么我们发生了第一类错误,即当H0是真的时候 我们却拒绝了H0 ,如果H是真的,则拒绝H0是 正确的。当原假设以等式的形式为真时,犯第 一类错误的概率被称为检验的显著性水平 。用希腊字母表示显显著性水平,一般 取为为0.05或0.01。通过选择过选择 ,控制了 犯第一类错误类错误 的概率。一般的,我们们将控 制第一类错误类错误 的假设检验设检验 叫做显显著性检检 验验。假设设双侧检验侧检验单侧检验单侧检验左侧检验侧检验右侧检验侧检验原假设设H0 : m = m0H0 : m m0H0 : m m0备择备择 假设设H1 : m m0H1 : m m03、原假设和备择假设的建立三种形式:计量经济学

4、中的假设检验主要是双侧假设检验0 0临界值临界值a a /2/2 a a /2 /2 样本统计量拒绝H0拒绝H0抽样分布1 - 1 - 置信水平双侧检验左侧检验0 0临界值a a样本统计量拒绝H0抽样分布1 - 1 - 置信水平观察到的样本统计量右侧检验0 0临界值a a样本统计量拒绝H0抽样分布1 - 1 - 置信水平观察到的样本统计量已知:(1)设 是来自正态总体X的一个简单随机样本,样本均值为 ,根据单个总体的抽样分布结论,选用统计量 未知:(2) 选用统计量:4、检验统计量5、P-值法P-值是一个概率值,衡量样本对原假 设的支持程度。P-越小说明对原假设的支 持程度越低。小的P-值表明

5、在假设H0为真 时,统计量的值时异常的。(以下侧检验为例)方法:首先根据题 目中所给条件计算检验统计量,然后通过 查标准正态分布表得出Z下侧的面积(即P -值),接着找到给定的显著性水平,最 后如果P-值值,则则拒绝绝H0。0 0临界值a a样本统计量拒绝H0抽样分布1 - 1 - 置信水平观察到的样本统计量5、临界值法临界值导致拒绝原假设的检验统计量 的最大值,一般的,临界值是在标准正态 分布的下侧面积对应于=0.01的检验统检验统 计计量的值值。(以下侧检验为例)方法:首先根据题 目中所给条件计算检验统计量,然后计算 标准正态分布的下侧面积对应于 的Z值 (即临界值)最后如果所求Z值值-Z

6、 , 则则拒绝绝H0假设检验的步骤:1、提出原假设和备择假设2、指定检验中的显著性水平3、搜集样本数据并计算检验统计量的值P-值法4、利用检验统计量计算出P-值5、如果P-值 ,则拒绝H0临界值法4、显著性水平确定临界值以及拒绝规则5、利用检验统计量的值及拒绝规则确定是否拒绝H0对于上侧检验,和双侧检验的P-值法和临界值法运 用的原理是相同的,这里不一一列举。总体均值的检验假设设双侧检验侧检验下侧检验侧检验上侧检验侧检验假设设形式H0 : m =m0 H1 : m m0H0 : m m0 H1 : m m0 统计统计 量 已知: 未知:拒绝绝域P值值决策如果P-值值,则则拒绝绝H0 例:某电子

7、元器件生产厂对一批产品进 行检测,使用寿命不低于2000小时为合格 品。该电子元器件的使用寿命服从正态分 别,标准差为100小时。从该批产品中随 机抽取了120个产品进行检测,测得样本 均值为1960小时,在 的显著性水 平下检验该批电子元器件的质量是否符合 要求。解:由题意总体服从正态分布, 样本均值 ,样本容量4.382拒绝域= -2.33所以拒绝原假设,即电子元件的质量不符合标准。(1)(2)(3)(4)重要的概率分布正态分布t分布X2分布F分布二、重要的概率分布复习(一)正态分布(二) t分布(三) x分布(四) F分布(一)正态分布1、简介:对于连续型随机变量而言,正 态分布是最重要

8、的一种概率分布,其形 状似“钟型”。经验表明:对于其值依赖 于众多微小因素且每一因素均产生微小 的或正或负影响的连续型随机变量来说 ,正态分布是一个相当好的描述模型。 如身高、体重、考试成绩等。表示随机变量X服从正态分布。 符号表示随机变量服从什么样的分布;N表示正态分 布;,为正态分布的(总体)均值(或期望)和方 差。X是一个连续型随机变量,可在区间(,+) 内任意取值。-2268%近似3-395%近似99.7%近似2、正态曲线下的区域示意图正态分布曲线以均值为中心,对称分布。正态分布的概率密度函数呈中间高、两边低,在均值处 达到最高,向两边逐渐降低,即随机变量在远离均值处 取值的概率逐渐变

9、小。正态曲线下的面积约有68%位于 两值之间;约有 95%面积位于2之间;约有99.7%的面积位于 3 之间。这些区域可用作概率的度量。(即经验法则)3、性质正态分布可由两个参数,来描述,即一旦知 道,的值,就可以根据附录表查到随机变量X落于某一区间的概率值。两个(或多个)正态分布随机变量的线性组合仍服从正态分布。该性质很重要,解释如下:正态分布的偏度为0,峰度为3。如果变量X的均值为,方差为,定义一个 新的变量Z,则根据性质5,变量Z的均值为0,方差为1。 在统计学中,我们称之为单位或标准正态变量, 用符号表示为:XN(0,1)任一给定均值和方 差的正态变量都可转化为标准正态变量,将其标 准

10、化可以大大简化计算。4、标准正态分布(二)t分布1、样本均值的抽样分布或概率分布样本均值是总体均值的估计量,但是 由于样本均值是依靠某一给定样本而定, 因此它的值会因随机样本的不同而变化。 由此,我们将样本均值看作随机变量,在 样本是随机抽取得到的条件下,求样本均 值的概率密度函数。2、理论依据:若X1,X2,X3,Xn是来自于均值为,方差 为的正态总体的一随机样本。则样本均值 也服 从正态分布,其均值为,方差为/n,即:也就是说,样本均值 的抽样(或概率)分布, 同样服从正态分布。样本均值概率分布的标准正态变量:将样本均值的概率密度转化为标准正态分布后,可 以从标准正态分布表中计算某一给定样

11、本均值大于 或小于给定的总体均值的概率。3、中心极限定理:如果X1,X2,Xn是 来自(均值为,方差为)任一总体的随机样本 ,随着样本容量的无限增大,其样本均值趋于正 态分布,其均值为,方差为/n。4、假定已知和的估计量S,则可以用样本标准差 (S)代替总体标准差(),得到一个新的变量t。根据统计理论得知:变量t服从自由度为(n-1)的t分布。 注意:在这里,自由度为(n-1),而不是n。 结论:从正态总体中抽取随机样本,若该正态总体的均 值为,但方差用其估计量S来代替,则其样本均值 服从t分布。通常用符号tk表示,其中k表示自由度。k=120(正态)K=20K=50不同自由度下的 t分布5、

12、性质 t分布与正态分布相类似,具有对称性。 t分布的均值与标准正态分布均值相同,为0,但方差为k/(n-2)。由此,在求t分布的方差时定义自 由度必须大于2。标准正态分布的方差等于1,因 此,t分布方差总大于标准分布的方差,也就是说 ,t分布比正态分布略“胖”些。t分布与正态分布当k增大时,t分布的方差接近于标准正态分布方差值1 。当k=10时,t分布的方差为10/8=1.25;当k=30时,t分布的方差为30/28=1.07;当k=100时,t分布的方差为100/98=1.02;结论:随着自由度的逐渐增大t分布近似于正态分布。注意:对于t分布,不要求其样本容量很大k=30时,t分 布与正态分

13、布已很近似。t分布表的使用:0-1.8121.812例:自由度为10,P (t1.812)=P (t1.812)=P (t1.812)+P(t-1.812)=0.10.05 0.05 例:已知20名10岁男孩的跳远成绩的平均 数为1.65m,标准差为0.2m,求出其总体平 均数的95%的置信区间。(三) 分布1、分布是统计学中常用的一种概率分布 ,它与正态分布有紧密的关系。统计理论证明:标准正态变量的平方服 从自由度为1的分布,用符号表示为,其中,Z是标准正态变量,即ZN(0,1); x的下标(1) 表示自由度。自由度是指平方和中独立观察值的个数。 因为我们考虑的是一个标准正态变量的平方,故自

14、由度 为1。现在令Z1,Z2,,Zk为k个独立的标准正态变量(即每一个变量都是均值为0,方差为1的正态变量), 现在对所有的变量Zs平方,则它们的平方和服从自由 度为k的X分布,即公式里的自由度为k,因为在所有变量的平方和中有k个独立的观察值。分布的几何图形:f()概率密度K=2K=5K=10变量的密度函数0性质与正态分布不同, 分布只取正值(它是平方和的分 布),并且取值范围从0到无限大。 与正态分布不同, 分布是斜分布,其偏度取决于 自由度的大小,自由度越小,越向右偏,但是随着自 由度的增大,逐渐呈对称,接近于正态分布。 分布的期望值为k,方差为2k。k为分布的自由度 。即分布的方差是其均

15、值的2倍。 若E1、E2分别为自由度为k1,k2的两个相互独立的 变量,则其和(Z1+Z2)也是一个变量,其自由度为 (k1+k2)。可以证明: 样本方差与总体方差的比值与自由度(n-1)的积服从自由度为(n-1)的分布。公式表示为:其中,为总体方差,S为样本方差,样本容量 为n。(四) F分布令随机样本X1,X2,X3,Xm来自均值为 x和方差为x的正态总体,其样本容量为m;随机样本Y1,Y2,Y3,Yn来自均值为y和方差为y的正态总体,其样本容量为n;且这两个样本相互独立。假设知道这两个随机样本的样本方差Sx和Sy(两个总体方差的估计量)。定义一个新的变量F分析F值:如果这两个总体方差真实相等,则计算出 的F值接近于1,如果两个总体方差真实值不相等, 则F值不等于1;两总体方差相差越大,则F值越大。统计理论表明:如果x =y(即两总体方差相等) ,则F服从分子自由度为k1=(m-1),分母自由度为 k2=(n-1)的F分布。需要说明一点:在概率论与数理统计中,更准确的说法是:( Sx/ x) /(Sy/ y)服从F分布,但我们上式给出, x =y, 故样本方差之比服从F分布。F分布又称为方差比分布,通常用符号表示为: 其中的双下标表明

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 科普知识

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号