统计知识回顾区间估计与假设检验课件

资源描述

《统计知识回顾区间估计与假设检验课件》由会员分享，可在线阅读，更多相关《统计知识回顾区间估计与假设检验课件（80页珍藏版）》请在金锄头文库上搜索。

1、暨南大学经济学院统计系陈文静,1,统计学预备知识：回顾,1 概率 2 概率分布（正态分布等） 3 两类错误 4 假设检验 5 置信区间、置信水平和显著性水平 6 统计检验的功效,暨南大学经济学院统计系陈文静,2,事件的概率(probability),定义：事件A的概率是对事件A在试验中出现的可能性大小的一种度量表示事件A出现可能性大小的数值(介于0和1之间) 事件A的概率表示为P(A) 概率的定义有：古典定义、统计定义和主观概率,暨南大学经济学院统计系陈文静,3,古典概率 (先验概率), 如果某一随机试验的结果有限，而且各个结果在每次试验中出现的可能性相同，则事件A发生的概率为该事件所

2、包含的基本事件个数 m 与样本空间中所包含的基本事件个数 n 的比值，记为,暨南大学经济学院统计系陈文静,4,古典概率特点,样本空间的基本事件只有有限个；每个基本事件发生的可能性相等。例：一批产品共100件，其中有6件不合格品，随机抽取一件不合格品的概率是：,暨南大学经济学院统计系陈文静,5,概率的统计定义, 在相同条件下重复进行n次随机试验，事件A出现 m 次，则比值 m/n 称为事件A发生的频率。随着n的增大，该频率围绕某一常数P上下摆动，且波动的幅度逐渐减小，趋于稳定，这个频率的稳定值即为事件A的概率，记为,优点：不受古典概率的两个特点的限制，容易理解。缺点：试验不能无限制的进行

3、下去。,暨南大学经济学院统计系陈文静,6,主观概率,主观概率：是指对一些无法重复的试验，确定其结果的概率只能根据以往的经验，人为确定这个事件的概率。主观概率是一个决策者对某个事件是否发生，根据个人掌握的信息对该事件发生可能性的判断例如，企业投资新项目的成功和失败的概率。例如天下雨的可能性多大？一种新产品畅销的可能性多大？由于仅仅是经验的主观判断，因此可靠性就值得怀疑，不宜滥用。,暨南大学经济学院统计系陈文静,7,概率的性质,非负性对任意事件A，有 0 P (A) 1 规范性必然事件的概率为1；不可能事件的概率为0。即P ( ) = 1； P ( ) = 0 可加性若A与B互斥

4、，则P ( AB ) = P ( A ) + P ( B ) 推广到多个两两互斥事件A1，A2，An，有 P ( A1A2 An) = P ( A1 ) + P (A2 ) + + P (An ),暨南大学经济学院统计系陈文静,8,参数估计的方法,暨南大学经济学院统计系陈文静,9,点估计 (point estimate),用样本的估计量的某个取值直接作为总体参数的估计值例如：用样本均值直接作为总体均值的估计；无法给出估计值接近总体参数程度的信息虽然在重复抽样条件下，点估计的均值可望等于总体真值，但由于样本是随机的，抽出一个具体的样本得到的估计值很可能不同于总体真值一个点估计量的可靠

5、性是由它的抽样标准误差来衡量的，这表明一个具体的点估计值无法给出估计的可靠性的度量,暨南大学经济学院统计系陈文静,10,点估计 (point estimate),点估计,暨南大学经济学院统计系陈文静,11,区间估计的提出,暨南大学经济学院统计系陈文静,12,区间估计 (interval estimate),在点估计的基础上，给出总体参数估计的一个区间范围，该区间由样本统计量加减估计误差而得到根据样本统计量的抽样分布能够对样本统计量与总体参数的接近程度给出一个概率度量比如，某班级平均分数在7585之间，置信水平是95%,暨南大学经济学院统计系陈文静,13,回顾：中心极限定理(cent

6、ral limit theorem),中心极限定理：设从均值为，方差为2 的一个任意总体中抽取容量为n的样本，当n充分大时，样本均值的抽样分布近似服从均值为、方差为2/n的正态分布,暨南大学经济学院统计系陈文静,14,暨南大学经济学院统计系陈文静,15,进一步解释,暨南大学经济学院统计系陈文静,16,置信区间（confidence interval）,暨南大学经济学院统计系陈文静,17,置信区间（confidence interval）,暨南大学经济学院统计系陈文静,18,暨南大学经济学院统计系陈文静,19,暨南大学经济学院统计系陈文静,20,置信水平：将构造置信区间的步骤重复很

7、多次，置信区间包含总体参数真值的次数所占的比例称为置信水平置信水平表示为 (1 - ，为是总体参数未在区间内的比例，称为显著性水平。常用的置信水平值有 99%, 95%, 90% 相应的为0.01，0.05，0.10 显著性水平越小越好,置信水平,暨南大学经济学院统计系陈文静,22,置信区间与置信水平,暨南大学经济学院统计系陈文静,23,对置信区间的几点理解,总体均值的区间估计,对总体均值进行区间估计时，需要考虑几种情形： 1、总体是否为正态分布？ 2、总体方差是否已知？ 3、用于构造估计量的样本是大样本（n30）? 还是小样本（n30）呢？,暨南大学经济学院统计系陈文静,25,

8、暨南大学经济学院统计系陈文静,26,暨南大学经济学院统计系陈文静,27,暨南大学经济学院统计系陈文静,28,暨南大学经济学院统计系陈文静,30,总体均值的区间估计 (大样本),1.假定条件总体服从正态分布,且方差() 已知如果不是正态分布，可由正态分布来近似 (n 30) 使用正态分布统计量 z,总体均值在1- 置信水平下的置信区间为,暨南大学经济学院统计系陈文静,31,暨南大学经济学院统计系陈文静,32,总体均值的区间估计 (小样本),1.假定条件总体服从正态分布,但方差() 未知小样本 (n 30) 使用 t 分布统计量,总体均值在1-置信水平下的置信区间为,暨南大

9、学经济学院统计系陈文静,33,t 分布, t 分布是类似正态分布的一种对称分布，它通常要比正态分布平坦和分散。一个特定的分布依赖于称之为自由度的参数。随着自由度的增大，分布也逐渐趋于正态分布,暨南大学经济学院统计系陈文静,34,暨南大学经济学院统计系陈文静,35,暨南大学经济学院统计系陈文静,37,假设检验：先对总体的参数(或分布形式)提出某种假设，然后利用样本信息判断假设是否成立的过程,对总体参数(或分布形式) 提出假设,假设检验,抽取样本，构造检验统计量,决策过程：根据某种规则判断假设是否成立,暨南大学经济学院统计系陈文静,38,假设检验和区间估计的区别,区间估计：用给定的大概率

10、推断出总体参数所在的范围。假设检验：是以小概率为标准，对总体的状况（总体参数或总体分布）所做出的假设进行判断。注：假设检验与区间估计结合起来，构成完整的统计推断内容。,暨南大学经济学院统计系陈文静,39,区间估计与假设检验的转换,区间估计问题：在一定的概率（置信水平）下，利用样本信息来估计总体的不合格率假设检验问题：以一定的概率水平（显著水平性），通过样本资料来判断该批产品是否合格或合格的程度注：对于同一个实例，用的是同一个样本，同一个样本统计量，同一个分布，因此区间估计与假设检验可以相互转换。,暨南大学经济学院统计系陈文静,40,置信区间是在一定的概率（置信水平）保证程度下

11、利用样本数据计算得到的关于总体参数可能所在的范围。而进行假设检验时，我们事先对总体参数的假设值有可能会落在这个置信区间外，这时我们判定为具有显著性差异，拒绝假设；假设值也可能会落在置信区间内，不能拒绝。假设检验：我们关心的是检验总体参数值有无变化（即是否存在显著性差异），而检验过程就是利用样本信息判断差异是否显著。区间估计：目的在于通过样本资料推断总体参数在一定的概率水平下可能的取值范围,估计与检验的联系,提出假设构造适当的检验统计量，并利用样本信息计算检验统计量的值规定显著性水平，确定临界值作出统计决策：拒绝假设还是接受假设,假设检验的步骤,暨南大学经济学院统计系陈文静,42,原

12、假设与备择假设,原假设(null hypothesis) ：研究者想收集证据予以反对的假设，待检验的假设。表示为H0 H0 ： = ，或某一数值备择假设(alternative hypothesis)：与原假设对立，研究者想收集证据予以支持的假设。表示为H1 H1： , 或某一数值,暨南大学经济学院统计系陈文静,43,原假设和备择假设是一个完备事件组，而且相互对立排斥在一项假设检验中，原假设和备择假设必有一个成立，而且只有一个成立接受原假设，意味着拒绝备择假设；拒绝原假设，意味着接受备择假设；先确定备择假设，再确定原假设等号“=”一般都是放在原假设上因研究目的不同，对同一

13、问题可能提出不同的假设(也可能得出不同的结论),(归纳与建议),提出原假设与备择假设,暨南大学经济学院统计系陈文静,44,假设检验中的两类错误,1.第类错误(弃真错误) 原假设为真时我们拒绝原假设第类错误的概率记为被称为显著性水平 2.第类错误(取伪错误) 原假设为假时我们没有拒绝原假设第类错误的概率记为(Beta),暨南大学经济学院统计系陈文静,45,两类错误的进一步解释,错误：错误,暨南大学经济学院统计系陈文静,46,两类错误的进一步解释,暨南大学经济学院统计系陈文静,47, 错误和错误的关系,和的关系就像翘翘板，小就大，大就小,你要同时减少两类错误的惟一办法是增

14、加样本容量!,暨南大学经济学院统计系陈文静,48,检验功效(test power),拒绝一个错误的原假设的能力根据的定义，是指没有拒绝一个错误的原假设的概率。这也就是说，1- 则是指拒绝一个错误的原假设的概率，这个概率被称为检验能力,也被称为检验的势或检验的功效(power) 可解释为正确地拒绝一个错误的原假设的概率,暨南大学经济学院统计系陈文静,49,在犯第一类错误（）概率得到控制的条件下，犯取伪错误的概率（）也要尽可能地小，或者说，不取伪的概率1-应尽可能增大。 1-越大，意味着当原假设不真实时，检验判断出原假设不真实的概率越大，检验的判别能力就越好； 1-越小，意味着当原假

15、设不真实时，检验结论判断出原假设不真实的概率越小，检验的判别能力就越差。可见1-是反映统计检验判别能力大小的重要标志，我们称之为检验功效或检验势。,检验功效 (power of test),暨南大学经济学院统计系陈文静,50,根据样本观测数据计算得到的，并据以对原假设和备择假设作出决策的某个样本统计量对样本估计量的标准化结果原假设H0为真点估计量的抽样分布,检验统计量 (test statistic),标准化的检验统计量,暨南大学经济学院统计系陈文静,51,选择检验统计量时需要考虑的要素,检验的样本容量：大样本还是小样本？总体方差是否已知？原因：因为总体方差是否已知以及检验的样本

16、大小决定了抽样分布，也就决定了检验统计量的选择与构造。,暨南大学经济学院统计系陈文静,52,显著性水平和拒绝域 (双侧检验示意图 ),抽样分布,暨南大学经济学院统计系陈文静,53,显著性水平 (significant level),1. 原假设为真时，拒绝原假设的概率被称为抽样分布的拒绝域 2. 它是事先指定的犯第类错误概率的最大允许值 3.常用的值有0.01, 0.05, 0.10 4.由研究者事先确定，也称名义显著性水平 5. 拒绝原假设，则表明检验的结果是显著的不拒绝原假设，表明检验的结果是不显著的,暨南大学经济学院统计系陈文静,54,对显著性水平的几点说明,提前选择一个显著性水平，可以根据分布表查出在该显著性水平下的临界值，进而将计算的检验统计值与临界值做一个比较，于是在给定的显著性水平下，原假设要么被拒绝，要么未被拒绝。不同的研究者根据特定的

展开阅读全文