《ch6参数估计》ppt课件

上传人:san****019 文档编号:83470584 上传时间:2019-02-27 格式:PPT 页数:75 大小:1.28MB
返回 下载 相关 举报
《ch6参数估计》ppt课件_第1页
第1页 / 共75页
《ch6参数估计》ppt课件_第2页
第2页 / 共75页
《ch6参数估计》ppt课件_第3页
第3页 / 共75页
《ch6参数估计》ppt课件_第4页
第4页 / 共75页
《ch6参数估计》ppt课件_第5页
第5页 / 共75页
点击查看更多>>
资源描述

《《ch6参数估计》ppt课件》由会员分享,可在线阅读,更多相关《《ch6参数估计》ppt课件(75页珍藏版)》请在金锄头文库上搜索。

1、第5章 概率基础,教学内容 正态分布 t-分布 F分布,统计推断的过程,4-3,设X是R.V., x 是一实数. 记 F(x)=P(Xx)。该函数就是随机变量X的分布函数。分布函数的导数称为密度函数,记作p(x )。 性质 (1) p(x)0 (2) (3),连续型随机变量的概率分布,4-4,定义: 连续型随机变量X的期望值为 方差为 性质:,4-5,正态分布 如果连续型随机变量X的密度函数为 则称随机变量X服从均值为,方差为2的正态分布,记为XN(,2)。 如果一个正态分布的=0,=1,则称该正态分布为标准正态分布,相应的随机变量称为标准正态随机变量,用Z表示,即ZN(0,1),相应的分布密

2、度函数为,连续型随机变量的概率分布,=0.6,=1,=2,连续型随机变量的概率分布,标准正态分布:如果正态分布的密度函数中,=0,=1,则这样的正态分布称为标准正态分布。 标准正态随机变量在区间-Z,Z取值的概率F(Z)可通过查标准正态分布概率表获得。,连续型随机变量的概率分布,例:设随机变量Z服从标准正态分布,求以下概率的大小: (1)p(-11),4-9,正态分布的标准化变换: 若随机变量X服从正态分布N (,2),则随机变量 Z = 服从标准正态分布,即ZN(0,1)。,4-10,例:某大学英语考试成绩服从正态分布,已知平均成绩为70分,标准差为10分。求该大学英语成绩在6075分的概率

3、。,例:假定学生某门学科的考试成绩服从均值为60分,标准差为12分的正态分布,问某一学生的成绩在60分到75分之间的概率应为多少? 解:,补:其他常用连续型随机变量的概率分布,t-分布:设X服从标准正态分布,Y服从自由度为n的2分布,且它们相互独立,则随机变量T=X/Y/n所服从的分布为自由度为n的t-分布。 当n30时, t-分布与标准正态分布的差别非常小,可用标准正态分布代替。 F-分布:设X和Y是相互独立的2分布,自由度分别是f1和f2,则称随机变量F=(X/Y).(f2/f1)所服从的分布为F-分布,称为它的自由度。,第6章 参数估计,教学内容 6.1 抽样与抽样分布 6.2 参数估计

4、的基本方法 6.3 总体均值的区间估计 6.4 总体成数的区间估计 6.5 样本容量的确定,学习目标,掌握样本平均数和样本成数的抽样分布 理解总体参数点估计的基本方法及其优良标准; 掌握总体均值和成数指标的区间估计方法; 会做题目,6.1 抽样与抽样分布,6.1.1 什么是抽样推断 基本概念 总体与样本(见第一章) 样本量与样本个数 总体参数与样本统计量 重复抽样与不重复抽样 这些概念是统计学特有的,体现了统计学的基本思想与方法。,4-16,(一)总体和样本(参见第1章),1.总体:又称全及总体、母体,指所要研究对象的全体,由许多客观存在的具有某种共同性质的单位构成。总体单位数用 N 表示。

5、2.样本:又称子样,来自总体,是从总体中按随机原则抽选出来的部分,由抽选的单位构成。样本单位数用 n 表示。 3.总体是唯一的、确定的,而样本是不确定的、可变的、随机的。,4-17,(二)样本容量与样本个数,样本容量:一个样本中所包含的单位数,用n表示。 样本个数:又称样本可能数目,指从一个总体中所可能抽取的样本的个数。对于有限总体,样本个数可以计算出来。样本个数的多少与抽样方法有关。(这个概念只是对有限总体有意义,对无限总体没有意义!),18,(三)总体参数和样本统计量,总体参数:反映总体数量特征的指标。其数值是唯一的、确定的。 样本统计量:根据样本分布计算的指标。是随机变量。,平均数 标准

6、差、方差 成数,参数 、2 P,统计量 s、 s2 p,总体,样本,19,(四)重复抽样与不重复抽样,重置抽样与不重置抽样 例如从A、B、C、D、E五个字母中随机抽取两个作为样本。N=5,n=2 重复抽样:样本总个数= 不重复抽样: 不考虑顺序:样本总个数 注:不重复抽样的样本量受总体大小限制,即n不能超过N,最多等于N;但重复抽样的样本量不受总体大小的影响。,20,6.1.3 抽样分布,抽样分布:主要求出样本平均数的期望与方差 包括以下内容 样本平均数的分布 样本成数的分布,抽样分布,设从总体中抽出的样本为X1,X2,,Xn,由于是重复抽样,每个Xi,(i=1,2,n)都是从总体中随机抽出的

7、,都是与总体同分布的随机变量,并且是相互独立的。 我们设总体的平均数为,方差为2,则样本平均数的期望值与方差分别是:,样本平均数的抽样分布,22,(一)样本平均数的分布(P108-109),某班组5个工人的日工资为34、38、42、46、50元。 = 42 2 = 32 现用重置抽样的方法从5人中随机抽2个构成样本。共有52=25个样本。如右图。,23,验证了以下两个结论: 抽样平均数的标准差反映所有的样本平均数与总体平均数的平均误差,称为抽样平均误差,用 表示。,(一)样本平均数的分布,24,(一)样本平均数的分布,由概率论知,如果总体是正态分布的,则样本平均数的抽样分布是如下正态分布 这是

8、一个非常重要的结论,有广泛的应用。,25,(二)样本成数的分布(P111-112),总体成数P是指具有某种特征的单位在总体中的比重。成数是一个特殊平均数,设总体单位总数目是N,总体中有该特征的单位数是N1。设x是0、1变量(总体单位有该特征,则x取1,否则取0),则有: 现从总体中抽出n个单位,如果其中有相应特征的单位数是n1,则样本成数是: p也是一个随机变量,利用样本平均数的分布性质结论,即有:,26,三、不重置抽样条件下样本均值和成数的抽样分布,样本均值的分布性质: 样本成数的分布性质,27,抽样分布总结,(三)抽样分布定理,1.正态分布再生定理 113 总体是正态分布,抽取容量n的样本

9、,样本平均数也服从正态分布。 样本平均数是更加集中的分布在总体平均数的周围。 2.中心极限定理 114 大样本的平均数近似服从正态分布。,6.2 参数估计,6.2.1 估计量与估计值 用样本统计量估计总体参数,用来估计总体参数的统计量叫做估计量,估计量的取值称为估计值。,参数估计的方法,二、点估计,点估计的定义 点估计就是根据总体参数与样本统计量之间的内在联系,直接以样本统计量作为相应总体参数的估计量。在统计中经常使用的点估计量有:,【例6-1】对某企业的产品进行抽样检验,设抽出100件产品,其中不合格产品5件,试估计该企业产品的合格率是多少? 我们可以通过样本的合格率来估计企业产品的合格率。

10、样本合格率p=95/100=95%,我们估计该企业产品的合格率是95%。,二、点估计,所谓区间估计,就是估计总体参数的区间范围,并要求给出区间估计成立的概率值。设 和 是两个统计量( ),分别作为总体参数区间估计的下限与上限,则要求: P( )=1- 式中(01)是区间估计的显著性水平,其取值大小由实际问题确定,经常取1%、5%和10%;1-称为置信度。,(二)区间估计,1、总体未知参数落在区间内的概率 2、表示为 (1 - 为显著性水平,是总体参数未在区间内的概率 3、常用的置信水平值有 99%, 95%, 90% 相应的 为0.01,0.05,0.10,置信水平(置信度),区间与置信水平,

11、均值的抽样分布,(1 - ) % 区间包含了 % 的区间未包含,(二)区间估计,参数估计应满足以下两个要求:一是估计的精确度要求,二是可靠性要求。 所谓精确度就是估计误差的最大范围,即误差的最大值,可通过极限误差来反映; 所谓可靠性是指估计结果正确的概率大小。 置信区间越小,精确性越高,但是可靠性下降; 置信区间越大,可靠性越大,但是精确性降低。 因此,精确性和可靠性是一对矛盾。,无偏性 用表示总体的待估计参数, 是估计的样本统计量,我们说 是的无偏估计,指的是满足:,6.2.3 评价估计量的标准,无偏性 无偏性要求用来估计总体参数的样本统计量,其分布是以总体参数真值为中心的。 在一次具体的抽

12、样估计中,估计量或者大于总体参数,或者小于总体参数; 但是,在进行重复抽样估计的过程中,所有估计量的平均数应该等于待估的总体参数。这说明,无偏估计要求估计量没有系统偏差。,估计量的优良性准则(无偏性),无偏性:估计量的数学期望等于被估计的总体参数,这就是为什么样本方差用n-1的原因!,一致性 一致性是指随着样本容量不断增大,样本统计量接近总体参数的可能性就越来越大,或者,对于任意给定的偏差控制水平,两者间偏差高于此控制水平的可能性越来越小,接近于0。,一致性 用公式表示就是: 公式中,为一任意小的数。上式说明,当n充分大时, 与之间的偏差,可以有很大的把握被控制在任意给定的范围之内。当n趋于无

13、穷大时,估计量 依概率收敛于 。,估计量的优良性准则(一致性),一致性:随着样本容量的增大,估计量越来 越接近被估计的总体参数,有效性 和 都是总体参数的无偏估计量,如果, 则说明估计量 比 更有效。,有效性 设总体的方差是 ,我们有: 显然,样本平均数的方差比样本中某个单位的标志值的方差要小,只是其方差的1/n,所以作为估计量,样本平均数更加有效。,6.3.1区间估计基本原理,6.3总体均值的区间估计,6.3.2 正态分布且总体方差已知;或非正态分布方差未知,且大样本,平均数的区间估计,对总体平均数区间估计时,使用下面的式子 (式中是极限误差) 有两种模式: 1、根据置信度1-,求出极限误差

14、,并指出总体平均数的估计区间。 2、给定极限误差,求置信度(略)。,当已知时,根据相关的抽样分布定理, 服从标准正态分布N(0,1)。查正态分布概率表, 可得 (一般记为 ),则 ,根据重复抽样与不重复抽样的 求法的不同,进一步可得总体平均数的估计区间: 重复抽样时,区间的上下限为: 不重复抽样时,区间的上下限为:,均值区间估计第1种模式(求置信区间),【例6-2】某地区的电视台委托调查公司估计地区内居民平均每日的看电视时间。调查公司随机抽取了100名居民进行调查,样本数据显示平均每人每天看电视时间是4个小时。如果已知总体的标准差=1.5小时。试求: (1)该地区内居民每天看电视的平均时间的置

15、信区间(置信度是95%);,(2)总体分布未知且总体方差未知,大样本条件下,由中心极限定理知,近似服从正态分布,此处用样本方差s代替总体方差。 P120,例6.4,总体方差未知(2未知),小样本 : 当总体服从正态分布但方差未知时,可用样本的标准差s代替总体标准差。这时统计量是: t服从的分布不是标准正态分布,而是自由度为n-1的t-分布(当n很大时,近似正态分布)。因此,总体均值的区间估计是:,总体方差未知(2未知) : 重复抽样 不重复抽样,4-56,总体均值区间估计总结,如果是正态总体,4-57,如果不是正态总体,或分布未知,此时不考虑小样本情况,因此,大样本情况下,直接用标准正态分布求

16、置信区间即可。,成数指标是一个特殊的平均数。所以,类似于总体平均数的区间估计,总体成数的区间估计是: 式中的成数抽样平均误差在重复抽样条件下是: 在不重复抽样的条件下是: 在实践中,由于总体成数常常未知,这时,抽样平均误差公式中的总体成数用样本成数代替。,6.4 总体成数的区间估计,【例6-3】某工厂要估计一批总数5000件的产品的废品率,于是随机抽出400件产品进行检测,发现有32件废品。试给出该批产品的废品率的区间估计(置信度是90%)。,总体平均数的区间估计,第一,样本抽取后,用简单算术平均或加权平均的方法计算样本平均数 。 第二,搜集总体数量标志方差的经验数据或计算样本数量标志方差s2。

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号