{品质管理抽样检验}05第五章抽样推断

上传人:冯** 文档编号:139830341 上传时间:2020-07-24 格式:PPTX 页数:127 大小:6.09MB
返回 下载 相关 举报
{品质管理抽样检验}05第五章抽样推断_第1页
第1页 / 共127页
{品质管理抽样检验}05第五章抽样推断_第2页
第2页 / 共127页
{品质管理抽样检验}05第五章抽样推断_第3页
第3页 / 共127页
{品质管理抽样检验}05第五章抽样推断_第4页
第4页 / 共127页
{品质管理抽样检验}05第五章抽样推断_第5页
第5页 / 共127页
点击查看更多>>
资源描述

《{品质管理抽样检验}05第五章抽样推断》由会员分享,可在线阅读,更多相关《{品质管理抽样检验}05第五章抽样推断(127页珍藏版)》请在金锄头文库上搜索。

1、第五章,抽 样 推 断,第一节 抽样推断及其特点 第二节 总体参数估计 第三节 假设检验概述,2020/7/24,1,第五章 抽样推断,不象其他科学,统计从来不打算使自己完美无缺,统计意味着你永远不需要确定无疑 Gudmund R.Iversen,统计名言,2020/7/24,2,第五章 抽样推断,参数估计在统计方法中的地位,2020/7/24,3,第五章 抽样推断,大学生每周上网花多少时间?,为了解学生每周上网花费的时间,中国人民大学公共管理学院的4名本科生对全校部分本科生做了问卷调查。调查的对象为中国人民大学在校本科生,调查内容包括上网时间、途径、支出、目的、关心的校园网内容,以及学生对收

2、费的态度,包括收费方式、价格等问卷调查由调查员直接到宿舍发放并当场回收。对四个年级中每年级各发60份问卷,其中男、女生各30份。共收回有效问卷共200份。其中有关上网时间方面的数据经整理如下表所示,2020/7/24,4,第五章 抽样推断,大学生每周上网花多少时间?,平均上网时间为8.58小时,标准差为0.69小时。全校学生每周的平均上网时间是多少?每周上网时间在12小时以上的学生比例是多少?你做出估计的理论依据是什么?,2020/7/24,5,第五章 抽样推断,第一节,抽样推断及其特点,1.1 抽样推断的特点 1.2 总体参数和样本统计量 1.3 抽样推断的基本条件 1.4 抽样推断的误差,

3、2020/7/24,6,第五章 抽样推断,1.1 抽样推断及其特点,抽样推断(统计推断) 按随机原则从总体中抽取部分单位构成样本,在一定的可靠程度下,根据样本的数量特征对总体的数量特征加以推断的方法。 抽样推断的方法: 总体参数的估计 总体参数的假设检验。,2020/7/24,7,第五章 抽样推断,1.1 抽样推断及其特点,抽样推断的特点 1. 抽样推断必须遵循随机原则。 2. 对抽样误差可以事先加以计算和控制。 3. 具有经济性、时效性,应用广泛的特点。 4. 可对全面调查的结果进行检验和修正。,2020/7/24,8,第五章 抽样推断,1.2 总体参数和样本统计量,2020/7/24,9,

4、第五章 抽样推断,1.2 总体参数和样本统计量,2020/7/24,10,第五章 抽样推断,1.3 抽样推断的基本条件,抽样推断的基本条件 1. 选择统计量优良估计量。 2. 合适的允许误差精确性。 3. 可接受的置信度可靠性。 精确性和可靠性是一对矛盾。要根据问题的性质和研究的需要在二者间权衡。,2020/7/24,11,第五章 抽样推断,1.4 抽样推断的误差,统 计 误 差,可控制,统计误差的分类,2020/7/24,12,第五章 抽样推断,1.4 抽样推断的误差,抽样误差 1. 抽样实际误差: 对某一样本而言,由随机因素引起的样本统计量与总体参数在数量上的差异就是抽样实际误差。,202

5、0/7/24,13,第五章 抽样推断,1.4 抽样推断的误差,2. 抽样平均(标准)误差: 抽样平均误差是抽样平均数的标准差,它反映样本平均数(样本成数)与总体平均数(总体成数)之间的平均差异程度。,2020/7/24,14,第五章 抽样推断,1.4 抽样推断的误差,总体标准差和成数的确定: 总体变化不大,采用过去总体指标数值做代替; 用样本标准差(x) 或样本成数 p 替代; 对于成数,可取 P = 0.5;如果有多个 P 值,取其最接近 0.5 的P 做替代。,2020/7/24,15,第五章 抽样推断,1.4 抽样推断的误差,3. 抽样极限(允许)误差 是样本统计量与被估计的总体参数之绝

6、对离差的最大允许值,常用表示,可简称为极限误差或允许误差。,2020/7/24,16,第五章 抽样推断,1.4 抽样推断的误差,和的关系:,Z 概率度,Z 表示以抽样平均误差为标准单位对极限误差的度量值。由Z 确定的概率保证程度F(Z)置信度。,2020/7/24,17,第五章 抽样推断,极限误差标准化的意义:,ZN ( 0, 1 ),1.4 抽样推断的误差,2020/7/24,18,第五章 抽样推断,第二节,总体参数的估计,2.1 总体参数估计概述 2.2 点估计 2.3 区间估计 2.4 样本容量的确定,2020/7/24,19,第五章 抽样推断,2.1 总体参数估计概述,总体参数估计就是

7、以样本统计量来估计总体参数。 参数估计要求: 1. 精确性适当的极限误差范围; 2. 可靠性估计结果正确的概率。 参数估计点估计和区间估计。,2020/7/24,20,第五章 抽样推断,2.2 点估计(point estimate),点估计就是根据总体参数与样本统计量之间的内在联系,直接以样本统计量作为相应总体参数的估计值,点估计又称为定值估计。 常用的点估计量有:,2020/7/24,21,第五章 抽样推断,参数估计(parameter estimation)就是用样本统计量去估计总体的参数 估计量:用于估计总体参数的统计量的名称 如样本均值,样本比例,样本方差等 例如: 样本均值就是总体均

8、值 的一个估计量 参数用 表示,估计量用 表示 估计值:估计参数时计算出来的统计量的具体值 如果样本均值 x =80,则80就是 的估计值,估计量与估计值 (estimator & estimated value),2020/7/24,22,第五章 抽样推断,优良估计量的三个标准:,E (统计量) 总体参数,1.无偏性: (unbiasedness),2.2 点估计,2020/7/24,23,第五章 抽样推断,2.一致性:(consistency),优良估计量的三个标准:,2.2 点估计,2020/7/24,24,第五章 抽样推断,x,X,X,优良估计量的三个标准:,2.2 点估计,2020/

9、7/24,25,第五章 抽样推断,3. 有效性: (efficiency),优良估计量的三个标准:,2.2 点估计,2020/7/24,26,第五章 抽样推断,2.2 点估计,2020/7/24,27,第五章 抽样推断,2.2 点估计,2020/7/24,28,第五章 抽样推断,总体参数的点估计: 原则:总体参数估计值就取统计量的值,作用:区间估计的基础。,2.2 点估计,2020/7/24,29,第五章 抽样推断,2.3 区间估计(interval estimate),一 区间估计的含义:,概率 P1?,区间大小 估计的精确性; 概率高低 估计的准确性。,总体参数,2020/7/24,30,

10、第五章 抽样推断,区间估计 (interval estimate),在点估计的基础上,给出总体参数估计的一个估计区间,该区间由样本统计量加减估计误差而得到 根据样本统计量的抽样分布能够对样本统计量与总体参数的接近程度给出一个概率度量 比如,某班级平均分数在7585之间,置信水平是95%,样本统计量 (点估计),2020/7/24,31,第五章 抽样推断,区间估计的图示,x,2020/7/24,32,第五章 抽样推断,将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例,也称置信度 表示为 (1 - 为是总体参数未在区间内的比例 常用的置信水平值有 99%, 95%, 90%

11、 相应的 为0.01,0.05,0.10,置信水平(confidence level),2020/7/24,33,第五章 抽样推断,由样本估计量构造出的总体参数在一定置信水平下的估计区间 统计学家在某种程度上确信这个区间会包含真正的总体参数,所以给它取名为置信区间 如果用某种方法构造的所有区间中有95%的区间包含总体参数的真值,5%的区间不包含总体参数的真值,那么,用该方法构造的区间称为置信水平为95%的置信区间。同样,其他置信水平的区间也可以用类似的方式进行表述,置信区间的表述 (confidence interval),2020/7/24,34,第五章 抽样推断,总体参数的真值是固定的,而

12、用样本构造的区间则是不固定的,因此置信区间是一个随机区间,它会因样本的不同而变化,而且不是所有的区间都包含总体参数 实际估计时往往只抽取一个样本,此时所构造的是与该样本相联系的一定置信水平(比如95%)下的置信区间。我们只能希望这个区间是大量包含总体参数真值的区间中的一个,但它也可能是少数几个不包含参数真值的区间中的一个,置信区间的表述 (confidence interval),2020/7/24,35,第五章 抽样推断,当抽取了一个具体的样本,用该样本所构造的区间是一个特定的常数区间,我们无法知道这个样本所产生的区间是否包含总体参数的真值,因为它可能是包含总体均值的区间中的一个,也可能是未

13、包含总体均值的那一个 一个特定的区间总是“包含”或“绝对不包含”参数的真值,不存在“以多大的概率包含总体参数”的问题 置信水平只是告诉我们在多次估计得到的区间中大概有多少个区间包含了参数的真值,而不是针对所抽取的这个样本所构建的区间而言的,置信区间的表述 (confidence interval),2020/7/24,36,第五章 抽样推断,置信区间的表述 (95%的置信区间),从均值为185的总体中抽出n=10的20个样本构造出的20个置信区间, 我没有抓住参数!,点估计值,2020/7/24,37,第五章 抽样推断,使用一个较大的置信水平会得到一个比较宽的置信区间,而使用一个较大的样本则会

14、得到一个较准确(较窄)的区间。直观地说,较宽的区间会有更大的可能性包含参数 但实际应用中,过宽的区间往往没有实际意义 比如,天气预报说“在一年内会下一场雨”,虽然这很有把握,但有什么意义呢?另一方面,要求过于准确(过窄)的区间同样不一定有意义,因为过窄的区间虽然看上去很准确,但把握性就会降低,除非无限制增加样本量,而现实中样本量总是有限的 区间估计总是要给结论留点儿余地,置信区间的表述 (confidence interval),2020/7/24,38,第五章 抽样推断,置信区间与置信水平的关系,2020/7/24,39,第五章 抽样推断,1. 区间的确定:,区间的中心 统计量的值,如:,区

15、间的半径 允许(极限)误差。,2.3 区间估计,2020/7/24,40,第五章 抽样推断,2. 概率的确定:,X,2.3 区间估计,2020/7/24,41,第五章 抽样推断,只要样本平均数 在以总体平均数 为中心、以 为半径的区间内,则总体平均数 就会落在以样本平均数 为中心、以 为半径的区间内。,2. 概率的确定:,2.3 区间估计,2020/7/24,42,第五章 抽样推断,S,X,2.3 区间估计,2020/7/24,43,第五章 抽样推断,极限误差的标准化:,S,2.3 区间估计,2020/7/24,44,第五章 抽样推断,标准化的意义:,ZN ( 0, 1 ),2.3 区间估计,

16、2020/7/24,45,第五章 抽样推断,二 总体平均数的区间估计:,2.3 区间估计,2020/7/24,46,第五章 抽样推断,2.3 区间估计,2020/7/24,47,第五章 抽样推断,【例 5-2】某地区电视台委托调查公司估计该地区居民平均每日看电视时间。调查公司随机抽取了100名居民进行调查,样本数据显示平均每人每天看电视时间为 4 小时。如果已知总体的标准差 = 1.5 小时。试求该地区内居民每天看电视的平均时间的置信区间。 (置信度是 95%),2.3 区间估计,2020/7/24,48,第五章 抽样推断,2.3 区间估计,2020/7/24,49,第五章 抽样推断,2.3 区间估计,2020/7/24,50,第五章 抽样推断,【例 5-3】某地区电视台委托调查公司估计该地区居民平均每日看电视时间。调查公司随机抽取了100名居民进行调查,样本数据显示平均每人每天看电视时间为 4 小时。如果已知总体的标准差 = 1.5 小时。试求该地区内居民每天看电视的平均时间的置信区间。 (要求估

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 商业/管理/HR > 企业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号