统计学课件i第七章抽样调查

上传人:E**** 文档编号:91172698 上传时间:2019-06-26 格式:PPT 页数:44 大小:482.50KB
返回 下载 相关 举报
统计学课件i第七章抽样调查_第1页
第1页 / 共44页
统计学课件i第七章抽样调查_第2页
第2页 / 共44页
统计学课件i第七章抽样调查_第3页
第3页 / 共44页
统计学课件i第七章抽样调查_第4页
第4页 / 共44页
统计学课件i第七章抽样调查_第5页
第5页 / 共44页
点击查看更多>>
资源描述

《统计学课件i第七章抽样调查》由会员分享,可在线阅读,更多相关《统计学课件i第七章抽样调查(44页珍藏版)》请在金锄头文库上搜索。

1、,经济管理类 技术基础课 统计学,第九章 抽样调查,第一节 抽样调查的意义 第二节 抽样平均误差 第三节 全及指标的推断及样本容量的确定,第九章 抽样调查,第一节 抽样调查的意义,一、抽样调查的概念 1、概念:是按照随机原则,从研究总体中抽取 部分单位进行调查,并推断总体数量特征的一种非 全面调查。 2、特点: 抽样调查是非全面调查; 一定要遵守随机原则; 利用样本数据推算总体数量特征; 抽样调查必然产生抽样误差。,第一节 抽样调查的意义,二、抽样调查的作用 1、适用于不能或者很难进行全面调查的场合; 主要是无限总体和破坏性试验。 2、适用于理论上能进行全面调查,但实际上 没有必要的场合; 3

2、、能节约人力、费用和时间,比较灵活; 4、可以验证和修正全面调查的正确性和不足; 5、可用于工业生产过程的质量控制; 6、可用于某种总体的假设检验。,第一节 抽样调查的意义,三、抽样调查的几个基本概念 (一)全及总体和抽样总体 1、全及总体:简称总体,是指所要认识对象的全体, 即具有同一性质的许多单位的集合体。 全及总体单位数用“N”表示。 2、抽样总体:简称样本,是从全及总体中随机抽取出 来,代表全及总体的小总体。 样本单位数即样本容量,用“n”表示。 大样本:n30, 小样本:n30 注意:全及总体是唯一的,但是未知的;样本总体的随机 的,但是已知的。,第一节 抽样调查的意义,(二)全及指

3、标和和抽样指标 1、全及指标:根据全及总体标志值计算的指标。,总体成数:具有某种标志的单位数占总体单位数的比重,用P或 Q表示。 设:总体单位数为N,具有某种标志的单位数为N1,不具有该种标志的单位数为N0,则总体的成数为:,第一节 抽样调查的意义,第一节 抽样调查的意义,2 、抽样指标:根据样本总体标志值计算的指标。,第一节 抽样调查的意义,样本成数:具有某种标志的样本单位数占全部单位数的比重,用p或 q表示。 设:样本单位数为n,具有某种标志的单位数为n1,不具有该种标志的单位数为n0,则样本的成数为:,第一节 抽样调查的意义,四、抽样组织方式 (一)简单随机抽样 1、概念:又称纯随机抽样

4、,是对总体不作任何处理,随机抽取样本单位的方法。 2、种类: (1)直接抽选法 (2)抽签法 (3)随机数字表法 3、特点: 简单,最符合随机原则,但误差较大。,第一节 抽样调查的意义,(二)类型抽样 1、概念:又称分类抽样,是先对总体各单位按一定标志加以分类,然后再从各类中按随机原则抽取样本单位的方法。 2、种类: (1)类型比例抽样:,(2)类型适宜抽样: 3、特点: 把分组法与随机抽样有机结合,提高了样本的代表 性,误差较小。,第一节 抽样调查的意义,(三)机械抽样 1、概念:又称等距抽样或系统抽样,是先对总体按一定顺序加以排列,然后按一定的间隔抽取样本单位的方法。 2、种类: (1)按

5、排队标志与研究目的是否有关分: 按无关标志机械抽样,按有关标志机械抽样 (2)按抽样单位抽选的方法不同分为 随机起点等距抽样、半距起点等距抽样、对称等距抽样 3、特点: 简便易行,但容易出现系统误差。,第一节 抽样调查的意义,(四)整群抽样 1、概念:是先对总体按某一标志分为若干群或组,然后,以群为抽样单位抽取样本的方法。 2、特点: 方便节约费用,但误差较大。 五、抽样方法 (一)重置抽样(重复抽样) 特点: N保持不变,各单位中选的机会均等。 (二)不重置抽样(不重复抽样) 特点: N逐渐减小,各单位中选的机会逐渐提高。,第二节 抽样平均误差,抽样误差的意义 纯随机抽样抽样平均误差的计算

6、分类抽样抽样平均误差的计算 机械抽样抽样平均误差的计算 整群抽样抽样平均误差的计算,一、抽样误差的意义,(一)抽样误差的概念 抽样误差是指样本指标与总体指标之间数量上的差 别,用符号表示为:,抽样误差的来源为:,一、抽样误差的意义,(二)影响抽样平均误差的因素 1、全及总体标志变动度(2或):与抽样平均误 差呈正比关系。 2、抽样单位数(n):与抽样平均误差呈反方向变化。 3、抽样组织方式。 4、抽样方法。 (三)抽样平均误差的概念简例 以平均数抽样平均误差为例,一、抽样误差的意义,2、不重复抽样:样本配合数=43=12,例求平均产量的抽样平均误差。 1、重复抽样:样本配合数=44=16,很明

7、显,重复抽样平均误差大于不重复抽样平均误差。 (四)抽样平均误差的的意义 1、可以衡量抽样调查的准确性; 2、是抽样推断和估计的基本根据。,二、纯随机抽样平均误差的计算,(一)平均数抽样平均误差的计算 1、重复抽样 根据数理统计证明:在纯随机重复抽样条件下,抽样平均 误差与全及总体的标准差成正比,与样本总体单位数的平方根 成反比,利用此关系可得出重复抽样平均数抽样误差的计算公 式为:,1、过去调查所得资料 2、用样本标准差代替总体标准差:用s代替。 3、用小规模调查资料 4、用估计资料,二、纯随机抽样平均误差的计算,2、不重复抽样,其中,(1 n/N)是修正系数。 (二)成数抽样平均误差的计算

8、 假定,某一现象有两种表现,具有一种表现的单位数为N1, 变量值为1,不具有该种表现的单位数为N0,变量值为0,则 平均数、方差分别为:,二、纯随机抽样平均误差的计算,2、不重复抽样平均误差,1、重复抽样平均误差,三、分类抽样平均误差的计算(简单要求),关键问题是影响抽样平均误差的主要因素:组内方差, 计算抽样平均误差时用平均组内方差。 总体:用 表示,样本:用 表示。 (一)平均数抽样平均误差的计算 1、重复抽样:,2、不重复抽样:,三、分类抽样平均误差的计算,其中,平均组内方差为: 总体平均组内方差:,样本平均组内方差:,例】 假定用分类比例抽样方式,从山区、丘陵、平原三种类型的200亩耕

9、地上抽取10块(每块1亩,亩产量见下表)进行抽样调查,用来推断全部耕地的平均亩产量,求平均亩产量的抽样平均误差。,三、分类抽样平均误差的计算,三、分类抽样平均误差的计算,解:(1)计算各组内方差:,(2)计算平均组内方差:,(3)计算抽样平均误差:,三、分类抽样平均误差的计算,(二)成数抽样平均误差计算,2、不重复抽样:,1、重复抽样:,三、分类抽样平均误差的计算,其中,平均组内方差为: 总体平均组内方差:,样本平均组内方差:,仍用上述资料计算成数的抽样平均误差。 假设亩产450斤以上为高产田,不到450斤的为低产田,计算高产田所占比重的抽样平均误差。,三、分类抽样平均误差的计算,解:(1)计

10、算平均组内方差:,(2)计算抽样平均误差:,三、分类抽样平均误差的计算,四、机械抽样平均误差的计算,机械抽样一般都用不重复抽样。 无关标志排队机械抽样类似于简单随机抽样,计算公式为:,有关标志排队机械抽样类似于分类抽样,计算公式为:,五、整群抽样平均误差的计算,其中:R:总体群数;r:样本群数;总体或样本平均 数群间方差的计算公式为:,关键问题是影响抽样平均误差的主要因素:群间方差, 总体:用 表示。 整群抽样一般都用不重复抽样,需要修正系数。 (一)平均数抽样平均误差的计算,五、整群抽样平均误差的计算,(二)成数抽样平均误差的计算,其中:R:总体群数;r:样本群数;总体或样本成数 群间方差的

11、计算公式为:,第三节 抽样推断及必要样本容量的确定,抽样推断 必要样本容量的确定,一、抽样推断(抽样估计),抽样推断的方法有两种:点估计和区间估计 (一)点估计 是不考虑抽样误差,直接用样本指标代替总体指标的估计方法。即: 特点:简单、粗略。,(二)区间估计 是考虑抽样误差,用样本指标估计总体指标所在范围的估计方法。 特点:1、用样本指标和抽样误差推断总体指标所在范围,一、抽样推断(抽样估计),2、区间估计表示的范围是一个可能的范围,总体指 标落在某个区间范围内就只有一定的可靠程度 原因:(1)样本是随机的; (2)抽样误差是所有实际误差的平均数。 3、扩大抽样误差的范围,可以提高推断的把握程

12、度 根据概率论和数理统计正态分布理论(见图1)可得出,扩大和缩小抽样误差对推断把握程度的影响。,概率度:统计学中把扩大或缩小后的抽样误差倍数,用“t”表示。 抽样极限误差(允许误差、置信区间),是扩大或缩小后的抽样误差范围或给定的最大抽样误差范围,用“”表示。,一、抽样推断(抽样估计),一、抽样推断(抽样估计),抽样极限误差、概率度、抽样平均误差三者之间的关系式为: t 因此,平均数抽样极限误差的公式为:,成数数抽样极限误差的公式为:,一、抽样推断(抽样估计),综上所述,区间估计的方法如下: (1)总体平均数的区间估计:,(2)总体成数的区间估计:,例9.6P204 ;P206 例9.7 (河

13、北 张举刚),一、抽样推断(抽样估计),解:(1)估计全部灯泡平均耐用时间的取值范围(概率保证程度0.9973)。 第一步,计算样本平均数,即样本灯泡的平均耐用时间,第二步,计算样本标准差(或方差),即平均耐用时间的标准差,第三步,计算抽样平均误差,即平均耐用时间的抽样平均误差(总体单位数较大,故用重复抽样计算),一、抽样推断(抽样估计),第四步,计算抽样极限误差,(查表得t=3)即平均耐用时间的抽样极限误差,第五步,进行区间估计,即全部灯泡平均耐用时间的区间范围,所以,按99.73得概率保证程度该厂全部灯泡的平均耐用时间的取值范围为918.99933.81小时。,(2)在0.6827概率保证

14、程度下,估计全部产品中不合格率的取值范围。 第一步,计算成数的抽样误差,即样本灯泡的不合格率的抽样误差,第四步,计算抽样极限误差,(查表得t=1)即不合格率的抽样极限误差,一、抽样推断(抽样估计),第三步,进行区间估计,即灯泡不合格率的区间范围,一、抽样推断(抽样估计),所以,按68.27的概率保证程度该厂全部灯泡不合格率的取值范围为0.120.68。,二、必要样本容量的确定,(一)样本容量确定的原则 在保证抽样推断能达到预期的可靠程度和精确程度的要求下,确定一个恰当的抽取样本单位的数目。 (二)影响样本容量的因素 1、抽样的可靠程度和精确程度(t):成正方向关系 2、总体的标志变动度( ):成正方向关系 3、抽样极限误差():成反方向关系 4、抽样组织方式和抽样方法 (三)必要样本容量的计算方法,二、必要样本容量的确定,用抽样极限误差公式推导可得。 1、平均数必要样本容量的确定,2、成数必要样本容量的确定,二、必要样本容量的确定,注意:(1)当计算结果是小数时,一律向上取整; (2)同一资料确定平均数、成数样本容量时,计算结果一般不同,取样本容量大的数为最终结果。,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号