统计学原理 抽样调查汇编

上传人:最**** 文档编号:117183069 上传时间:2019-11-18 格式:PPT 页数:88 大小:1.35MB
返回 下载 相关 举报
统计学原理 抽样调查汇编_第1页
第1页 / 共88页
统计学原理 抽样调查汇编_第2页
第2页 / 共88页
统计学原理 抽样调查汇编_第3页
第3页 / 共88页
统计学原理 抽样调查汇编_第4页
第4页 / 共88页
统计学原理 抽样调查汇编_第5页
第5页 / 共88页
点击查看更多>>
资源描述

《统计学原理 抽样调查汇编》由会员分享,可在线阅读,更多相关《统计学原理 抽样调查汇编(88页珍藏版)》请在金锄头文库上搜索。

1、第七章 抽样调查 l 教学内容和要求 l明确抽样调查与推断(估计)的涵义和特点 l掌握抽取样本的方式方法 l掌握抽样误差的涵义及计算方法 l掌握样本容量的确定方法 l熟练地对总体参数进行估计 l了解参数的经济意义 第一节 抽样调查与统计推断基础知识 一、 抽样调查的概念、特点和适用范围 1、 抽样 抽样是根据一定的调查目的,从调查对象中抽取部分单 位构成样本的过程 全部工业企业 部分工业企业 2、抽样种类 概率抽样 (随机抽样) 非概率抽样 (非随机抽样) 简单随机抽样 分层抽样 等距抽样 整群抽样 3、抽样调查的概念 抽样调查是按照随机原则从调查对象中抽取一部分单位作为样 本进行调查,以其所

2、获得的样本资料,对总体的数量特征进行 估计的一种非全面调查方式。 抽样调查 抽样(手段) 推断 (目的) 调查对象 或总体 样本 抽取 推断 调查 4、抽样调查的特点 -与其他非全面调查相比较 按照随机原则抽取调查单位 根据样本信息对总体的数量特征进行估计 存在误差但可以计算并施加控制 5、抽样调查的适用范围 在不可能进行全面调查的情况下,抽样调查是唯一选择 在时效性要求很高的情况下,适用于抽样调查 在不必要开展全面调查的情况下,适用于抽样调查 在对全面调查进行补充和修正时,适用于抽样调查 二、抽样调查与估计的步骤 设计抽样方案 抽样样本单位 对样本单位进行调查 由样本信息对总体特征进行估计

3、三、抽样调查与推断的常用指标 1、总体指标(总体参数) 用以描述与刻画总体数量特征。特点:既定,唯一,未知。 总体平均数 总体方差与标准差 符号规定: N-总体单位数 n-样本单位数 X-总体平均数 P-总体成数 x-样本平均数 p-样样本成数 -总体标准差 S-样本标准差 n-样本单位数,也叫样本容量。 n30时,为大样本,n30时为小样本 总体成数 总体单位属性有时为品质标志,品质标志有时为是非标志-标志 表现只有两种情况,如,性别:男,女;产品质量:合格,不合格 。 变量值X频数f成数(频率) 一种属性1N1P= N1/N 另一种属性0N21-P=N2/N N1 是非标志的平均数、方差和

4、标准差 N1/N=P P(1-P) 1、样本指标(样本统计量) 用以描述与刻画样本数量特征。样本既定时:唯一,可知。 样本平均数 样本方差与标准差 样本成数(平均数 ) 四、数据的分布特征及其度量 峰 度 均值反 映集中 趋势 偏 斜 度 所有数据 对均值的 偏离或离 散度 集中趋势的度量 : 众数 、中位数和四分位数、平均数 离散程度的度量 : 极差 、平均差、方差和标准差、离散系数 峰度的度量:峰度系数 偏度的度量:偏度系数 第二节 抽样方法与抽样调查组织方式 一、 抽取样本的方法 u重复抽样 亦称回置抽样 每抽出一个单位在登记后仍放回去 同一个单位有多次被重复抽中的可能 u不重复抽样 亦

5、称不回置抽样 已经被抽出的单位不再放回 每个单位只有被抽中一次的可能 二、抽样调查组织方式 l简单随机抽样: 对总体不做任何处理,直接随机抽取样本。具体包括抽签法, 随机数表法。适用性:总体单位之间差异较小,且总体单位数目较少的情况 。 l类型抽样:又称分层抽样,将总体单位按某种属性特征分类或分层,再从各类 或各层抽样。适用性:总体单位之间差异较大,且总体单位数目较多的情况 。 l等距抽样:又称机械抽样或系统抽样,将总体各单位按一定标志或顺序排列 ,实施等距或等间隔(k=N/n)抽样。 l整群抽样:又称集团抽样,将总体按某一标志划分成若干群,随机抽取若干 群,对抽中的群内的所有单位逐一调查。

6、第三节、简单随机抽样及抽样估计 一、抽样误差测算 二、抽样区间估计 三、抽样数目确定 1、统计调查误差 登记性误差:所有统计调查活动都可能会产生登记性误差。 全面调查和非全面调查皆如此。表现为样本的统计数据与真值 有偏误。通过加强监管和组织工作,可以减少乃至消除此误差 。 代表性误差:代表性误差只存在于非全面调查,表现为样本结 构与总体结构不一致。抽样调查中的代表性误差不可避免,但可 以计算和控制。 一、抽样误差 2、抽样平均误差 抽样平均误差是样本平均数或样本成数的标准差 3名同学成绩为88,82,96 平均88.66667分,不重复抽样,n=2 可能的样本为:88,82; 88,96; 8

7、2,96 平均数: 85 92 89 88.66667 抽样误差就是用来反映样本平均数与总体平均数的离差的 样本平均数的抽样平均误差 样本成数的抽样平均误差 当样本单位数既定时,从一个总体可抽取多个样本,抽样指标(如平均数、 抽样成数等),就有多个不同的数值,它们对总体指标(如总体平均数、总体成 数等)的离差也就有大有小,这就必需用一个指标来衡量抽样误差的一般水平。 抽样平均误差是抽样平均数(或抽样成数)的标准差,它反映抽样平均数( 或抽样成数)与总体平均数(或总体成数)的平均差异程度。 根据概率论与数理统计学的有关知识,抽样平均误差公式 重复抽样: 不重复抽样 : 上例只有3名同学作为总体,

8、不重复抽样且每次样本容量为2, 所有可能的抽样可以试验。但当总体单位较多时候,各种可能 的抽样是不可以一一试验的。这就需要而且只能根据一个样本 进行计算。 考虑问题:哪些因素影响抽样平均误差? 它们如何影响抽样平均误差? 1、总体标准差 2、样本单位数n 3、抽样方法 4、抽样的组织 方式 解:已知 N=30,n=4,2=4 例题:某工人某天生产电子元件30件,已知其方差为4,现 从中抽取4件产品进行质量检查。试计算本次抽样平均误差 在重复抽样下: 厘米 在不重复抽样下: 厘米 例题:有5个工人的日产量分别为(单位:件):6,8,10, 12,14,用重复抽样的方法,从中随机抽取2个工人的日产

9、量 ,用以代表这5个工人的总体水平。计算抽样平均误差 解:总体平均数 件 抽样平均误差 件? 总体标准差 件 在抽样平均误差公式中有总体方差2、P(1-P)或标准差, P (1-P)的平方根,但是在大部分情况下,总体方差或标准差 是未知的。如何处理? 用以前或同类现象的标准差代替 当有多个标准差可供选择时,选其最大者 当为成数时,选其最接近0.5的那一个P,因为P=0.5时,p最大 当为成数时,没可供选择的成数,直接取p=0.5 用样本标准差代替 在大样本下,直接用S代替 在小样本下,用S代替 ,S= 1、甲乙两地区各抽选400家企业进行调查,结果表明,甲地区平均 每个企业盈利300万元,乙地

10、区平均每个企业盈利80万元,甲乙两 地区标准差系数分别为30%和20%,请计算两地区的抽样平均误差 练习题 2、某企业生产的产品,按正常生产经验,合格率为90%,现从 5000件产品中抽取50件进行检验,求合格率的抽样平均误差 3、要估计某县10万家庭的电视机拥有率,随机抽取100户家庭, 发现有85户拥有电视机,求电视机拥有率的平均抽样误差。 2、解:在重复抽样条件下,合格率的抽样平均误差为: 在不重复抽样条件下,合格率的抽样平均误差为: 3、根据已知条件可得: p= 85/100 =0.85 2=p(1-p)= 0.850.15=0.1275 在重置抽样下: =0.0357 不重置抽样下:

11、 = =0.0357 计算结果表明,用样本的拥有率来估计总体的拥有率,其抽样误 差平均说来为3.6%左右。 3、抽样极限误差 抽样极限误差也叫允许误差,是指样本指标与总体指标之间抽样误 差的可能范围。或者说,在一定的置信度下,抽样估计可以允许的 误差范围。 抽样平均数的极限误差 抽样成数的极限误差 置信度,又称置信水平或把握度,是表明抽样指标和总体指标的 误差不超过一定范围的概率保证度,一般表示为1-, 是显著 性水平 样本指标与总体指标之间的差异绝对值不超过极限误差 样本统计量与总体参数之间的差异绝对值不超过极限误差 这样看来,置信度越大,极限误差就越大,反之,置信度越 小,极限误差就越小。

12、 根据平均数抽样分布理论,在给定置信度1-时,大样样本条件下 的极限误差可以表示为: 抽样平均数的极限误差 抽样成数的极限误差 Z /2是什么? 在给定显著性水平,或者给定置信水平1- 时候,标准正态分布的 临界值为Z /2 ,可查Z分布表取得 广泛应用的是: 1-=90%, Z =1.65 1-=95%, Z =1.96 1-=95.45%, Z =2 1-=99%, Z =2.58 1-=99.73%, Z =3 对刚下线的1000个酒瓶重量进行检查。重复抽取100个酒 瓶,样本平均重量为100克,样本标准差为5克,试以95% 的把握度估计本次抽查的抽样极限误差 解: 依照题意,已知:N=

13、1000 ,n=100,S=5,1-=95% Z /2 =1.96 抽样平均数的极限误差 重复抽样的平均误差 本次抽样极限误差 意思是说,我们有95%的把握保证样本的平均重量与总体的平 均重量的误差不超过0.98克 例题例题 2、某电扇厂对1500台电扇使用寿命进行抽样调查,抽取30台, 平均寿命为45万小时,使用寿命的标准差为240小时,试以95% 的置信水平计算本次抽查的极限误差 1、对某地区电视机拥有率进行抽样调查,抽取100户,调查显示 90户拥有电视机,试以95%的把握程度计算本次调查的极限误差 练习 二、抽样区间估计:利用样本信息对总体数量特征进行推断 区间估计:在一定的置信度下,

14、根据样本统计量推断总体参 数与总体总量的可能范围或置信区间。 1、总体均值的区间估计:由样本平均数估计总体均值的可能范围 由抽样极限误差的定义:在1-下, 总体均值的置信区间: 亦即, 在大样本下,给定置信度1-时, 总体均值的 区间估计 抽样平 均误差 总体均值的区间估计的含义: -由样本平均数估计总体均值的可能范围 在大样本下,给定置信度1-时, 总体均值的置信区间为: 含义:我们有1-(95%)的把握能保证总体均值落在上述区间之内 例题: 对刚下线的1000个酒瓶重量进行检查。重复抽取100个酒 瓶,样本平均重量为100克,样本标准差为5克,试以95%的置 信度估计这批酒瓶重量的置信区间

15、,并说明其含义是什么? 解: 已知:N=1000 ,n=100,S=5,1-=95% ,Z /2 =1.96 重复抽样的平均误差 总体均值的置信区间:(100-1.960.5,100+1.960.5 ) ( 99.02,100.98 ) 2、总体成数的区间估计:由样本成数估计总体成数的可能范围 由成数的抽样极限误差的定义:在1-下, 总体成数的置信区间: 亦即, 在大样本下即, 例、对某地区电视机拥有率进行调查,抽取100户,调查显示90户拥有电视机 ,试以95%的把握程度估计本地区电视机拥有率 解:n=100,n1=90,即 p=90/100=0.9,1-=95%,即 z/2=1.96 (重复)抽样平均误差 (成数)抽样极限误差 在把握度为95%下的置信区间:(90%-5.88%,90+5.88%)即(84.12%,95.88%) 我们以95%把握度保证本地区电视机拥有率介于84.12%95.88%之间 3、总体总量的区间估计:由样本总量估计总体总量的可能范围 总体标志总量的区

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号