统计抽样调查讲解

上传人:我** 文档编号:115795901 上传时间:2019-11-14 格式:PPT 页数:78 大小:632.50KB
返回 下载 相关 举报
统计抽样调查讲解_第1页
第1页 / 共78页
统计抽样调查讲解_第2页
第2页 / 共78页
统计抽样调查讲解_第3页
第3页 / 共78页
统计抽样调查讲解_第4页
第4页 / 共78页
统计抽样调查讲解_第5页
第5页 / 共78页
点击查看更多>>
资源描述

《统计抽样调查讲解》由会员分享,可在线阅读,更多相关《统计抽样调查讲解(78页珍藏版)》请在金锄头文库上搜索。

1、第七章 抽样调查 1 第一节 抽样调查的基本概念 及理论依据 一、估计量和估计值 二、全及总体和抽样总体 三、全及指标和样本指标 四、抽样方式和样本可能数目 五、抽样理论依据 2 一、估计量和估计值 v1. 估计量:是指用于估计相关的总体参数的 统计量。样本均值、样本比例(样本成数) 和样本方差都是估计量,估计量是随机的。 v2. 估计值:是指估计量的具体数值。根据具 体样本数据,按照估计量的计算公式,计算 出的样本均值、样本比例和样本方差的具体 数值就是估计值。是抽样推断的基础。 3 二、全及总体和抽样总体 v1. 全及总体(总体):是指所要认识对象的 全体,是同一性质的许多个体的集合体。有

2、 变量总体与属性总体之分,全及总体是惟一 的、确定的但却是未知的,常用“N”表示。 v2. 抽样总体(样本):是从全及总体中随机 抽取出来一部分单位的集合体。有大样本和 小样本之分,以30个样本单位为划分依据。 v样本总体是随机的、已知的,常用“n”表示。 4 三、全及指标和样本指标 v(一) 全及指标 v根据全体总体各个单位的标志值或标志 特征计算的、反映总体某种属性的综合 指标。全及指标也是惟一确定的,但也 是未知的。 v1. 总体平均数:根据变量总体的标志值 计算的。 5 2. 总体成数(总体比例):常用“P”表示 v是指总体中具有某种标志的单位数在总体中 所占的比重。变量总体也可以计算

3、成数。 具有某种属性的单位数具有某种属性的单位数 总体单位总数总体单位总数 总体总体 成数成数 不具有某种属性的单位数不具有某种属性的单位数 不具有某种属不具有某种属 性的单位数所性的单位数所 占的比重占的比重 6 3. 总体标准差和总体方差2 v都是测量总体标志值分散程度的指标。 v(二)抽样指标 v是指根据抽样总体各个标志值或标志特征计 算的综合指标。与全及指标相对应也有抽样 平均数、抽样成数、样本标准差和样本方差 等估计量。抽样指标是随机的。 7 1. 样本平均数: 2. 样本成数数: 3. 样本标准差 和样本方差: 8 四、抽样方式和样本可能数目 v(一)抽样方式 v1. 重复抽样(放

4、回抽样):从总体N中随机 抽取n个单位,每次抽取均为独立试验。 v2. 不重复抽样(不放回抽样):每次抽中的 单位不再放回总体中,为不独立试验。 v3. 考虑顺序抽样:即考虑总体单位的性质, 还考虑各单位排序的抽样。 v4. 不考虑顺序抽样:只考虑总体单位的性质 差异,而不考虑其排序的抽样。9 (二)样本可能数目 v是指从既定的总体中可以抽取多少个样本, 即样本总体的数量有多少。 v1. 考虑顺序的不重复抽样可能数目 v即不重复排列的可能样本数目。计算公式: ! ! 设:N=10,n=5,则: ANn =109876=30240个可能样本数目 10 2. 考虑顺序的重复抽样可能数目 v即可重复

5、排列的可能样本数目。公式: vBNn=Nn =105 =100000个可能样本数目 v3. 不考虑顺序的不重复抽样可能数目 v即不重复组合。计算公式: ! 11 4. 不考虑顺序的重复抽样可能数目 v即可重复组合。计算公式: DNn=CnN+n-1 v对于同一总体,采用四种不同的抽样组织形 式,其样本可能数目也是不同的。按样本可 能数目的多少排序依次是:考虑顺序的重复 抽样考虑顺序的不重复抽样不考虑顺序 的重复抽样不考虑顺序的不重复抽样 12 五、抽样理论依据 v抽样调查的理论依据是概率论的大数定律。 v(一)大数定律 v1. 独立同分布大数定律:证明当n足够大时 ,平均数具有稳定性,为用样本

6、平均数估计 总体平均数提供了理论依据。 v2. 贝努力大数定律:证明当n足够大时,频 率具有稳定性,为用频率代替概率提供了理 论依据。大数的重要意义P253 13 (二)中心极限定律 v1. 独立同分布中心极限定理:证明不论变量 总体服从何种分布,只要它的数学期望和方 差存在,从中抽取容量为n 的样本,则这个 样本的总和或平均数是个随机变量,当n 充 分大时,样本的总和或平均数趋于正态分布. v2. 德莫佛-拉普拉斯中心极限定理:证明属性 总体的样本成数和样本方差,在n足够大时, 同样趋于正态分布。 14 第二节 抽样平均误差 一、抽样平均误差的概念 二、影响抽样平均误差的因素 三、抽样平均误

7、差的意义 四、抽样平均误差的计算 15 一、抽样平均误差的概念 v(一)抽样误差 v是指样本指标和总体指标之间在数量上的差 别,是随机性的代表性误差。是抽样推断的 依据,不包括登记误差和可能产生的偏差。 v(二)抽样平均误差 v是指所有可能出现的样本指标的标准差,即 所有可能出现的样本指标和总体指标的平均 离差。抽样实际误差无法知道,而平均误差 是可能计算的。 16 二、影响抽样平均误差的因素 v(一)总体标志的变动程度(x ) v总体标志的变动程度与抽样平均误差成同 向变动关系。 v(二)抽样单位数(n)的多少 v在其他条件不变的情况下,抽样单位数与抽 样平均误差成反向变动关系。 v(三)抽

8、样组织方式 v重复抽样方式的高于不重复抽样,分类抽 样的低于机械抽样或整群抽样。 17 三、抽样平均误差的意义 v抽样平均误差是一种标准差的概念,是所有 可能样本指标与总体指标之间离差平方的平 均数的平方根。它概括了一系列抽样可能结 果所产生的所有抽样误差。它有三点意义: v1. 是衡量抽样指标对于总体指标代表性程 度的一个尺度; v2. 是计算极限误差的依据; v3. 是确定抽样单位数多少的计算依据之一 18 四、抽样平均误差的计算 v(一)抽样平均数的抽样平均误差x v是变量总体一系列抽样平均数对总体平均数 的标准差。其理论计算公式: 平均数平均数 抽样平抽样平 均误差均误差 样本平均样本

9、平均 数(随机数(随机 变量)变量) 总体平均数(惟总体平均数(惟 一确定的,但通一确定的,但通 常是未知的)常是未知的) 样本可能数目样本可能数目 19 1. 重复抽样抽样平均数的抽样平均误差x v根据数理统计理论,在重复抽样方式下,抽 样平均误差与全及总体的标准差成正比关系 ,而与抽样总体单位数的平方根成反比关系 ,可推导出如下公式: 平均数平均数 抽样平抽样平 均误差均误差 全及总体全及总体 的标准差的标准差 抽样单位数抽样单位数 抽样平均误差仅为全及总体标准差的抽样平均误差仅为全及总体标准差的 注意理解注意理解P259P259例题例题 重要重要 20 2. 不重复抽样抽样平均数的抽样平

10、均误差x v不重复抽样与重复抽样相比,样本可能数目 减少,且样本变量之间不是互相独立的。因 此,在重复抽样的基础上考虑一个修正系数 即可。证明过程见P261-262 总体总体单位总数单位总数样本样本单位总数单位总数抽样比例抽样比例 总体总体标准差标准差 重要重要重要重要 21 (一)抽样成数的抽样平均误差p v属性总体的标志值是用文字表示的,且标志 只有两个取值,非此即彼,故将属性总体的 标志称为“交替标志”或“是非标志”。 v交替标志也可以计算平均数(即成数)和标 准差。为了计算交替标志的平均数和标准差 必须将交替变异的标志过渡到数量标志。 v交替标志仍以x表示,设:x =1表示单位具有 某

11、一标志, x = 0表示单位不具有某一标志。 具有某一标志的单位数用N1表示; 22 不具有某一标志的单位数用N0表示。 v总体成数和标准差与样本成数和标准差的计 算方法相同。只是总体指标用大写字母表示 ,样本指标用小写字母表示。例如: v具有某一标志的单位数占总体的比重: 总体成数总体成数样本成数样本成数 不具有某一标志的单位数占总体的比重不具有某一标志的单位数占总体的比重: 23 交替标志的平均数和标准差计算表P265 样本样本 成数成数 属性总体抽样平均误差的计算也有重复抽 样和不重复抽样之分: 24 1. 重复抽样抽样成数的抽样平均误差 2. 不重复抽样抽样成数的抽样平均误差 样本成数

12、样本成数 样本单位数样本单位数 总体单位总数总体单位总数抽样比例抽样比例 解决未知的总体指标的解决未知的总体指标的4 4点办法:点办法:P263P263 25 v1. 用过去调查所得到的资料。如果有几个 不同的总体方差,应该用数值较大的。 v谨慎性要求。2越大,说明总体的离散程 度越高,要抽取更多的样本单位(n)才 具有代表性。 v2. 用样本方差代替总体方差2() v3. 用小规模调查资料计算的方差代替2 v4. 用估计材料计算的方差代替2 26 (三)抽样平均误差计算实例P266 使用时间 (小时) 抽取灯泡个 数(个) 组中值(x ) xf 900以下28751750 900950492

13、53700 95010001197510725 1000105071102572775 1050110084107590300 1100115018112520250 11501200711758225 1200以上312253675 合 计200211400 27 样本平均数 样本成数 28 使用时间 (小时) 抽取灯泡 个数(个) 组中值 (x) 900以下2875-8(-4)32 9009504925-12(-3)36 950100011975-22(-2)44 10001050711025-71(-1)71 105011008410750(0)0 1100115018112518(1)

14、18 115012007117514(2)28 1200以上312259(3)27 合 计200-72256 29 30 第三节 全及指标的推断 一、全及指标的点估计 二、全及指标的区间估计 31 一、全及指标的点估计 v(一)点估计的概念 v点估计又称定值估计,它是直接以样本 指标作为相应总体指标的估计量。 v例如,以样本平均数直接估计总体平均 数,即:x=X。例如,某地区根据样本 资料计算的粮食亩产量为600公斤,就 以600公斤作为全地区粮食亩产水平的 估计值。 32 (二)点估计的优缺点 v1. 优点:点估计能够提供总体指标的具 体数值,可以作为行动决策的数量依据 。例如,企业的市场部

15、门对产品销量的 预测直接决定着生产部门和采购部门的 作业计划。 v2. 缺点:任何点估计的结果不是对就是 错,并不能提供误差情况和误差程度等 相关的信息。 33 (三)点估计量的评价标准 v估计一个总体指标可以用多种样本统计 量,例如估计总体平均数,可以用样本 平均数,也可以用样本中位数、样本众 数等。具体应以哪一个统计量来估计总 体平均数才是最优的,就涉及估计量的 评价标准问题。 v一个优良的估计量应该符合以下三个标 准: 34 v1. 无偏性。即样本统计量的期望值(平 均数)等于被估计的总体平均数。 v2. 一致性。即当样本单位数n充分大时 ,样本统计量也充分靠近总体参数(指 标)。 v3

16、. 有效性。即作为优良估计量的方差应 该比其他估计量的方差小。 v同时具备上述条件的估计量就是优良的 35 二、全及指标的区间估计 v(一)区间估计的概念 v区间估计是在点估计的基础上,给出在 一定的置信程度下,确定总体指标取值 区间的方法和过程。 v(二)置信区间(抽样极限误差) v是根据概率理论,以一定的可靠程度保 证抽样误差不超过某一事先给定的范围 。这一范围是抽样指标与全及指标之间 离差的可能范围。 36 v设:x 与p分别表示抽样平均数与抽样成 数的置信区间(抽样极限误差),则: x = x-X 将上式中的绝对值符合去掉并进行变换: 抽样调查的目的是用样本指标来估计总体 指标,而不是用总体指标来估计样本指标 p= p - P 37 全及指标X、P的区间估计公式: v(三)置信程度(可信赖程度或把握程度) v置信程度是用概率来表示的。极限误差与抽 样平均误差是什么关系?是单位误差,极 限误差是的若干倍。这里的倍数通常用 t 来表示。t称概率度,它是以为

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号