【5A版】抽样技术

上传人:Jerm****014 文档编号:70748772 上传时间:2019-01-18 格式:PPT 页数:90 大小:1.17MB
返回 下载 相关 举报
【5A版】抽样技术_第1页
第1页 / 共90页
【5A版】抽样技术_第2页
第2页 / 共90页
【5A版】抽样技术_第3页
第3页 / 共90页
【5A版】抽样技术_第4页
第4页 / 共90页
【5A版】抽样技术_第5页
第5页 / 共90页
点击查看更多>>
资源描述

《【5A版】抽样技术》由会员分享,可在线阅读,更多相关《【5A版】抽样技术(90页珍藏版)》请在金锄头文库上搜索。

1、抽样技术,授课老师:苏宇楠 周二(14:00-15:50)南睿楼 主南 3-1 周四(16:10-18:00)南睿楼 主南 3-1 单周,课前交流,是否修过抽样课程? 1.有 2.没有 是否修过调查课程? 1.有 2.没有 实践经验 1.有 2.没有 课程内容,第一章 绪论,概念介绍: 目标总体与抽样总体 抽样框与抽样单元 总体特征与估计量 方差、偏差、均方误差 抽样误差与非抽样误差 精度与费用,第一章 绪论,一、数据的来源 1. 统计数据的重要性 量化研究的需要 抽样调查是数据来源的重要途径 样本的有效性问题,全球性调查报告:中国人均性伴侣数全球排第一 “近日,2004年杜蕾斯全球性调查报告

2、向社会发布。引人注目的是报告 中显示中国人的平均性伴侣数最多,为193人,远远高于全球的平均 数105人;而中国人平均每年性生活的频率却只有90次,排全球倒数 第7位,低于全球平均水平103次。同时,报告还显示中国首次接受性 教育的年龄为137岁,最接近世界平均水平,然而却只有22的调查 对象认为青少年性教育由家人或监护人完成。” 资料来源:北京晨报,2004年11月25日 矛盾: 为什么性伴侣最多,性频率却不高?首次接受性教育的年龄走低,却 不是由家长来完成性教育任务? 问题在于,样本是怎样产生的?,到底多少人赞成取消“黄金周”? 2007年11月9-15日,新华网、人民网、国家发改委网站、

3、新浪、搜 狐等网站就“节假日调整方案”联合进行网上调查,约155万人通 过网络参与了调查,调查结果是: 68%的网民支持将“五一”节调整出的两天和新增加的一天用于增 加清明、端午、中秋三个传统节日为国家法定节假日; 81%的网民支持保留“十一”和春节两个黄金周,并将春节放假时 间提前一天(即春节假从除夕开始); 77%的网民支持调整前后周末形成元旦、清明、国际劳动节、端 午、中秋五个连续三天的“小长假”; 90%网民支持国家全面推行职工带薪休假制度。 资料来源:2007年11月16日“北京青年报”,网友质疑: 网民调查的比例是否就是全体公民意愿的比例? 调查问卷中是否有缺欠?(整个调查问卷以“

4、五一”黄金周 取消为前提,例如问卷中“对于保留十一和春节两个黄金 周,您的态度是什么”这个问题,回避了五一黄金周存废 问题,有偷换概念的嫌疑) 该项调查也引起一片质疑。,上述调查结果都是被社会广泛质疑的。从技术层面 讲,被质疑的一个重要原因是没有说明样本的产生过 程,样本的代表性。 成功的案例也有。如美国总统竞选的预测。,第一章 绪论,美国总统竞选预测: 民主党候选人 共和党候选人 实际 汉佛莱(50%) 尼克松(50%) 尼(50.3%) 尼克松(62%) 尼(61.8%) 卡特(51%) 卡(51.1%) 里根(52%) 里(55.3%) 1984 里根(59%) 里(59.2%) 198

5、8 布什(56%) 布(53.9%) 对人的评价比对物的评价要更困难,2. 数据的间接来源 3. 数据的直接来源 试验数据 调查数据 本课程是对调查而言。,第一章 绪论,二、抽样调查的作用 1. 抽样调查的概念 2. 抽样调查的作用 有些现象不可能进行全面调查 实际操作有困难 检查、核查作用,第一章 绪论,3. 抽样调查优点 费用低 速度快 有助于提高数据质量,第一章 绪论,三、抽样调查的历史 1. 国际上抽样调查的进展 1802年法国数学家拉普拉斯进行人口抽样估计,这是文字记载最早的抽样案例。 目前抽样方法用于各个领域: 人口调查,经济领域调查,社会问题研究,电视收视率调查,民意调查,等。,

6、第一章 绪论,2. 我国情况 不同的发展阶段 目前,政府调查,社会调查,市场调查, 收视率调查等,都有长足进展。 与国外差距:热情有余,科学性不够,对 抽样理论缺乏了解。,第一章 绪论,四. 调查步骤 一个完整的调查包括几个阶段性的工作。 1. 调查目标确定 属于调查策划。明确通过调查所要获取的信息,确定 调查内容,决定向谁进行调查(确定调查对象) 2. 调查问卷设计 3. 抽样方法确定 4. 调查方式(数据收集)确定 5. 数据编码与录入,第一章 绪论,6. 数据审核与插补 7. 数据估计(包括权数确定,计算置信区间) 8. 调查结果表述(调查报告),第二章 基本概念,一、总体与样本 1.

7、总体 2. 样本 二、目标总体与抽样总体 1. 目标总体 2. 抽样总体 3. 抽样框 良好抽样框的标志,第二章 基本概念,三、概率抽样与非概率抽样 1. 概率抽样 特点与作用 2. 非概率抽样 (1)方便选样 (2)目的选样 (3)自愿样本 (4)配额选样 特点,案 例 : 调查北京市老年人的住房条件,抽 样 方 案 设 计,调查目标的确定; 把与主题相关的问题转换为调查问题 目标总体的确定, 已知变量,研究变量,待估参数 抽样框选择和建立 可得资源明细 进度表,允许估计误差 数据收集方法 抽样设计,样本选择机制,样本量 数据整理方法 估计量公式,方差估计量 人员培训,现场工作的组织 资源的

8、分配 质量控制和评估,抽样方案设计,第一、确定抽样调查的目的、任务和要求; 第二、确定调查对象的范围和抽样单位; 第三、确定抽取样本方法; 第四、确定必要的样本数; 第五、对主要抽样指针的精度提出要求; 第六、确定总体目标量的估算方法; 第七、制订实施总体方案的办法和步骤。,例子,N=4, n=2 Lable farm acreage corn acreage 1 4 1 2 6 3 3 6 5 4 20 15 Total 36 24,第二章 基本概念,四、 等概抽样与不等概抽样 1. 等概抽样 2. 不等概抽样,第二章 基本概念,五、抽样误差与非抽样误差 1. 抽样误差 可以计算 可以控制

9、2. 非抽样误差 (1)抽样框误差 (2)无回答误差 (3)计量误差,第二章 基本概念,六、方差、偏差与均方误差 方差反映随机因素 为 的估计值 偏差反映系统因素 为总体真值,第二章 基本概念,均方误差,第二章 基本概念,七、估计量的优良性准则 1. 一致性 当 越大时, 接近于 的概率越大,第二章 基本概念,2. 无偏性 3.有效性 令 , 为 的两个无偏估计量 若 则 是较 有效的估计量,第二章 基本概念,八、精度与费用,精度,100%,95%,60%,20%,40%,.,.,费用,第三章 简单随机抽样,第一节 基本问题 一、什么是简单随机抽样 1. 放回抽样 2. 不放回抽样 二、实施方

10、法 抽签 随机数表 计算机抽取,第三章 简单随机抽样,三、符号说明 总体 样本 单位数 总和 均值 比例 方差 及,第三章 简单随机抽样,第二节 简单随机抽样的误差计算 例题:A、B 、C 、D 4人,体重分别为 100,110,120,130斤 可知: 现采用抽样方法估计 , ,放回抽样,第三章 简单随机抽样,样本 样本 A,A 100 225 A,B 105 100 A,C 110 25 A,D 115 0 B,A 105 100 B,B 110 25 B,C 115 0 B,D 120 25 C,A 110 25 C,B 115 0 C,C 120 25 C,D 125 100 D,A

11、115 0 D,B 120 25 D,C 125 100 D,D 130 225 合计,第三章 简单随机抽样,100 105 110 115 120 125 130 频数 1 2 3 4 3 2 1 频率 0.0625 0.125 0.1875 0.25 0.1875 0.125 0.0625 说明样本分布近似正态分布 并且:,样本分布,第三章 简单随机抽样,抽样误差(标准差) 抽样误差计算公式 误差也可用方差形式表现,第三章 简单随机抽样,若采用不放回抽样 计算公式,第三章 基本概念,为 修正系数 为 修正系数 令 ,称抽样比, 故, 有限总体调整系数,第三章 简单随机抽样,第三节 简单随机

12、抽样中的估计 一、均值估计 不放回抽样是常用方法 是 的估计,第三章 简单随机抽样,置信区间 :概率度 当 时, 称为允许抽样误差,第三章 简单随机抽样,二、 总量估计,第三章 简单随机抽样,三、比例估计 令 总体比例 样本比例 例: , , 有 户家庭拥有彩 电,全市居民家庭彩电拥有率?,第三章 简单随机抽样,置信区间 (81.9% 88.1%),第三章 简单随机抽样,第四节 样本量的确定 影响样本量的因素 调查经费 总体方差 允许误差范围 置信度,第三章 简单随机抽样,一、样本量计算基本公式 1. 调查费用确定样本量 先确定费用函数,如 C 一定时,可得到样本量上限,第三章 简单随机抽样,

13、2. 放回抽样 由 得,第三章 简单随机抽样,3. 不放回抽样 由 得 将分子,分母同除以 故,第三章 简单随机抽样,4. 比例估计中的样本量 放回抽样 不放回抽样,第三章 简单随机抽样,二、控制相对误差的样本量 (放回抽样) 令 则: 在不放回抽样条件下,第三章 简单随机抽样,三、总体方差的事先确定 1. 以往数据或经验数据 2. 预调查解决 的估计问题 3. 全距与标准差之间的关系推测 4. 先抽取 ,根据 ,求出总体方差 估计,进而求得 ,再抽,四、样本量设计中的误区 1. 估计精度越高越好吗? 简单随机抽样估计比例P的样本量与误差(当P=0.5时) 样本量 误差 50 0.14 100

14、 0.10 500 0.045 1000 0.032 对精度要求的判断十分重要。为得到最小误差而选择最 大样本量不是好的选择。,第三章 简单随机抽样,2. 样本量与总体规模N有关吗? 例:简单随机抽样估计P,置信度95%,允许误差5%,在P=0.5条件下 总体规模(N) 所需样本量(n) 50 44 100 80 500 222 1000 286 5000 370 10000 385 100000 398 1000000 400 10000000 400,抽样调查中的样本量,抽样调查中的样本量,由此可知,在精度要求相同条件下,在北 京市进行一项调查和在全国进行一项调查,样 本量的差别并不大。 总体规模越大,进行抽样调查的效率越高。 若分类、分区、分层分别进行估计则另当别

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > PPT模板库 > 总结/计划/报告

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号