第五章抽样推断培训教材

上传人:yuzo****123 文档编号:142652656 上传时间:2020-08-22 格式:PPT 页数:53 大小:1.45MB
返回 下载 相关 举报
第五章抽样推断培训教材_第1页
第1页 / 共53页
第五章抽样推断培训教材_第2页
第2页 / 共53页
第五章抽样推断培训教材_第3页
第3页 / 共53页
第五章抽样推断培训教材_第4页
第4页 / 共53页
第五章抽样推断培训教材_第5页
第5页 / 共53页
点击查看更多>>
资源描述

《第五章抽样推断培训教材》由会员分享,可在线阅读,更多相关《第五章抽样推断培训教材(53页珍藏版)》请在金锄头文库上搜索。

1、第五章 参数估计,本章学习目的与要求 第一节 抽样分布 第二节 抽样误差 第三节 抽样估计方法 第四节 抽样组织设计,下一页,返回本节首页,本章学习目的与要求,目的: 学习目的在于提供一套利用抽样资料来估计总体数量特征的方法。 要求: 明确抽样调查的概念、特点、作用; 理解抽样误差的影响因素; 掌握抽样平均误差的计算方法; 掌握抽样估计方法与样本容量确定的方法; 理解类型抽样、等距抽样、整群抽样的含义、特点 与适用场合。,上一页,下一页,返回本节首页,第一节 抽样分布,一、抽样推断的概念 二、抽样推断的特征 三、抽样推断的内容 四、有关抽样的基本概念,上一页,下一页,返回本节首页,二、抽样推断

2、的特征,(一)是由部分推算整体的一种认识方法; (二)按随机原则抽取样本; (三)运用概率估计的方法; (四)抽样推断的误差可以事先计算并加以 控制。,上一页,下一页,返回本节首页,三、抽样推断的内容,(一)抽样估计 抽样估计是通过以样本数据对总体某一未知数量特征进行估计的一种统计分析方法。 (二)假设检验 假设检验是根据研究的目的和要求,先对总体某一未知的数量特征作某种假设,然后根据样本数据对这一假设进行检验,以判断假设的真伪的一种统计分析方法。,上一页,下一页,返回本节首页,四、有关抽样的基本概念,(一)总体和样本 (二)样本容量和样本个数 (三)参数和统计量 (四) 重复抽样和不重复抽样

3、,上一页,下一页,返回本节首页,(一)总体和样本,总体 总体又称母体或全及总体,它是指所要认识的,具有某种共同性质的许多单位的集合体,也就是研究对象的全体。总体单位数一般用“N”表示。 样本 样本又称子样或总体样本,是从全及总体中抽取并进行观察,代表全及总体的那部分单位的集合体。样本单位数一般用“n”表示。,上一页,下一页,返回本节首页,(二)样本容量和样本个数,1样本容量 样本容量是指样本所包含的单位数。 2样本个数 样本个数又称样本可能数目,也就是从一个总体中可能抽取的样本个数。 对于一次抽样调查,总体是唯一确定的,而样本却是不确定的,一个全及总体可能抽出很多个样本总体。,上一页,下一页,

4、返回本节首页,(三)参数和统计量,根据总体各单位的标志值或标志属性计算的,反映总体数量特征的综合指标称为全及指标。全及指标是总体变量的函数,其数值是确定的、惟一的,因此称为参数。 根据样本各单位标志值或标志属性计算的,反映样本数量特征的综合指标称为样本指标。样本指标是样本变量的函数,用来估计总体参数,因此也称统计量,其值随着样本的不同而不同,因此统计量是个随机变量。,上一页,下一页,(1)常用的参数,(2)常用统计量,a.平均数: 成数: b.方差: 成数方差:,常用的参数和统计量,上一页,下一页,返回本节首页,(四) 重复抽样和不重复抽样,1.重复抽样 从N个单位中每次抽取1个,抽取后将其号

5、码记下,再放回,一直抽取n个单位组成一个样本,这样的抽样方法称为重复抽样。 2.不重复抽样 从N个单位中每次抽取1个,抽取后不放回,一直抽取n个单位组成一个样本这样的抽样方法称为不重复抽样。,上一页,下一页,返回本节首页,第二节 抽样误差,一、抽样误差的概念及影响因素 二、抽样平均误差 三、抽样极限误差,上一页,下一页,返回本节首页,一、抽样误差的概念及影响因素,(一)抽样误差的概念 指由于抽样的随机性而造成样本指标与总体参数之间的误差,这种误差是抽样调查所固有的、不可避免的,也叫随机误差。 (二)抽样误差的影响因素 1.总体各单位标志值的差异程度:差异越大,抽样误差越大; 2.样本的单位数:

6、单位数越多,抽样误差越小; 3.抽样的方法:重复抽样的抽样误差比不重复抽样的大; 4.抽样调查的组织形式:不同的组织方式有不同的抽样误差,上一页,下一页,返回本节首页,二、抽样平均误差,(一)什么是抽样平均误差 抽样平均误差是反映抽样误差一般水平的指标,其实质是指抽样平均数的标准差,它反映了抽样指标与总体指标的平均离差程度,通常用抽样平均数的标准差来衡量。 (二)抽样平均误差的计算 1.重复抽样的条件下 2.不重复抽样的条件下,上一页,下一页,返回本节首页,1.重复抽样的条件下,式中,n为样本容量; 为总体标准差,一般情况下是未知,可用样本标准差替代 。,式中,n为样本容量; 为总体成数标准差

7、,一般情况下是未知,可用样本成数标准差替代 。,上一页,下一页,返回本节首页,2.不重复抽样的条件下,式中,N为总体单位数;n为样本容量;X2 为总体方差,一般情况下是未知,可用样本方差替代 x 2,式中, N为总体单位数; n为样本容量;P2 为总体成数方差一般情况下是末知,可用样本成数方差替代p2 。,上一页,下一页,返回本节首页,三、抽样极限误差,抽样极限误差是指样本指标与全及指标之间的误差范围。即: 或 如果抽样极限误差用抽样平均误差来衡量,则有: 或,即,抽样极限误差是抽样平均误差的多少倍。我们把倍数t称为抽样误差的概率度,上一页,下一页,返回本节首页,第三节 抽样估计方法,一、总体

8、参数的点估计 二、总体参数的区间估计 三、样本容量的确定,上一页,下一页,返回本节首页,一、总体参数的点估计,(一)参数点估计的基本特点 (二)抽样估计的优良标准 (三)抽样估计的置信度,上一页,下一页,返回本节首页,(一)参数点估计的基本特点,基本特点: 根据总体指标的结构形式设计样本指标作为总体参数的估计量,并以样本指标的实际值直接作为相应总体参数的估计值。 例如,样本平均值作为相应总体平均数的估计值;以抽样调查所获得的人口结构代表总体的人口结构等。,上一页,下一页,返回本节首页,(二)抽样估计的优良标准,无偏性 作为总体参数估计量的样本统计量,要求其期望值(平均数)等于被估计的总体参数。

9、这样的估计量称为无偏估计量。 有效性 即方差越小的估计量就越有效.以抽样指标估计总体指标,要求作为优良估计量的方差应比其它估计量的方差小。 一致性 亦称相合性,是指当n时,估计量依概率收敛于总体参数的真值,即作为优良估计量的样本容量充分大时,抽样指标也应充分地靠近总体指标。,上一页,下一页,返回本节首页,(三)抽样估计的置信度,抽样估计的置信度是表明抽样指标和总体指标的误差不超过一定范围的概率的概率保证程度。 置信度一般用“1-”表示区间估计的可靠程度或把握程 度,也即所估计区间包含总体真值的可能性。,例如,“在95%置信度下,样本平均身高与总体平均身高的误差为5cm”表示在很多次抽样中,样本

10、平均身高与总体平均身高相差小于5cm的抽样次数占总抽样次数的95%。,上一页,下一页,置信度与概率度的之间关系:,因此,可以通过正态分布概率表获得。,上一页,下一页,返回本节首页,二、总体参数的区间估计,(一)区间估计的基本特点及要素 (二)总体平均数(成数)的区间估计,上一页,下一页,返回本节首页,(一)区间估计的基本特点及要素,区间估计的基本特点 根据给定的概率保证度,利用实际抽样资料,指出总体参数可能存在的区间范围。这个区间称为置信区间。 区间估计必须具备的三个要素 (1)估计值 (2)抽样误差范围 (3)概率保证程度,上一页,下一页,返回本节首页,(二)总体平均数(成数)的区间估计,表

11、 达 式,其中, 为极限误差,其中, 为极限误差,上一页,下一页,返回本节首页,1.计算抽样平均数和标准差,或抽样成数平均数和成数标准差,2 .计算抽样平均误差,5 .结论,3 .计算极限误差,4 .计算区间的上下限,总体均值(成数)区间估计的一般步骤,上一页,下一页,返回本节首页,1.计算抽样平均数和标准差:,如果总体标准差末知,则用样本标准差代替,对于大样本用,对于小样本用,(1)平均数,(2)标准差,上一页,下一页,返回本节首页,计算抽样平均数和标准差,1.计算抽样平均数和标准差:,或抽样成数平均数和成数标准差:,或,(1)平均数,如果总体标准差末知,则用样本标准差代替,(2)标准差,上

12、一页,下一页,返回本节首页,1.计算抽样平均数和标准差:,或抽样成数平均数和成数标准差:,重复抽样:,2 .计算抽样平均误差:,不重复抽样:,N很大时,上一页,下一页,返回本节首页,计算抽样平均误差,计算极限误差,1.计算抽样平均数和标准差:,或抽样成数平均数和成数标准差:,3 .计算极限误差:,2 .计算平均误差:,注意:如果给定的是置信度,则可查正态分布概率表获得。,上一页,下一页,返回本节首页,计算区间的上下限,1.计算抽样平均数和标准差:,或抽样成数平均数和成数标准差:,2 .计算平均误差:,4 .计算区间的上下限:,3 .计算极限误差:,或,上一页,下一页,返回本节首页,结论,1.计

13、算抽样平均数和标准差:,或抽样成数平均数和成数标准差:,2 .计算平均误差:,5 .结论,3 .计算极限误差:,4 .计算区间的上下限:,如:可以在1-的概率保证程度下,估计*在*之间。,如果给定的是概率度,则可查正态分布概率表获得。,这是上面所计算的上下限,上一页,下一页,返回本节首页,例:某灯泡厂某月生产5000000个灯泡,在进行质量检查中, 随机抽取500个进行检验,这500个灯泡的耐用时间见下表:,试求在重复抽样条件下: 该厂全部灯泡平均耐用时间的取值范围(概率保证程度0.9973) 检查500个灯泡中不合格产品占0.4%,试在0.6827概率保证下,估 计全部产品中不合格率的取值范

14、围。,问题 ?,解: 计算平均数与标准差,计算抽样平均误差,计算抽样极限误差,(由概率保证程度0.9973,查表得概率度t=3) 估计总体指标区间,在99.73%概率保证程度下,估计该厂全部灯泡平均耐用时间 在919933.8小时之间。, p=0.4%,概率保证程度为0.6827时,t=1,在68.27%概率保证下,估计全部产品中不合格率 在0.12%0.68%之间。,三、样本容量的确定,(一)确定适当样本容量的意义 (二)简单随机抽样下样本容量的确定,上一页,下一页,返回本节首页,(一)确定适当样本容量的意义,1.在一定的误差允许下,样本容量太大,则 会增大工作量,造成人力、财力和时间的 浪

15、费。 2.如果改变了对误差的要求,则可以通过增 减样本容量来控制抽样误差的大小。,上一页,下一页,返回本节首页,(二)简单随机抽样下样本容量的确定,1.对于重复抽样:,由于,2.对于不重复抽样:,由于,上一页,下一页,返回本节首页,【例】某药厂为检查瓶装药片数量,随机抽取100瓶,结果平均每瓶101.5片,标准差为3片。试以99.73%的概率保证程度重复抽样条件下推断成品库该种药平均每瓶数量的区间。如果允许误差减少到原来的一半,其他条件不变,问需抽取多少瓶? 解:,上一页,下一页,返回本节首页,【例】一家广告公司想估计某类商店去年所花的平均广告费用有多少。经验表明,总体方差约为1800000元

16、。如置信度取95%,并要使估计处在总体平均值附近500元的范围内,这家广告公司以重复抽样方式应抽多大的样本? 解:已知2=1800000,=0.05, t=1.96,=500,上一页,下一页,返回本节首页,第四节 抽样组织设计,一、抽样组织设计的基本原则 二、几种常用的抽样组织形式,上一页,下一页,返回本节首页,一、抽样组织设计的基本原则,(一)随机原则 抽取样本单位时,应确保每个总体单位都有被抽取的 可能;在对样本单位的资料进行搜集和整理时,不能随 意遗漏或更换样本单位。 (二)抽样误差最小 在其他条件相同的情况下,选择抽样误差最小的方案。 (三)费用最少 在其他条件相同的情况下,选择费用最少的方案。,上一页,下一页,返回本节首页,二、抽样组织形式,(一)简单随机抽样 (二)等距抽样 (三

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 中学教育 > 教学课件 > 高中课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号