抽样分布与抽样方法

上传人:san****019 文档编号:70884348 上传时间:2019-01-18 格式:PPT 页数:80 大小:1.32MB
返回 下载 相关 举报
抽样分布与抽样方法_第1页
第1页 / 共80页
抽样分布与抽样方法_第2页
第2页 / 共80页
抽样分布与抽样方法_第3页
第3页 / 共80页
抽样分布与抽样方法_第4页
第4页 / 共80页
抽样分布与抽样方法_第5页
第5页 / 共80页
点击查看更多>>
资源描述

《抽样分布与抽样方法》由会员分享,可在线阅读,更多相关《抽样分布与抽样方法(80页珍藏版)》请在金锄头文库上搜索。

1、第5章 抽样分布与抽样方法,,本章主要内容,随机抽样和统计推断 抽样分布 抽样设计方法,教学基本要求,通过本章的学习,掌握抽样的概念,简单随机抽样的方法;掌握重置抽样的抽样分布,不重置抽样的抽样分布;识记抽样其他组织形式,抽样设计的基本原则,掌握各种抽样组织形式的抽样平均误差的计算方法,了解抽样方案的设计内容。,抽样的基本概念,抽样涉及的基本概念有: 总体与样本 样本容量与样本个数 总体参数与样本统计量 重复抽样与不重复抽样 这些概念是统计学特有的,体现了统计学的基本思想与方法。,总体和样本(回顾),1.总体:又称全及总体、母体,指所要研究对象的全体,由许多客观存在的具有某种共同性质的单位构成

2、。总体单位数用 N 表示。 2.样本:又称子样,来自总体,是从总体中按随机原则抽选出来的部分,由抽选的单位构成。样本单位数用 n 表示。 3.总体是唯一的、确定的,而样本是不确定的、可变的、随机的。,例1:一汽车轮胎制造商生产一种被认为寿命更长的新型轮胎。 例2:某党派想支持某一候选人参选美国某州议员,为了决定 是否支持该候选人,该党派领导需要估计支持该候选人的民众 占全部登记投票人总数的比例。由于时间及财力的限制:,抽样估计方法主要用在下列两种情况: 1、对所考查的总体不可能进行全部测度; 2、从理论上说可以对所考查的总体进行全部测度,但实践上由于人力、财力、时间等方面的原因,无法或没有必要

3、(不划算)进行全部测度。 注意: 抽样调查必须遵循随机原则。 抽样估计只能得到对总体特征的近似测度,因此,抽样估计还必须同时考察所得结果的“可能范围”与“可靠程度”。,样本容量与样本个数,样本容量:一个样本中所包含的单位数,用n表示。 样本个数:又称样本可能数目,指从一个总体中所可能抽取的样本的个数。对于有限总体,样本个数可以计算出来。样本个数的多少与抽样方法有关。(这个概念只是对有限总体有意义,对无限总体没有意义!),例3:某大公司人事部经理整理其2500个中层干部的档案。其中一项内容是考察这些中层干部的平均年薪及参加过公司培训计划的比例。 总体:2500名中层干部(population )

4、, 如果:上述情况可由每个人的个人档案中得知,可容易地测出这2500名中层干部的平均年薪及标准差。 假如:1:已经得到了如下的结果: 总体均值(population mean) =51800 总体标准差(Population standard deviation=4000,2、同时,有1500人参加了公司培训, 则参加公司培训计划的比例为: P=1500/2500=0.60 参数是总体的数值特征(A parameter is a numerical characteristic of a population.)。 如:例3中的中层干部平均年薪,年薪标准差及受培训人数所占比例均为该公司中层干部

5、这一总体的参数。 抽样估计就是要通过样本而非总体来估计总体参数。,统计量,x1,x2, xn是相应于样本X1,X2, Xn的样本值,则称g(x1,x2, xn)是g(X1,X2, Xn)的观察值。,注:统计量是随机变量。,1.,思考?,常用统计量,样本均值,样本方差,它反映了总体均值 的信息,它反映了总体方差 的信息,样本k阶原点矩,样本k阶中心矩,k=1,2,它反映了总体k 阶矩 的信息,当k=1时, 就是样本均值,它反映了总体k 阶 中心矩的信息,它们的观察值分别为:,注意: 总体参数是常数,计算总体参数的公式中所用到的总体各单位的标志值是确定的具体数值,而样本统计量是随机变量,计算样本统

6、计量的公式中所用的样本在未具体观察前是随机变量。 计算有限总体参数的公式中要使用总体的所有单位的标志值,(有限总体的单位总数N),而计算样本统计量的公式中只使用抽取到的样本(其个数是样本量n)。,总体参数和样本统计量,总体参数:反映总体数量特征的指标。其数值是唯一的、确定的。 样本统计量:根据样本分布计算的指标。是随机变量。,例:从一批瓷砖中随机抽取10件,测得其重量为(单位:千克): 2.10,2.43,1.85,2.40,2.15,2.28,1.96,2.35,2.00,1.99 求这组样本的均值和方差。 解:,抽样分布,总体中各元素的观察值所形成的分布 分布通常是未知的 可以假定它服从某

7、种分布,总体分布 (population distribution),一个样本中各观察值的分布 也称经验分布 当样本容量n逐渐增大时,样本分布逐渐接近总体的分布,样本分布 (sample distribution),抽样分布的概念,1、举个例子:丢骰子 2、结论:样本均值并不总是落在总体均值很近的位置。因此,我们不能仅仅根据一个样本得出总体的情况,需认识到样本统计量本身就是个随机变量,不同的样本会导致样本统计量取不同的值。 3、解决方法:在大量重复抽样试验的基础上,得出统计量取值的集合及相应的概率,进而作出判断和比较,抽样分布的形成过程 (sampling distribution),样本统计

8、量的概率分布,是一种理论分布 在重复选取容量为n的样本时,由该统计量的所有可能取值形成的相对频数分布 随机变量是样本统计量 样本均值, 样本比例,样本方差等 结果来自容量相同的所有可能样本 提供了样本统计量长远而稳定的信息,是进行推断的理论基础,也是抽样推断科学性的重要依据,抽样分布 (sampling distribution),样本均值的抽样分布 (例题分析),例:设一个总体,含有4个元素(个体) ,即总体单位数N=4。4 个个体分别为x1=1,x2=2,x3=3,x4=4 。总体的均值、方差及分布如下,均值和方差,样本均值的抽样分布 (例题分析), 现从总体中抽取n2的简单随机样本,在重

9、复抽样条件下,共有42=16个样本。所有样本的结果为,样本均值的抽样分布 (例题分析), 计算出各样本的均值,如下表。并给出样本均值的抽样分布,样本均值的抽样分布 例题分析,样本均值的分布与总体分布的比较 (例题分析), = 2.5 2 =1.25,总体分布,比较及结论:1. 样本均值的均值(数学期望) 等于总体均值 2. 样本均值的方差等于总体方差的1/n,抽样分布的形式,1、样本均值抽样分布的形式与原有总体的分布和样本容量n的大小有关 2、如果原总体分布是正态分布,那么,无论样本容量的大小如何,样本均值的抽样分布都服从正态分布 3、如果原总体分布是非正态分布,即看样本容量的的大小,当样本容

10、量大于30时,抽样分布将趋近正态分布,这就是著名的中心极限定理,样本均值的抽样分布 与中心极限定理,当总体服从正态分布N(,2)时,来自该总体的所有容量为n的样本的均值x也服从正态分布,x 的数学期望为,方差为2/n。即xN(,2/n),中心极限定理 (central limit theorem),中心极限定理:设从均值为,方差为 2的一个任意总体中抽取容量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为、方差为2/n的正态分布,中心极限定理 (central limit theorem),x 的分布趋于正态分布的过程,总体(或样本)中具有某种属性的单位与全部单位总数之比 不同性别的

11、人与全部人数之比 合格品(或不合格品) 与全部产品总数之比 总体比例可表示为 样本比例可表示为,样本比例的分布 (proportion),样本比例的分布,在重复选取容量为n的样本时,由样本比例的所有可能取值形成的相对频数分布 总体为二项分布 当样本容量很大时,样本比例的抽样分布可用正态分布近似,即,抽样分布与总体分布的关系,例:求样本平均数的概率分布,设某公司1000名职工的人均年奖金为2000元,标准差500元,随机抽取36人作为样本进行调查,问样本的人均年奖金在19002200元之间的概率有多大?,设XN(72,100),为使样本均值大于70的概率不小于90%,则样本量至少应取多少? 解:

12、设样本量为n,则,例,依题意:,查表得:,抽样设计方法,抽样估计效果的衡量与抽样组织形式,抽样估计效果好坏,关键是抽样平均误差的控制。抽样平均误差小,抽样效果从整体上看就是好的;否则,抽样效果就不理想。 抽样平均误差受以下几方面的因素影响: 总体的变异性,即与总体的标准差大小有关 样本容量 抽样方法 抽样的组织形式 抽样的组织形式有如下几种: 简单随机抽样、等距抽样、类型抽样、整群抽样、阶段抽样,简单随机抽样(Simple Random Sampling),若总体X的样本X1,X2,Xn满足:(1)X1,X2,Xn与X同分布;(2)X1,X2,Xn相互独立,那称它为简单随机样本。简称为样本,其

13、观察值x1,x2,xn称为样本值。,定理 : 若 为X的一个样本,则 的联合分布函数为:,若设X的概率密度为f,则 的联合概率密度为:,简单随机抽样(Simple Random Sampling),简单随机抽样可根据总体的有限性或无限性分为有限总体简单随机抽样与无限总体随机抽样。 有限总体简单随机抽样的特点: 每一个可能的相同容量的样本被抽中的概率相同。 无限总体简单随机抽样的特点: 1、每一样本(单位)来自同一总体; 2、每一样本(单位)是独立抽取的。,简单随机抽样,1、自有限总体的抽样 方法:将总体单位编成抽样框,而后用抽签或随机 数表抽取样本单位。 适用:总体规模不大;总体内部差异小。

14、2、自无限总体的抽样 方法:必须特殊制定一种独立选取样本点的抽样过 程,以避免由于某些类型的个体以较大概率被选入 而产生误差。 适用:总体太大或是无限的;总体内部差异小。,随机数字表(摘录),63271 59986 71744 51102 15141 80714 58683 93108 13554 79945 88547 09896 95436 79115 08303 01041 20030 63754 08459 28364 55957 57243 83865 09911 19761 66355 40102 26646 60147 15702 46276 87453 44790 67122

15、45573 84358 21625 16999 13385 22782 55363 07449 34835 15290 76616 67191 12777 21861 68689 03263 69393 92785 49902 58447 42048 30378 87618 26933 40640 16281 13186 29431 88190 04588 38733 81290 89541 70290 40113 08243 17726 28652 56836 78351 47327 18518 92222 55201 27340 10493 36520 64465 05550 30157

16、82242 29520 69753 72602 23756 54935 81628 36100 39254 56835 37636 02421 98063 89641 64953 99337 随机数字表中,可以从任何一个位置、任何方向开始挑选 随机数。一旦选择一个任意起点,就采用事先确定的程序。,重复抽样与不重复抽样,对于无限总体而言,抽样总是可以看成是重复抽样(或重置抽样),然后,对于有限总体而言,由抽样是否具有可重复性,又可分为重复(重置)抽样与不重复(不重置)抽样。而且,根据抽样中是否排序,所能抽到的样本个数往往不同。,重复抽样:例如从A、B、C、D、E五个字母中随机抽取两个作为样本。N=5,n=2

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号