统计学复习资料 抽样分布

上传人:mg****85 文档编号:49742581 上传时间:2018-08-02 格式:PPT 页数:53 大小:781.50KB
返回 下载 相关 举报
统计学复习资料 抽样分布_第1页
第1页 / 共53页
统计学复习资料 抽样分布_第2页
第2页 / 共53页
统计学复习资料 抽样分布_第3页
第3页 / 共53页
统计学复习资料 抽样分布_第4页
第4页 / 共53页
统计学复习资料 抽样分布_第5页
第5页 / 共53页
点击查看更多>>
资源描述

《统计学复习资料 抽样分布》由会员分享,可在线阅读,更多相关《统计学复习资料 抽样分布(53页珍藏版)》请在金锄头文库上搜索。

1、第四章 抽样分布主要内容 第一节 抽样的概念与方法 第二节 简单随机样本的抽样分布 第三节 抽样其它组织形式及其分布特 征统计应用:两个例子 The purpose of Statistics inference is to obtain information about a population from information contained in sample. 例1:一汽车轮胎制造商生产一种被认为寿命更长新型轮胎。例2:某党派想支持某一候选人参选美国某州议员,为了决定 是否支持该候选人,该党派领导需要估计支持该候选人的民众 占全部登记投票人总数的比例。由于时间及财力的限制:120

2、个 样本测试平均里程: 36,500公里推断新轮胎 平均寿命: 36,500公里400个 样本支持人数: 160推断支持该候选人的选民 占全部选民的比例: 160/400=40%抽样估计方法主要用在下列两种情况:1、对所考查的总体不可能进行全部测度;2、从理论上说可以对所考查的总体进行全 部测度,但实践上由于人力、财力、时间等方 面的原因,无法或没有必要(不划算)进行全 部测度。注意:抽样调查必须遵循随机原则。抽样估计只能得到对总体特征的近似测度,因 此,抽样估计还必须同时考察所得结果的“可能 范围”与“可靠程度”。第一节 抽样的概念与方法一、抽样的基本概念 二、简单随机抽样的方法 一、抽样的

3、基本概念例3:某大公司人事部经理整理其2500个中层干 部的档案。其中一项内容是考察这些中层干部的 平均年薪及参加过公司培训计划的比例。总体:2500名中层干部(population ),如果:上述情况可由每个人的个人档案中得知 ,可容易地测出这2500名中层干部的平均年薪及 标准差。假如:1:已经得到了如下的结果:总体均值=51800总体标准差=40002、同时,有1500人参加了公司培训,则参加公司培训计划的比例为:P =1500/2500=0.60参数参数是总体的数值特征(A parameter is a numerical characteristic of a population.

4、)。如:例3中的中层干部平均年薪,年薪标准 差及受培训人数所占比例均为该公司中层干部 这一总体的参数。抽样估计就是要通过样本而非总体来估计 总体参数。假如抽取30名,得到样本平均数、标准差和成数是则,样本:抽取到的30名中层干部。 统计量:根据样本分布计算的综合指标,是样本变 量的函数。 另注意区分样本容量和样本个数: 样本容量是指一个样本所包含的单位数。 样本个数是指样本的可能数目。二、简单随机抽样的方法 (一)放回抽样 n个单位的样本是有n次试验的结果构成 每次试验都是独立的 每次试验都在相同条件进行 样本的可能个数为 (考虑顺序)或 (不考虑顺序)(二)不放回抽样 n个单位的样本是有n次

5、试验的结果构成 每次试验不是独立的 每个单位在多次试验中中选机会是不等 的 样本的可能个数为N(N-1)(N-2)(N- n+1)(考虑顺序)或 (不考虑顺序)在社会经济统计中,往往采用的是较大总体( 视为无限总体)下的无序不重复抽样。 第二节 简单随机样本的 抽样分布一、重置抽样的抽样分布 二、不重置抽样的抽样分布 一、重置抽样的抽样分布 样本统计量的分布就是抽样分布 (一)样本均值的抽样分布 容量相同的所有可能样本的样本均值的概 率分布 一种理论概率分布 进行推断总体总体均值的理论基础【例例】设一个总体,含有4个元素(个体) ,即总体单位 数N=4。4 个个体分别为x1=1、x2=2、x3

6、=3 、x4=4 。 总体的均值、方差及分布如下总体分布1 14 42 23 30 0.1.1.2.2.3.3均值和方差总体特征值 现从总体中抽取现从总体中抽取n n2 2的简单随机样本,在重复抽的简单随机样本,在重复抽 样条件下,共有样条件下,共有4 42 2=16=16个样本。所有样本的结果为个样本。所有样本的结果为3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二个观察值第一个观察值所有可能的n = 2 的样本(共16个)样本均值的抽样分布样本均值的抽样分布 计算出各样本的均值,如下表。并给出样本均计算出各样本的均值,如下

7、表。并给出样本均 值的抽样分布值的抽样分布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二个观察值第一个观察值16个样本的均值(x)X X样本均值的抽样分布样本均值的抽样分布1.01.00 0.1.1.2.2.3.3P P ( (X X ) )1.51.53.03.04.04.03.53.52.02.02.52.5样本均值的分布与总体分布的比较 = 2.5 = 2.5 2 2 =1.25=1.25总体分布总体分布1 14 42 23 30 0.1.1.2.2.3.3抽样分布抽样分布P P ( ( X X ) )1.01.00

8、0.1.1.2.2.3.31.51.53.03.04.04.03.53.52.02.02.52.5X X显然,不同的样本对应着不同的样本统计量,而由于 样本抽取的随机性,样本统计量即为一种随机变量。 一般地,样本统计量的可能取值及其取值概率,形成 其概率分布,统计上称为抽样分布(sampling distribution)。正是抽样分布及其特征使得用样本统计量估计总 体参数的“精确程度”能够给予概率上的描述。 由于样本统计量的随机性及其抽样分布的存在,同 样可计算其均值、方差、标准差等数字特征来反映该 分布的中心趋势和离散趋势。1、样本平均数的期望值 由于不同的样本可得到不同的样本均值,因此,

9、 考察样本均值的期望就显得非常重要。用 表示样本均值的期望值, 表示总体均值 ,可证明在简单随机抽样中。结论:样本平均数的标准差可得:样本均值的标准差可用来测度样本均值与总体均值的 “距离”,即可用来计算可能的误差,它也被称为均 值标准误(standard error of the mean)或抽样平 均误差。2.样本平均数的标准差(二)样本比例的抽样分布在经济与商务的许多场合,需要用样本比例p对 总体比例P进行统计推断。样本比例抽样分布是样本比例所有可能值概率分 布。 同样地,要考察样本比例p与总体比例P的接近程 度,需要有样本比例抽样分布的相关信息。结论根据p的期望值、标准差及前面样本平均

10、数 的特性(抽样分布形状)。1、期望值:E (p)=P2、标准差: 现从总体中抽取现从总体中抽取n n2 2的简单随机样本,在不重复的简单随机样本,在不重复 抽样条件下,共有抽样条件下,共有1212个样本。所有样本的结果为个样本。所有样本的结果为3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二个观察值第一个 观察值所有可能的n = 2 的样本(共16个)二、不重置抽样的抽样分布 (一)样本均值的抽样分布样本均值的抽样分布 计算出各样本的均值,如下表。并给出样本均计算出各样本的均值,如下表。并给出样本均 值的抽样分布值的抽样分布

11、3.52.52.033.02.51.523.53.02.542.542.03211.51第二个观察值第一个观察值12个样本的均值(x)X X样本均值的抽样分布样本均值的抽样分布0 01 12 23 3P P ( (X X ) )1.51.53.03.03.53.52 22.52.5样本均值的分布与总体分布的比较 = 2.5 = 2.5 2 2 =1.25=1.25总体分布总体分布1 14 42 23 30 0.1.1.2.2.3.3抽样分布抽样分布P P ( ( X X ) )0 0.1.1.2.2.3.31.51.53.03.03.53.52.02.02.52.5X X结论:(不放回抽样)1

12、、样本平均数的期望值 2、样本平均数的标准差称为有限总体修正因子(finite population correction factor) (二)样本比例的抽样分布不放回抽样p的期望值、标准差分别为。1、期望值:E (p)=P2、标准差:附注:正态分布理论与中心极限定理1、正态分布的密度函数式中 为正态分布的平均数, 是它的标 准差。这两个参数决定正态分布密度函数 的形状。也可简记为N正态分布密度函数特性:(1)对称性。 (2)非负性。 (3)当x处于中心位置时 ,密度函数值最大。 (4)在 处为密度函 数的拐点,越大图形越扁平。(5)当x 时,密度函数f(x) 0,即曲线向两 边下垂,伸向无

13、穷远处。2、正态分布标准化正态分布函数为:不同的正态分布参数也就有不同的正态分布形式 ,利用上式分布函数计算各类不同的正态分布形 式某点或某区间的概率是很困难的。必须对各种 正态分布加以标准化,才能求其概率, 标准化:要求平均数为0,方差为1,用用N(0,1)N(0,1) 来表示。来表示。即是原变量变为新变量:例 :某农场的小麦亩产量服从正态分布,已知平均 亩产为550公斤,标准差50公斤,求亩产在525575 公斤间所占的比例。例:解放军战士的身高是按正态分布,经抽查平均 身高175公分,标准差是4公分,现军服厂要裁制 100,000套军服,问身高在171179公分之间要裁 多少套?3、正态

14、分布再生定理正态分布再生定理则无论样本容量n大小如何,样本均值都为 正态分布。当总体分布未知时,需要用到中心极限定理中心极限定理:对容量为n 的简单随机样本,样本均值的分布随 样本容量的增大而趋于正态分布。经验上验证,当样本容量等于或大于30时,无论 总体的分布如何,样本均值的分布则非常接近正态分 布。因此统计上常称容量在30(含30)以上的样本为 大样本(large-sample-size)。4、中心极限定理 (Central limit Theorem)5、样本容量与样本均值分布的关系由于样本标准差与总体标准差及样本容量有关:因此,样本容量增大,样本均值标准差变小,从而 使样本分布峰度变高

15、,于是在相同区间内,概率分布线 下的面积变大,提高了样本均值落在该区间的可能性。注意:1、所有可能的样本均值的平均数等于总体均值,而 与样本容量无关。2、点估计往往是在总体方差已知的情况下进行的。附注:关于正态分布查表的基本方法概率是曲线下的面积关于正态分布查表的基本方法:f(z) f(z) f(z)z z z -0.5 0 0.5 -0.5 0.5P(-0.5x 0.5)=0.3829 P(x-0.5)=(1-0.3829)/2=0.5-0.3829/2=0.30855 P(x0.5)=0.30855 P (x0.5)=1-0.30855=0.69145第三节 抽样其它组织形式及其 分布特征一、抽样其他组织形式 二、抽样设计的基本原则 三、抽样组织设计 四、抽样方案的设计 一、抽样其他组织形式 类型抽样 整群抽样 系统抽样 分层抽样 多阶段抽样 (一)保证随机原则的实现 (二)考虑样本容量和结构问题 (三)关于抽样的组织形式问题 (

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 生活休闲 > 科普知识

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号