统计学抽样分析PPT课件

上传人:W**** 文档编号:153174621 上传时间:2020-11-27 格式:PPT 页数:146 大小:1.50MB
返回 下载 相关 举报
统计学抽样分析PPT课件_第1页
第1页 / 共146页
统计学抽样分析PPT课件_第2页
第2页 / 共146页
统计学抽样分析PPT课件_第3页
第3页 / 共146页
统计学抽样分析PPT课件_第4页
第4页 / 共146页
统计学抽样分析PPT课件_第5页
第5页 / 共146页
点击查看更多>>
资源描述

《统计学抽样分析PPT课件》由会员分享,可在线阅读,更多相关《统计学抽样分析PPT课件(146页珍藏版)》请在金锄头文库上搜索。

1、抽样估计的现实应用,例1 一汽车轮胎制造商生产一种被认为寿命更长的新型轮胎。,120个 样本,测试,平均里程: 36,500公里,推断,新轮胎 平均寿命: 36,500公里,400个 样本,支持人数: 160,推断,支持该候选人的选民 占全部选民的比例: 160/400=40%,例2:某党派想支持某一候选人参选美国某州议员,为了决定是否支持该候选人,该党派领导需要估计支持该候选人的民众占全部登记投票人总数的比例。由于时间及财力的限制:,本章要求: 教学目的:本章阐述参数估计的理论与方法,通过学习使学生能运用不同的抽样方式对总体参数进行估计及进行假设检验。 教学重点及难点: 教学重点:抽样误差的

2、计算;简单随机抽样下总体参数的区间估计及简单随机抽样下样本单位数的计算;假设检验。 教学难点:抽样平均误差的计算,参数的区间估计。 主要教学内容及要求:1、了解抽样方案设计的主要内容和抽样方案的检验;了解抽样分布的概念和定理;2、理解抽样法的意义、特点;3、掌握抽样误差、抽样平均差和抽样极限误差等概念的涵义;掌握影响抽样误差大小的因素;掌握确定必要样本单位数目的方法;掌握统计假设检验。4、熟练掌握抽样推断中的基本原理和方法,能够利用样本资料推断总体指标。5、能运用excel计算有关样本统计量,进行总体参数的区间估计。,第六章 抽样调查,第六章 抽样调查,第一节 抽样调查的意义 第二节 抽样调查

3、的基本概念及理论的依据 第三节 抽样平均误差 第四节 全及指标的推断 第五节 抽样方案的设计 第六节 必要样本数的确定 第七节 假设检验,第一节 抽样估计的意义,一、抽样估计的定义 二、抽样估计的特点 三、抽样估计的运用 四、抽样估计的一般步骤,指样本单位的抽取不受主观因素及其他系统性因素的影响,每个总体单位都有均等的被抽中机会,抽样估计,按照随机原则 从调查对象中抽取一部分单位进行调查,并以调查结果对总体数量特征作出具有一定可靠程度的估计与推断,从而认识总体的一种统计方法,统计推断,全及总体指标:参数(未知量),样本总体指标:统计量(已知量),抽样估计,并非所有的抽样估计都按随机原 则抽取样

4、本,也有非随机抽样,总体,随机样本,非随机样本,与总体分布特征相同,与总体分布特征不同,按随机原则抽取样本单位 目的是推断总体的数量特征 抽样推断的结果具有一定的可靠程度,抽样误差可以事先计算并控制,抽样估计的特点,不可能进行全面调查时 不必要进行全面调查时 来不及进行全面调查时 对全面调查资料进行补充修正时,抽样估计的适用范围,设 计 抽 样 方 案,抽 取 样 本 单 位,收 集 样 本 数 据,计 算 样 本 统 计 量,推 断 总 体 参 数,抽样估计的一般步骤,第二节 抽样调查的基本概念及理论依据,一、全及总体和抽样总体 二、全及指标和抽样指标 三、抽样方法和样本的可能数目 四、 抽

5、样调查的理论依据,全及总体,研究对象的全体,即第一章中学过的总体。,抽样总体,按随机原则从全及总体中抽取一部分单位组成的集合体,又叫抽样总体。,样本总体中所包括的单位数叫样本容量,一般用n表示 1、大样本(n30 2、小样本(n30),全及总体中所包括的单位数一般用N表示。 1、有限总体 2、无限总体,设总体中 个总体单位某项标志的标志值分别 为 ,其中具有某种属性的有 个 单位,不具有某种属性的有 个单位,则, 总体平均数(又叫总体均值):, 总体标准差:, 总体方差:, 总体成数:, 总体是非标志的标准差:, 总体是非标志的方差:,设样本中 个样本单位某项标志的标志值 分别为 ,其中具有和

6、不具有某 种属性的样本单位数目分别为 和 个,则, 样本平均数(又叫样本均值):, 样本单位标志值的标准差:, 样本单位标志值的方差:,为 的无偏估计,为 的无偏估计, 样本成数:, 样本单位是非标志的标准差:, 样本单位是非标志的方差:,为 的 无偏估计,为 的 无偏估计,当样本容量很大时,1/n,与1/(n-1)相差不大,样本方差的分式,可以直接除以n,与总本的方差计算分式保持一致。,例3:某大公司人事部经理整理其2500个中层干部的档案。其中一项内容是考察这些中层干部的平均年薪及参加过公司培训计划的比例。 总体:2500名中层干部 如果:上述情况可由每个人的个人档案中得知,可容易地测出这

7、2500名中层干部的平均年薪及标准差。,假如:1:已经得到了如下的结果: 总体均值: =51800 总体标准差: =4000,参数是总体的数值特征,上述总体均值、总体标准差、比例均称为总体的参数,2、同时,有1500人参加了公司培训,则 参加公司培训计划的比例为: P =1500/2500=0.60,如:例3中的中层干部平均年薪,年薪标准差及受培训人数所占比例均为该公司中层干部这一总体的参数。 抽样估计就是要通过样本而非总体来估计总体参数。,假如随机抽取了一个容量为30的样本: 工资 是否参加培训 49094.3 Yes 53263.9 Yes 49643.5 Yes ,假如根据该样本求得的年

8、薪样本平均数、标准差及参加过培训计划人数的比例分别为:,抽样方法,重复抽样,又被称作重置抽样、有放回抽样,继续 抽取,特点,同一总体单位有可能被重复抽中,而且每次抽取都是独立进行,不重复抽样,又被称作不重置抽样、不放回抽样,抽出 个体,登记 特征,继续 抽取,特点,同一总体中每个单位被抽中的机会并不均等,在连续抽取时,每次抽取都不是独立进行,是最为常用的抽样方法,用于无限总 体和许多有限总体样本单位的抽样。,抽样方法,对样本的要求不同,考虑顺序的抽样 ABBA,不考虑顺序的抽样 AB=BA,两种分类交叉,考虑顺序的重复抽样,考虑顺序的不重复抽样,不考虑顺序的重复抽样,不考虑顺序的不重复抽样,例

9、:从A、B、C、D四个工人中随机抽取二人组成一样本,可能的样本是:,考虑顺序的重复抽样 考虑顺序的不重复抽样 AA AB AC AD AA AB AC AD BA BB BC BD BA BB BC BD CA CB CC CD CA CB CC CD DA DB DC DD DA DB DC DD 不考虑顺序的重复抽样 不考虑顺序的不重复抽样 AA AB AC AD AA AB AC AD BA BB BC BD BA BB BC BD CA CB CC CD CA CB CC CD DA DB DC DD DA DB DC DD,第八章 抽样推断,1.1 抽样方案的设计 1.2 简单随机抽

10、样的抽样误差的测定 1.3 简单随机抽样的抽样估计,一、抽样误差的概念 二、抽样平均误差 三、抽样极限误差,第三节 抽样平均误差,某个样本容量的抽样分布,更大样本容量的抽样分布,抽样平均 误差,根据所有可能样本的样平均数或样本成数计算的标准差,即每一次抽样的样本指标和总体指标之间的平均差异程度。即样本估计量的标准差,式中: 为样本平均数的抽样平均误差; 为可能的样本数目; 为第 个可能样本的平均数; 为总体平均数,注意:不要混淆抽样 平均误差与样本标准差!,例:有4个工人,月产量分别为40,50,70,80,这一总体平均数和标准差为:,总体平均数,标准差,现用重复抽样的方法从4人中抽取2人构成

11、样本,求样本的平均数,用以代表4人总体的平均水平,所有可能的样本及样本的平均工资列表如下:,样本平均数的平均数: 抽样平均误差,抽样平均误差的计算公式, 样本平均数的抽样平均误差,当N500时,有,重复抽样时:,不重复抽样时:, 样本成数的抽样平均误差,重复抽样时:,不重复抽样时:,当N500时,有,抽样平均误差的计算公式,关于总体方差的估计方法,用过去同类问题全面调查或抽样调查的经验数据代替; 用样本标准差 代替总体标准差 ,用 代替 。,抽样平均误差的计算公式,影响抽样误差的因素,总体各单位的差异程度(即标准差的大小): 越大,抽样误差越大; 样本单位数的多少: 越大,抽样误差越小; 抽样

12、方法:不重复抽样的抽样误差比重复抽样的抽样误差小; 抽样组织方式:简单随机抽样的误差最大。,练习,1、对某乡进行简单重复抽样调查,抽出100个农户,户均年收入2000元,年收入标准差100元,求抽样平均误差。若抽取的是200户,则抽样平均误差以是多少。若要使抽样平均误差降低为原来的一半,则应抽多少户。 2、对某县人口用不重复抽样方法按1/10比例抽出1万人进行调查,得知样本平均年龄40岁,年龄标准差20岁,求抽样平均误差。 3、某县人口10万人,用简单随机不重复抽样方法抽取1/10的人口进行调查,得知男性人口比重为51%,求男性人口比重的抽样平均误差。 4、对某乡进行简单随机重复抽样调查,抽出

13、100个农户进行调查,得知年收入在1800元以上的占95%,求农户年收入在1800元以上比重的抽样平均误差。,抽样极限 误差,指在一定的概率保证程度下,抽样误差不允许超过的某一给定范围,也称作允许误差、误差范围、误差置信限等,注意: 1、统计学上往往用抽样极限误差来测度抽样误差的大小或者说测度点估计的精度。 原因:总体参数值往往并不知道,因此,实际抽样误差与抽样平均误差也往往无法求出,但在抽样分布大体知道的情况下,抽样极限误差是可以估计出来的。,2、抽样极限误差的估计总是要和一定的概率保证程度联系在一起的。,原因:样本统计量往往是一随机变量,它与总体参数真值之差也是一个随机变量,因此就不能期望

14、某次抽样的样本估计值落在一定区间内是一个必然事件,而只能给予一定的概率保证。 因此,在进行抽样估计时,既需要考虑抽样误差的可能范围,同时还需考虑落到这一范围的概率大小。 前者是估计的准确度问题,后者是估计的可靠性问题,两者紧密联系不可分开。这也正是区间估计所关心的主要问题。,平均产量的分布如下:,实际计算中一般不直接计算概率保证程度, 由于 ,,所以抽样极限误差是概率度t的函数,t为概率度,是给定概率保证程度下样本均值 偏离总体均值的抽样平均误差的倍数。,据中心极限定理,当总体为正态或总体非正态但n30时,样本均值的分布趋近于正态分布;当n足够大时,样本成数的分布近似为正态分布。,令,平均数的

15、抽样分布,全部可能样本平均数的均值等于总体均值,即: 从非正态总体中抽取的样本平均数当n足够大时其分布接近正态分布。 从正态总体中抽取的样本平均数不论容量大小其分布均为正态分布。 样本均值的标准差为总体标准差的,成数的抽样分布,全部可能样本成数的均值等于总体比率,即: 从非正态总体中抽取的样本成数,当n足够大时其分布接近正态分布。 从正态总体中抽取的样本成数,不论容量大小其分布均为正态分布。 样本成数的标准差为总体标准差的,样本抽样分布,原总体分布,t与相应的概率保证程度存在一一对应关系,常用t值及相应的概率保证程度为:,t值 概率保证程度 1.00 0.6827 1.65 0.9000 1.96 0.9500 2.00 0.9545 2.58 0.9900 3.00 0.9973,在实际中,一般将这种对应函数关系编成正态概率表供直接查用,(大样本条件下),68.27%,95.45%,99.73%,估计的准确度和估计的可靠性问题,由于提高把握程度,会增大允许误差,使估计精度降低,而缩小允许误差,提高估计的精度,又会降低估计的把握程度,所以在实际中应根据具体情况,先确定一个合理的把握程度再求相应的允许误差或先确定一个允许误差范围再求相应的把握程度。,抽样估计量的优良标准,设为待估计的总

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 工作范文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号