统计学课件之抽样估计

上传人:luobi****88888 文档编号:94013306 上传时间:2019-07-31 格式:PPT 页数:58 大小:773.50KB
返回 下载 相关 举报
统计学课件之抽样估计_第1页
第1页 / 共58页
统计学课件之抽样估计_第2页
第2页 / 共58页
统计学课件之抽样估计_第3页
第3页 / 共58页
统计学课件之抽样估计_第4页
第4页 / 共58页
统计学课件之抽样估计_第5页
第5页 / 共58页
点击查看更多>>
资源描述

《统计学课件之抽样估计》由会员分享,可在线阅读,更多相关《统计学课件之抽样估计(58页珍藏版)》请在金锄头文库上搜索。

1、本资料来源,例:A地区行政官员承诺:2006年农户人均纯收入达到5000元,人均纯收入在4500元以下的农户不超过25%。随机抽样该地区农户1000户,资料如下:,问: A地区该届政府的承诺是否兑现,抽样估计,例:某市公安系统2006年末共有500辆警车,当年上报需要维修的车辆135辆,为此申请维修费用共计120万元。由于需要维修车辆比例大大超过往年的水平,虽然2006年的实际情况有可能导致车辆损耗加大,但财务审批人员对如此高的维修比例仍有疑虑。为此委托某调查机构组织调查,随机抽查了100辆警车,检查发现其中有24辆需要维修。如果你是财务审批人员,请问你是否核准支出这笔维修费用?,抽样估计,调

2、查A市全部1000个新雇员发现,拥有MPA文凭、无工作经验的新雇用的女性管理人员的平均月薪为3000元,而那些拥有同样文化程度也无工作经验的新雇用的男性管理人员的平均工资是3200元。 结论:存在对女性的岐视,描述:,对某县全部青少年罪犯的调查发现,参加某咨询项目的青少年罪犯中有25%的人在一年内又犯案了,那些没有参加某咨询项目的青少年罪犯中则有40%的人在一年内又犯案了。 结论:该咨询项目对预防青少年再次犯罪是有益的,抽样估计,调查了A市全部1000个新雇员中的100名发现,拥有MPA文凭、无工作经验的新雇用的女性管理人员的平均月薪为3000元,而那些拥有同样文化程度也无工作经验的新雇用的男

3、性管理人员的平均工资是3200元。 可否认为:存在对女性的岐视?,推断:,对某县部分青少年罪犯的调查发现,参加某咨询项目的青少年罪犯中有25%的人在一年内又犯案了,那些没有参加某咨询项目的青少年罪犯中则有40%的人在一年内又犯案了。 可否认为:该咨询项目对预防青少年再次犯罪 是有益的?,抽样估计,抽样估计,参 数 估 计,基本概念和基础理论,研究方法基础:现象水平的推断,基本概念和基础理论,三组基本概念 两大核心理论 抽样的程序 抽样分布 抽样误差,推断的相关概念(1):总体、个体、样本,总体:被研究对象的全体;容量为N。 个体:组成总体的各个单位。 样本:遵循随机原则从总体中抽取的若干个体组

4、成的全体;容量为n。,四组基本概念,推断的相关概念(2):参数、估计量,参数:反映总体某一水平的指标;未知的、需要估计的 估计量:描述样本某一水平的指标;已知的,随机变量,用来估计参数。,四组基本概念,均值: 方差:,一般标志的平均数和方差:,推断的相关概念(2) :参数、估计量,参 数 估计量,四组基本概念,均值: 方差:,是非(交替)标志的平均数和标准差异:,推断的相关概念(2) :参数、估计量,参 数 估计量,四组基本概念,推断的相关概念(3) : 参数估计点估计、区间估计,参数估计:依据样本的观测,在一定的置信概率下,对总体的某一参数水平作出估计,四组基本概念,推断的相关概念(3) :

5、 参数估计点估计、区间估计,四组基本概念,两大核心理论,大数定律:描述大量随机变量的平均结果的稳定性 无论个别随机现象的结果如何,大量随机现象的平均结果实际上与每个个别现象的特征无关,并且几乎不再是随机的了。 包括: (1)统计常性法则:任何事物,在其总体内科学的抽取一部分进行观察,这部分一定具有总体的普遍特征。 (2)大数恒性法则:对差异来说,大量的观测比小量观察更易于发现规律,因此,样本越大,差异越小,即越能代表总体的普遍特征。 (3)小数永存法则:任何事物,凡是稀有的现象或者具有非常性者,常为少数,但总是存在。,切贝谢夫定理(推论):,两大核心理论,切贝谢夫定理与抽样估计:,两大核心理论

6、,贝努里定理,两大核心理论,贝努里定理与参数估计,两大核心理论,中心极限定理:说明大量的、独立的随机变量的和的分布趋于正态分布这一基本现象,定理(推论):,两大核心理论,中心极限定理说明:假如被研究的随机变量可表示为大量独立随机变量的和 ,其中每一个别随机变量对于总和只起微小的作用(n充分大),则可以认为 这个随机变量实际上是服从正态分布的,即:,两大核心理论,中心极限定理与参数估计,两大核心理论,抽样程序,简单随机抽样 系统随机抽样 分层随机抽样 整群随机抽样,如何获得样本: 从抽样方法看:有重置抽样、不重置抽样 从抽样程序看:有五种基本程序,抽样的程序简单随机抽样,程序:从总体的N个单位中

7、以同等概率不加任何限制地随机抽取n个单位组成样本进行观测以推断总体参数,工具:随机数据表,操作:给总体的N个单位逐一编号;确定随机数据表的起始点号;依据随机数据表中出现的号码确定样本单位,特点:总体中的每一个单位均有同等的被抽中的概率,第一次被抽中的概率:,第二次被抽中的概率:,第三次被抽中的概率:,抽样的程序简单随机抽样,抽样的程序系统随机抽样,程序:按总体的N个单位在总体中的排列顺序,在起首的k个单位中随机地抽取一个单位,然后每隔一定间隔k抽取一个单位,把这样抽出的n个单位组成样本进行观测,以推断总体参数。也称等距抽样。,工具:包含顺序排列的N个总体单位的表(图)、随机数据表,操作:计算抽

8、样间隔k=N/n;依据随机数据表在起首的k个单位中确定第1个样本单位i;依次确定第2、3、个样本单位i+k、i+2k、;由 i , i+k , i+2k , i+(n-1)k共n 个单位构成样本,特点:总体中的每一个单位均有同等的被抽中的概率 样本单位在总体中分布均匀,优缺点:在有可供利用图表的条件下,易于操作;由于样本单位分布均匀,可提高推断精度 当总体单位按有关标志排序并有线性趋势时,会影响推断精度导致系统性误差,抽样的程序系统随机抽样,抽样的程序分层随机抽样,程序:将总体的N个单位按其某一标志划分为互不重叠的若干个层,再分别从各层中独立地随机地抽取一定数量的单位构成样本,用以推断总体参数

9、。,工具:随机数据表,操作:将总体分为L个层,每一层内包含Nh个总体单位; 确定每一层内计划抽取的样本单位数nh ,h1,2,,L; 在每一层内实施一次简单随机抽样,抽取nh个单位; n1, n2 , nL共n (= n1+ n2 +nL)个单位构成样本,(两个关键),特点:以各层样本水平推断相应层的总体水平,再计算总体综合水平。,总体参数的真实水平:,总体参数的估计水平:,抽样的程序分层随机抽样,原则:给定误差条件,使费用最省 或:给定费用约束,使精度最高 影响因素: 确定方法:等比例分配 适宜分配 最优分配,分层抽样的两个关键:,1、分层:,2、样本单位在各层中的分配,抽样的程序分层随机抽

10、样,抽样的程序整群随机抽样,程序:将总体的N个单位分成S个整群,随机地抽取其中的s个整群组成样本,用以推断总体参数。,工具:随机数据表,操作:对总体分群;抽取其中的若干个群;对抽中的群作全面观测(或在抽中的群中再进行简单随机抽样),抽样分布,总体分布及其特征,总体分布: 总体中所有个体关于某个变量(标志)的取值所形成的分布。,总体参数:反映总体分布特征的指标:,样本分布及其特征,样本分布: 样本中所有个体关于某个变量(标志)的取值所形成的分布。,当样本容量很大,或者是当逐渐增大时,样本分布会接近总体分布。 如果样本容量很小,样本分布就有可能与总体分布相差很大,抽样估计的结果就会很差。,抽样分布

11、,样本统计量:,抽样分布及其特征,抽样分布,概念,分布,特征值,几种重要的抽样分布,抽样分布,是样本统计量的概率分布,由样本统计量的所有可能取值和与之相应的概率组成,假设从容量为N的总体中抽取容量为n的样本最多可抽取m套不同的样本,则m个样本统计值的频率分布,即为抽样分布。,抽样分布,抽样分布,设m个样本统计值按单项式分组可分为k组,则抽样分布的表现形式为:,样本均值的抽样分布形式,样本成数的抽样分布形式,样本均值的抽样分布例 样本成数的抽样分布例,抽样分布,总体分布: 某车间班组5个工人日工资为34,38,42,46,50元,抽样分布,(1)重复抽样(考虑顺序) 从5个工人(日工资为34,3

12、8,42,46,50元)中随机抽取2人构成样本,共52=25个样本 所有可能样本及其平均数:,第一单位,第二单位,样本均值,抽样分布,样本均值的抽样分布(九组),样本均值的抽样分布图,抽样分布,(2)不重复抽样 从5个工人(日工资为34,38,42,46,50元)中随机抽取2人构成样本(考虑顺序),共5420个样本。所有可能样本及其平均数:,抽样分布,样本均值的抽样分布(七组),抽样分布,总体成数为,总体方差为,总体分布: 某总体由10个球组成,其中红球6个。现从总体中随机抽取4个球,那么在重复抽样和不重复抽样下红球比重(样本成数)的抽样分布分别如何?,抽样分布,重复抽样下红球比重的抽样分布(

13、统一课件42),抽样分布,不重复抽样下红球比重的抽样分布(统一课件44),抽样分布,抽样分布,样本均值抽样分布的期望值: 在重复或不重复抽样下都等于总体均值 样本均值抽样分布的方差: 重复抽样方差大于不重复抽样 (不重复抽样的抽样分布较为集中),样本成数的期望值: 在重复或不重复抽样下,样本成数的均值都等于总体成数 样本成数抽样分布的方差: 重复抽样方差大于不重复抽样 (不重复抽样下样本成数的抽样分布较为集中),抽样分布,在各种抽样方法和抽样组织方式下,样本统计量的数学期望(均值)都等于总体参数。 抽样分布越集中、样本统计量的方差越小,则样本统计值越可能接近总体参数真值,抽样估计的误差越小、估

14、计结果就越精确。,抽样分布,实际的抽样分布形成取决于以下五个因素:,总体分布(越集中,抽样分布越集中) 样本容量(最关键因素,容量越大抽样分布越集中) 抽样方法(采用重复或不重复方法,抽样分布不同) 抽样组织形式(不同形式下的样本个数及结构不同,抽样分布也不同) 估计量构造(样本估计量不同,抽样分布不同),抽样分布,抽样分布,1.1、若总体服从正态分布:,则样本均值 也服从正态分布:,总体均值 估计:,1.2、任一总体,若样本容量充分大(n30):,则样本均值 也趋于正态分布:,抽样分布,1.3、若正态总体方差未知且n较小,则 服从于自由度为n-1的 t分布 1.4、任一方差已知总体但n较小,

15、 服从自由度为n-1的 t分布,抽样分布,抽样分布,总体均值 估计中:,不重复抽样,小样本 时:,正态总体、 已知:,正态总体、 未知:,任一总体、 已知:,教材P97、104,2、从一个数学期望为p、方差为 的是非变量(0-1分布)总体中随机抽取容量为n的样本,估计总体成数p:,抽样分布,小样本时: 重置抽样:p服从二项分布 不重置抽样:p服从超几何分布,总体成数 估计:,大样本 ( nP5, n (1-P)5)时:,教材P97、105,抽样误差,抽样误差:遵循随机原则的条件下,总体参数与其估计量之间的离差,由随机因素、偶然因素作用而产生。,影响因素:要求的置信度;总体在相关标志上的变异 抽样方法;抽样程序;样本规模,抽样误差,1、抽样平均误差(抽样标准误差) : 概念:样本统计量分布的标准差。,1、抽样平均误差(抽样标准误差) 作用:衡量总体参数的估计量的平均精度 计算(以简单随机抽样为例):,抽样误差,2、抽样极限误差 概念:根据抽样分布,在一定的置信度下,所确定的抽样实际误差变动的最大范围。 (抽样实际误差无法计算,但可以在一定概率下加以控制) 作用:用来估计总体参数在一定概率下的置信区间 用来推算允许误差范围内的必要n; 计算 :,抽样误差,

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > IT计算机/网络 > 其它相关文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号