统计学-07抽样推断幻灯片资料

上传人:yulij****0329 文档编号:140972385 上传时间:2020-08-03 格式:PPT 页数:149 大小:1.27MB
返回 下载 相关 举报
统计学-07抽样推断幻灯片资料_第1页
第1页 / 共149页
统计学-07抽样推断幻灯片资料_第2页
第2页 / 共149页
统计学-07抽样推断幻灯片资料_第3页
第3页 / 共149页
统计学-07抽样推断幻灯片资料_第4页
第4页 / 共149页
统计学-07抽样推断幻灯片资料_第5页
第5页 / 共149页
点击查看更多>>
资源描述

《统计学-07抽样推断幻灯片资料》由会员分享,可在线阅读,更多相关《统计学-07抽样推断幻灯片资料(149页珍藏版)》请在金锄头文库上搜索。

1、统计学,从数据到结论 王二威,第七章 抽样推断,引言,森林管理 森林的现有储量 森林以往的生长情况 森林未来的生长情况,7.1 抽样推断概述,抽样推断的涵义 以抽样调查为基础 用样本资料估计和判断总体资料 抽样推断的特征 按随机的原则抽取样本 以样本指标推算总体指标 抽样误差可以事先计算和控制,7.1 抽样推断概述,A公司人事部经理被分配一项任务,为公司2500名管理人员制定一份简报,其中包括管理人员的平均薪金和公司中已完成管理培训程序的管理人员所占比率。 如果没有2500管理人员具体的信息,假定选取30名管理人员组成一个样本进行研究分析,7.1 抽样推断概述:抽样的组织方式,1. 简单随机抽

2、样 直接抽选法 标签法 随机数码表法 2. 类型抽样(分层抽样) 等比例分类抽样 不等比例分类抽样,3. 等距抽样的 : 亦叫机械抽样 先将总体各单位按某一标志排队 然后按等距离抽取样本单位,7.1 抽样推断概述:抽样的组织方式,等距抽样的操作程序: 第一步:编制抽样框 将全及总体按有关标志(x)从低到高顺序排队 列出辅助标志(f) 将辅助标志依次累计,例,某村民小组有30户农户,若调查该村民小组所有农户2005年人均收入水平,可编制成如下抽样框:,抽样框,第二步:计算抽样距离(K),如果抽取6户进行调查,则: 抽样距离K=105617.5,第三步:抽取调查单位,半距起点、等距抽样,半距起点、

3、等距抽样,以第一个抽样距离的一半处作为第一个调查单位 以后毎隔一个抽样距离抽取一个调查单位 直到最后一个调查单位抽出为止,以抽取6户为例,抽取的户数依次为:,第1户 n1=17.528.75 为第3号户 第2户 n2=8.75+17.5=26.25 为第8号户 第3户 n3=26.25+17.5=43.75 为第13号户 第4户 n4=43.75+17.5=61.25 为第19号户 第5户 n5=61.25+17.5=78.75 为第24号户 第6户 n6=78.75+17.5=96.25 为第28号户 抽中户的位置可用图形表示如下:,第四步:对抽中单位进行代表性检查,计算样本平均数与全及平均

4、数之比值 其比值以人均收入水平上下不超过3%为有代表性。,现以半距起点、等距抽取的6户为例,检查其代表性,30户的人均收入xf /f =37990105 361.8(十元) 6户的人均收入x/n (190+260+340+402+477+503)6 362(十元) 二者比值为:362/361.8100.06 可以看出,抽中的6户有足够的代表性,可以作为样本进行调查。,4、整群抽样,将总体单位划分成若干群(R) 以群为单位,从中随机抽取一部分群(r) 对中选群的所有单位进行全面调查。 例如:对某镇农户进行家计调查,以自然村庄划分群,抽取若干个自然村庄,对中选村庄的所有农户都进行调查。,7.1 抽

5、样推断概述:抽样的组织方式,5. 多阶段抽样 类型抽样和整群抽样的结合,7.1 抽样推断概述:抽样方法,重复抽样 亦称回置抽样 每抽出一个单位在登记后仍放回去 同一个单位有多次被重复抽中的可能 不重复抽样 亦称不回置抽样 已经被抽出的单位不再放回 每个单位只有被抽中一次的可能,7.2 抽样分布及抽样推断理论依据基础知识,概率 随机变量 (概率)分布 正态分布,7.2 抽样分布及抽样推断理论依据基础知识:概率,概率是0和1之间的一个数目,表示某个事件发生的可能性或经常程度。 你买彩票中大奖的机会很小(接近0) 但有人中大奖的概率几乎为1 你被流星击中的概率很小(接近0) 但每分钟有流星击中地球的

6、概率为1 你今天被汽车撞上的概率几乎是0 但在北京每天发生车祸的概率是1。,7.2 抽样分布及抽样推断理论依据基础知识:概率,发生概率很小的事件称为小概率事件(small probability event); 小概率事件不那么可能发生,但它往往比很可能发生的事件更值得研究。 在某种意义上,新闻媒体的主要注意力大都集中在小概率事件上。,7.2 抽样分布及抽样推断理论依据基础知识:随机变量,7.2 抽样分布及抽样推断理论依据基础知识:概率分布,随机变量取一切可能值或范围的概率或概率的规律称为概率分布(probability distribution,简称分布)。 概率分布可以用各种图或表来表示;

7、一些可以用公式来表示。 概率分布是关于总体的概念。有了概率分布就等于知道了总体。,7.2 抽样分布及抽样推断理论依据基础知识:正态分布,取连续值的变量,如高度、长度、重量、时间、距离等等;它们被称为连续变量(continuous variable)。 换言之,一个随机变量如果能够在一区间(无论这个区间多么小)内取任何值,则该变量称为在此区间内是连续的,其分布称为连续型概率分布。 它们的概率分布很难准确地用离散变量概率的条形图表示。,7.2 抽样分布及抽样推断理论依据基础知识:正态分布,想象连续变量观测值的直方图;如果其纵坐标为相对频数,那么所有这些矩形条的高度和为1;完全可以重新设置量纲,使得

8、这些矩形条的面积和为1。 不断增加观测值及直方图的矩形条的数目,直方图就会越来越像一条光滑曲线,其下面的面积和为1。 该曲线即所谓概率密度函数(probability density function,pdf),简称密度函数或密度。下图为这样形成的密度曲线。,逐渐增加矩形条数目的直方图和一个形状类似的密度曲线。,7.2 抽样分布及抽样推断理论依据基础知识:正态分布,正态分布的密度曲线是一个对称的钟型曲线(最高点在均值处)。正态分布也是一族分布,各种正态分布根据它们的均值和标准差不同而有区别。 一个正态分布用N(m,s)表示;其中m为均值,而s为标准差。也常用N(m,s2)来表示,这里s2为方差

9、(标准差的平方)。,7.2 抽样分布及抽样推断理论依据基础知识:正态分布,标准差为1的正态分布N(0, 1)称为标准正态分布(standard normal distribution)。 标准正态分布的密度函数用f(x)表示。 任何具有正态分布N(m,s)的随机变量X都可以用简单的变换(减去其均值m,再除以标准差s):Z=(X-m)/s,而成为标准正态随机变量。这种变换和标准得分的意义类似。,两条正态分布的密度曲线。左边是N(-2,0.5)分布,右边是N(0, 1)分布,正态分布,当然,和所有连续变量一样,正态变量落在某个区间的概率就等于在这个区间上,密度曲线下面的面积。 比如,标准正态分布变

10、量落在区间(0.51,1.57)中的概率,就是在标准正态密度曲线下面在0.51和1.57之间的面积。 很容易得到这个面积等于0.24682;也就是说,标准正态变量在区间(0.51,1.57)中的概率等于0.24682。如果密度函数为f(x),那么这个面积为积分,标准正态变量在区间(0.51, 1.57)中的概率,7.2 抽样分布及抽样推断理论依据基础知识:参数与统计量,总体参数 总体均值,总体成数,总体标准差,总体方差 统计量 抽样平均数,抽样成数,样本标准差,样本方差,7.2 抽样分布及抽样推断理论依据P200 三种分布,总体分布 样本分布 抽样分布,所有样本指标(如均值、成数、方差等)所形

11、成的分布称为抽样分布 是一种理论概率分布 随机变量是 样本统计量 样本均值, 样本成数等 结果来自容量相同的所有可能样本,抽样分布(概念要点),样本均值的抽样分布(一个例子),【例】设一个总体,含有4个元素(个体),即总体单位数N=4。4 个个体分别为X1=1、X2=2、X3=3 、X4=4 。总体的均值、方差及分布如下,均值和方差,样本均值的抽样分布 (一个例子), 现从总体中抽取n2的简单随机样本,在重复抽样条件下,共有42=16个样本。所有样本的结果如下表,样本均值的抽样分布 (一个例子), 计算出各样本的均值,如下表。并给出样本均值的抽样分布,所有样本均值的均值和方差,式中:M为样本数

12、目 比较及结论:1. 样本均值的均值(数学期望)等于总体均值 2. 样本均值的方差等于总体方差的1/n,样本均值的分布与总体分布的比较,抽样分布, = 2.5 2 =1.25,总体分布,7.2 抽样分布及抽样推断理论依据大数定律,大数定律是阐述大量随机变量的平均结果具有稳定性的一系列定律的总称 独立同分布 贝奴利大数定律 意义:随着抽样单位数的增加,样本平均数有接近于总体平均数的趋势,样本均值的抽样分布与中心极限定理,当总体服从正态分布N (,2 )时,来自该总体的所有容量为n的样本的均值X也服从正态分布,X 的数学期望为,方差为2/n。即XN(,2/n),中心极限定理,中心极限定理:设从均值

13、为,方差为 2的一个任意总体中抽取容量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为、方差为2/n的正态分布,1. 抽样调查的主要目的在于( )。 计算和控制误差 B. 了解总体单位情况 . 用样本来推断总体 D. 对调查单位作深入的研究 2. 抽样调查所必须遵循的基本原则是( )。 随意原则 B. 可比性原则 . 准确性原则 D. 随机原则 3. 在下列情况下,计算不重复抽样的抽样平均误差可以采用重复抽样公式( )。 A. 总体单位数很多 B. 抽样单位数很少 . 抽样单位数对总体单位数的比重很小; D. 抽样单位数对总体单位数的比重较大。,4. 一般所说的大样本是指样本容量(

14、)。 小于10 B. 不大于10 . 小于30 D. 不小于30 5.将总体单位按一事实上标志排队,并按固定距离抽选样本点的方法是( )。 A. 类型抽样 B. 等距抽样 . 整群抽样 D. 简单随机抽样 6.按地理区域划片所进行的区域抽样,其抽样方法属于( )。 A. 纯随机抽样 B. 等距抽样 . 类型抽样 D. 整群抽样,7.4 参数估计,7.4.1 抽样误差概念 7.4.2 影响抽样误差大小的影响因素 7.4.3 抽样平均误差的计算 7.4.4 抽样极限误差,7.4.1 抽样误差的概念,抽样误差是样本指标和总体指标之间数量上的差别。以数学符号表示:,理解抽样误差可以从两方面着手:,抽样

15、误差是指由于抽样的随机性而产 生的那一部分代表性误差,不包括登记 性误差。也不包括可能发生的偏差。,误差,登记性误差,代表性误差,在调查过程中由于主客观原因引起的登记、汇总或计算等方面的差错而造成的误差,由于样本结构和总体结构不同,样本总体不能完全代表总体而产成的样本指标与总体指标的误差,偏差,随机误差,破坏了抽样的随机原则而产生的误差,实际误差,抽样平均误差,是样本指标与总体指标的差别,所有可能出现的样本指标的标准差,遵守随机原则但可能抽到各种不同的样本而产生的误差,主要样本 统计量,平均数比率(成数)方差,抽样平均误差是反映抽样误差一般水平的指 标,其实质是指抽样平均数的标准差,它反 映了

16、是指样本指标与总体指标的平均离差程 度,也就是样本指标与总体指标的标准差, 通常用 来表示。,抽样平均误差,可以作为衡量样本指标对于全及指标代表性程度的一个尺度。 是计算样本指标与全及指标之间变异范围的一个根据。 在组织抽样调查中,也是确定抽样单位数多少的计算依据之一。,抽样平均误差,7.1.2 影响抽样平均误差的因素,1.总体各单位标志值的差异程度; 2.样本的单位数; 3.抽样的方法; 4.抽样调查的组织形式。,差异越大,抽样误差越大,单位数越多,抽样误差越小,重复抽样的抽样误差比不重复抽样的大,1.重复抽样的条件下,式中,n为样本容量; 为总体标准差。一 般情况下是未知,可用样本标准差替代 。,式中,n为样本容量; 为总体成数标准差,一般情 况下是未知,可用样本成数标准差替代 。.,2.不重复抽样的条件下,式中,N为总体单位数;n为样本容量;X2 为总体方差。一般情况下是未知,可用样本方差替代x 2。,式中, N为总体单位数; n为样本容量;P2 为总体成数的方差。一般情况下是

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 中学教育 > 教学课件 > 高中课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号