统计学 刘灵芝_ 第五章 抽样推断

上传人:E**** 文档编号:89426019 上传时间:2019-05-25 格式:PPT 页数:107 大小:1.46MB
返回 下载 相关 举报
统计学  刘灵芝_ 第五章  抽样推断_第1页
第1页 / 共107页
统计学  刘灵芝_ 第五章  抽样推断_第2页
第2页 / 共107页
统计学  刘灵芝_ 第五章  抽样推断_第3页
第3页 / 共107页
统计学  刘灵芝_ 第五章  抽样推断_第4页
第4页 / 共107页
统计学  刘灵芝_ 第五章  抽样推断_第5页
第5页 / 共107页
点击查看更多>>
资源描述

《统计学 刘灵芝_ 第五章 抽样推断》由会员分享,可在线阅读,更多相关《统计学 刘灵芝_ 第五章 抽样推断(107页珍藏版)》请在金锄头文库上搜索。

1、第五章 抽样推断,导入引 例 1 质量检验,一灯泡厂每天约生产50万只灯泡,质量控制部门必须检验灯泡的次品率。 这个任务可以通过检验每一只灯泡来完成,但是这样做的花费巨大而且会造成每只灯泡价格的猛涨。另一方法是从每天生产的50万只灯泡中选出1000只,然后检验这1000只灯泡。如果这1000只灯泡是以正确的方式被选出的,那么从中检测出的次品比例,可被用于估计全天所有产品的次品比例。,导入引例2 人在戒烟后体重会增加?,为了调查研究“人在戒烟后体重会增加”这一断言,研究人员选择了一个由400个参与者构成的样本,他们都成功地参与了戒烟运动。每个人在活动开始前和一年后都称量了体重。参与者体重的平均变

2、化是增加了5磅,研究人员由此总结说有证据表明这一断言是正确的。,导入引例3 民意调查,纽约时报、哥伦比亚广播公司新闻、华盛顿邮报、全美广播公司新闻、有线新闻网等频繁地使用统计,比如民意调查人员如何判断19500多万具有选举权的美国人的意见? 他们当然不会接触每一个潜在的美国选民。相反,他们调查一小部分,比如1500个潜在选民的意见,然后据此估计整个国家所具有选举权的人的意见。令人惊讶的是,被访人中持有特定观点的人的比例与整个总体在那个特殊时刻持有相同观点的人的比例会很接近。,解决思路,设计数据收集过程 准备用于分析的数据 分析数据 解释数据分析的结果,第一节 抽样推断的意义及基本概念,一、抽样

3、推断的意义,(一)概念 按照随机原则从总体中抽取一部分单位组成样本进行调查,并根据样本资料计算的特征值,对总体特征值做出具有一定可靠程度的估计,以达到认识 总体数量特征的目的。,(二)特点 1、以遵守随机原则为前提; 2、以部分特征推断总体特征; 3、抽样误差可以计算和控制。,统计推断的过程,(三)抽样推断的主要作用,1、对于不可能进行全面调查的总体数量特征的推断,无限总体 破坏性或消耗性试验,2、对于某些不必要进行全面调查的总体数量特征的 推断,市场商品需求量 民意测验,3、对于全面调查的资料进行评价和修正,(四)抽样推断的主要内容 统计估计 参数估计 非参数估计 假设检验,参数估计 参数估

4、计是依据所获得的样本观察资料,对所研究现象总体的水平、结构、规模等数量特征进行估计。 假设检验 假设检验是利用样本的实际资料来检验事先对总体某些数量特征所作的假设是否可信的一种统计分析方法。,抽样推断的内容,二、抽样推断中的基本概念,(一) 全及总体和抽样总体(总体和样本),全及总体:所要观察的研究对象的全体,它是由所 研究范围内具有共同性质的全部单位所 组成的集合体。 总体单位数用N表示。,抽样总体:按照随机原则从全及总体中抽出作 为代表这一总体的一部分单位组成的 集合体。 抽样总体的单位数用n表示。 n 30 大样本 n 30 小样本,(二) 抽样方法,1、重复抽样: 例如总体有A、B、C

5、、D四个单位,要从中以重复抽样的方法抽取2个单位构成样本。全部可能抽取的样本数目为 44=16个 2、不重复抽样: 例如总体有A、B、C、D四个单位,要从中以不重复抽样的方法抽取2个单位构成样本。全部可能抽取的样本数目为 43=12个,(三) 参数和统计量 (全及指标和抽样指标、总体指标和样本指标),全及指标:根据总体各单位的标志值或标志属性 计算的,反映总体数量特征的综合指标。 抽样指标:根据样本各单位的标志值或标志属性 计算的综合指标。,样本及其代表性(概念要点),样本(sample):又称样本总体或子样,就是从总体中随机抽取出来并用来代表总体的那部分单位所构成的新的小总体或集合体。对于一

6、个具体的抽样问题,总体是唯一确定的,而样本则不是唯一的。 影响样本代表性的因素: 1、总体分布的离散程度的大小。(用方差 表示) 2、抽样单元数的多少(或称样本容量的大小)。 3、抽样方法(重复抽样和不重复抽样)。,参数与统计量,在统计学中约定俗成,将用来描述总体的特征的综合指标称为总体的参数; 将用来描述样本特征的指标称为样本统计量。,参数,统计量,(四) 抽样框 即总体单位的名单,是指对可以选择作为样本的总体单位列出名册或顺序编号,以确定总体的抽样范围和结构。,(五)样本容量指一个样本所包括的单位数。,抽样框与抽样单位,抽样框:为便于抽样工作的组织,在抽样前在可能条件下编制的用来进行抽样的

7、记录或表明总体所有抽样单元的框架。抽样框可以是一份清单(名单抽样框)、一张地图(区域抽样框),它是设计和实施随即抽样所必备的基础条件。 一个理想的抽样框的要求是,它应该尽可能地与目标总体相一致。 一般而言,如果总体中的每个元素在清单上分别只出现一次,且清单上又没有总体以外的其他元素出现,则该清单就是一个完备的抽样框。在完备的抽样框中,每个元素必须且只能同一个号码对应。,(六)样本个数指从一个总体中可能抽取的最多的 样本数量。,1、重复抽样:,2、不重复抽样:,样本可能数目:又称样本个数,是指从一个有N个单位的总体中抽取容量为n的样本时,有可能出现的所有样本的个数,是一种理论概率分布。 样本个数

8、:一个样本包含的单位数。用 “n”表示。一般要求 n 30 在总体单位数N和样本容量n一定的条件下,样本可能数目与抽样方法有关。而在同一抽样方法下,又由于对被抽中的几个单位考虑顺序与否,从而有不等的样本可能数目。,样本可能数目,可能样本数目的计算公式,第二节 抽样误差,一、抽样误差的概念及种类,在抽样推断中,由于随机抽样的偶然因素使样本不足以代表总体而引起的样本指标与被估计的相应总体指标的离差。,(一)抽样误差的概念,抽样误差即指随机误差,这是抽样推断固有的误差,是无法避免的。,(二)抽样误差的种类,一、抽样误差的概念,抽样误差:是指由于随机抽样的偶然因素使样本各单位的结构不足以代表总体各单位

9、的结构,而引起抽样指标与总体指标之间的绝对离差。 影响抽样误差大小的因素: 1)总体各单位标志值的差异程度。 2)样本的单位数。 3)抽样方法及抽样调查的组织形式。不同的抽样组织形式就有不同的抽样误差。而且同一种组织形式的合理程度也影响抽样误差。,二、抽样平均误差,多数样本指标与总体指标都有误差,误差有大、有小,有正、有负,抽样平均误差就是将所有的误差综合起来,再求其平均数。 抽样平均误差:是反映抽样误差一般水平的指标。,二、抽样平均误差,通常用抽样平均数的标准差或抽样成数的标准差来作为衡量其抽样误差一般水平的尺度。 按照标准差的一般意义,抽样平均数(或抽样成数)的标准差是按抽样平均数(或抽样

10、成数)与其平均数的离差平方和计算的,但由于抽样平均数的平均数等于总体平均数,而抽样成数的平均数等于总体成数,抽样指标的标准差恰好反映了抽样指标和总体指标的平均离差程度。,二、抽样平均误差,(一)抽样实际误差,是指每一个样本指标与总体被估计的真实指标之间的离差。,(二)抽样平均误差含义,是指抽样平均数或抽样成数的标准差, 它反映了样本平均数与总体平均数或样本成数与总体成数之间的一般离差。 通常用表示。,(三)实际计算公式 (以纯随机抽样为例),1.重复抽样,2.不重复抽样, 样本平均数的平均数等于总体平均数。 抽样平均数的标准差仅为总体标准差的 可通过调整样本单位数来控制抽样平均误差。,抽样平均

11、误差所反映的内容,某灯泡厂从一天所生产的产品10,000个中抽取100个检查其寿命,得平均寿命为2000小时,样本标准差为20小时,试求抽样平均误差。,重复抽样:,若不重复抽样:,某玻璃器皿厂某日生产15000只印花玻璃杯,现按重复抽样方式从中抽取150只进行质量检验,有147只合格,试求这批印花玻璃杯合格率的抽样平均误差。,(四)抽样误差的影响因素:,4. 不同的抽样组织形式(简单抽样,类型抽样,等距抽样,整群抽样)。,1. 全及总体标志变异程度。,2. 抽样单位数目的多少n。,3. 不同的抽样方法(重复和不重复)。,三、抽样极限误差,样本指标与总体指标之间允许的误差范围叫抽样极限误差。也称

12、抽样允许误差。它是样本指标可允许变动的上限或下限与总体指标之差的绝对值。,即:,四、抽样极限误差的概率度,基于概率估计的要求,抽样极限误差通常需要以抽样平均误差 或 为标准单位来衡量。把极限误差 或 分别除以 或 的得相对数t,表示误差范围为抽样平均误差的t倍。t是测量估计可靠程度的一个参数称为抽样误差的概率度。,根据中心极限定理,得知当n足够大时,抽样总体为正态分布。 根据正态分布规律可知,样本指标是以一定的概率落在某一特定的区间内,统计上把这个给定的区间叫抽样极限误差,也称置信区间,即在概率F(t)的保证下: 抽样极限误差=t,(t为概率度),当F(t)=68.27%时,抽样极限误差等于抽

13、样平均误差的1倍(t=1); 当F(t)=95.45%时,抽样极限误差等于抽样平均误差的2倍(t=2); 当F(t)=99.73%时,抽样极限误差等于抽样平均误差的3倍(t=3);,可见,抽样极限误差,即扩大或缩小了以后的抽样误差范围。,上例资料编成次数分配表如下:,-30 样本个数 样本频率 样本累计频率 0 5 0.20 0.20 5 8 0.32 0.52 10 6 0.24 0.76 15 4 0.16 0.92 20 2 0.08 1.00 合计 25 1.00 ,第三节 抽样估计和推算,一、统计量选择的标准,(一)无偏性,(二)一致性,(三)有效性,(一)点估计(定值估计),二、抽

14、样估计的方法,点估计 (概念要点),从总体中抽取一个样本,根据该样本的统计量对总体的未知参数作出一个数值点的估计 例如: 用样本均值作为总体未知均值的估计值就是一个点估计 点估计没有给出估计值接近总体未知参数程度的信息 点估计的方法有矩估计法、顺序统计量法、最大似然法、最小二乘法等,1. 用于估计总体某一参数的随机变量 如样本均值,样本比例、样本中位数等 例如: 样本均值就是总体均值的一个估计量 如果样本均值 x = 3 ,则 3 就是 的估计值 理论基础是抽样分布,估计量 (概念要点),估计量的优良性准则 (无偏性),无偏性:估计量的数学期望等于被估计的总体 参数,估计量的优良性准则 (有效

15、性),有效性:一个方差较小的无偏估计量称为一个更 有效的估计量。如,与其他估计量相比 ,样本均值是一个更有效的估计量,估计量的优良性准则 (一致性),一致性:随着样本容量的增大,估计量越来越 接近被估计的总体参数,(二)区间估计,是根据样本指标和抽样误差去推断全及指标的可能范围,并能反映出估计的准确程度和把握程度。,由于区间估计所表示的是一个可能的范围,而不是一个绝对可靠的范围。就是说,推断全及指标在这个范围内只有一定的把握程度。用数学的语言讲,就是有一定的概率。,总体参数的区间估计 (抽样误差范围的概率保证度),在确定允许的抽样误差范围后,从主观愿望说,希望抽样调查的结果,样本指标的估计值都

16、能够落在允许的误差范围内,但这并非都能实现的事情。 由于抽样指标值随着样本的变动而变动,它本身是个随机变量,因而抽样指标和总体指标的误差仍然是个随机变量,不能保证误差不超过一定范围的这件事是必然的,而只能给以一定程度的概率保证。 抽样估计置信度就是表明抽样指标和总体指标的误差不超过一定范围的概率保证程度。,落在总体均值某一区间内的样本,总体参数的区间估计(概念),总体参数区间的基本特点:是根据给定的概率保证程度的要求,利用实际抽样资料,指出总体被估计值的上限和下限,即指出总体参数可能存在的区间范围。 换句话说,对于总体的被估计指标X,找出样本的两个估计量x1和x2,使被估计指标X落在区间(x1,x2)内的概率1-,(01),为已知的。即P(xXx)=1一是给定的。我们称区间( x1,x2 )为总体指标X的置信区间,其估计置信度为1一,称为显著性水平,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号