第5章抽样推断——2抽样误差课件

资源描述

《第5章抽样推断——2抽样误差课件》由会员分享，可在线阅读，更多相关《第5章抽样推断——2抽样误差课件（41页珍藏版）》请在金锄头文库上搜索。

1、2020/7/31,1,第五章抽样推断,第二节抽样误差 (本章的重点和难点),2020/7/31,2,内容体系,一、抽样误差的意义（一）抽样误差（二）抽样误差产生的原因（三）影响抽样误差大小的因素二、抽样平均误差（一）样本平均数的抽样平均误差（二）样本成数的抽样平均误差三、抽样极限误差抽样极限误差的含义和定义公式四、概率度t和置信度F(t),抽样误差的理论问题,2020/7/31,3,一、抽样误差的意义,抽样误差的大小表明抽样效果的好坏，抽样误差越小，样本的代表性越高；反之，越低 (一)抽样误差的含义指按照随机原则，从总体中抽出样本，由于样本的结构与总体的结构有差距，从

2、而引起的样本指标和全及指标之间的离差. 离差的正负没有区别，所以经常用绝对离差表示抽样误差,计算抽样误差时，一般假定不存在登记性误差和系统误差,2020/7/31,4,（二）抽样误差产生的原因,用调查中的误差来源来说明,2020/7/31,5,调查中的误差来源,调查中的误差,登记性误差 (工作性误差),代表性误差,是差错，可以尽可能地避免,抽样误差。不是差错，不可避免，随机抽样特有的，可以计算并控制,违反随机原则抽样，可避免,2020/7/31,6,(三)影响抽样误差大小的因素,1.总体各单位标志值的差异程度或2 正向关系 2.样本容量的大小 n 反向关系,2020/7/31,7,影响抽样误

3、差大小的因素(续),3.抽样方法重复/不重复不重复抽样的误差重复抽样的误差 4.抽样调查的组织形式等距抽样、分层抽样简单随机抽样整群抽样,2020/7/31,8,影响抽样误差大小的因素(续),1.总体各单位标志值的差异程度或2 2.样本容量的大小n 3.抽样方法重复/不重复 4.抽样调查的组织形式,客观存在无法改变,目标：主观确定2、3、4来适应1，使误差控制在我们期望的范围之内,2020/7/31,9,抽样平均误差引论个别样本的抽样误差,【例】设一个总体，含有4个元素(个体)，即总体单位数N=4。4个单位的变量值分别为X1=1、X2=2、X3=3 、X4=4。总体的均值=2.5 现

4、从总体中抽取n2的简单随机样本在考虑顺序重复抽样条件下，共有多少个样本？ 42=16个样本把所有可能的样本列到下面的表格中：, 计算出各样本的均值,计算出各样本的抽样误差,个别样本的抽样误差,所有样本的平均抽样误差怎样来表示呢？,2020/7/31,12,是所有可能样本的样本指标与总体指标的平均离差。 x样本平均数的抽样平均误差 p样本成数的抽样平均误差,二、抽样平均误差,上式被称为抽样平均误差的理论公式，为什么？ 1.总体指标未知 2.实践中只会抽取一个样本，不会抽出所有可能的样本,2020/7/31,13,抽样平均误差又称为抽样标准误,可以变换为：,前提条件：,中心极限定理已经证明了,

5、2020/7/31,14,可以看出，x与成正比，与n的平方根成反比,抽样平均误差的实际计算公式,（一）样本平均数的抽样平均误差x 1、重复抽样条件下,抽样平均误差性质讨论,(1)样本平均数的平均数是不是总体平均数? (2)抽样平均误差是不是样本平均数的标准差? (3)抽样平均误差与总体标准差的计算关系是什么? 【例】设一个总体，含有4个元素(个体) ，即总体单位数N=4。4个单位的变量值分别为X1=1、X2=2、X3=3 、X4=4 。总体的均值、方差,2020/7/31,16,从总体中抽取n2的简单随机样本，在考虑顺序重复抽样条件下，共有42=16个可能的样本,抽样平均误差性质讨论,2020

6、/7/31,17, 计算出各样本的均值,抽样平均误差性质讨论,2020/7/31,18,抽样平均误差性质讨论,2020/7/31,19,抽样平均误差性质讨论,2020/7/31,20,（1）样本平均数的平均数等于总体平均数,（2）抽样平均误差仅为总体标准差的,（3）可以通过调整样本单位数n来控制抽样平均误差的大小,抽样平均误差性质讨论,是总体参数客观存在不可改变,2020/7/31,21,性质举例：将样本容量增加3倍，则抽样平均误差会缩小一半,抽样平均误差减少20%，则样本容量就需要变为原来的 1.56倍,2020/7/31,22,（一）样本平均数的抽样平均误差x,2、不重复抽样条件下,在

7、总体单位数N很大的情况下，N-1N,近似表示为：,2020/7/31,23,总体标准差未知时的处理,2未知，怎么办？ 1.以往的经验数据 2.以样本方差近似代替,2020/7/31,24,1、重复抽样条件下,（二）样本成数的抽样平均误差p,2、不重复抽样条件下,在N很大的情况下，可近似表示为：,2=P(1-P),P未知，一般以p替代,2020/7/31,25,说明,重复抽样的x都要大于不重复抽样的x ，因为有限总体修正系数1-n/N1；但是，在n/N很小时，二者相差甚微，所以，当n/N0.01时，直接将不重复抽样按重复抽样来计算以上结论都是在简单随机抽样的前提下得出的，在其他抽样组织形式

8、下公式会有差异 2未知时，要会合理的替代,2020/7/31,26,抽样平均误差例题分析P192例5-3,要求：按产品质量要求，耐用时数达到和超过1000小时为合格品，求该批灯管平均耐用时数和合格率的抽样平均误差。,N=10000,2020/7/31,27,解答,解：根据表中资料，计算得到： 200支灯管的平均耐用时数,耐用时数的标准差,灯管的合格率,2020/7/31,28,重复抽样,灯管平均耐用时数的抽样平均误差,灯管合格率的抽样平均误差,2020/7/31,29,不重复抽样,灯管平均耐用时数的抽样平均误差,灯管合格率的抽样平均误差,2020/7/31,30,1、重复抽样条件下,总结：抽

9、样平均误差公式,2、不重复抽样条件下,在N很大的情况下，可近似表示为：,2020/7/31,31,三、抽样极限误差,抽样误差是越小越好吗？,抽样误差小,标准：将抽样误差控制在我们能承受的范围内,抽样极限误差,人为确定的,2020/7/31,32,含义和定义公式(p193),抽样极限误差又称允许误差，是根据研究任务要求和被研究总体差异程度确定的可允许的最大抽样误差范围，一般用表示，它等于样本指标可允许变动的上、下限与总体指标的绝对离差。 x平均数的抽样极限误差 p成数的抽样极限误差这个误差范围是人为给定的，是区间估计中为了得到一个可靠性估计而专门设计的的定义公式为了理解并引出置信区间表达

10、式，对上述定义公式作如下的代数变换：,2020/7/31,33,定义公式的等价变换,等价变换为下列不等式：,x的含义，是希望所抽到的样本的样本平均数能落在内，从而样本对总体的代表性足够高,p的含义，是希望所抽到的样本的样本平均数能落在内,2020/7/31,34,由于总体平均数和总体成数是未知的，抽样调查的目的就是要用样本指标来估计它们，因此上述不等式进一步变换为：这就是我们需要的区间估计式，即置信区间的表达形式,区间估计式,2020/7/31,35,与之间的关系理解(重点理解),同一个总体中，在抽样组织方式、抽样方法、样本容量一定的条件下，是一个确定的数值是人为规定的，是人们根据研究

11、目的确定的，它的大小与人们期望的估计精度和估计可靠性有关一般用t 倍的来表示，通常是通过人为规定t 来控制客观存在，因此人为规定和人为规定t或F(t)是等价的,2020/7/31,36,概率度t，是用除以相应的后得到 t本质上是标准化后的变量，标准化过程为,四、概率度t与概率F(t),2020/7/31,37,在大样本条件下，样本平均数服从正态分布样本成数服从正态分布,中心极限定理证明了,2020/7/31,38,正态分布概率值t与F(t)的关系,概率F(t)，称为概率保证程度或置信度、可靠程度等，用以表示样本指标与总体指标之间的误差不超过一定范围的概率的大小,2020/7/31,39,常用概率度和概率,给定t值，就可以查正态概率分布表得到相应的概率,F(t)是t的单调增函数,2020/7/31,40,概率度t的作用,t实际上是衡量概率F(t)的一个尺度、标准，所以称为概率度作用： 1.通过t，建立了与之间的数量关系 =t 2.通过t，也建立了区间的大小与估计把握程度F(t)之间的关系,2020/7/31,41,5.2结束,谢谢大家！,

展开阅读全文

第5章抽样推断——2抽样误差课件

最新文档