统计学原理第五版李洁明祁新娥6抽样调查课件

上传人:桔**** 文档编号:567965904 上传时间:2024-07-22 格式:PPT 页数:113 大小:798KB
返回 下载 相关 举报
统计学原理第五版李洁明祁新娥6抽样调查课件_第1页
第1页 / 共113页
统计学原理第五版李洁明祁新娥6抽样调查课件_第2页
第2页 / 共113页
统计学原理第五版李洁明祁新娥6抽样调查课件_第3页
第3页 / 共113页
统计学原理第五版李洁明祁新娥6抽样调查课件_第4页
第4页 / 共113页
统计学原理第五版李洁明祁新娥6抽样调查课件_第5页
第5页 / 共113页
点击查看更多>>
资源描述

《统计学原理第五版李洁明祁新娥6抽样调查课件》由会员分享,可在线阅读,更多相关《统计学原理第五版李洁明祁新娥6抽样调查课件(113页珍藏版)》请在金锄头文库上搜索。

1、统计学原理第五版 李洁明 祁新娥6抽样调查第六章第六章 抽样调查 统计学原理第五版 李洁明 祁新娥6抽样调查第一节第一节 抽样调查的意义抽样调查的意义 一、抽样调查的概念一、抽样调查的概念一一般所讲的般所讲的抽样调查抽样调查,即指,即指狭义的抽样调狭义的抽样调查查(随机抽样随机抽样):按照随机原则从总体中抽取:按照随机原则从总体中抽取一部分单位进行观察,并运用数理统计的原一部分单位进行观察,并运用数理统计的原理,以被抽取的那部分单位的数量特征为代理,以被抽取的那部分单位的数量特征为代表,对总体作出数量上的推断分析。表,对总体作出数量上的推断分析。统计学原理第五版 李洁明 祁新娥6抽样调查二、抽

2、样调查的特点二、抽样调查的特点 (一)抽样调查的目的是由部分来推断整体。(一)抽样调查的目的是由部分来推断整体。(二)抽选部分单位时要遵循随机原则(二)抽选部分单位时要遵循随机原则(三)抽样调查会产生抽样误差,抽样误差可(三)抽样调查会产生抽样误差,抽样误差可以计算,并且可以加以控制。以计算,并且可以加以控制。统计学原理第五版 李洁明 祁新娥6抽样调查三、抽样调查的适用范围三、抽样调查的适用范围 抽抽样调查方法是市场经济国家在调查方法样调查方法是市场经济国家在调查方法上的必然选择,和普查相比,它具有准确度高、上的必然选择,和普查相比,它具有准确度高、成本低、速度快、应用面广等优点。成本低、速度

3、快、应用面广等优点。统计学原理第五版 李洁明 祁新娥6抽样调查(一)实(一)实际工作不可能进行全面调查观察,而又需要际工作不可能进行全面调查观察,而又需要了解其全面资料的事物;了解其全面资料的事物;(二)虽(二)虽可进行全面调查观察,但比较困难或并不必可进行全面调查观察,但比较困难或并不必要;要;(五)对(五)对普查或全面调查统计资料的质量进行检查和普查或全面调查统计资料的质量进行检查和修正;修正;(四)在(四)在有些情况下,抽样调查的结果比全面调查要有些情况下,抽样调查的结果比全面调查要准确。准确。(七)利(七)利用抽样推断的方法,可以对于某种总体的假用抽样推断的方法,可以对于某种总体的假设

4、进行检验,判断这种假设的真伪,以决定取舍。设进行检验,判断这种假设的真伪,以决定取舍。一般适用于以下范围:一般适用于以下范围:(三)(三)和和全面调查相比较,抽样调查能节省人力、费全面调查相比较,抽样调查能节省人力、费用和时间,而且比较灵活用和时间,而且比较灵活(六)(六)抽抽样调查方法可以用于工业生产过程中的质量样调查方法可以用于工业生产过程中的质量控制。控制。统计学原理第五版 李洁明 祁新娥6抽样调查一、一、全及总体和抽样总体全及总体和抽样总体(一一) 全及总体,简称总体全及总体,简称总体全全及总体:所要认识对象的全体。及总体:所要认识对象的全体。 总体单位数用总体单位数用N表示。表示。全

5、全 及及总体按其单位标志性质不同分为:变总体按其单位标志性质不同分为:变量总体和属性总体。量总体和属性总体。 变量总体可以用数量标示加以计量。变量总体可以用数量标示加以计量。 属性总体用文字描写属性特征。如:属性总体用文字描写属性特征。如:完好、非完好。完好、非完好。第二节第二节 抽样调查的基本概念及理论依据抽样调查的基本概念及理论依据 统计学原理第五版 李洁明 祁新娥6抽样调查一、一、全及总体和抽样总体全及总体和抽样总体(二二) 抽样总体,简称样本抽样总体,简称样本第二节第二节 抽样调查的基本概念及理论依据抽样调查的基本概念及理论依据 抽抽样总体:抽取出来调查观察的单位。样总体:抽取出来调查

6、观察的单位。 抽样总体的单位数用抽样总体的单位数用n表示。表示。 n 30 大样本大样本 n 30 小样本小样本统计学原理第五版 李洁明 祁新娥6抽样调查 二、二、 全及指标和抽样指标全及指标和抽样指标( (总体指标和样本指标总体指标和样本指标) )全全及指标:全及总体的那些指标。及指标:全及总体的那些指标。(一)全及指标(一)全及指标统计学原理第五版 李洁明 祁新娥6抽样调查 (二)抽样指标(二)抽样指标抽抽样指标:抽样总体的那些指标。样指标:抽样总体的那些指标。统计学原理第五版 李洁明 祁新娥6抽样调查 (三)统计抽样过程(图(三)统计抽样过程(图6-16-1,p255p255)统计学原理

7、第五版 李洁明 祁新娥6抽样调查 三、抽样方法和样本可能数目三、抽样方法和样本可能数目根据取样的方式不同,抽样方式分为:重复抽样和不重复抽样。根据取样的方式不同,抽样方式分为:重复抽样和不重复抽样。根据对样本的要求不同,抽样方式分为:考虑顺序抽样和不考根据对样本的要求不同,抽样方式分为:考虑顺序抽样和不考虑顺序抽样。虑顺序抽样。抽样方法抽样方法样本可能数目(样本可能数目(p256-257p256-257,了解),了解)统计学原理第五版 李洁明 祁新娥6抽样调查1. 1. 如果是重复抽样:如果是重复抽样:例例统计学原理第五版 李洁明 祁新娥6抽样调查2. 2. 如果是不重复抽样如果是不重复抽样:

8、考虑顺序的不重复抽样:考虑顺序的不重复抽样:例例统计学原理第五版 李洁明 祁新娥6抽样调查不考虑顺序的不重复抽样不考虑顺序的不重复抽样:例例统计学原理第五版 李洁明 祁新娥6抽样调查 四、抽样调查的理论依据(四、抽样调查的理论依据(p257-259p257-259,了解),了解)(1)独立同分布大数定律)独立同分布大数定律(2)贝努大数定律)贝努大数定律1.1.大数定律大数定律2.2.中心极限定理(中心极限定理(p256-257p256-257,了解),了解)(1)独立同分布中心极限定理)独立同分布中心极限定理(2)德莫佛)德莫佛-拉普拉斯中心极限定理拉普拉斯中心极限定理统计学原理第五版 李洁

9、明 祁新娥6抽样调查第三节第三节 抽样平均误差抽样平均误差 一、抽样误差的概念一、抽样误差的概念在统计调查中,调查资料与实际情况不一致,在统计调查中,调查资料与实际情况不一致,两者的偏离称为统计误差。两者的偏离称为统计误差。统计学原理第五版 李洁明 祁新娥6抽样调查抽样误差抽样误差即指随机误差,这种误差是抽即指随机误差,这种误差是抽样调查固有的误差,是无法避免的。样调查固有的误差,是无法避免的。统计学原理第五版 李洁明 祁新娥6抽样调查二、影响抽样平均误差的因素二、影响抽样平均误差的因素 (一)(一) 全全及总体标志变异程度。及总体标志变异程度。正比关系正比关系(二)(二)抽抽样单位数目的多少

10、。样单位数目的多少。反比关系反比关系(三)抽样的组织方式。(三)抽样的组织方式。统计学原理第五版 李洁明 祁新娥6抽样调查三、抽样平均误差的意义三、抽样平均误差的意义1. 在在于说明样本指标的代表性大小。于说明样本指标的代表性大小。 误差大,则样本指标代表性低;误差大,则样本指标代表性低; 误差小,则样本指标代表性高;误差小,则样本指标代表性高; 误差等于误差等于0,则样本指标和总体指标一样大。,则样本指标和总体指标一样大。2. 说说明样本指标和总体指标相差的一般范围。明样本指标和总体指标相差的一般范围。3. 确定抽样单位数多少的计算依据。确定抽样单位数多少的计算依据。统计学原理第五版 李洁明

11、 祁新娥6抽样调查四、抽样平均误差的计算四、抽样平均误差的计算 抽样平均误差抽样平均误差实际上是样本指标的标准差。实际上是样本指标的标准差。通常用通常用表示。表示。(一)抽样平均数的抽样平均误差(一)抽样平均数的抽样平均误差统计学原理第五版 李洁明 祁新娥6抽样调查1. 1. 重复抽样条件下抽样平均数的抽样平均误差重复抽样条件下抽样平均数的抽样平均误差统计学原理第五版 李洁明 祁新娥6抽样调查2. 2. 不重复抽样条件下抽样平均数的抽样平均误差不重复抽样条件下抽样平均数的抽样平均误差统计学原理第五版 李洁明 祁新娥6抽样调查四、抽样平均误差的计算四、抽样平均误差的计算 (二)抽样成数的抽样平均

12、误差(二)抽样成数的抽样平均误差重复抽样条件下抽样成数的抽样平均误差重复抽样条件下抽样成数的抽样平均误差不重复抽样条件下抽样成数的抽样平均误差不重复抽样条件下抽样成数的抽样平均误差统计学原理第五版 李洁明 祁新娥6抽样调查四、抽样平均误差的计算四、抽样平均误差的计算 1.1.用过去调查所得的资料。用过去调查所得的资料。3.3.用小规模调查资料。用小规模调查资料。2.2.用样本方差的资料代替总体方差。用样本方差的资料代替总体方差。4.4.用估计的材料。用估计的材料。(三)抽样平均误差计算实例(三)抽样平均误差计算实例(p270-271)统计学原理第五版 李洁明 祁新娥6抽样调查例统计学原理第五版

13、 李洁明 祁新娥6抽样调查101010-20 400102015-15 225103020-10 100104025 -5 25105030 0 0201015-15 225202020-10 100203025 -5 25204030 0 0205035 5 25301020-10 100302025 -5 25303030 0 0304035 5 2530504010 100401025 -5 25402030 0 0403035 5 2540404010 10040504515 225501030 0 0502035 5 2550304010 10050404515 22550 5050

14、20 400合 计-2 500接左:接左:统计学原理第五版 李洁明 祁新娥6抽样调查统计学原理第五版 李洁明 祁新娥6抽样调查以上资料编成次数分配表如下:以上资料编成次数分配表如下:样本数样本数f (f (即次数分配即次数分配) )101-20152-15203-10254 -5305 0354 5403 10452 15501 20合计 25 -统计学原理第五版 李洁明 祁新娥6抽样调查 抽抽样误差差是所有可能出是所有可能出现的的样本指本指标的的标准准差。它是由于抽差。它是由于抽样的随机性而的随机性而产生的生的样本指本指标与与总体指体指标之之间的平均离差。的平均离差。 统计学原理第五版 李洁

15、明 祁新娥6抽样调查抽取样本抽取样本样本平均数样本平均数离差离差10 2015-1522510 3020-1010010 4025 -5 2510 5030 0 020 3025 -5 2520 4030 0 020 5035 5 2530 4035 5 2530 50401010040 504515225合 计-750上例五户中抽取二户调查,如采取不考虑顺序的不重复抽上例五户中抽取二户调查,如采取不考虑顺序的不重复抽样方法,则:样方法,则:统计学原理第五版 李洁明 祁新娥6抽样调查 第四节第四节 全及指标的推断全及指标的推断 一、抽样推断要求一、抽样推断要求抽样推断就是按照已经抽定的样本指标

16、来估抽样推断就是按照已经抽定的样本指标来估计总体指标,或其所在的区间范围。计总体指标,或其所在的区间范围。统计学原理第五版 李洁明 祁新娥6抽样调查只要在样本代表性大,且对全及指标精确只要在样本代表性大,且对全及指标精确性要求不高的情况下,满足下列三个准则性要求不高的情况下,满足下列三个准则:无偏性无偏性一致性一致性有效性有效性就会得到合理的估计。就会得到合理的估计。抽样指标估计总体指标有三个要求:(抽样指标估计总体指标有三个要求:(p272)统计学原理第五版 李洁明 祁新娥6抽样调查( (一一) )点估计点估计例二、抽样推断的方法二、抽样推断的方法统计学原理第五版 李洁明 祁新娥6抽样调查1

17、.1.直接换算法直接换算法抽样平均数抽样平均数(成数成数)总体单位数总体单位数=总体标志总量总体标志总量1.如如果采用点估计方法:上例果采用点估计方法:上例1中:中:40010000=400(万千克万千克) 如果用区间估计方法:上例如果用区间估计方法:上例1中该农场小麦总产量的范围为:中该农场小麦总产量的范围为: t=2: (397.62 402.38)10000=397.62 402.38(万千克万千克) t=3: (396.43 403.57)10000=396.43 403.57(万千克万千克) 2.上上例例2中,全部一级品数量的范围为:中,全部一级品数量的范围为: (92.82% 97

18、.18%)8000=7425.6 7774.4(件件)统计学原理第五版 李洁明 祁新娥6抽样调查2. 2. 修正分数法修正分数法就就是用抽样所得的调查结果同有关资料对是用抽样所得的调查结果同有关资料对比的系数来修正全面统计资料时采用的一种比的系数来修正全面统计资料时采用的一种方法。方法。统计学原理第五版 李洁明 祁新娥6抽样调查 某村某村60006000农户,农户,20052005年年末统计养猪头数,年年末统计养猪头数,从下往上报的是从下往上报的是90009000头,现抽头,现抽1010(600(600户户) )的的农户再复查一下,发现有漏报,也有重报。按农户再复查一下,发现有漏报,也有重报。

19、按600600户,原来数字是户,原来数字是890890头,实际复查为头,实际复查为935935头,头,故总的来说,是少报。故总的来说,是少报。例例1统计学原理第五版 李洁明 祁新娥6抽样调查某市房地局,年报工资总额某市房地局,年报工资总额3218.13218.1万元。万元。现抽查现抽查1414个单位:个单位: 年报:年报:415.03415.03万元万元 多报:多报:0.440.44万元万元 少报:少报:1.471.47万元万元抵冲后抵冲后 1.47-0.44=1.03(1.47-0.44=1.03(万元万元) )例2统计学原理第五版 李洁明 祁新娥6抽样调查( (二二) )区间估计区间估计根

20、据样本指标和抽样误差去推断全根据样本指标和抽样误差去推断全及指标的可能范围,它能说清楚估计的及指标的可能范围,它能说清楚估计的准确程度和把握程度。准确程度和把握程度。1.区间估计的意义区间估计的意义统计学原理第五版 李洁明 祁新娥6抽样调查 抽样极限误差又叫抽样误差范围,也称置信区间,是变抽样极限误差又叫抽样误差范围,也称置信区间,是变动的抽样指标与确定的全及指标之间的离差的可能范围。动的抽样指标与确定的全及指标之间的离差的可能范围。2.抽样极限误差抽样极限误差 抽样误差范围的实际意义抽样误差范围的实际意义是要求被估计的是要求被估计的全及指标全及指标 或或P落在抽样指标一定范围内,即落在抽样指

21、标一定范围内,即落在落在 或或的范围内。的范围内。统计学原理第五版 李洁明 祁新娥6抽样调查当当F(t)=68.27%F(t)=68.27%时,抽样极限误差等于抽样平均误差的时,抽样极限误差等于抽样平均误差的1 1倍倍(t=1);(t=1);当当F(t)=95.45%F(t)=95.45%时,抽样极限误差等于抽样平均误差的时,抽样极限误差等于抽样平均误差的2 2倍倍(t=2);(t=2);当当F(t)=99.73%F(t)=99.73%时,抽样极限误差等于抽样平均误差的时,抽样极限误差等于抽样平均误差的3 3倍倍(t=3);(t=3);例例3.可信程度可信程度抽样极限误差抽样极限误差=t,(,

22、(t为概率度)为概率度)可见,抽样极限误差,即扩大或缩小了以后的可见,抽样极限误差,即扩大或缩小了以后的抽样误差范围。抽样误差范围。P(277)统计学原理第五版 李洁明 祁新娥6抽样调查统计学原理第五版 李洁明 祁新娥6抽样调查某农场进行小麦产量的抽样调查,该农场小麦播种面积为某农场进行小麦产量的抽样调查,该农场小麦播种面积为1000010000亩,采用不重复的简单随机抽样从中选亩,采用不重复的简单随机抽样从中选100100亩作为样亩作为样本,进行实割实测,得到样本的平均亩产量为本,进行实割实测,得到样本的平均亩产量为400400千克,千克,样本标准差为样本标准差为1212千克。千克。则:则:

23、例例1统计学原理第五版 李洁明 祁新娥6抽样调查 某机械厂日产某种产品某机械厂日产某种产品80008000件,现采用纯随机不重复件,现采用纯随机不重复抽样方式抽样方式( (按重复抽样公式计算按重复抽样公式计算) ),从中抽取,从中抽取400400件进行观件进行观察,其中有察,其中有380380件为一级品,试以概率件为一级品,试以概率95.45%95.45%的可靠程度的可靠程度推断全部产品的一级品率及一级品数量的范围。推断全部产品的一级品率及一级品数量的范围。则:抽样一级品率:则:抽样一级品率:例例2统计学原理第五版 李洁明 祁新娥6抽样调查 第五节第五节 抽样方案设计抽样方案设计 搞好抽样设计

24、必须掌握两个基本原则:搞好抽样设计必须掌握两个基本原则:(一)保证实现抽样随机性的原则(一)保证实现抽样随机性的原则(二)保证实现最大的抽样效果的原则(二)保证实现最大的抽样效果的原则 在一定的误差和可靠性的要求下选择费在一定的误差和可靠性的要求下选择费用最少的样本设计。用最少的样本设计。一、抽样方案设计的基本原则一、抽样方案设计的基本原则统计学原理第五版 李洁明 祁新娥6抽样调查二、简单随机抽样二、简单随机抽样( (纯随机抽样纯随机抽样) )即从总体单位中不加任何分组、排队,即从总体单位中不加任何分组、排队,完全随机地抽取调查单位。完全随机地抽取调查单位。随机抽选可有各种不同的具体做法,如:

25、随机抽选可有各种不同的具体做法,如:(一)直接抽选法;(一)直接抽选法;(二)抽签法;(二)抽签法;(三)随机数码表法;(三)随机数码表法;统计学原理第五版 李洁明 祁新娥6抽样调查纯随机抽样的抽样平均误差纯随机抽样的抽样平均误差 (一一) 平均数的抽样平均误差平均数的抽样平均误差1.重重复抽样复抽样统计学原理第五版 李洁明 祁新娥6抽样调查取得取得的途径有的途径有:(:(了解了解) ) 1.用用过去全面调查或抽样调查的资料,若同时有过去全面调查或抽样调查的资料,若同时有n个个的资料,应选用数值较大的那个;的资料,应选用数值较大的那个;2. 用用样本标准差样本标准差S代替全及标准差代替全及标准

26、差;3. 在在大规模调查前,先搞个小规模的试验性的调查来确大规模调查前,先搞个小规模的试验性的调查来确定定S,代替,代替;4. 用用估计的方法。估计的方法。统计学原理第五版 李洁明 祁新娥6抽样调查 某灯泡厂从一天所生产的产品某灯泡厂从一天所生产的产品10,00010,000个中抽取个中抽取100100个检查其寿命,得平均寿命为个检查其寿命,得平均寿命为20002000小时小时( (一般为重复抽样一般为重复抽样) ),根据以往资料:,根据以往资料:=20=20小小时,时,根据以往资料,产品质量不太稳定,若根据以往资料,产品质量不太稳定,若=200=200小时,小时,例例统计学原理第五版 李洁明

27、 祁新娥6抽样调查2.2.不不重复抽样重复抽样:统计学原理第五版 李洁明 祁新娥6抽样调查( (二二) ) 成数的抽样平均误差成数的抽样平均误差 已证明得:已证明得:成数的方差为成数的方差为p(1-p) 统计学原理第五版 李洁明 祁新娥6抽样调查 某玻璃器皿厂某日生产某玻璃器皿厂某日生产1500015000只印花玻璃杯,现只印花玻璃杯,现按重复抽样方式从中抽取按重复抽样方式从中抽取150150只进行质量检验,结只进行质量检验,结果有果有147147只合格,其余只合格,其余3 3只为不合格品,试求这批印只为不合格品,试求这批印花玻璃杯合格率花玻璃杯合格率( (成数成数) )的抽样平均误差。的抽样

28、平均误差。例例统计学原理第五版 李洁明 祁新娥6抽样调查三、类型抽样三、类型抽样( (分类抽样分类抽样) )先对总体各单位按一定标志加以分类先对总体各单位按一定标志加以分类(层层),然后再从各类,然后再从各类(层层)中按随机原则抽取中按随机原则抽取样本,组成一个总的样本。样本,组成一个总的样本。 统计学原理第五版 李洁明 祁新娥6抽样调查类型抽样的作用:类型抽样的作用:1.利用已知的信息提高抽样的效率。2.抽样的组织工作比较方便。3.掌握总体中各个子总体的情况。统计学原理第五版 李洁明 祁新娥6抽样调查两种类型抽样方法:两种类型抽样方法:1.等等比例类型抽样比例类型抽样(类型比例抽样类型比例抽

29、样);2.不不等比例类型抽样等比例类型抽样(类型适宜抽样类型适宜抽样)。统计学原理第五版 李洁明 祁新娥6抽样调查(一)类型比例抽样方法的单位数的确定(一)类型比例抽样方法的单位数的确定统计学原理第五版 李洁明 祁新娥6抽样调查(二)类型适宜抽样方法单位数的确定(二)类型适宜抽样方法单位数的确定 对于标志变动程度大的组,抽取样本单位数的比例相应要对于标志变动程度大的组,抽取样本单位数的比例相应要大些;反之,对于标志变动程度小的组,抽取样本的单位大些;反之,对于标志变动程度小的组,抽取样本的单位数的比例相应地可小些。数的比例相应地可小些。统计学原理第五版 李洁明 祁新娥6抽样调查(三)类型抽样之

30、抽样误差的计算(三)类型抽样之抽样误差的计算 在重复抽样情况下在重复抽样情况下:统计学原理第五版 李洁明 祁新娥6抽样调查统计学原理第五版 李洁明 祁新娥6抽样调查 某农场种小麦某农场种小麦1200012000公顷,其中平原公顷,其中平原36003600公顷,丘陵公顷,丘陵60006000公顷,山地公顷,山地24002400公顷,现用类型抽样法调查公顷,现用类型抽样法调查12001200公公顷,以各种麦田占全农场面积的比重分配抽样面积数量。顷,以各种麦田占全农场面积的比重分配抽样面积数量。 麦田类型抽样的平均误差计算表麦田类型抽样的平均误差计算表类类 型型全场播种全场播种面积面积(公顷公顷)抽

31、样调抽样调查面积查面积(公顷)(公顷)单位面积单位面积产量不均产量不均匀程度指匀程度指标标(千克千克)符符 号号Ninii丘陵地区丘陵地区 6000600 750337500000平原地区平原地区 3600360 840254016000山山 地地 24002401000240000000合合 计计120001200-831516000例例统计学原理第五版 李洁明 祁新娥6抽样调查统计学原理第五版 李洁明 祁新娥6抽样调查高产麦田比重的平均误差计算表高产麦田比重的平均误差计算表类别类别高产田高产田比重比重(%)非高产田非高产田比重比重(%)麦田不均匀麦田不均匀程度指标程度指标(%)抽样调查抽样

32、调查面积面积(公顷公顷)pi(1-pi)ni符号符号pi1-pipi(1-pi)ni丘陵丘陵802016 60096.0平原平原9010 9 36032.4山地山地604024 24057.6合计合计-1200 186统计学原理第五版 李洁明 祁新娥6抽样调查四、机械抽样四、机械抽样( (等距抽样等距抽样) ) (一)机械抽样的概念和作用(一)机械抽样的概念和作用概念:先概念:先将全及总体的所有单位按某一标志顺将全及总体的所有单位按某一标志顺序排队,然后按相等的距离抽取样本单位。序排队,然后按相等的距离抽取样本单位。作用:作用:1.简单易行。简单易行。2.机械抽样的误差大小与总体单位的顺序有关

33、。机械抽样的误差大小与总体单位的顺序有关。统计学原理第五版 李洁明 祁新娥6抽样调查1. 选选择标志与抽样调查所研究内容无关,择标志与抽样调查所研究内容无关, 称无关标志排队。称无关标志排队。2. 选选择标志与抽样调查所研究的内容有关,择标志与抽样调查所研究的内容有关, 称有关标志排队。称有关标志排队。研究工人的平均收入水平时,按工号排队。研究工人的平均收入水平时,按工号排队。例例研究工人的生活水平,按工人月工资额高研究工人的生活水平,按工人月工资额高低排队。低排队。例例(二)机械抽样按排队所依据的标志不同,(二)机械抽样按排队所依据的标志不同,分为无关标志排队法和有关标志排队法。分为无关标志

34、排队法和有关标志排队法。统计学原理第五版 李洁明 祁新娥6抽样调查1.随随机起点等距抽样机起点等距抽样k k kk k k k+a 2k+a (n-1)k+a k+a 2k+a (n-1)k+aa ak k(k(k为抽取间隔为抽取间隔) )示意图:示意图:(三)机械抽样按样本单位抽选的方法不同,(三)机械抽样按样本单位抽选的方法不同,分为随机起点等距抽样、半距起点等距抽样分为随机起点等距抽样、半距起点等距抽样和对称等距抽样和对称等距抽样。统计学原理第五版 李洁明 祁新娥6抽样调查2.2.半半距起点等距抽样距起点等距抽样k k kk k kk k(k(k为抽取间隔为抽取间隔) )示意图:示意图:

35、统计学原理第五版 李洁明 祁新娥6抽样调查3.3.对对称等距抽样称等距抽样示意图:示意图:k k kk k k 2k-a 2k+a 4k-a 4k+a 2k-a 2k+a 4k-a 4k+aa ak k(k(k为抽取间隔为抽取间隔) )统计学原理第五版 李洁明 祁新娥6抽样调查机械抽样机械抽样,实际上是一种特殊的类,实际上是一种特殊的类型抽样。因为,如果在类型抽样中,把型抽样。因为,如果在类型抽样中,把总体划分为若干相等部分,每个部分只总体划分为若干相等部分,每个部分只抽一个样本,在这种情况下,则类型抽抽一个样本,在这种情况下,则类型抽样就成了机械抽样。样就成了机械抽样。统计学原理第五版 李洁

36、明 祁新娥6抽样调查1.1.若若按无关标志排队按无关标志排队公式用以上公式用以上纯随机抽样纯随机抽样的公式,一般采用的公式,一般采用不重复抽样公式:不重复抽样公式:(四)机械抽样(四)机械抽样( (等距抽样等距抽样) )的抽样平均误差的抽样平均误差 统计学原理第五版 李洁明 祁新娥6抽样调查2. 2. 若若按有关标志排队按有关标志排队公式用公式用类型抽样类型抽样的公式:的公式:统计学原理第五版 李洁明 祁新娥6抽样调查五、整群抽样五、整群抽样 整群抽样整群抽样即从全及总体中成群地抽取样本单位,对即从全及总体中成群地抽取样本单位,对抽中的群内的所有单位都进行观察。抽中的群内的所有单位都进行观察。

37、整群抽样的作用:整群抽样的作用:1.当总体缺乏包括全部总体单位的抽样框,无法进行当总体缺乏包括全部总体单位的抽样框,无法进行抽选时须采用整群抽样。抽选时须采用整群抽样。2.比较方便和节约费用。比较方便和节约费用。统计学原理第五版 李洁明 祁新娥6抽样调查整群抽样的抽样误差受三个因素影响:整群抽样的抽样误差受三个因素影响: 1.抽抽出的群数出的群数(r)多少多少 (反比关系反比关系)2.群群间方差间方差( ) (正比关系正比关系)3.3.抽抽样方法样方法 统计学原理第五版 李洁明 祁新娥6抽样调查群间方差的计算方法如下:群间方差的计算方法如下:(p294p294)统计学原理第五版 李洁明 祁新娥

38、6抽样调查抽抽样方法样方法 统计学原理第五版 李洁明 祁新娥6抽样调查 假如某一机器大量生产某一种零件,现每隔一小时抽取假如某一机器大量生产某一种零件,现每隔一小时抽取5 5分分钟产品进行检验,用以检查产品的合格率,检查结果如下:钟产品进行检验,用以检查产品的合格率,检查结果如下:合格率合格率群数群数rpipir80% 20.80 1.6-0.09960.0198485% 40.85 3.4-0.04960.0098490%120.90 10.8 0.0004 (太小不计太小不计)95% 30.95 2.85 0.05040.0076298% 30.98 2.94 0.08040.01939合

39、计合计24- 21.59-0.05669例统计学原理第五版 李洁明 祁新娥6抽样调查六、多阶段抽样六、多阶段抽样 多阶段抽样多阶段抽样:即把抽样本单位的过程分为两个或:即把抽样本单位的过程分为两个或几个阶段来进行。几个阶段来进行。(如果一次就直接抽选出具体样本单位,这叫单(如果一次就直接抽选出具体样本单位,这叫单阶段抽样)具体讲:阶段抽样)具体讲: 先抽大单位先抽大单位(可以用类型可以用类型抽样或机械抽样抽样或机械抽样), 再在大单位中抽小单位再在大单位中抽小单位(可用整群抽样或简单随机抽样可用整群抽样或简单随机抽样),小单位中再小单位中再抽更小的单位;而不是一次就直接抽取基层的调抽更小的单位

40、;而不是一次就直接抽取基层的调查单位。查单位。(一)多阶段抽样基本理论和方法(一)多阶段抽样基本理论和方法统计学原理第五版 李洁明 祁新娥6抽样调查六、多阶段抽样六、多阶段抽样 多阶段抽样的作用:多阶段抽样的作用:(1)当抽样调查的面很广,没有一个包括所)当抽样调查的面很广,没有一个包括所有总体单位的抽样框,或者总体范围太大而无有总体单位的抽样框,或者总体范围太大而无法直接抽取样本时,须采用多阶段抽样。法直接抽取样本时,须采用多阶段抽样。(2)可以相对地节约人力与物力。)可以相对地节约人力与物力。(3)可以利用现成的行政区划、组织系统作)可以利用现成的行政区划、组织系统作为划分各阶段的依据,为

41、组织抽样调查提供方为划分各阶段的依据,为组织抽样调查提供方便。便。(一)多阶段抽样基本理论和方法(一)多阶段抽样基本理论和方法统计学原理第五版 李洁明 祁新娥6抽样调查六、多阶段抽样六、多阶段抽样 多阶段抽样的作用:多阶段抽样的作用:(1)当抽样调查的面很广,没有一个包括所有总)当抽样调查的面很广,没有一个包括所有总体单位的抽样框,或者总体范围太大而无法直接体单位的抽样框,或者总体范围太大而无法直接抽取样本时,须采用多阶段抽样。抽取样本时,须采用多阶段抽样。(2)可以相对地节约人力与物力。)可以相对地节约人力与物力。(3)可以利用现成的行政区划、组织系统作为划)可以利用现成的行政区划、组织系统

42、作为划分各阶段的依据,为组织抽样调查提供方便。分各阶段的依据,为组织抽样调查提供方便。(一)多阶段抽样基本理论和方法(一)多阶段抽样基本理论和方法(二)多阶段抽样的实际应用(二)多阶段抽样的实际应用城市住户抽样城市住户抽样调查方案实施(调查方案实施(p301-307p301-307)统计学原理第五版 李洁明 祁新娥6抽样调查多阶段抽样的抽样平均误差多阶段抽样的抽样平均误差 以两阶段抽样为例以两阶段抽样为例设总体分设总体分R组,每组包含组,每组包含 个单位,若各组个单位,若各组 相等,则相等,则在抽样第一阶段,从在抽样第一阶段,从R组中抽出组中抽出r组;组;在抽样第二阶段,在中选的在抽样第二阶段

43、,在中选的r组中随机抽选组中随机抽选 个个单位,若各组单位,若各组m相等,则相等,则n=rm统计学原理第五版 李洁明 祁新娥6抽样调查则则:在重复抽样下:在重复抽样下在不重复抽样下在不重复抽样下统计学原理第五版 李洁明 祁新娥6抽样调查例例 设某大学在学期初对学生进行体重抽样调查,先从设某大学在学期初对学生进行体重抽样调查,先从全校全校80个班以不重复抽样方法随机抽取个班以不重复抽样方法随机抽取8个班,然后个班,然后再从抽取的班中再分别抽取再从抽取的班中再分别抽取10个人作为第二阶段抽个人作为第二阶段抽样单位。计算所得的抽样平均体重为样单位。计算所得的抽样平均体重为60.5千克,抽样千克,抽样

44、各班内方差平均数各班内方差平均数 为为50,各班之间体重方差,各班之间体重方差 为为22。 假设全校各班均为假设全校各班均为40人。试以人。试以94.45%(t=2)的概率,)的概率,推断该校学生平均体重的范围。推断该校学生平均体重的范围。统计学原理第五版 李洁明 祁新娥6抽样调查已知已知:解解:统计学原理第五版 李洁明 祁新娥6抽样调查以上抽样平均误差的公式归纳如下:以上抽样平均误差的公式归纳如下:统计学原理第五版 李洁明 祁新娥6抽样调查第六节第六节 必要抽样单位数的确定必要抽样单位数的确定 一、确定抽样单位数的意义和原则一、确定抽样单位数的意义和原则意义:意义:在抽样调查时,认真研究和确

45、定一个必要在抽样调查时,认真研究和确定一个必要的抽样单位数,对于省时、省力又能保证较好的的抽样单位数,对于省时、省力又能保证较好的抽样调查效果,无疑是具有重要意义的。抽样调查效果,无疑是具有重要意义的。原则:原则:在保证抽样推断能达到预期的可靠程度和在保证抽样推断能达到预期的可靠程度和精确程度的要求下,确定一个恰当的抽取样本单精确程度的要求下,确定一个恰当的抽取样本单位的数目。位的数目。统计学原理第五版 李洁明 祁新娥6抽样调查二、确定抽样单位数的依据二、确定抽样单位数的依据1.决定于调查者对一项抽样推断的可靠程度和精确决定于调查者对一项抽样推断的可靠程度和精确程度的要求。程度的要求。2.抽样

46、单位数决定于总体标志的变异程度。(正比)抽样单位数决定于总体标志的变异程度。(正比)3.抽样单位数决定于不同的抽样组织方法。抽样单位数决定于不同的抽样组织方法。4.结合调查的人力、物力和财力的许可情况加以适结合调查的人力、物力和财力的许可情况加以适当调整,然后作出最后的确定。当调整,然后作出最后的确定。统计学原理第五版 李洁明 祁新娥6抽样调查二、确定抽样单位数的依据二、确定抽样单位数的依据统计学原理第五版 李洁明 祁新娥6抽样调查( (一一) ) 简单随机抽样简单随机抽样三、确定抽样单位数的计算公式三、确定抽样单位数的计算公式统计学原理第五版 李洁明 祁新娥6抽样调查( (二二) ) 类型抽

47、样类型抽样重复抽样重复抽样:不重复抽样不重复抽样:统计学原理第五版 李洁明 祁新娥6抽样调查(三三) 机械抽样机械抽样 在有总体差异程度和比重的全面资料时,在有总体差异程度和比重的全面资料时,可采用类型抽样的公式;可采用类型抽样的公式; 没有总体的全面资料时,可采用简单随机没有总体的全面资料时,可采用简单随机抽样的公式。抽样的公式。统计学原理第五版 李洁明 祁新娥6抽样调查( (四四) ) 整群抽样(一般为不重复抽样)整群抽样(一般为不重复抽样)统计学原理第五版 李洁明 祁新娥6抽样调查建筑工地打土方工人建筑工地打土方工人40004000人,需测定平均每人工作量,人,需测定平均每人工作量,要求

48、误差范围不超过要求误差范围不超过0.2M0.2M3 3,并需有,并需有99.73%99.73%保证程度。保证程度。根据过去资料根据过去资料=1.5=1.5,求样本数应是多少?,求样本数应是多少?例例1统计学原理第五版 李洁明 祁新娥6抽样调查某金笔厂月产某金笔厂月产1000010000支金笔,以前多次抽样调查一支金笔,以前多次抽样调查一等品率为等品率为90%90%,现在要求误差范围在,现在要求误差范围在2%2%之内,可靠之内,可靠程度达程度达95.45%95.45%,问必须抽取多少单位数?,问必须抽取多少单位数?例例2统计学原理第五版 李洁明 祁新娥6抽样调查例例3某鞋厂对某种类型的鞋子进行耐

49、穿时间的抽样检验,某鞋厂对某种类型的鞋子进行耐穿时间的抽样检验,经过二次小型抽样检验,结果知道标准差是经过二次小型抽样检验,结果知道标准差是1818天与天与2020天,试问在抽样误差不超过天,试问在抽样误差不超过1 1天(概率为天(概率为0.90110.9011)的要)的要求下,至少应抽查多少双鞋子?求下,至少应抽查多少双鞋子?已知已知: : 解:解:即至少应抽查即至少应抽查400400双鞋子双鞋子统计学原理第五版 李洁明 祁新娥6抽样调查第七节第七节 假设检验假设检验一、假设检验的概念一、假设检验的概念所谓所谓假设检验假设检验,就是对某一总体参数,就是对某一总体参数先作出假设的数值;然后搜集

50、样本资料,先作出假设的数值;然后搜集样本资料,用这些样本资料确定假设数值与样本数值用这些样本资料确定假设数值与样本数值之间的差异;最后,进一步判断两者差异之间的差异;最后,进一步判断两者差异是否显著,若两者差异很小,则假设的参是否显著,若两者差异很小,则假设的参数是可信的,作出数是可信的,作出“接受接受”的结论,若两的结论,若两者的差异很大,则假设的参数准确的可能者的差异很大,则假设的参数准确的可能性很小,作出性很小,作出“拒绝拒绝”的结论。的结论。统计学原理第五版 李洁明 祁新娥6抽样调查某厂生产一批产品,必须检验合格才能某厂生产一批产品,必须检验合格才能出厂,规定合格率为出厂,规定合格率为

51、95%95%,现从中抽取,现从中抽取100100件件进行质量检查,发现合格率为进行质量检查,发现合格率为93%93%,假设检,假设检验就是利用样本指标验就是利用样本指标p=93%p=93%的合格率,来判的合格率,来判断原来假设断原来假设P=95%P=95%合格率是否成立。如假设合格率是否成立。如假设成立,产品就能出厂,如假设不成立,这批成立,产品就能出厂,如假设不成立,这批产品便不能出厂。产品便不能出厂。例例1统计学原理第五版 李洁明 祁新娥6抽样调查某地区去年职工家庭年收入为某地区去年职工家庭年收入为7200072000元,元,本年抽样调查结果表明,职工家庭年收入为本年抽样调查结果表明,职工

52、家庭年收入为7100071000元,这是否意味着职工生活水平下降元,这是否意味着职工生活水平下降呢?我们还不能下这个结论,最好通过假设呢?我们还不能下这个结论,最好通过假设检验,检验这两年职工家庭收入是否存在显检验,检验这两年职工家庭收入是否存在显著性统计差异,才能判断该地区今年职工家著性统计差异,才能判断该地区今年职工家庭年收入是否低于去年水平。庭年收入是否低于去年水平。例例2统计学原理第五版 李洁明 祁新娥6抽样调查二、假设检验的步骤和特点二、假设检验的步骤和特点 (一一)假设检验的一般步骤如下:假设检验的一般步骤如下:第一步:设立假设。第一步:设立假设。原假设是所要检验的假设,记作原假设

53、是所要检验的假设,记作H0;备选假设是当原假设被否定时的另一备选假设是当原假设被否定时的另一种可成立的假设,记作种可成立的假设,记作H1;H0与与H1两者是对立的,如两者是对立的,如H0真实,则真实,则H1不真实;如不真实;如H0不真实,则不真实,则H1为真实。为真实。 H0和和H1在统计学中称为统计假设。在统计学中称为统计假设。统计学原理第五版 李洁明 祁新娥6抽样调查关于总体平均数的假设有三种情况:关于总体平均数的假设有三种情况: (1) H(1) H0 0: : = =0 0; H H1 1: : 0 0 (2) H (2) H0 0: : 0 0; H H1 1: : 0 0以上三种类

54、型,对第一种类型的检验,称双边以上三种类型,对第一种类型的检验,称双边检验,因为检验,因为0 0,包含,包含 0 0和和0 0。而。而对第二、三种类型的检验,称单边检验。对第二、三种类型的检验,称单边检验。例例统计学原理第五版 李洁明 祁新娥6抽样调查第二步:确定检验统计量。第二步:确定检验统计量。例例统计学原理第五版 李洁明 祁新娥6抽样调查第三步:规定显著性水平第三步:规定显著性水平 。若原假设若原假设H0为真时,却被当成错误而被拒绝,为真时,却被当成错误而被拒绝,统计上把犯这种错误的概率统计上把犯这种错误的概率称称为显著性水显著性水平。用平。用表示。表示。例例 =0.05(即即5%)或或

55、=0.01(即即1%)统计学原理第五版 李洁明 祁新娥6抽样调查 在假设检验中,要分析样本数值与参数在假设检验中,要分析样本数值与参数假设值之间的差异,若两者差异越小,假设假设值之间的差异,若两者差异越小,假设值真实的可能性则越大;反之,假设值真实值真实的可能性则越大;反之,假设值真实的可能性越小。因此,要分析两者差异是否的可能性越小。因此,要分析两者差异是否显著,如两者差异是显著的,就要否定原假显著,如两者差异是显著的,就要否定原假设,因此,假设检验又称显著性检验。设,因此,假设检验又称显著性检验。统计学原理第五版 李洁明 祁新娥6抽样调查第四步:确定临界值。第四步:确定临界值。 按照按照规

56、定的显著性水平规定的显著性水平和和样本本统计量量的分布性的分布性质,确定,确定否定域和接受域的临界值。否定域和接受域的临界值。统计学原理第五版 李洁明 祁新娥6抽样调查第五步:计算检验统计量的值。第五步:计算检验统计量的值。根据样本数据计算检验统计量的值。根据样本数据计算检验统计量的值。统计学原理第五版 李洁明 祁新娥6抽样调查第六步:根据检验统计量的值与临界值进行比第六步:根据检验统计量的值与临界值进行比较,做出判断。较,做出判断。 如如果检验统计量的数值落在否定域内果检验统计量的数值落在否定域内(包包括临界值括临界值),就说明原假设,就说明原假设H0与样本描述的情与样本描述的情况有显著差异

57、,应该否定原假设;如果该数况有显著差异,应该否定原假设;如果该数值落在接受域内,就说明原假设值落在接受域内,就说明原假设H0与样本描与样本描述的情况无显著差异,则应接受原假设。述的情况无显著差异,则应接受原假设。统计学原理第五版 李洁明 祁新娥6抽样调查三、假设检验的两类错误三、假设检验的两类错误 总体情况总体情况H H0 0为真为真H H1 1为真为真结论结论接受接受H H0 0决断正确决断正确犯第二类错误(采伪)犯第二类错误(采伪)(概率为(概率为)拒绝拒绝H H0 0犯第一类错误(拒真)犯第一类错误(拒真)(概率为(概率为)决断正确决断正确统计学原理第五版 李洁明 祁新娥6抽样调查四、统

58、计参数的假设检验方法四、统计参数的假设检验方法 ( (介绍方差已知的总体平均数的假设检验介绍方差已知的总体平均数的假设检验) ) 统计学原理第五版 李洁明 祁新娥6抽样调查( (一一) ) 双边检验双边检验H H0 0:=:=0 0;H H1 1:0 0统计学原理第五版 李洁明 祁新娥6抽样调查 某种产品的直径为某种产品的直径为6cm6cm时,产品为合格,现随机抽取时,产品为合格,现随机抽取100100件作件作为样本进行检查,得知样本平均值为为样本进行检查,得知样本平均值为6.1cm6.1cm,现假设标准差为,现假设标准差为0.2cm0.2cm,令,令=0.05=0.05,检验这批产品是否合格

59、。,检验这批产品是否合格。例例统计学原理第五版 李洁明 祁新娥6抽样调查 统计学原理第五版 李洁明 祁新娥6抽样调查( (二二) ) 单边检验单边检验统计学原理第五版 李洁明 祁新娥6抽样调查 根据过去学校的记录,学生的统计学考试的平均分数为根据过去学校的记录,学生的统计学考试的平均分数为6565分,分,标准差为标准差为1616分。现在学校改革了教学方法,经抽取分。现在学校改革了教学方法,经抽取6464名学生作调名学生作调查,得平均分数为查,得平均分数为6969分,问平均分数有无显著提高?分,问平均分数有无显著提高?( (=0.05=0.05) )例例1统计学原理第五版 李洁明 祁新娥6抽样调查 某工厂生产瓶装某工厂生产瓶装1 1千克的某饮料,标准差为千克的某饮料,标准差为0.020.02千克,现随机千克,现随机抽取抽取3636瓶进行检验,得平均重量为瓶进行检验,得平均重量为0.99620.9962千克,问能否相信该厂千克,问能否相信该厂生产的饮料每瓶重量为生产的饮料每瓶重量为1 1千克。千克。( (=0.05=0.05) )例例2统计学原理第五版 李洁明 祁新娥6抽样调查End of Chapter 6统计学原理第五版 李洁明 祁新娥6抽样调查

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 资格认证/考试 > 自考

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号