抽样与抽样分布优秀课件

上传人:M****1 文档编号:569729754 上传时间:2024-07-30 格式:PPT 页数:82 大小:914.50KB
返回 下载 相关 举报
抽样与抽样分布优秀课件_第1页
第1页 / 共82页
抽样与抽样分布优秀课件_第2页
第2页 / 共82页
抽样与抽样分布优秀课件_第3页
第3页 / 共82页
抽样与抽样分布优秀课件_第4页
第4页 / 共82页
抽样与抽样分布优秀课件_第5页
第5页 / 共82页
点击查看更多>>
资源描述

《抽样与抽样分布优秀课件》由会员分享,可在线阅读,更多相关《抽样与抽样分布优秀课件(82页珍藏版)》请在金锄头文库上搜索。

1、第第7 7章章 抽样与抽样分布抽样与抽样分布统计学7/30/20241统计学统计学STATISTICS第第7 7章章 抽样与抽样分布抽样与抽样分布一、抽样概述一、抽样概述二、抽样分布二、抽样分布三、三、ExcelExcel在抽样与抽样分布中的应用在抽样与抽样分布中的应用7/30/20242统计学统计学STATISTICS本章学习目标本章学习目标1.1.理解随机抽样、非随机抽样两类不同抽样方法理解随机抽样、非随机抽样两类不同抽样方法的本质区别的本质区别2.2.了解重复抽样、不重复抽样下的样本可能数目了解重复抽样、不重复抽样下的样本可能数目3.3.区别简单随机抽样、类型抽样、等距抽样、整区别简单随

2、机抽样、类型抽样、等距抽样、整群抽样、多阶段抽样等不同的随机抽样组织形式群抽样、多阶段抽样等不同的随机抽样组织形式4.4.了解总体分布、样本分布、抽样分布的关系,了解总体分布、样本分布、抽样分布的关系,明确二项分布、正态分布、明确二项分布、正态分布、t t分布、分布、2 2分布等重要分布等重要分布的特征分布的特征5.5.理解抽样分布的理论基础理解抽样分布的理论基础6.6.重点掌握样本均值、样本比例在不同条件下的重点掌握样本均值、样本比例在不同条件下的抽样分布抽样分布7/30/20243统计学统计学STATISTICS一、抽样概述一、抽样概述(一)(一) 抽样的方法抽样的方法(二)(二) 随机抽

3、样的组织形式随机抽样的组织形式(三)(三) 抽样方案的设计抽样方案的设计7/30/20244统计学统计学STATISTICS(一)(一) 抽样的方法抽样的方法随机抽样随机抽样方便抽样方便抽样判断抽样判断抽样自愿样本自愿样本滚雪球抽样滚雪球抽样定额抽样定额抽样非随机抽样非随机抽样常用的抽样方法常用的抽样方法重重复复抽抽样样不不重重复复抽抽样样考考虑虑顺顺序序抽抽样样不不考考虑虑顺顺序序抽抽样样7/30/20245统计学统计学STATISTICS根根据据随随机机原原则则从从总总体体中中直直接接抽抽选选部部分分单单位位构构成成样样本本的的方方法法。也称概率抽样也称概率抽样特点特点按随机原则抽取样本抽

4、取样本时使每个单位都有一定的机会被抽中每个单位被抽中的概率是已知的,或是可以计算出来的 某一总体单位能否被抽中,与其它单位是否被抽中没有关联。 随机抽样随机抽样7/30/20246统计学统计学STATISTICS重复抽样重复抽样从总体从总体N N个单位中随机抽取一个样本容量个单位中随机抽取一个样本容量为为n n的样本,每次从总体中抽取一个,并的样本,每次从总体中抽取一个,并把结果登记下来,又放回总体中重新参把结果登记下来,又放回总体中重新参加下一次的抽选。又称加下一次的抽选。又称放回抽样放回抽样不重复抽样不重复抽样每次从总体中抽选一个单位后就不每次从总体中抽选一个单位后就不再将其放回参加下一次

5、的抽选。又再将其放回参加下一次的抽选。又称称不放回抽样不放回抽样. .总体单位数总体单位数N N不变,同一单位可能不变,同一单位可能多次被抽中。多次被抽中。总体单位数减少总体单位数减少n n,同一单位只可能,同一单位只可能被抽中一次。被抽中一次。随机抽选样本的方式随机抽选样本的方式 7/30/20247统计学统计学STATISTICS考虑顺序的重复抽样考虑顺序的重复抽样可能的样本数目可能的样本数目不考虑顺序的重复抽样不考虑顺序的重复抽样不考虑顺序的不重复抽样不考虑顺序的不重复抽样考虑顺序的不重复抽样考虑顺序的不重复抽样考虑各单位的中选顺序考虑各单位的中选顺序ABBAABBA不考虑各单位的中选不

6、考虑各单位的中选顺序。顺序。 AB ABBABA7/30/20248统计学统计学STATISTICS【例【例1 1】某一总体含有某一总体含有A A、B B、C C、D D、E E共共5 5个总体单位,从个总体单位,从中随机抽取中随机抽取2 2个单位构成样本,可能的样本数目有多少?个单位构成样本,可能的样本数目有多少? 采用考虑顺序的重复抽样,样本可能数目为采用考虑顺序的重复抽样,样本可能数目为55=2555=25个个 采用不考虑顺序的重复抽样,样本可能数目为(采用不考虑顺序的重复抽样,样本可能数目为(5 52 2+5+5)/2=15/2=15个个 采用不考虑顺序的不重复抽样,样本可能数目为采用

7、不考虑顺序的不重复抽样,样本可能数目为 5 5!/ /(2 2!(5-25-2)!)!=10=10个个 采用考虑顺序的不重复抽样,样本可能数目为采用考虑顺序的不重复抽样,样本可能数目为54=2054=20个个 7/30/20249统计学统计学STATISTICS相对于概率抽样而言相对于概率抽样而言抽抽取取样样本本时时不不是是依依据据随随机机原原则则,而而是是根根据据研研究究目目的的对对数数据据的的要要求求,采采用用某某种种方方式式从从总体中抽出部分单位对其实施调查总体中抽出部分单位对其实施调查有有方方便便抽抽样样、判判断断抽抽样样、自自愿愿样样本本、定定额额抽样等方式抽样等方式 非随机抽样非随

8、机抽样7/30/202410统计学统计学STATISTICS方便抽样方便抽样调调查查过过程程中中由由调调查查员员依依据据方方便便的的原原则则,自自行行确确定入抽样本的单位定入抽样本的单位调查员在街头、公园、商店等公共场所进行拦截调查厂家在出售产品柜台前对路过顾客进行的调查优点:优点:容易实施,调查的成本低容易实施,调查的成本低缺缺点点:样样本本单单位位的的确确定定带带有有随随意意性性,样样本本无无法法代代表表有有明明确确定定义义的的总总体体,调调查查结结果果不不宜宜推推断断总总体体7/30/202411统计学统计学STATISTICS判断抽样判断抽样研研究究人人员员根根据据经经验验、判判断断和

9、和对对研研究究对对象象的的了了解解,有目的选择一些单位作为样本有目的选择一些单位作为样本有重点抽样,典型抽样,代表抽样等方式判判断断抽抽样样是是主主观观的的,样样本本选选择择的的好好坏坏取取决决于于调调研者的判断、经验、专业程度和创造性研者的判断、经验、专业程度和创造性抽样成本比较低,容易操作抽样成本比较低,容易操作样样本本是是人人为为确确定定的的,没没有有依依据据随随机机的的原原则则,调调查结果不能用于对推断总体查结果不能用于对推断总体7/30/202412统计学统计学STATISTICS自愿样本自愿样本被被调调查查者者自自愿愿参参加加,成成为为样样本本中中的的一一分分子子,向调查人员提供有

10、关信息向调查人员提供有关信息例如,参与报刊上和互联网上刊登的调查问卷活动,向某类节目拨打热线电话等,都属于自愿样本自愿样本自愿样本与抽样的随机性无关与抽样的随机性无关样本是有偏的不能依据样本的信息推断总体7/30/202413统计学统计学STATISTICS定额抽样定额抽样先先将将体体中中的的所所有有单单位位按按一一定定的的标标志志( (变变量量) )分分为为若若干干类类,然然后后在在每每个个类类中中采采用用方方便便抽抽样样或或判判断断抽抽样样的的方方式式选选取取样样本本单单位位操操作作简简单单,可可以以保保证证总总体体中中不不同同类类别别的的单单位位都都能能包包括括在在所所抽抽的的样样本本之

11、之中中,使使得得样本的结构和总体的结构类似样本的结构和总体的结构类似抽抽取取具具体体样样本本单单位位时时,不不是是依依据据随随机机原原则,属于非概率抽样则,属于非概率抽样 7/30/202414统计学统计学STATISTICS随机抽样与非随机抽样的比较随机抽样与非随机抽样的比较随机随机抽样抽样依据随机原则抽选样本样本统计量的理论分布存在可根据调查的结果推断总体非随机非随机抽样抽样不是依据随机原则抽选样本样本统计量的分布是不确定的使用样本结果推断总体的效果要差一些7/30/202415统计学统计学STATISTICS1 1 简单随机抽样(纯随机抽样)简单随机抽样(纯随机抽样) 根据随机原则直接从

12、总体中抽取单位构成样根据随机原则直接从总体中抽取单位构成样本的一种抽样方式。本的一种抽样方式。 仅适用于规模不大、分布比较均匀的总体仅适用于规模不大、分布比较均匀的总体(二)随机抽样的组织方式(二)随机抽样的组织方式每个容量为每个容量为n n的样本都有同等机会的样本都有同等机会( (概率概率) )被抽中被抽中简单、直观,是最简单、最基本、最符合随机原简单、直观,是最简单、最基本、最符合随机原则,但同时也是抽样误差最大的抽样组织形式则,但同时也是抽样误差最大的抽样组织形式一般有抽签、抓阄、随机数码表、抽样函数等一般有抽签、抓阄、随机数码表、抽样函数等 7/30/202416统计学统计学STATI

13、STICS63271 59986 71744 51102 15141 80714 58683 93108 13554 7994588547 09896 95436 79115 08303 01041 20030 63754 08459 28364 55957 57243 83865 09911 19761 66355 40102 26646 60147 1570246276 87453 44790 67122 45573 84358 21625 16999 13385 2278255363 07449 34835 15290 76616 67191 12777 21861 68689 0326

14、369393 92785 49902 58447 42048 30378 87618 26933 40640 1628113186 29431 88190 04588 38733 81290 89541 70290 40113 0824317726 28652 56836 78351 47327 18518 92222 55201 27340 1049336520 64465 05550 30157 82242 29520 69753 72602 23756 5493581628 36100 39254 56835 37636 02421 98063 89641 64953 99337 在随机

15、数码表中,可以从任何一个位置、任何方在随机数码表中,可以从任何一个位置、任何方向开始挑选随机数字。一旦选择一个任意起点,就采向开始挑选随机数字。一旦选择一个任意起点,就采用事先确定的程序抽取样本。用事先确定的程序抽取样本。 随机数字表随机数字表(摘录)(摘录)7/30/202417统计学统计学STATISTICS2 2 类型抽样(分类抽样或分层抽样)类型抽样(分类抽样或分层抽样) 将总体全部单位分类,形成若干个类型组,然后从将总体全部单位分类,形成若干个类型组,然后从各类型中分别随机抽取若干单位组成样本的抽样形式。各类型中分别随机抽取若干单位组成样本的抽样形式。总体总体N N样本样本n n等比

16、例抽取等比例抽取不等比例抽取不等比例抽取 能使样本结构更接近于总体结构,提高样本的能使样本结构更接近于总体结构,提高样本的代表性,适宜于单位标志值差异程度较大的总体,代表性,适宜于单位标志值差异程度较大的总体,能同时推断总体指标和各组的指标能同时推断总体指标和各组的指标7/30/202418统计学统计学STATISTICS3 3 等距抽样(机械抽样或系统抽样)等距抽样(机械抽样或系统抽样) 将总体单位按某一标志排序,然后按相等间隔将总体单位按某一标志排序,然后按相等间隔抽取样本单位构成样本的抽样形式抽取样本单位构成样本的抽样形式随机起点随机起点半距起点半距起点对称起点对称起点(总体单位按某一标

17、志排序)(总体单位按某一标志排序)按无关标志排队,其抽样效果相当于简单随机抽样;按无关标志排队,其抽样效果相当于简单随机抽样;按有关标志排队,其抽样效果相当于类型抽样。按有关标志排队,其抽样效果相当于类型抽样。7/30/202419统计学统计学STATISTICS4 4 整群抽样整群抽样 将总体全部单位分为若干将总体全部单位分为若干“群群”,然后随机抽,然后随机抽取一部分取一部分“群群”,被抽中群体的所有单位构成样本,被抽中群体的所有单位构成样本的抽样方式。的抽样方式。例:总体群数例:总体群数R=16 R=16 样本群数样本群数r=4r=4A AB BC CD DE EF FG GH HI I

18、J JK KL LM MN NO OP PL LH HP PD D样本容量样本容量 简单、方便,能节省人力、物力、财力和时间,简单、方便,能节省人力、物力、财力和时间,但其样本代表性可能较差,产生的抽样误差较大。但其样本代表性可能较差,产生的抽样误差较大。7/30/202420统计学统计学STATISTICS55多阶段抽样多阶段抽样 指分两个或两个以上的阶段来完成抽取样本指分两个或两个以上的阶段来完成抽取样本单位过程的抽样方式单位过程的抽样方式例:在某省有例:在某省有100100多万农户,需要抽取多万农户,需要抽取10001000户户调查农户生产性投资情况。调查农户生产性投资情况。 第一阶段:

19、从该省所有县中抽取第一阶段:从该省所有县中抽取5 5个县个县 第二阶段:从被抽中的第二阶段:从被抽中的5 5个县中各抽个县中各抽4 4个乡个乡 第三阶段:从被抽中的第三阶段:从被抽中的2020个乡中各抽个乡中各抽5 5个村个村 第四阶段:从被抽中的第四阶段:从被抽中的100100个村中各抽个村中各抽1010户户样本样本n=10010=1000(n=10010=1000(户户) ) 既可以相对节约人力和物力,又可以利用现成既可以相对节约人力和物力,又可以利用现成的行政区划、组织系统作为划分各阶段的依据,但的行政区划、组织系统作为划分各阶段的依据,但抽样误差的计算要复杂得多。抽样误差的计算要复杂得

20、多。 7/30/202421统计学统计学STATISTICSq调查对象的性质特点调查对象的性质特点q对调查对象的了解程度(抽样框的特点)对调查对象的了解程度(抽样框的特点)q抽样误差的大小抽样误差的大小q人力、财力和物力等条件的限制人力、财力和物力等条件的限制在实际工作中,选择适当的抽样组在实际工作中,选择适当的抽样组织方式主要应考虑:织方式主要应考虑:如何确定抽样组织方式如何确定抽样组织方式7/30/202422统计学统计学STATISTICS明确明确调查目调查目 的的 明确明确总体及总体及抽样单位抽样单位 确定或构确定或构建抽样框建抽样框 提出指标提出指标精度要求精度要求 选择抽样选择抽样

21、组织形式组织形式(三)抽样方案的设计(三)抽样方案的设计 确定确定样本容量样本容量 制定制定具体办法具体办法步骤步骤 1.1.抽样方案的设计内容抽样方案的设计内容7/30/202423统计学统计学STATISTICS2.2.抽样方案设计的基本原则抽样方案设计的基本原则(1 1)保证实现抽样随机性的原则)保证实现抽样随机性的原则(2 2)保证实现最大的抽样效果原则)保证实现最大的抽样效果原则3.3.抽样方案设计中的重要问题抽样方案设计中的重要问题(1 1)保证随机原则的实现)保证随机原则的实现(2 2)要考虑样本容量和结构问题)要考虑样本容量和结构问题 (3 3)关于抽样的组织形式问题)关于抽样

22、的组织形式问题(4 4)关于调查费用的问题)关于调查费用的问题7/30/202424统计学统计学STATISTICS(一)关于分布的几个概念(一)关于分布的几个概念(二)抽样分布的理论基础(二)抽样分布的理论基础(三)样本均值的抽样分布(三)样本均值的抽样分布(四)样本比例的抽样分布(四)样本比例的抽样分布二、抽样分布二、抽样分布7/30/202425统计学统计学STATISTICS1.1.总体变量总体变量x x的概率分布,它由变量的概率分布,它由变量x x的所有取值的所有取值和与之相应的概率组成。和与之相应的概率组成。2.2.反映总体分布特征的常用指标有总体均值反映总体分布特征的常用指标有总

23、体均值和和总体标准差总体标准差1.1.总体分布通常是未知的总体分布通常是未知的总体(一)关于分布的几个概念(一)关于分布的几个概念总体分布总体分布N=FP=F/F7/30/202426统计学统计学STATISTICS1.1.样本中各观察值的概率分布,它由一个样本的样本中各观察值的概率分布,它由一个样本的所有观察值所有观察值x x和与之相应的概率和与之相应的概率p p组成。组成。2.2.样本分布的特征值主要有样本均值样本分布的特征值主要有样本均值 与样本标与样本标准差准差s s 3.3.当样本容量当样本容量n n逐渐增大时,样本分布逐渐接近逐渐增大时,样本分布逐渐接近总体的分布总体的分布 样样本

24、本样本分布样本分布7/30/202427统计学统计学STATISTICS1.1.样本统计量(样本均值样本统计量(样本均值, , 样本比例,样本方样本比例,样本方差等)的概率分布,由各样本统计量的值和差等)的概率分布,由各样本统计量的值和与之相应的概率组成。与之相应的概率组成。 2.2.样本统计量是随机变量,其结果来自容量相样本统计量是随机变量,其结果来自容量相同的所有可能样本同的所有可能样本3.3.是一种理论概率分布。提供了样本统计量稳是一种理论概率分布。提供了样本统计量稳定的信息,是进行推断的理论基础,也是抽定的信息,是进行推断的理论基础,也是抽样推断科学性的重要依据样推断科学性的重要依据

25、抽样分布抽样分布7/30/202428统计学统计学STATISTICS总体总体样样本本样样本本样样本本抽样分布的形成过程抽样分布的形成过程计算样本统计量计算样本统计量如:样本均值如:样本均值7/30/202429统计学统计学STATISTICS【例例】设一个总体,含有4个元素(个体) ,即总体单位数N=4。4 个个体分别为X1=1、X2=2、X3=3 、X4=4 。总体的均值、方差及分布如下:总体分布总体分布1 14 42 23 30 00.10.10.20.20.30.3均值和方差均值和方差7/30/202430统计学统计学STATISTICS 现现从从总总体体中中抽抽取取n n2 2的的简

26、简单单随随机机样样本本,在在重重复复抽抽样条件下,共有样条件下,共有4 42 2=16=16个样本。所有样本的结果为个样本。所有样本的结果为3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二个观察值第一个观察值所有可能的n = 2 的样本(共16个)7/30/202431统计学统计学STATISTICS 计计算算出出各各样样本本的的均均值值,如如下下表表。并并给给出出样样本本均均值值的抽样分布的抽样分布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二个观察值第一

27、个观察值16个样本的均值(x)X样本均值的抽样分布1.00.10.20.3P (X )1.53.04.03.52.02.507/30/202432统计学统计学STATISTICS比较及结论比较及结论: 1. 样本均值的均值(数学期望) 等于总体均值 2. 样本均值的方差等于总体方差的1/n7/30/202433统计学统计学STATISTICS = 2.5 2 =1.25总体分布总体分布142300.10.20.3抽样分布抽样分布P ( X )1.000.10.20.31.53.04.03.52.02.5XP ( X )7/30/202434统计学统计学STATISTICS1.1.进进行行 n

28、n 次次重重复复试试验验,出出现现“成成功功”的的次次数数X X的的概概率分布称为二项分布率分布称为二项分布, ,记为:记为:2.2.设设X X为为 n n 次次重重复复试试验验中中事事件件A A出出现现的的次次数数,X X 取取 x x 的概率为的概率为P P二项分布二项分布X = xix1 ,x2 , ,xnP(X =xi)=PiP1 ,P2 , ,Pn重复试验的条件:重复试验的条件:一次试验只有两个可能结果;一次试验只有两个可能结果;试验可以重复进行;试验可以重复进行;每一次试验成功的概率都是每一次试验成功的概率都是p p。 7/30/202435统计学统计学STATISTICS1.1.

29、二项分布二项分布的数学期望为的数学期望为 E ( X ) np2.2.方差方差为为 D ( X ) npq二项分布的数学期望和方差二项分布的数学期望和方差:7/30/202436统计学统计学STATISTICS1.1.描述连续型随机变量的最重要的分布描述连续型随机变量的最重要的分布2.2.经典统计推断的基础经典统计推断的基础3.3.若随机变量的概率密度函数为:若随机变量的概率密度函数为:x xf f ( (x x) )正态分布正态分布则称则称X X服从均值为服从均值为、方差为、方差为2 2的正态分布,记为的正态分布,记为 7/30/202437统计学统计学STATISTICS1.1.概率密度概

30、率密度函数在函数在x x 的上方,即的上方,即f f( (x x)0)02.2.正正态态曲曲线线的的最最高高点点在在均均值值 ,它它也也是是分分布布的的中中位位数数和和众数,即对称分布众数,即对称分布3.3.正正态态分分布布是是一一个个分分布布族族,每每一一特特定定正正态态分分布布通通过过均均值值 和和标标准准差差 来来区区分分。 决决定定了了图图形形的的中中心心位位置置, , 决决定曲线的平缓程度,即宽度定曲线的平缓程度,即宽度4.4.曲曲线线f f( (x x) )相相对对于于均均值值 对对称称,尾尾端端向向两两个个方方向向无无限限延延伸,且理论上永远不会与横轴相交伸,且理论上永远不会与横

31、轴相交5.5.随机随机变量的概率由曲线下的面积给出变量的概率由曲线下的面积给出6.6.正态正态曲线下的总面积等于曲线下的总面积等于1 1正态分布的特点正态分布的特点7/30/202438统计学统计学STATISTICS 和和 对对正态曲线的影响正态曲线的影响xf(x)CAB7/30/202439统计学统计学STATISTICS正态分布的概率正态分布的概率概率是曲线下的面积概率是曲线下的面积! !a ab bx xf f( (x x) )7/30/202440统计学统计学STATISTICS正态分布函数正态分布函数1.1.随机变量的概率也可以用分布函数随机变量的概率也可以用分布函数F F( (x

32、 x) )来表示来表示2.2.分分布函数定义为布函数定义为3.3.根根据分布函数,据分布函数,P P( (a a X X b b) )可以写为可以写为f(x)xx0F ( x0 )7/30/202441统计学统计学STATISTICS标准正态分布标准正态分布1.1.一般的正态分布取决于均值一般的正态分布取决于均值 和标准差和标准差 2.2.计计算算概概率率时时 ,每每一一个个正正态态分分布布都都需需要要有有自自己己的的正正态态概概率率分分布布表表,这这种种表表格格是是无无穷穷多的多的3.3.若若能能将将一一般般的的正正态态分分布布转转化化为为标标准准正正态态分分布,计算概率时只需要查一张表布,

33、计算概率时只需要查一张表7/30/202442统计学统计学STATISTICS标准正态分布函数标准正态分布函数2.2. 标准正态分布标准正态分布的概率密度函数的概率密度函数1.1.任任何何一一个个一一般般的的正正态态分分布布,均均可可通通过过下下面面的的线线性变换转化为标准正态分布性变换转化为标准正态分布3.3. 标准正态分布标准正态分布的分布函数的分布函数7/30/202443统计学统计学STATISTICS标准正态分布表的使用标准正态分布表的使用1.1.将一个一般的正态分布转换为标准正态分布将一个一般的正态分布转换为标准正态分布2.2.计算概率时计算概率时,只要查标准正态概率分布表即可,只

34、要查标准正态概率分布表即可3.3.对于负对于负的的x x ,可由可由 (-(-x x) ) x x 得到得到4.4.对对于标准正态分布,即于标准正态分布,即X XN N(0,1)(0,1),有,有P P ( (a a X X b b) ) b b a a P P (|X| (|X| a a) ) 2 2 a a 1 15.5.对对于一般正态分布,即于一般正态分布,即X XN N( ( , , ) ),则有,则有7/30/202444统计学统计学STATISTICSx x =5=5 =10=10一般正态分布一般正态分布一般正态分布一般正态分布一般正态分布一般正态分布6.26.2 =1 =1Z Z

35、标准正态分布标准正态分布标准正态分布标准正态分布标准正态分布标准正态分布 0 0 0.120.12.0478.0478.0478.04787/30/202445统计学统计学STATISTICS【例【例3 3】设设X XN N(0(0,1)1)分布,求以下概率:分布,求以下概率: (1) (1) P P( (X X 1.5)2)2);(3)(3)P P(-1(-1X X 3)3); (4) (4) P P(| (| X X | | 2) 2) 解解:(1) (1) P P( (X X 1.5) = 2)=1- 2)=1- P P( (X X 2)=1-0.9973=0.0227 2)=1-0.9

36、973=0.0227 (3) (3) P P(-1(-1X X 3)= 3)= P P( (X X 3)- 3)- P P( (X X -1)-1) = = (3)- (3)- (-1)= (-1)= (3) 1-(3) 1- (1)(1) = 0.9987-(1-0.8413)=0.84 = 0.9987-(1-0.8413)=0.84 (4) (4)P P(| (| X X | | 2)= 2)=P P(-2(-2 X X 2)= 2)= (2)- (2)- (-2)(-2) = = (2)- 1-(2)- 1- (2)=2 (2)=2 (2)- 1=0.9545(2)- 1=0.9545

37、7/30/202446统计学统计学STATISTICS【例【例4 4】设设X XN N(5(5,3 32 2) ) ,求以下概率,求以下概率 (1) (1) P P( (X X 10) 10) ; (2) (2) P P(2(2X X 10 0 0,有:,有:该定律表明:当重复试验次数该定律表明:当重复试验次数n n充分大时,事件充分大时,事件A A发生的频率发生的频率m m/ /n n依概率收敛于事件依概率收敛于事件A A发生的概率,发生的概率,即即频率具有稳定性。频率具有稳定性。 大数定律的实践意义:一是抽样必须遵循随机大数定律的实践意义:一是抽样必须遵循随机原则;二是抽样必须遵循大量原则

38、。原则;二是抽样必须遵循大量原则。 7/30/202453统计学统计学STATISTICS阐述大量随机变量之和的极限分布阐述大量随机变量之和的极限分布是正态分布的一系列定理的总称。是正态分布的一系列定理的总称。 中心极限定理中心极限定理独立同分布中心极限定理(也称为列维独立同分布中心极限定理(也称为列维- -林德伯林德伯格定理):格定理):设设x x1 1,x,x2 2,x,x3 3是独立同分布的随机变量是独立同分布的随机变量序列,且存在有限的数学期望序列,且存在有限的数学期望和方差和方差,那么,那么当当nn时:时:该定理表明该定理表明:不论总体服从什么分布,只要其数学期不论总体服从什么分布,

39、只要其数学期望和方差存在,对这一总体进行重复抽样,当样本容望和方差存在,对这一总体进行重复抽样,当样本容量充分大时,量充分大时, 或或 就趋近于正态分布。就趋近于正态分布。中心极限定理中心极限定理7/30/202454统计学统计学STATISTICS当样本容量足够大时(n 30) ,样本均值的抽样分布逐渐趋于正态分布设设从从均均值值为为 ,方方差差为为 2 2的的一一个个任任意意总总体体中中抽抽取取容容量量为为n n的的样样本本,当当n n充充分分大大时时,样样本本均均值值的的抽抽样样分分布布近似服从均值为近似服从均值为、方差为、方差为2 2/ /n n的正态分布的正态分布一个任意分布的总体X

40、7/30/202455统计学统计学STATISTICS7/30/202456统计学统计学STATISTICS中心极限定理的意义在于:当我们的认识中心极限定理的意义在于:当我们的认识对象分布未知时,只要坚持随机抽取足够多对象分布未知时,只要坚持随机抽取足够多的样本单位,就可以使样本统计量服从或近的样本单位,就可以使样本统计量服从或近似服从正态分布,继而便可运用正态分布理似服从正态分布,继而便可运用正态分布理论,根据样本信息来推断认识对象总体的数论,根据样本信息来推断认识对象总体的数量特征。量特征。 7/30/202457统计学统计学STATISTICS1.1.在随机选取容量为在随机选取容量为n

41、n的样本时,由样本均值的所的样本时,由样本均值的所有可能取值形成的相对频数分布有可能取值形成的相对频数分布2.2.一种理论概率分布一种理论概率分布3.3.推断总体均值推断总体均值 的理论基础的理论基础(三)样本均值的抽样分布(三)样本均值的抽样分布7/30/202458统计学统计学STATISTICS1.样本均值的数学期望样本均值的数学期望2.样本均值的方差样本均值的方差重复抽样不重复抽样样本均值的抽样分布特征样本均值的抽样分布特征7/30/202459统计学统计学STATISTICS3. 样本均值的标准误差样本均值的标准误差所有可能的样本均值的标准差,测度所有所有可能的样本均值的标准差,测度

42、所有样本均值的离散程度样本均值的离散程度计算公式为计算公式为7/30/202460统计学统计学STATISTICS2 2已知时已知时, ,样本均值的抽样分布样本均值的抽样分布 总体总体是否正态分布是否正态分布否否否否否否是是是是大大大大大大小小样本容量样本容量n正态分布正态分布正态分布正态分布非正态分布非正态分布7/30/202461统计学统计学STATISTICS表明:表明:当总体服从正态分布时,不论样本容量多大,样本当总体服从正态分布时,不论样本容量多大,样本均值都服从正态分布,且样本均值的数学期望等于均值都服从正态分布,且样本均值的数学期望等于总体均值,样本均值的方差等于总体方差的总体均

43、值,样本均值的方差等于总体方差的1/n 1/n 当总体分布为非正态总体或分布形式未知时,样本当总体分布为非正态总体或分布形式未知时,样本容量充分大时(一般要求容量充分大时(一般要求n30n30),样本均值的抽样),样本均值的抽样分布可以近似地用正态分布分布可以近似地用正态分布 来描述。来描述。 总体为非正态总体或分布形式未知,如果样本容量总体为非正态总体或分布形式未知,如果样本容量太小,我们无法从理论上探讨样本均值的抽样分布太小,我们无法从理论上探讨样本均值的抽样分布 7/30/202462统计学统计学STATISTICS 【例】【例】设从一个均值设从一个均值=10=10,标准差,标准差=0.

44、6=0.6的总体中,的总体中,随机抽取容量随机抽取容量n=36n=36的样本。要求:的样本。要求:7/30/202463统计学统计学STATISTICS解:解:根据中心极限定理,不论总体分布是什么形状,根据中心极限定理,不论总体分布是什么形状,只要样本足够大(只要样本足够大(n30n30时),样本均值时),样本均值 7/30/202464统计学统计学STATISTICS7/30/202465统计学统计学STATISTICS【例】【例】某厂生产的某种节能灯管的使用寿命某厂生产的某种节能灯管的使用寿命服从正态分布,对某批产品测试的结果,平服从正态分布,对某批产品测试的结果,平均使用寿命为均使用寿命

45、为10501050小时,标准差为小时,标准差为200200小时。小时。试求:试求: (a a)使用寿命在)使用寿命在500500小时以下的灯管占多小时以下的灯管占多大比例?大比例? (b b)使用寿命在)使用寿命在85085014501450小时的灯管占小时的灯管占多大比例?多大比例? (c c)以均值为中心,)以均值为中心,9595的灯管的使用的灯管的使用寿命在什么范围内?寿命在什么范围内?7/30/202466统计学统计学STATISTICS 解:解:设设 X X使用寿命,则使用寿命,则X XN N (1050 (1050,2002002 2 ) )(2)(-1)0.977250.1586

46、50.8186 95的灯管寿命在均值的灯管寿命在均值392左右(即左右(即6581442)小时)小时1(2.75)10.997020.002987/30/202467统计学统计学STATISTICS2 2未知时未知时, ,样本均值的抽样分布样本均值的抽样分布 总体总体是否正态分布是否正态分布否否否否否否是是是是大大大大大大小小样本容量样本容量n t分布分布 t分布分布非正态分布非正态分布7/30/202468统计学统计学STATISTICS表明:当总体方差未知时,对于正态总体(无论样本表明:当总体方差未知时,对于正态总体(无论样本容量的大小),或者总体非正态或分布形式未知但样容量的大小),或者

47、总体非正态或分布形式未知但样本容量充分大时,样本均值的标准化值服从本容量充分大时,样本均值的标准化值服从 分布分布值得注意的是,当样本容量逐渐增大时,值得注意的是,当样本容量逐渐增大时, t分布逐渐分布逐渐逼近标准正态分布。所以,当样本容量很大时,除了逼近标准正态分布。所以,当样本容量很大时,除了可以利用可以利用 进行相关计算外,也可以进行相关计算外,也可以利用利用 近似服从标准正态分布来计算近似服从标准正态分布来计算 7/30/202469统计学统计学STATISTICS【例】【例】已知湖南省已知湖南省20092009年的全省粮食总平均亩产为年的全省粮食总平均亩产为600600公斤,其分布形

48、式及方差均未知。现从全省随机抽取公斤,其分布形式及方差均未知。现从全省随机抽取49004900亩进行调查了解,测得该样本的标准差为亩进行调查了解,测得该样本的标准差为400400公斤,公斤,求这求这49004900亩的平均亩产不低于亩的平均亩产不低于620620公斤的概率。公斤的概率。分析:分析:解:解:粮食单产粮食单产x的分布形式及方差均未知,故以样的分布形式及方差均未知,故以样本方差代替总体方差,从理论上讲,本方差代替总体方差,从理论上讲, 7/30/202470统计学统计学STATISTICS一般情况下,根据一般情况下,根据t t值与自由度在值与自由度在t t分布表中可以查分布表中可以查

49、找相应的概率。由于这里的找相应的概率。由于这里的t t分布的自由度很大,分布的自由度很大,为为4900-1=48994900-1=4899,这时的,这时的t t分布与标准正态分布几乎分布与标准正态分布几乎一样,故可以查标准正态分布表,得一样,故可以查标准正态分布表,得 结果表明:这结果表明:这49004900亩的平均亩产不低于亩的平均亩产不低于620620公斤的概公斤的概率只有率只有0.0233%0.0233%。 7/30/202471统计学统计学STATISTICS(四)样本比例的抽样分布(四)样本比例的抽样分布 1.1.是非标志均值与比例的关系是非标志均值与比例的关系对于是非标志总体对于是

50、非标志总体X X而言,而言,X X的取值只有两个:的取值只有两个:0 0和和1 1。设总体的单位数为。设总体的单位数为N N,具有某一特征(如产品,具有某一特征(如产品合格)的比例为合格)的比例为,则:,则: 7/30/202472统计学统计学STATISTICS对于是非标志的样本来说,其取值也是两个:对于是非标志的样本来说,其取值也是两个:0 0和和1 1。设样本容量为设样本容量为n n,具有某一特征(如产品合格)的,具有某一特征(如产品合格)的比例为比例为p,p,则:则: 结论:结论:是非标志的均值等于其比例。是非标志的均值等于其比例。 7/30/202473统计学统计学STATISTIC

51、S样本比例的数学期望样本比例的数学期望样本比例的方差样本比例的方差重复抽样不重复抽样样本比例的抽样分布特征样本比例的抽样分布特征 样本比例的抽样分布是容量相同的所有可能样本样本比例的抽样分布是容量相同的所有可能样本的样本比例的概率分布。其分布特征如下:的样本比例的概率分布。其分布特征如下:7/30/202474统计学统计学STATISTICS容量相同的所有可能样本的样本比例的概率分容量相同的所有可能样本的样本比例的概率分布布是非标志的总体方差已知,且是非标志的总体方差已知,且 样本比例的抽样分布可用正态分布样本比例的抽样分布可用正态分布近似近似 ,一种理论概率分布一种理论概率分布推断总体比例推

52、断总体比例的理论基础的理论基础2.2.样本比例的抽样分布样本比例的抽样分布正态分布正态分布7/30/202475统计学统计学STATISTICS【例】【例】假设有一批种子的发芽率为假设有一批种子的发芽率为0.70.7。现有这种种子。现有这种种子100100颗,试求:颗,试求:(1 1)其中有)其中有7272颗以上发芽的概率。颗以上发芽的概率。(2 2)发芽率在)发芽率在0.60.80.60.8之间的概率;之间的概率;解:(1 1)设)设X X发芽种子颗数,因发芽种子颗数,因B B(100(100,0.7)0.7), 则则p p N(0.7,0.21/100),N(0.7,0.21/100),X

53、 X近似地服从近似地服从N N (70(70,21)21)。 P P( (X X 72)72)P P( (Z Z 0.44)0.44)1 1P P( (Z Z0.44)0.44) 1 10.670.670.330.337/30/202476统计学统计学STATISTICS7/30/202477统计学统计学STATISTICS3.3.样本比例的抽样分布样本比例的抽样分布tt分布分布容量相同的所有可能样本的样本比例的概率分布容量相同的所有可能样本的样本比例的概率分布是非标志的总体方差未知,且是非标志的总体方差未知,且 样本比例样本比例p p服从服从t t分布,分布,也是推断总体比例也是推断总体比例

54、的理论基础的理论基础7/30/202478统计学统计学STATISTICS三、三、ExcelExcel在抽样与抽样分布中的应用在抽样与抽样分布中的应用 (一)EXCELEXCEL在抽样中的应用在抽样中的应用 (二)EXCELEXCEL在抽样分布中的应用在抽样分布中的应用 7/30/202479统计学统计学STATISTICS (一)EXCELEXCEL在抽样中的应用在抽样中的应用1.1.利用函数抽取样本单位利用函数抽取样本单位利用函数利用函数RAND()RAND()进行不重复随机抽样进行不重复随机抽样利用函数利用函数RANDBETWEEN(bottom,topRANDBETWEEN(botto

55、m,top) ) 进行重复随机进行重复随机抽样抽样2.利用数据分析工具中的利用数据分析工具中的“抽样抽样”选项抽取样本单位选项抽取样本单位第一步:第一步:单击工具菜单,选择数据分析选项打开数单击工具菜单,选择数据分析选项打开数 据分析对话框,从中选择抽样。据分析对话框,从中选择抽样。第二步:单击抽样选项,弹出抽样对话框。第二步:单击抽样选项,弹出抽样对话框。第三步:在输入区域框中输入总体单位编号或数字第三步:在输入区域框中输入总体单位编号或数字 所在的单元格区域,并单击确定。所在的单元格区域,并单击确定。 7/30/202480统计学统计学STATISTICS(二)EXCELEXCEL在抽样分

56、布中的应用在抽样分布中的应用 【案例】【案例】 估计样本优等品率的概率范围估计样本优等品率的概率范围 某公司宣称其某批产品的优等品率为80%,现从中抽取80件组成简单随机样本,问样本优等品率达到90%以上的概率约为多少?第一步,第一步,在A1中输入“样本优等品率p” ,在B1中输入“0.9”第二步第二步,在A2中输入“总体优等品率”,在B2中输入“0.8”。第三步第三步,在A3中输入“p的标准差p ”,在B3中输入“=SQRT(B2*(1-B2)/80)”,回车。 第四步第四步,在A4中输入“z值”,在B4中输入“=(B1-B2)/B3”,回车。第五步第五步,在A5中输入“(z)”,在B5中输

57、入“=NORMSDIST(B4)”,回车。第六步第六步,在A6中输入“1-(z)”,在B6中输入“=1-B5”,回车。7/30/202481统计学统计学STATISTICS本章小结1.1.了解抽样的方法及可能样本数目、随机抽了解抽样的方法及可能样本数目、随机抽样的组织形式、抽样方案的设计样的组织形式、抽样方案的设计2.2.理解抽样分布、正态分布、理解抽样分布、正态分布、t t分布的意义分布的意义3.3.了解抽样分布的形成过程了解抽样分布的形成过程4.4.理解抽样分布的大数定律与中心极限定理理解抽样分布的大数定律与中心极限定理5.5.掌握样本均值与样本比例的抽样分布掌握样本均值与样本比例的抽样分布6.6.熟悉熟悉ExcelExcel在抽样与抽样分布中的应用在抽样与抽样分布中的应用7/30/202482

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 工作计划

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号