管理统计学第6章统计量及抽样分布d

资源描述

《管理统计学第6章统计量及抽样分布d》由会员分享，可在线阅读，更多相关《管理统计学第6章统计量及抽样分布d（76页珍藏版）》请在金锄头文库上搜索。

1、管理统计学,你不必吃完整头牛，才知道它的肉是咬不动的。 Samel Johson,第 6 章统计量及其抽样分布,6.1 统计量 6.2 关于分布的几个概念 6.3 由正态分布导出的几个重要分布 6.4 样本均值的分布与中心极限定理 6.5 样本比例的抽样分布 6.6 两个样本平均值之差的分布 6.7 关于样本方差的分布,学习目标,了解统计量及其分布的几个概念了解由正态分布导出的几个重要分布理解样本均值的分布与中心极限定理掌握单样本比例和样本方差的抽样分布,抽样分布中的基本概念,总体与样本样本容量与样本个数重复抽样与不重复抽样总体参数与样本统计量,一、总体和样本,1.总体：是研究对象的全

2、体，由许多具有某种相同性质的个体组成。总体中所包含的单位数用N表示。总体中各个单位的标志值用表示。 2.样本：又称子样，来自总体，是从总体中按随机原则抽选出来的部分，由抽选的单位构成。样本单位数用 n 表示，为样本观察值。 3.总体是唯一的、确定的，而样本是不确定的、可变的、随机的。,二、样本容量与样本个数,样本容量：一个样本中所包含的单位数，用n表示。n30，大样本；n30,小样本。样本个数：又称样本可能数目，指从一个总体中所可能抽取的样本的个数。对于有限总体，样本个数可以计算出来。样本个数的多少与样本容量、抽样方法、和抽样组织方式等因素有关。,三、抽样方法,重复抽样与不重复抽样 1.

3、重复抽样：（1）n个单位样本是由n次连续抽取结果构成；（2）每次抽取都是独立的；（3）每次抽取都在相同的条件下进行，每个单位在每次抽取中被抽中的机会相等。,2. 不重复抽样：（1）每次抽取不重复，相当于同时抽取n个单位样本；（2）每次抽取都是不独立的；（3）每个单位在每次抽取中中选机会相等，但是在不同次抽取中中选机会是不均等的。在样本容量相同情况下，重复抽样的样本个数多于不重复抽样的样本个数，而不重复抽样的样本代表性高于重复抽样,四、总体参数和样本统计量,总体参数：反映总体数量特征的指标。其数值是唯一的、确定的。样本统计量：根据样本分布计算的指标。是随机变量。,平均

4、数标准差、方差成数,参数、2 P,统计量S、 S2 p,总体,样本,样本统计量的问题,因为样本是随机抽取的，则样本统计量是随机变量。在调查的例子中，当我们再重新选取200人的样本进行统计后，得到的上网时间的平均数就不一定还等于8.58小时，可能6小时，也可能只有4小时。既然每次抽取的样本之间的统计量都不一致，是否还能用来估计总体的参数？既然样本统计量是个随机变量，不妨先来看一下它概率分布如何,6.1 统计量,6.1.1 统计量的概念 6.1.2 常用统计量 6.1.3 次序统计量 6.1.4 充分统计量p141,统计量(statistic),设X1,X2,Xn是从总体X中抽取的容量为n

5、的一个样本，如果由此样本构造一个函数T(X1,X2,Xn)，不依赖于任何未知参数，则称函数T(X1,X2,Xn)是一个统计量样本均值、样本比例、样本方差等都是统计量统计量是样本的一个函数统计量是统计推断的基础,常用统计量 p140,次序统计量,一组样本观测值X1,X2,Xn由小到大的排序X（1）X（2） X（i） X（n）后，称X（1），X（2），X（n）为次序统计量中位数、分位数、四分位数等都是次序统计量,6.2 关于分布的几个概念,6.2.1 抽样分布 6.2.2 渐进分布 6.2.3 随机模拟获得的近似分布,抽样分布的概念：由样本统计量的全部可能取值和与之相应的概率（频率）组成的

6、分配数列。例如：对总体均值进行推断，从N个单位中随机抽取n个单位组成样本，计算样本均值，假定全部可能的样本有k个，就有k个样本均值，则的概率分布就称为样本平均数的抽样分布。,抽样分布(sampling distribution),样本统计量的概率分布，是一种理论分布在重复选取容量为n的样本时，由该统计量的所有可能取值形成的相对频数分布结果来自容量相同的所有可能样本提供了样本统计量长远而稳定的信息，是进行推断的理论基础，也是抽样推断科学性的重要依据,抽样分布 (sampling distribution),4. 因为样本是随机抽取的，则样本统计量是随机变量。在开始的例子中，当我们再

7、重新选取200人的样本进行统计后，得到的上网时间的平均数就不一定还等于8.58小时，可能6小时，也可能只有4小时。既然每次抽取的样本之间的统计量都不一致，是否还能用来估计总体的参数？既然样本统计量是个随机变量，不妨先来看一下它概率分布如何?,20,21,22,表 10人中有放回抽二人的全部可能样本,23,表任职年限样本均值分布数列,24,25,26,6.3 由正态分布导出的几个重要分布,6.3.1 2分布 6.3.2 t 分布 6.3.3 F 分布,若随机变量X的概率密度函数,记为,正态分布,一般正态分布,正态分布,标准正态分布:当时，记为UN（0，1）,标准正态分布,正态分布,非标

8、准正态分布向标准正态分布的转化若标准化因子则UN（0，1）,正态分布,查表当u大于零时，可查正态分布表但如果u0时，则可由式（-u）=1-（u）求出,正态分布,线性性质：如果 ,且相互独立。对于常数，有下式成立：,正态分布,由阿贝(Abbe) 于1863年首先给出，后来由海尔墨特(Hermert)和卡皮尔逊(KPearson) 分别于1875年和1900年推导出来设，则令，则 Y 服从自由度为1的2分布，即当总体，从中抽取容量为n的样本，则,2分布(2 distribution),2 分布,相互独立且均为服从N（0，1）分布的随机变量，则称随机变量所服从的分布是自由度为n

9、的分布，且记。,分布的变量值始终为正分布的形状取决于其自由度n的大小，通常为不对称的正偏分布，但随着自由度的增大逐渐趋于对称期望为：E(2)=n，方差为：D(2)=2n(n为自由度) 可加性：若U和V为两个独立的2分布随机变量，U2(n1)，V2(n2),则U+V这一随机变量服从自由度为n1+n2的2分布,2分布(性质和特点),c2分布(图示),2分布图,分布,查表：对于给定的，01，可在分布表中查得，即例如即指,分布,t 分布,t 分布,高塞特(W.S.Gosset)于1908年在一篇以“Student”(学生)为笔名的论文中首次提出t 分布是类似正态分布的一种对称分布，它通常要

10、比正态分布平坦和分散一个特定的分布依赖于称之为自由度的参数。随着自由度的增大，分布也逐渐趋于正态分布,且X和Y相互独立，则称随机变量所遵循的分布规律为t分布。,t 分布图示,F 分布,由统计学家费希尔(R.A.Fisher) 提出的，以其姓氏的第一个字母来命名设若U为服从自由度为n1的2分布，即U2(n1)，V为服从自由度为n2的2分布，即V2(n2),且U和V相互独立，则称F为服从自由度n1和n2的F分布，记为,F分布 (F distribution),F分布(图示), 不同自由度的F分布,图4-4,F分布图,F,F分布,查表性质,F分布,6.4 样本均值的分布与中心极限定理,在重复选取

11、容量为n的样本时，由样本均值的所有可能取值形成的相对频数分布一种理论概率分布推断总体均值的理论基础,样本均值的抽样分布,重复抽样分布-样本平均数的分布,例：四名工人甲乙丙丁，他们的日工资分别为50元、60元、70元、80元，则：,样本均值的抽样分布,总体的均值，总体方差为，样本均值与总体均值相等，样本方差等于总体方差的,该题中抽样方法改为不重复抽样，共有12个样本，抽样分布如下：计算得样本平均值的均值和样本方差分别为,不重复抽样分布-样本平均数的分布,我们得到的假定,从上面例子中，我们似乎可以得到这样的假定：重复抽样的样本均值的均值与总体的均值相等，样本均值的方差与总体方差之间的关

12、系为不重复抽样的样本均值的均值与总体的均值相等，样本均值的方差与总体方差之间的关系为,重复抽样下，样本均值的概率分布条形图如下,样本均值的抽样分布与中心极限定理,当总体服从正态分布N(,2)时，来自该总体的所有容量为n的样本的均值x也服从正态分布，x 的数学期望为，方差为2/n。即xN(,2/n),中心极限定理(central limit theorem),从均值为，方差为 2的一个任意总体中抽取容量为n的样本，当n充分大时，样本均值的抽样分布近似服从均值为、方差为2/n的正态分布,中心极限定理(central limit theorem),x 的分布趋于正态分布的过程,如果样本平均数是服从

13、均值为、方差为2的非正态分布中抽取的n个单位的平均数，则随着n的增加样本平均数抽样分布逐渐逼近正态分布，即：在重复抽样下，不重复抽样下，大样本的平均数基本上服从正态分布。,p148例题,61,62,小样本分布定理,如果从均值为、方差未知的正态总体中抽取容量为n的样本，则样本统计量服从自由度df=n-1的t分布，其中，s为样本标准差，即：由于用s代替未知的总体方差，所以样本统计量t不服从正态分布而服从t分布。,6.5 样本比例的抽样分布,总体(或样本)中具有某种属性的单位与全部单位总数之比不同性别的人与全部人数之比合格品(或不合格品) 与全部产品总数之比总体比例可表示为样本比例可

14、表示为,比例(proportion),在重复选取容量为n的样本时，由样本比例的所有可能取值形成的相对频数分布一种理论概率分布当样本容量很大时，样本比例的抽样分布可用正态分布近似推断总体比例的理论基础,样本比例的抽样分布,样本比例的数学期望样本比例的方差重复抽样不重复抽样,样本比例的抽样分布 (数学期望与方差) p150例题,68,6.6 两个样本均值之差的抽样分布,两个总体都为正态分布，即，两个样本均值之差的抽样分布服从正态分布，其分布的数学期望为两个总体均值之差方差为各自的方差之和,两个样本均值之差的抽样分布 p152例题,6.7 关于样本方差的分布,6.7.1 样本方差的分布

15、 6.7.2 两个样本方差比的分布,样本方差的分布,在重复选取容量为n的样本时，由样本方差的所有可能取值形成的相对频数分布对于来自正态总体的简单随机样本，则比值的抽样分布服从自由度为 (n -1) 的2分布，即,73,两个样本方差比的分布,两个总体都为正态分布，即X1N(1 ,12)，X2N(2 ,22 ) 从两个总体中分别抽取容量为n1和n2的独立样本两个样本方差比的抽样分布，服从分子自由度为(n1-1)，分母自由度为(n2-1) 的F分布，即,我们知道了,各样本均数不一定等于总体均数，而是围绕总体均数上下波动，所有样本均数的算术平均数等于总体的均数样本均数间存在差异，这种变异程度由样本均数的标准差描述。在此基础上，我们找到了利用样本数量特征计算总体数量特征的方法,

展开阅读全文

管理统计学第6章 统计量及抽样分布d

管理统计学第6章统计量及抽样分布d