《概率论与数理统计第6章-样本及抽样分布课件》由会员分享,可在线阅读,更多相关《概率论与数理统计第6章-样本及抽样分布课件(74页珍藏版)》请在金锄头文库上搜索。
1、 数理统计是具有广泛应用的一个数学分支,它是在一般统计所进行的数据整理的基础上,用概率论的方法科学地加工、提炼、并做出判断的一门数学学科。其主要思想方法是用局部推断整体。数理统计的内容非常丰富,从本章开始,我们将逐步介绍参数估计、假设检验、方差分析及回归分析的部分内容。第六章第六章 样本及抽样分布样本及抽样分布111随机样本随机样本 在数理统计中,我们往往研究有关对象的某一项数量指标,例如,人体身高、体重、产品合格率等。为此,考虑与这一数量指标相联系的随机试验,即选取一部分对象对这一数量指标进行试验或观察,根据获得的数据来推断全部对象的这些数量指标的分布情况。把研究对象的全体称为总体总体,而把
2、组成总体的各个元素称为个体个体,代表总体的指标X是一个随机变量,所以总体就是指某个随机变量X可能取的值的全体.2 总体中的每一个个体是随机试验的一个观察值,因此它是某一随机变量X的值,这样,一个总体对应于一个随机变量X。对总体的研究就是对一个随机变量X的研究,X的分布函数和数学特征就称为总体的分布函数和数学特征。今后将不区分总体与相应的随机变量,统称为总体X. 从总体中抽取若干个个体,就是对代表总体的随机变量X进行若干次观测,从总体中抽取若干个个体的过程称为抽样,抽样的结果称为样本,样本中所含个体的数量称为样本容量.3 为了使样本在尽可能大的程度上反映总体的特性,我们对样本有基本要求,从总体中
3、抽取样本必须满足:(1) 随机性随机性 为使样本具有充分的代表性,抽样必须是随机的,应使总体中的每一个个体都有同等的机会被抽取到.(2) 独立性独立性 各次抽样必须是相互独立的,即每次抽样的结果既不影响其它各次抽样的结果,也不受其它各次抽样结果的影响.4 称这种随机的、独立的抽样为简单随机抽样,由此得到的样本称为简单随机样本.若是从总体中进行放回抽样,显然就是简单随机抽样,得到的样本就是简单随机样本;若从有限总体中进行不放回抽样,虽然不是简单随机抽样,但当总体容量N很大而样本容量n较小(n/N10%)时,可近似看作放回抽样,从而可近似看作简单随机抽样,得到的样本也可近似地作为简单随机样本.以后
4、提到的抽样与样本均是指简单随机抽样与简单随机样本.5总体总体 研究对象全体元素组成的集合 所研究的对象的某个(或某些)数量指标的全体,它是一个随机变量(或多维随机变量).记为X . X 的分布函数和数字特征称为总体的分布函数和数字特征.6.1 从总体中抽取容量为n的样本,就是对代表总体的随机变量X随机地、独立地进行n次观测,每次观测的结果可以看作一个随机变量,n次观测的结果就是n个随机变量X1,X2Xn,它们相互独立,并与总体X服从相同的分布. 6样本样本 从总体中抽取的部分个体.称 为总体 X 的一个容量为n的样本观测值,或称样本的一个实现.用 表示, n 为样本容量.样本空间样本空间 样本
5、所有可能取值的集合. 个体个体 组成总体的每一个元素 即总体的每个数量指标,可看作随机变量 X 的某个取值.用 表示.7若总体X 的样本 满足:一般,对有限总体,放回抽样所得到的样本为简单随机样本,但使用不方便,常用不放回抽样代替.而代替的条件是(1) 与X 有相同的分布(2) 相互独立简单随机样本简单随机样本N / n 10.总体中个体总数总体中个体总数样本容量样本容量则称 为简单随机样本.8设总体 X 的分布函数为F (x),则样本若总体X 的密度函数为 f( x),则样本的联合密度函数为的联合分布函数为9例如例如 设某批产品共有N 个,其中的次品数为M, 其次品率为 若 p 是未知的,则
6、可用抽样方法来估计它.X 服从参数为p 的0-1分布,可用如下表示方法:从这批产品中任取一个产品,用随机变量X来描述它是否是次品:10设有放回地抽取一个容量为 n 的样本的联合分布为其样本值为样本空间为11若抽样是无放回的,则前次抽取的结果会影响后面抽取的结果.例如所以, 当样本容量 n 与总体中个体数目N 相比很小时, 可将无放回抽样近似地看作放回抽样.12设 是取自总体X 的一个样本, 为一实值连续函数,且不含有未知参数, 则称随机变量为统计量统计量.若是一个样本值,称的一个样本值为统计量定义定义统计量统计量2 2 抽样分布抽样分布13例例 是未知参数, 若 , 已知,则为统计量是一样本,
7、是统计量, 其中则但不是统计量.14常用的统计量常用的统计量为样本均值样本均值为样本方差样本方差为样本标准差样本标准差设是来自总体 X 的容量为 n 的样本,称统计量15为样本的k 阶原点矩原点矩为样本的k 阶中心矩中心矩例如16注注 样本方差样本方差 与样本二阶中心矩与样本二阶中心矩 的不同的不同故推导推导关系式关系式1)17推导推导 设则2)18推导推导 设则3)19例例1 1 从一批机器零件毛坯中随机地抽取10件, 测得其重量为(单位: 公斤): 210, 243, 185, 240, 215, 228, 196, 235, 200, 199求这组样本值的均值、方差、二阶原点矩与二阶中心
8、矩.解解令例例1 120则则21例例2 2 在总体 中,随机抽取一个容量为36的样本,求样本均值 落在50.8到53.8之间的概率.解解故例例2 222例例3 3 设总体X 的概率密度函数为为总体的样本,求(1)(1)的数学期望与方差(2) (3) 解解(1)例例3 323近似近似(3)由中心极限定理(2)24常用统计量的常用统计量的分布分布 前面我们介绍了总体、样本及统计量的概前面我们介绍了总体、样本及统计量的概念。由于样本是随机变量,统计量是样本的函念。由于样本是随机变量,统计量是样本的函数,从而统计量也是随机变量。统计量的分布数,从而统计量也是随机变量。统计量的分布称为称为抽样分布抽样分
9、布。一般情况下,当总体分布已知。一般情况下,当总体分布已知时,求统计量的分布是很困难的。然而,当总时,求统计量的分布是很困难的。然而,当总体服从正态分布时,某些统计量的分布比较容体服从正态分布时,某些统计量的分布比较容易求得。易求得。25(1)(1) 正态分布正态分布则特别地,则若i.i.d.若26标准正态分布的 分位数分布的上 分位数.正态分布的双侧 分位数.定义定义若 ,则称z 为标准正态若 , 则称 为标准27标准正态分布的 分位数图形 z 常用数字/2 -z/2=z1-/2/2 z/2-z/228 定义 设 独立,且都服从标准正态分布,即 ,则称服从自由度为 n 的 分布,记作:分布分
10、布(2)(2)n = 2 时,其密度函数为为参数为1/2的指数分布.29一般其中,在x 0时收敛,称为函数,具有性质的密度函数为自由度为 n 的30n=2n = 3n = 5n = 10n = 15 31例如例如分布的性质分布的性质20.05(10)n = 10性质性质性质性质32相互独立,证证 1设则33(3) (3) t 分布分布 (Student 分布)t t 分布分布定义定义 设则称 T 服从自由度为 n 的T 分布.记为X ,Y相互独立,其密度函数为34t 分布的图形(红色的是标准正态分布)n = 1n=2035t 分布的性质分布的性质1f n(t)是偶函数,2T 分布的上 分位数
11、t 与双测 分位数 t/2 均 有表可查.性质 一般来说,当n 30时,t 分布与标准正态分布就非常接近了。36n = 10t-t37t/2-t/2/2/238(4) F 分布分布F 分布分布则称 F 服从为第第一一自自由由度度为n ,第第二二自自由由度度为 m 的F 分布分布. .记为 其密度函数为定义定义X, Y 相互独立,设令39m = 10, n = 4m = 10, n = 10m = 10, n = 15m = 4, n =10m = 10, n = 10m = 15, n = 1040F 分布的性质分布的性质例如事实上,故求F(n,m)性质41例例1 1 证明证证例142证证例例
12、2 2证明:设令例243分别为样本均值与 样本方差,则1. 3. 与 相互独立;2.定理一 设是来自正态总体的 一个样本,与正态总体的抽样分布正态总体的抽样分布44所以 证明 1.由正态分布的可加性,可知 服从正态分布,又因为2,3的证明略。45证明 由定理一知所以又的 一个样本,则定理二 设是来自正态总体46 由于 与 相互独立,因此 与相互独立,从而由t 分布的定义有:47的两个样本,且它们相互独立,设定理三 设和是分别来自正态总体和分别是这两个样本的样本均值;分别是这两个样本的样本方差,则有48(1)(2) 当 时其中49证明 (1)有定理一知由相互独立性及F分布的定义可知:50(2)
13、由定理条件有所以又因并且它们是相互独立的,故由 分布的可加性可知51从而由独立性条件及 t 分布的定义有 即即52的概率不小于90%,则样本容量至少取多少?例例3 3设 ,为使样本均值大于70解解 设样本容量为 n , 则故令得即所以取例353例例4 4 从正态总体中,抽取了 n = 20的样本(1) 求(2) 求解解 (1)即例454故55(2) (2) 故56例例5 5 设随机变量X 与Y 相互独立,X N(0,16), Y N(0,9) , X1, X2 , X9 与Y1, Y2 , Y16 分别是取自 X 与 Y 的简单随机样本, 求统计量所服从的分布.解解例557从而58例例6 6
14、设总体 的样本,为总体 X 试确定常数c ,使cY 服从分布.解解故因此例659例例7 7 设 是来自N ( , 2 )的简单随机样本, 是样本均值,则服从自由度为n - 1的t 分布的随机变量为例760故应选 (B)解解61例1 设随机变量X和Y相互独立都服从N(0,42),而X1,X2,X16和Y1,Y2,Y16分别来自总体X和Y的样本,则统计量服从 分布,参数为 。由t分布的定义有62自由度参数为16。6364例3 设X1,X2,Xn是来自正态总体N(,2)的样本,则解 因为X N(,2),6566例4 设X1,X2, X3, X4是来自正态总体N(0,22)的样本,X=a(X1-2X2
15、)2+b(3X3-4X4)2,则当a= ,b= 时,统计量X服从2分布,其自由度为 。解 由题设可知,统计量X服从2分布,只有当6768例6设X1,X2,Xn是来自正态总体N(,2)的简单随机样本,其中,2未知,则下面不是统计量的事( )。 解 由于统计量中不含任何未知参数,故选(D).69例7 设总体X N(2,42),X1,X2,Xn为X的样本,则下面结果正确的是( ). 70例8 设X1,X2,Xn是X的样本,X的期望为E(X),且 解 需要注意的是对于有确定分布的X,E(X)是确定的数值;实际上仍是一个随机变量.因而只有(B)项是正确的.故选(B).71例9 从正态总体N(,0.52)中抽取样本X1,X2,X10(1) 已知=0,求概率解(1)由=0,则72(2) 由题设知由此得所求概率为由此得所求概率为7374