《第八部分常用统计分布》由会员分享,可在线阅读,更多相关《第八部分常用统计分布(18页珍藏版)》请在金锄头文库上搜索。
1、第八章 常用统计分布第一节第一节 超几何分布超几何分布 适用:小群体的两分变量。假定总体为适用:小群体的两分变量。假定总体为K个成功类、(个成功类、(N-K)个为失败类个为失败类 1.超几何分布为离散型随机变量的概率超几何分布为离散型随机变量的概率分布,它的数学形式是分布,它的数学形式是9/5/20249/5/20242 2 2.2.超几何分布的数学期望值和方差超几何分布的数学期望值和方差超几何分布的数学期望值和方差超几何分布的数学期望值和方差如果用如果用 ,则有,则有9/5/20249/5/20243 3 例例 以随机方式自以随机方式自5男男3女的小群体中选出女的小群体中选出5人组成一个人组
2、成一个委员会,求该委员会中女性委员人数的概率分布、期望值与委员会,求该委员会中女性委员人数的概率分布、期望值与变异数。变异数。 解解 由题意可知:由题意可知:N8K3,NK5n5,代入代入(81)式,故概率分布如下:式,故概率分布如下: 由由 , ,代入,代入(84)式、式、(85)式得式得(1)(2)X0 1 2 3 合计合计P=(X=x) 1/56 15/56 30/56 10/5656/569/5/20249/5/20244 4 3.3.关于超几何分布的近似关于超几何分布的近似关于超几何分布的近似关于超几何分布的近似 设某校有设某校有设某校有设某校有l000l000名大学生,其中有外国留
3、学生名大学生,其中有外国留学生名大学生,其中有外国留学生名大学生,其中有外国留学生1010、名,现从该校、名,现从该校、名,现从该校、名,现从该校学生中任抽学生中任抽学生中任抽学生中任抽2 2人,求抽到外国留学生的概率分布。人,求抽到外国留学生的概率分布。人,求抽到外国留学生的概率分布。人,求抽到外国留学生的概率分布。 解解解解 抽到外国留学生人数抽到外国留学生人数抽到外国留学生人数抽到外国留学生人数X X服从服从服从服从N N10001000、K K1010、n n2 2的超的超的超的超几何分布,根据几何分布,根据几何分布,根据几何分布,根据(8(81)1)式得式得式得式得 9/5/2024
4、9/5/20245 5 由于由于由于由于 0 00020020 01 1,用二项分布近似,用二项分布近似,用二项分布近似,用二项分布近似 计算有计算有计算有计算有 ,由,由,由,由(8(86)6)式得式得式得式得 两种方法计算结果比较一下,仅在小数点后第两种方法计算结果比较一下,仅在小数点后第两种方法计算结果比较一下,仅在小数点后第两种方法计算结果比较一下,仅在小数点后第5 5位上位上位上位上才出现误差。当然在才出现误差。当然在才出现误差。当然在才出现误差。当然在0 01 1时,如此计算误差会比较大。时,如此计算误差会比较大。时,如此计算误差会比较大。时,如此计算误差会比较大。另外,二项分布的
5、计算量仍不算小,有时还可以将二项分另外,二项分布的计算量仍不算小,有时还可以将二项分另外,二项分布的计算量仍不算小,有时还可以将二项分另外,二项分布的计算量仍不算小,有时还可以将二项分布近似为泊松分布,这一点我们将在下一节讨论。布近似为泊松分布,这一点我们将在下一节讨论。布近似为泊松分布,这一点我们将在下一节讨论。布近似为泊松分布,这一点我们将在下一节讨论。 9/5/20249/5/20246 6第二节泊松分布第二节泊松分布 适用:适用:稀有事件稀有事件的研究。一个事件的平均发生次数的研究。一个事件的平均发生次数是大量实验的结果,在这些试验中,此事件可能发生,但是大量实验的结果,在这些试验中,
6、此事件可能发生,但是发生的概率非常小。是发生的概率非常小。 泊松分布亦为离散型随机变量的概率分布泊松分布亦为离散型随机变量的概率分布,随机变量,随机变量X为样本内成功事件的次数。若为样本内成功事件的次数。若为成功次数的期望值,为成功次数的期望值,假定它为已知。而且在某一时空中成功的次数很少,超过假定它为已知。而且在某一时空中成功的次数很少,超过5次的成功概率可忽不计,那么次的成功概率可忽不计,那么X的某一具体取值的某一具体取值x(即稀(即稀有事件出现的次数)的概率分布为有事件出现的次数)的概率分布为 9/5/20249/5/20247 7 泊松分布的性质:泊松分布的性质:x的取值为零和一切正整
7、数;图的取值为零和一切正整数;图形是非对称的,但随着的形是非对称的,但随着的增加,图形变得对称;泊松增加,图形变得对称;泊松分布的数学期望和方差均为分布的数学期望和方差均为。9/5/20249/5/20248 8 例例 某城市某城市50天交通事故的频数分布如天交通事故的频数分布如 表所示,试求泊松表所示,试求泊松理论分布。理论分布。X0123 4合计P0.44930.35950.14380.03830.00911.0000理论频(50Pi )22.418.07.21.90.550.0一天交通事故数0123合计天数f23177350 解解 由资料知由资料知查泊松分布表,得理论分布查泊松分布表,得
8、理论分布 将实测频数与理论频数比较,可知题中所述稀有事件是将实测频数与理论频数比较,可知题中所述稀有事件是满足泊松分布的。满足泊松分布的。 9/5/20249/5/20249 9 第三节第三节 卡方分布卡方分布 卡方分布是一种连续型随机变量的概率分布,主要用于列联表卡方分布是一种连续型随机变量的概率分布,主要用于列联表检验。检验。 1.数学形式数学形式 设随机变量设随机变量X1,X2,Xk,相互独立,且都服从同一的正态,相互独立,且都服从同一的正态分布分布N (,2)。那么,我们可以先把它们变为标准正态变量。那么,我们可以先把它们变为标准正态变量Z1,Z2,Zk,k个独立标准正态变量的平方和被
9、定义为卡方分布个独立标准正态变量的平方和被定义为卡方分布( 分布)的随机变量分布)的随机变量 ( 读作卡方),且读作卡方),且 我们把随机变量我们把随机变量 的概率分布称为的概率分布称为 分布,其概率密度记分布,其概率密度记作作 。其中。其中k为卡方分布的自由度,它表示定义式中独立变量为卡方分布的自由度,它表示定义式中独立变量的个数。的个数。 9/5/20249/5/20241010 关于卡方分布的分布函数,附表关于卡方分布的分布函数,附表7对不同的自由度对不同的自由度k及不同的临及不同的临界概率界概率(01),给出了满足下面概率式的,给出了满足下面概率式的 的值的值(参见参见图图)。 注意注
10、意 写法的含义:它写法的含义:它表示自由度为表示自由度为k的卡方分布,当的卡方分布,当其分布函数其分布函数 时,其随机变量时,其随机变量 的临界值的临界值(参参见图见图)。具体来说,在假设检验。具体来说,在假设检验中,它表示在显著性水平中,它表示在显著性水平上卡上卡方分布随机变量方分布随机变量 的临界值。的临界值。 9/5/20249/5/20241111 解解解解 查卡方分布表查卡方分布表查卡方分布表查卡方分布表( (附表附表附表附表7)7)得得得得 例例 试求下列各值:试求下列各值: 例例 已知已知k5, 15,求临界概率,求临界概率。 解解 查卡方分布表,在表中自由度为查卡方分布表,在表
11、中自由度为5的横行中找到的横行中找到与与15最接近的数值是最接近的数值是15086,得到,得到的近似值为的近似值为001。由此可知由此可知 001 9/5/20249/5/20241212 式中:式中:式中:式中: 2 2代表总体方差,自由度为代表总体方差,自由度为代表总体方差,自由度为代表总体方差,自由度为n nll。 2.卡方分布的性质卡方分布的性质 (1) 恒为正值恒为正值 。 (2)卡方分布的期望值卡方分布的期望值 是自由度是自由度k,方差,方差 为为2k。 卡方分布取决于自由度卡方分布取决于自由度k,每一个可能的自由度对应一个具体,每一个可能的自由度对应一个具体的卡方分布。卡方分布只
12、与自由度有关,这就给卡方分布的实际应的卡方分布。卡方分布只与自由度有关,这就给卡方分布的实际应用带来很大方便。分布由正态分布导出,但它之所以与正态分布的用带来很大方便。分布由正态分布导出,但它之所以与正态分布的参数参数和和无关,是因为标准正态变量无关,是因为标准正态变量Z与原来的参数无关。与原来的参数无关。 (3)卡方分布具有可加性卡方分布具有可加性 (4)利用卡方分布可以推出样本方差利用卡方分布可以推出样本方差 S2 的分布的分布9/5/20249/5/20241313 所以,样本方差所以,样本方差所以,样本方差所以,样本方差S S 2 2落在落在落在落在3 33 3和和和和8 87 7之间
13、的概率约为之间的概率约为之间的概率约为之间的概率约为9090。 3. 样本方差的抽样分布样本方差的抽样分布 例例 由一正态总体抽出容量为由一正态总体抽出容量为25的一随机样本,已知的一随机样本,已知26,求,求样本方差样本方差S 2在在33到到87之间的概率。之间的概率。 解解 已知已知n25,26,由,由 得得 9/5/20249/5/20241414 第四节第四节 F 分布分布 F 分布是连续性随机变量的另一种重要的小样本分布,分布是连续性随机变量的另一种重要的小样本分布,可用来检验两个总体的方差是否相等,多个总体的均值是可用来检验两个总体的方差是否相等,多个总体的均值是否相等。还是方差分
14、析和正交设计的理论基础。否相等。还是方差分析和正交设计的理论基础。 1.数学形式数学形式 设设 和和 相互独立,那么随机变量相互独立,那么随机变量 服从自由度为服从自由度为(k1,k2)的的F分布。其中,分子上的自由分布。其中,分子上的自由度度k1叫做第一自由度,分母上的自由度叫做第一自由度,分母上的自由度k2叫做第二自由度。叫做第二自由度。 9/5/20249/5/20241515 我们把随机变量我们把随机变量F的概率分的概率分布称为布称为F分布,其概率密度记分布,其概率密度记作作 。本书附。本书附表表8,对不同自由度,对不同自由度(k1,k2)及及不同的临界概率不同的临界概率(01),给出
15、满足下列概率式的给出满足下列概率式的F(k1,k2)的值的值(参见图参见图)。 注意注意 写法的含义:它表示自由度为写法的含义:它表示自由度为 (k1,k2)的的F分布,当其分布函数分布,当其分布函数 时,其随机变量时,其随机变量 F 的临界值的临界值(参参见图见图)。具体来说,在假设检验中,它表示在显著性水平。具体来说,在假设检验中,它表示在显著性水平上上F分布分布随机变量随机变量 F 的临界值。的临界值。 9/5/20249/5/20241616 例例 试求下列各值:试求下列各值: 如果如果 和和 是两个独立随是两个独立随机样本的方差,样本来源于具有相同机样本的方差,样本来源于具有相同方差
16、方差2的两个正态总体,样本容量的两个正态总体,样本容量分别为分别为n1和和n2,那么根据,那么根据(822)式,式,随机变量随机变量F 服从于自由度为服从于自由度为(n11和和n21)的的F分布。分布。 解解查查F分布表分布表(附表附表8)得得 9/5/20249/5/20241717 2.2. F F分布性质分布性质分布性质分布性质 (1)随机变量随机变量F恒为正值,恒为正值,F分布也是一个连续的非对分布也是一个连续的非对称分布。称分布。 (2)分布具有一定程度的分布具有一定程度的反对称性。反对称性。 (3) F分布的期望值与变异数分布的期望值与变异数(方差方差) 9/5/20249/5/20241818