【2017年整理】数理统计第二章

上传人:豆浆 文档编号:1051856 上传时间:2017-05-26 格式:DOC 页数:61 大小:2.74MB
返回 下载 相关 举报
【2017年整理】数理统计第二章_第1页
第1页 / 共61页
【2017年整理】数理统计第二章_第2页
第2页 / 共61页
【2017年整理】数理统计第二章_第3页
第3页 / 共61页
【2017年整理】数理统计第二章_第4页
第4页 / 共61页
【2017年整理】数理统计第二章_第5页
第5页 / 共61页
点击查看更多>>
资源描述

《【2017年整理】数理统计第二章》由会员分享,可在线阅读,更多相关《【2017年整理】数理统计第二章(61页珍藏版)》请在金锄头文库上搜索。

1、- 1 - 1 -第 2 章 参数估计和概率分布拟合英国著名统计学家 R.A.Fisher 把统计推断归纳为三个方面:抽样分布,参数估计与假设检验.其中参数估计又分为点估计和区间估计.本章主要讨论参数估计,下一章讨论假设检验.后面各章中都会涉及估计和检验的问题.2.1 基本概念2.1.1 简单随机样本在数理统计中,总体就是指一个随机变量(或向量),或一个概率分布 .这F个随机变量(戓概率分布)的特征数或参数就是总体的特征数或参数. 数理统计的任务简单说就是“由样本推断总体”.数理统计学中提出和发展的各种统计方法需要具有普遍性和优良性。而优良性的评估要依据一定的准则,并结合样本的概率性质(即统计

2、模型)给出。对于简单随机样本,样本的联合分布完全取决于总体分布 ,简单随机样F本 具有如下概率性质:nX,.21(1) (代表性)每个 都具有与总体 相同的分布 ;iX)n,(1X(2) (独立性) 相互独立.,21由于简单随机样本具有如此的概率性质,一旦给出总体的概率密度或分布列我们就可以求出样本的联合概率密度或联合分布列(概率质量函数) 。(1)若总体 具有概率密度函数 ,那么 的联合密度为X)x(f )X,(n21f)f(x)x,f( n21n 1(2) 若总体 具有概率质量函数 ,那么 的联合质量函数为)xp(),(n21)p(x)x,p( n21n1XP- 2 - 2 -在抽样调查中

3、,若 是对总体作不重复抽样而得到的样本,那么n2X,1不相互独立,因而 不是简单随机样本,但当样本容量 相n2X,1 n2,1 n对于总体中个体总数 很小时,我们可把 视为简单随机样本.另外,Nn2X,1若总体是无限总体时,那么简单随机抽样得到的样本 视为简单随机n2,1样本. 为建模方便,个体数目 很大的有限总体常被视为无限总体.本章以及本章以后内容中提到的样本大多是简单随机样本,因此以后说到的样本,如无特别声明,均指简单随机样本.例 2.1.1 设 为来自总体 的简单随机样本,那么样本 的nX,1 )(N2 )X,(n1联合概率密度函数为2(11 )-xni ie)x,f(n1iix)(2

4、2)(例 2.1.2 设总体 服从参数为 的指数分布, 为来自该总体的简单随机XnX,1样本,求样本 的联合概率密度函数.),(n1解:总体 的概率密度为0x,e)f(-样本 的联合概率密度为X,n1ixie)x,f(10,n1xnx,i 例 2.1.3 设 为来自总体 的简单随机样本,求样本 的联合nX,1 )p(B1 )X,(n1概率质量函数.- 3 - 3 -解:总体 的概率质量函数为X10,xp)-(1)x(P)xp样本 的联合概率密度为,(n1iix-xi)p(),xp1110,-n1xnxii 2.1.2 统计量及抽样分布在有了样本后,我们需要对样本进行处理或做某些运算,以提取所需

5、要的信息.用数学的语言,就是要构造样本 的函数 ,当有了样本nX,1 )X,(Tn1值 后,就可以完全确定 的值 .称 为统计量.要nx1 T)x(注意的是这里强调了:当样本值确定后,统计量的值就完全确定。因此统计量只是样本 的函数,而不能涉及任何其他的未知量.例如设)X,(Tn1nX,1为来自总体 的样本,那么 是统计量.而对于, )(N2niiX1,当 已知时, 是统计量; 当 未知时, 不是统计量.统计量可以niiXT1 TT是多维的.在具体的统计问题中,构造统计量总是有目的的,是针对特定问题的需要而构造的,目的是把分散在样本中的某方面信息集中起来、提炼出来。比如,如果需要估计总体均值,

6、我们会考虑统计量 ,而不会考虑统计量niiX1.而如果估计总体方差, 我们会想到统计量21)X-(-nSii2(或 ),而不会用统计量 .21)-(-ii2 21)X-(nii niiX1- 4 - 4 -下面是一些常用的统计量:样本均值: ,niiX1样本方差: ,21)-(-nSii2我们常说“ 的自由度为 ”,自由度这个名词有如下两种解释:2(1) 是 个数 , 的平方和,而这 个数受到一个(也只有一个)约束: SX1nn,故只有 个自由度.niiX10)(n(2) 若 代入 中,并将其整理为二次型 ,则 的秩为 .自由ii121)(Xii AX 1n度就定义为这个秩。样本标准差: 2S

7、样本 阶原点矩:knikikXA1样本 阶中心矩: nikik)-(B1样本协方差: ni iixy )Y-(X(-S1样本相关系数: yxy次序统计量:设有样本 ,按如下方式定义随机变量 ,当有了样本值nX,1 )i(X后,将样本值从小到大排序为 ,那么 的取值为 ,称nx1 )n(2)xx1不 )i( )i(x为第 个次序统计量, 是 的一次实现.称 为样本i)X不i )i()i( n)(2(1,不的次序统计量, 是 的一次实现. 和n,1 xn)(2(1,不 Xn)(2(1,不 )(X1分别称为极小和极大次序统计量. 称为样本极差.)( R)(X)(样本分位数:样本 分位数定义为)p(0

8、- 5 - 5 -不不不pn,X21m)(np)(p1样本中位数为不不n,X2m)(n()(50121.注:样本分位数的定义在不同的教材上可能会有所差异。样本经验分布函数:对于任意的实数 , ,即 表示x21#n,ixX)(Vin)x(V样本 中小于或等于 的频数. 经验分布函数定义为nX,1 x,)x(VF由于样本 是 个随机变量,因此统计量 也是随机变量,其n,1 )X,(Tn1概率分布称为抽样分布.当有了具体的样本观察值 后,可得统计量的具体nx1取值 ,称此具体取值为统计量的观察值.)x,(Tn1在统计分析和统计推断中,统计量起着重要作用,对统计量的统计性质的了解就很重要.统计量的统计

9、性质主要涉及两个方面:统计量的特征数(比如,期望、方差等); 统计量的概率分布即抽样分布.性质 2.1.1 设总体 的数学期望为 ,方差为 , 为来自该总体的X2nX,1简单随机样本, 为样本均值和样本方差,则2S,(1) )X(E(2) nVar2(3) 2)S(证明:(1) niinii )X(E)(E)X11- 6 - 6 -(2) ;n)X(Varn)X(Var)(riinii 2121 (3)由于 ,从而 ni iinii )-()-(1212 ii-12nii)X-(E12)X(E-)(nii122221/不2所以 )S(例 2.1.4 设 为来自总体 的简单随机样本, 为极大次n

10、X,1 )(,U0)n(X序统计量,求(1) 的概率密度函数;(2) , .)( XE)n(Var)n解: 的分布函数为,(MaxXn)n(1x,)(F)n10不这里 是分布 的分布函数,从而可得 的概率密度函数为)x()(U)n(X不不,xn)f-M01所以10ndx)X(En1-n2n1-2)n(0.XVar)n( 222 11)n()(-例 2.1.5 设 为来自总体 的简单随机样本, 的分布函数为 ,nX, XX)x(F为样本的经验分布函数,对于任意给定的实数 ,求 , .)x(Fn x(x)FEn(Varn- 7 - 7 -解: 对于任意给定的实数 , ,从而x)(Vn)x(F,B,

11、(x)FEnF)(n1.Var n)(-)(xar12以上结果的推导都用到了简单随机样本的概率性质.2.1.3 正态总体的抽样分布一般而言,统计量的精确分布难以导出.而在正态总体下,样本均值和样本方差等常用统计量的精确分布是可以导出的.下面给出其结果.定理 设 为来自总体 的简单随机样本, 为样本均值和样nX,1 ),N(22S,X本方差,则(1) ,/),N(2(2) ,2S)-n不21niiX-)-n(12(3) 相互独立.,X对于结论(1) ,利用正态分布的性质易得,而(2) , (3)的证明比较复杂,此处略.推论:设 为来自总体 的简单随机样本, 分别为样本均nX,1 ),N(22S,

12、X值和样本方差,则n/S-X)-(t1在数理统计中,经常会遇到对两个或多个总体的均值、方差作比较的问题,此时一般可通过对样本均值的比较、样本方差的比较得出结论.这里就需要知道样本均值之差、样本方差之比的抽样分布.下面给出在正态总体下,样本均值之差、样本方差之比的抽样分布.- 8 - 8 -定理 设 为来自总体 的简单随机样本, 分别为该样本的mX,1 ),N(212xS,X样本均值和样本方差, 为来自总体 的简单随机样本, 分别nY,1 ),(2 2y,Y为此样本的样本均值和样本方差.又设两样本相互独立,则(1) 在 条件下,有21 )-nm(t2nS)-(YXW其中 .212-S)()(yx

13、w(2) 21/Syx )n,mF(2.3.4 统计模型统计分析和推断总是基于一定的统计模型下进行的.统计模型就是样本的联合分布。如何建立统计模型?如何评价统计模型?等等.这些问题很准确论述和回答。只有在具体的统计问题中,去探讨这些问题才有价值.下面先看一个实例:粒子排放量的泊松拟合.人们在对放射性物质在一段时间内放射出的粒子数进行观察时,结果显示单位时间内的发射数不是常数。下表给出了 1207 个时间区间的观测数据,每个区间长 10 秒.观测频数 期望频数n 观测频数 期望频数n02 18 12.23 28 27.04 56 56.55 105 94.910 123 130.611 101

14、99.712 74 69.713 53 45.0- 9 - 9 -6 126 132.77 146 159.18 164 166.99 161 155.614 23 27.015 15 15.116 9 7.917 5 7.1由于在一段时间内放射出的粒子数是随机波动的,分析这个问题时需要建立统计模型(或随机模型) 。若以 表示 10 秒内 粒子放射数.那么 是一个离散XX随机变量。实际观测的数据 看成是随机样本 的一次),(10271x ),(102721实现。那么如何建立统计模型呢?也就是要对样本 的分布提出一,X些假设,如果是简单随机样本,只需给对应的总体 拟合一个概率分布。一般而言,给一个未知的分布,或给总体拟合一个概率分布主要从两个方面去考虑:第一个方面就是“用数据说话”,对观察数据 作初步分析,以初步n1x判断观察数据来自于哪一类分布,要注意的是在数理统计中,观察数据 总n1x,是被认是随机样本 的一次实现;第二个方面就是根据获取数据的方式,n1X,物理机制、专业理论或长期的实践经验等方面的信息加以判断. 根据物理机制及长期的观察和经验,放射的粒子数符合三个假设:(1)事件的发生(即粒子的放射)的基本速率在空间或时间上是常数;(2)事件的在发生不同空

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号