[数学]6第六章-统计量及其分布

上传人:F****n 文档编号:88366808 上传时间:2019-04-25 格式:PPT 页数:85 大小:2.74MB
返回 下载 相关 举报
[数学]6第六章-统计量及其分布_第1页
第1页 / 共85页
[数学]6第六章-统计量及其分布_第2页
第2页 / 共85页
[数学]6第六章-统计量及其分布_第3页
第3页 / 共85页
[数学]6第六章-统计量及其分布_第4页
第4页 / 共85页
[数学]6第六章-统计量及其分布_第5页
第5页 / 共85页
点击查看更多>>
资源描述

《[数学]6第六章-统计量及其分布》由会员分享,可在线阅读,更多相关《[数学]6第六章-统计量及其分布(85页珍藏版)》请在金锄头文库上搜索。

1、总体 个体 样本 统计量 抽样分布定理,第六章 统计量及其分布,从历史的典籍中,人们不难发现许多关于钱粮、户口、地震、水灾等等的记载,说明人们很早就开始了统计的工作 . 但是当时的统计,只是对有关事实的简单记录和整理,而没有在一定理论的指导下,作出超越这些数据范围之外的推断.,到了十九世纪末二十世纪初,随着近代数学和概率论的发展,才真正诞生了数理统计学这门学科.,6.1 数理统计学简介,一 什么是数理统计学,研究随机现象规律性的一门学科,以概率论,问题作出推断、预测和决策.,资料,对数据进行分析(统计分析)从而对所研究的,为基础,研究如何用有效的方法收集和利用数据,具体地说,就是研究从一定总体

2、中随机抽出一部分(样本),对样本的性质进行研究,以对总体的性质作出推测性判断的科学(例如,产品质量,人均收入).,为什么要用样本去推测和判断总体的性质,主要有以下几个原因: 破坏性 数量巨大,因为是用部分去推断总体的性质,所以得出的结论就不一定完全正确,分析方法的关键是使可能产生的错误越小越好,以对所提问题作出尽可能正确的结论.,数理统计和概率论有着密切的联系,概率论是数理统计的基础,数理统计是概率论的应用.,概率论是将事件出现的频率抽象为概率的概念进行研究,并由此建立了随机变量的概率分布的基本理论.数理统计则是直接从随机现象的观测值去研究其客观规律性.,二 数理统计学的基本内容, 统计推断,

3、根据实际问题的不同要求,产生了数理统计学的众多研究分支.,本课程侧重于,概括起来分为两大类:,试验的设计和研究,例1 某钢筋厂日产钢筋10000根,质量检查员每天抽查其中50根的强度.,(1)如何从这50根钢筋的强度数据去估计整批10000根的强度平均值,如何估计整批钢筋强度偏离平均值的离散程度?,(2)如果规定了这种钢筋的标准强度,如何由抽查的50个强度数据判断整批钢筋的平均强度与标准强度有无差异?,(于是可提出很多问题),此问题为参数估计.,此问题为假设检验.,(3)抽查的50个强度数据有大有小,如果当天生产的钢筋是采取不同工艺生产的,那么强度呈现的差异是由于工艺不同造成的,还是仅仅由随机

4、因素造成的?,(4)如果钢筋强度与某种原料的成分含量有关,那么从抽查的50个强度与该原料含量的50组对应数据,如何去表达整批钢筋强度与该原料含量的关系?,此问题为方差分析,即分析造成强度差异的原因.,此问题为回归分析.,以上四个问题都是数理统计学研究的基本内容,此外还有正交试验设计,多元统计分析,时间序列分析,抽样理论, 质量控制, 可靠性理论和统计决策理论等.,总体中所含个体的数目可以是有限的,也可以是,6.2 总体和样本,一 总体 个体 样本,总体:就是研究对象的全体.,个体:是组成总体的每个元素.,无限的,分别称为有限总体和无限总体.,从总体中随机抽取 n 个个体,称为容量为n的样本(子

5、样).,任何一个总体,都可以用一个随机变量 X 来表示.,例如,从一批日光灯中随机抽取一个,其寿命 X 显然是,为相同值的日光灯在这批日光灯中所占的比例.因此,一个随机变量,它取各种可能值的概率恰好就是寿命,如果知道X的分布,则这批日光灯的寿命情况就完全清,楚了.即可以用 X 及其分布来描述这批日光灯这一总体.,再例如,从某大学全体学生中随机抽取一个,其学习成绩 X 显然是一个随机变量,它取各种可能值的概率恰好就是成绩为相同值的学生在全校所占的比例.因此,可以用 X 及其分布来描述该校全体学生这一总体.,在统计研究中,人们关心的仅仅是代表总体的一项,(或几项)数量指标以及数量指标的分布情况.,

6、总体就是指某个随机变量X可能取值的全体。X的分布,称为总体的分布.,常用 “总体 X 服从.分布”这一说法.,从总体 X 中随机抽取容量为 n的样本 ,用,表示.不难理解, X 及,都是随机变量.,是n维随机变量.,简单随机样本,简单随机样本是应用中最常见的情形,今后,若取自总体 X的样本 X1, X2 , Xn 相互独立,且与 X 有相同的分布,则称 X1, X2, Xn为取,自总体 X 的简单随机样本. 简称为样本.,当说到“X1, X2 , Xn 是取自某总体的样本”,时,若不特别说明,均指简单随机样本.,(x1, x2, xn),称为样本的一组观测值,,简称样本值 .,一旦取定一组样本

7、,得到的是n个具体的数,一般来说,不同次的抽取(每次取n个),将得到不同,的样本观测值.,样本,所有可能取值的全体称为样本,空间, 它是n维空间或其中的一个子集.,一组样本观测值(x1, x2, xn)就是样本空间中的一个点.,定理1,若(X1, X2 , Xn) 是取自总体 X的样本,而 X的概率密度为f(x)( 或分布函数为F(x) ),则(X1, X2 , Xn) 的联合密度函数为,(或联合分布函数为,),总体X的一个样本,,求样本的联合密度.,例1 设总体,解:因为XU1, 2, 其密度为,Xi的密度,样本的联合密度为,二 理论分布和经验分布,作出经验分布用以观察理论分布的概况.,若总

8、体是随机变量 X, 则 X 的分布就是总体的分布,(称为理论分布). 样本是总体的代表和反映,简单,随机样本能很好地反映总体的情况.通常的方法是,若x1, x2 , xn 为总体 X 的n个独立观测值,称Fn*(x)为总体X作n次独立观察的经验分布函数.,并作函数,定义,将这些值按从小到大的顺序排列为,x1*x2* . xn*,从图中可以看到, Fn*(x)是F(x)的一个近似.,关于Fn*(x)与理论分布F(x)的关系,有如下定理:,对于样本的不同取值, 将得到不同的经验分布函数,Fn*(x), 所以对于x 的每一个数值, Fn*(x)是一个,随机变量.,当n时, Fn*(x)以概率1关于x

9、一致收敛于F(x),这个定理是用样本推断总体的基本理论依据.,定理2(格列汶科),即,Fn*(x)的图形是一条阶梯形曲线, 若样本观测值,不重复, 则每一跃度为 ;,若有重复, 则按 的倍数为跃度.,显然经验分布函数Fn*(x)具有以下性质:, 0 Fn*(x) 1, Fn*(x)单调上升, Fn*(x) 右连续,三 分布密度的近似求法(略),如果 X 是一个连续型随机变量, 可以用样本观测值作出的频率直方图来近似代替分布密度曲线.,由样本去推断总体情况,需要对样本进行“加工”和“提炼”,这就要构造一些样本的函数,它把样本中所含的(某一方面)的信息集中起来.,一 统计量,6.3 统计量和抽样分

10、布,定义,设(X1, X2,. , Xn)为取自总体X的一个样本,T=T(X1, X2,. , Xn)为样本(X1, X2,. , Xn)一个实值连续函数,且T中不含任何未知参数, 则称T(X1,X2,. , Xn)为一个,统计量.,注:,1. 统计量是不含任何未知参数的样本的函数,2. 统计量T=T(X1, X2, . , Xn)是随机变量, 它应该有确定,它是完全由样本决定的量.,的概率分布.,统计量的分布称为抽样分布.,例1,而,都不是统计量.,都是统计量,是取自总体 X 的一个样本,则,设总体XN( , 2), 其中, 2未知,几个常见的统计量:,样本均值:,样本方差:,设X1, X2

11、,. ,Xn,是取自总体X的一个样本,,因为,样本k 阶原点矩:,样本k阶中心矩:,k=1, 2,样本标准差:,k=1, 2,显然,样本(X1, X2,. ,Xn)的观察值为,(x1, x2 , xn ),的观察值分别记为,通常,大写字母表示统计量, 如,小写字母表示观察值, 如,顺序统计量,定义,设(X1, X2,. , Xn)为取自总体X的一个样本,现由样本建立n个函数:,(X1, X2,. , Xn) k=1, 2, ., n,x1* x2* . xn*后的第k个数值.则称X1*, X2*, .Xn*为顺序统计量.,显然,X1* X2* . Xn*,其中Xk*为这样的统计量,它的观察值为

12、xk*. xk*为样本,X1, X2,. , Xn的观察值x1, x2,. , xn中按大小排列,X1*=minX1, X2, ., Xn,Xn* =max X1, X2, ., Xn,称X1*为最小项统计量, Xn*为最大项统计量,称Dn*= Xn*X1*为样本的极差,若n是奇数, 则称 为样本的中值,若n是偶数, 则称 为样本的中值,设(X1, X2,. , X5)为总体X的样本, 今对这个样本进行了三次观察, 其值如下表:,例2,求 , S2及Dn*的观察值,解,二 抽样分布,(常用统计量的分布),1 2分布,2分布是由正态分布派生出来的一种分布.,定义,设随机变量X1, X2,. ,

13、Xn相互独立且均服从,N(0 , 1),则称随机变量,2,所服从的分布为自由度是n的2,分布.,2 (n),2,记为,定理3,随机变量 2 的分布密度函数为,n取不同值时的2 分布,的图形,*例3,相互独立, 都服从,若,正态分布,则,证:,令,i=1, 2,., n,则,又因为 Xi ,所以,Yi N(0, 1),且Y1,Y2,.,Yn,相互独立,所以,2 分布具有下列性质:,性质1,性质2,(2 分布的可加性),若,且X, Y 相互独立,则,2 t 分布 ( student 分布),定义,设 X N(0, 1) , Y ,且X与Y相互独立,,则称随机变量,所服从的分布,为自由度是n的t分布

14、,记为T t(n),定理4,t分布的密度函数为,( t 分布的密度函数fT(x)的图像参见教材 ),(1) fT(x)是偶函数, 图像关于y 轴对称.,注:,(2) t分布曲线很接近标准正态分布曲线.,且当n充分大时,t分布的极限分布是标准正态分布.,所以,(3) 对于较小的n ,t 分布与N (0, 1)分布相差很大.,当n30时,它们的差别已很小.,可以证明, t 分布的期望和方差分别为,3 F分布,若 随机变量X与Y相互独立,且,则称随机变量,所服从的分布为F分布,记为,其中m称为第一自由度, n称为第二自由度.,定理5,F分布的密度函数为,推论:若 FF(m , n) ,则,证:,因为

15、,令,( F分布的密度fF(x)图像参见教材 ),可以证明, F分布的期望和方差分别为,4. 概率分布的分位数,设连续型随机变量 X 的分布函数为F(x), 0p1,若实数满足,PX =F()=p,则称实数为X的概率分布的p分位数.,例如,标准正态分布N(0, 1)的p分位数,即是满足,的实数,也就是说, N(0, 1)的密度曲线下, 的左边的,面积恰好等于p.,上侧分位数:,PX =,满足,的实数称为随机变,量X 的上侧分位数.,N(0, 1), t分布, 2分布, F分布的上侧分位数,通常记为u , t , 2 , F ,这些数值可以查表.,上侧分位数与分位数的关系:,即也是X 的1 分位数.,则有,若X的上侧 分位数为 ,PX =,PX =1 PX = 1 ,双侧分位数1 ,2 ,是指满足,PX 1=,和,PX 2=,的实数1 ,2,显然, 1是 X 的,2是 X 的上侧,分位数,分位数,注意:,若XN(a, 2), 要求X的下侧分位数 ,可化为求 N(0, 1)的分位数,此时,所以,即,(2) 若Tt(n), t (n)表示下侧分位数, 根据t分布的对称性,PT t (n) = 1PT t (n) =1,所以,t (n)=t1 (n),(3)

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > PPT模板库 > PPT素材/模板

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号