概率论:第7章 数理统计的基础知识

上传人:人*** 文档编号:569816171 上传时间:2024-07-31 格式:PPT 页数:76 大小:978.50KB
返回 下载 相关 举报
概率论:第7章 数理统计的基础知识_第1页
第1页 / 共76页
概率论:第7章 数理统计的基础知识_第2页
第2页 / 共76页
概率论:第7章 数理统计的基础知识_第3页
第3页 / 共76页
概率论:第7章 数理统计的基础知识_第4页
第4页 / 共76页
概率论:第7章 数理统计的基础知识_第5页
第5页 / 共76页
点击查看更多>>
资源描述

《概率论:第7章 数理统计的基础知识》由会员分享,可在线阅读,更多相关《概率论:第7章 数理统计的基础知识(76页珍藏版)》请在金锄头文库上搜索。

1、第第7章章 数理统计的基础知识数理统计的基础知识l 总体与样本总体与样本l分布的估计分布的估计l 统计量与抽样分布统计量与抽样分布l 正态总体抽样分布正态总体抽样分布数理统计的任务数理统计的任务 以概率论为理论基础以概率论为理论基础,从统计资料所反映的局部从统计资料所反映的局部特征来推断事物的整体特征特征来推断事物的整体特征。数理统计的应用很广泛,如天气预报、质量控制等数理统计的应用很广泛,如天气预报、质量控制等7.1 总体与样本总体与样本数理统计的研究方法是归纳法,同概率论相反。数理统计的研究方法是归纳法,同概率论相反。概率论概率论中通常已知随机变量的概率分布,然后对其中通常已知随机变量的概

2、率分布,然后对其性质及相互关系进行研究。性质及相互关系进行研究。数理统计数理统计研究的是:一个随机变量所服从的分布是研究的是:一个随机变量所服从的分布是未知的,或者知其分布而不知其中所含的参数,需未知的,或者知其分布而不知其中所含的参数,需要确定这个随机变量的分布或参数。要确定这个随机变量的分布或参数。 概率论与数理统计的区别:概率论与数理统计的区别:n例如,通过检查某厂家一批产品中的个产品,例如,通过检查某厂家一批产品中的个产品,从而设法估计这批产品的合格率。从而设法估计这批产品的合格率。n例如,调查某城市例如,调查某城市1000名住户收支情况,从而了解名住户收支情况,从而了解这城市居民收支

3、分布。这城市居民收支分布。基本概念基本概念对某一问题研究对象的全体称为母体或总体。对某一问题研究对象的全体称为母体或总体。总体总体 组成总体的每一个研究对象称为个体。组成总体的每一个研究对象称为个体。个体个体有限总体有限总体是指其总体中的成员只有有限个。是指其总体中的成员只有有限个。无限总体无限总体是指其总体中的成员有无限多个。是指其总体中的成员有无限多个。 例例1、普查某城市大学生的身体高度。这个城市全体大学生的身高组成总体,且是有限总体,而每个学生的身高就是个体。例例2、一个育苗室各处的温度的全体就是总体,且是无限总体,每处的温度就是个体。1、在实际问题中,总体与个体不是一成不变的,在实际

4、问题中,总体与个体不是一成不变的,而是由我们的研究任务来确定的。而是由我们的研究任务来确定的。2、有限总体与无限总体也是相对的。有时为了研有限总体与无限总体也是相对的。有时为了研究问题的方便,把有限总体个数相当多时近似作为究问题的方便,把有限总体个数相当多时近似作为无限总体去处理,把无限总体分成几个部分当作有无限总体去处理,把无限总体分成几个部分当作有限总体去处理。限总体去处理。注意:注意: 在一个总体中,抽取在一个总体中,抽取n个个体个个体1,2, ,n,这,这n个个个体总称为总体的个体总称为总体的样本或子样,样本或子样,n称为样本容量称为样本容量。样本样本简单随机样本简单随机样本如果一个样

5、本具有如下特性:如果一个样本具有如下特性:n 1)代表性代表性。样本中的每一个分量。样本中的每一个分量i(i=1,2,n)与总体有相同的分布。与总体有相同的分布。n 2)独立性独立性。n个样本个样本1,2, ,n是相互独立的。是相互独立的。则称为则称为简单随机样本简单随机样本,简称样本。,简称样本。样本分布样本分布 对于总体对于总体的样本的样本1,2,n 若若的分布函数为的分布函数为F(x),那么样本(,那么样本( 1,2,n )的联合分布函数为的联合分布函数为 若若的分布密度为的分布密度为 ,那么样本的联合分布密,那么样本的联合分布密度为度为例例1 设总体设总体N(,2),求样本,求样本(1

6、,2,n)的联合分的联合分布密度。布密度。总体总体N(,2),则,则有分布密度有分布密度:解解于是于是(1,2,n)的联合分布密度为的联合分布密度为 在数理统计中,总体的分布往往是未知的,需在数理统计中,总体的分布往往是未知的,需要通过样本找到一个分布来近似代替总体分布。要通过样本找到一个分布来近似代替总体分布。例例 某炼钢厂生产的钢由于各种因素的影响,各某炼钢厂生产的钢由于各种因素的影响,各炉钢的含硅量可以看作是一个随机变量,现记录了炉钢的含硅量可以看作是一个随机变量,现记录了120炉钢的含硅量百分数,求出这个样本的频数分炉钢的含硅量百分数,求出这个样本的频数分布与频率分布。布与频率分布。7

7、.2 分布的估计分布的估计 频率分布频率分布频率分布直方图频率分布直方图 步骤如下步骤如下:(1)决定组距与组数决定组距与组数 选取起点与终点。起点a选得比最小值略小些,终点b选得比最大值略大些,确定组距:d=(ba)/m 将a,b进行等分,即在a,b内插入m1个分点:把a,b分成m个组(即小区间)。通常在试验数据较多(即样本容量n较大)时,可分成1020组,数据在100以内可分成512组。这里的起点、终点、组距、组数可视具体情况来定。(2)数出频数,列出分组频率分布)数出频数,列出分组频率分布 数出样本值x1,x2,xn 落在每个组的数目,计算每个组的频数与频率。(3)绘出频率分布直方图)绘

8、出频率分布直方图 以样本值为横轴,以(频率组距)为纵轴,在横轴上标出各分组的点,以各组的组距为底,画出高度等于(频率组距)的小矩形。整个图形称为频率分布直方图,简称为直方图。 当n相当大时,第k组频率fk可近似表示取值落入 内的 概率,即 因此,直方图的轮廓线可作为随机变量因此,直方图的轮廓线可作为随机变量分布密度函数曲线的一种近似曲线。分布密度函数曲线的一种近似曲线。 频率分布密度曲线频率分布密度曲线 设设x1, x2, xn是总体是总体的一个样本观察值,将它的一个样本观察值,将它们按大小排列为们按大小排列为 ,令,令样本分布函数样本分布函数称称Fn(x)为样本分为样本分布函数布函数(或经验

9、分或经验分布函数布函数)。 对于每一个固定的对于每一个固定的x,Fn(x)是事件是事件 “0,有有 当然有更深刻的结论存在。这就是格里汶科所当然有更深刻的结论存在。这就是格里汶科所给出的关系式:给出的关系式: 由此可见,当由此可见,当n相当大时,经验分布函数相当大时,经验分布函数Fn(x)是母体分布函数是母体分布函数F(x)的一个良好近似。数理统计的一个良好近似。数理统计学中一切都以样本为依据,其理由就在于此。学中一切都以样本为依据,其理由就在于此。 样本是总体的反映,但样本所含信息不能样本是总体的反映,但样本所含信息不能直接用于解决我们所要研究的问题,而需要把直接用于解决我们所要研究的问题,

10、而需要把子样所含的信息进行数学上的加工使其浓缩起子样所含的信息进行数学上的加工使其浓缩起来,从而解决我们的问题。这在数理统计学中来,从而解决我们的问题。这在数理统计学中往往通过构造一个合适的依赖于样本的函数往往通过构造一个合适的依赖于样本的函数(统计量)来达到。(统计量)来达到。7.3 统计量与抽样分布统计量与抽样分布统计量统计量 设设1,2,n是总体是总体的一个样本,若的一个样本,若g(1,2,n)是连续函数,且其中不包含任何未知参数,称样本是连续函数,且其中不包含任何未知参数,称样本函数函数g(1,2,n)为统计量。为统计量。 例例 设1,2,n为母体为母体的子样,的子样,N(a,2),若

11、,若a为已为已知,知,2未知,则未知,则不是不是统计量,因量,因为它含有未知参数它含有未知参数。其中其中常用统计量常用统计量 样本均值样本均值 样本方差样本方差设设1,2,n是从总体是从总体中抽取的一个样本中抽取的一个样本 样本标准差样本标准差(或样本均方差或样本均方差)样本样本k阶阶(原点原点)矩矩样本样本k阶中心矩阶中心矩当k=1时,M1就是样本均值 。记为显然显然定理定理1 设设1,2,n是取自总体是取自总体的一个样本,的一个样本,E=,D=2 ,则,则证明:证明:1)抽样分布抽样分布 统计量的分布称为抽样分布统计量的分布称为抽样分布 设设1,2,n相互独立,且都服从相互独立,且都服从N

12、(0,1)分布,则分布,则称随机变量称随机变量 其中其中定理定理2 t分布分布 设设N(0,1)N(0,1),2(n),且它们相互独立,且它们相互独立, 则称随机变量则称随机变量服从自由度为服从自由度为n n的的t分布分布,记为记为t(n)。即。即Tt(n)随机变量随机变量T T的概率密度为的概率密度为t分布的密度曲线:分布的密度曲线:1、n1时,时,t分布成为分布成为Cauchy分布。分布。Cauchy分布不存在任何阶矩。结论:结论:如如Tt(n),密度函数为,密度函数为f(x)。则。则2)当当n4545时时,t,t分布与分布与N(0,1)N(0,1)接近。接近。3) 当当n2n2时,时,E

13、(T)=0,E(T)=0, 定理定理3:1) f(x)是偶函数。是偶函数。F分布分布服从第一自由度为服从第一自由度为n n1 1、第二自由度为、第二自由度为n n2 2的的F F分布。分布。记为记为F FF(nF(n1 1,n,n2 2) )。如如F FF(nF(n1 1,n,n2 2) ),则其密度函数其密度函数为 下图描绘了F(10,50),F(10,10),F(10,4)的密度曲线。定理定理4:2) 若若Xt (n),则,则X2F(1,n)分位点分位点对给定的对给定的(0x)=成立,则称成立,则称x为此概率分布的为此概率分布的上侧分位点上侧分位点,或或上上分位数、临界值。分位数、临界值。

14、 定义定义 相应地,相应地,若有若有P(x) =成立,则称成立,则称x为下侧分位点。为下侧分位点。本书仅讨论上侧分位点,下侧分位点类似。本书仅讨论上侧分位点,下侧分位点类似。1、标准正态分布的上侧分位点、标准正态分布的上侧分位点成立的u是标准正态分布的上侧分位点是标准正态分布的上侧分位点(或上或上分位分位数数)。对给定的(01),使例例1 求(1)u0. 025,(2)u0.975解解 (1)=0.025, 1=0.975,查正态分布表得u=1.96, 即u0.025=1.96; (2) u0.975u0.0251.962、2 2分布的上侧分位点分布的上侧分位点 对于给定(01),使例例2解解例例3解解3、t分布的上侧分位点分布的上侧分位点 对于给定的(01),使成立的t(n)是t分布的上侧分位点(或上分位数)。其中的f(x)是t(n)的概率密度函数。例例4解解例例5解解4、F分布的上侧分位点分布的上侧分位点 对于给定的(00)的指数分布。求证:例:例:证明:证明:

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 研究生课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号