数理统计总复习

上传人:kms****20 文档编号:56829894 上传时间:2018-10-16 格式:PPT 页数:141 大小:2.89MB
返回 下载 相关 举报
数理统计总复习_第1页
第1页 / 共141页
数理统计总复习_第2页
第2页 / 共141页
数理统计总复习_第3页
第3页 / 共141页
数理统计总复习_第4页
第4页 / 共141页
数理统计总复习_第5页
第5页 / 共141页
点击查看更多>>
资源描述

《数理统计总复习》由会员分享,可在线阅读,更多相关《数理统计总复习(141页珍藏版)》请在金锄头文库上搜索。

1、第一章 统计量及其分布,总体与样本 统计量与抽样分布 次序统计量及其分布 常用的统计分布,第一节 总体与样本,总体与个体 样本与样本分布 从样本去认识总体,2. 独立性: X1,X2,Xn是相互独立的随机变量.,最常用的一种抽样方法叫作“简单随机抽样”,它要求抽取的样本满足下面两点:,1. 代表性: X1,X2,Xn中每一个与所考察 的总体有相同的分布.,抽样方式,若总体的分布函数为F(x),则其简单随机样本的联合分布函数为,样本分布,解,例,解,例,样本数据的整理与显示一、频数频率分布表二、样本数据的图形显示三、经验分布函数,第二节 统计量与抽样分布,一、统计量与抽样分布,二、样本均值及其抽

2、样分布,三、样本方差与样本标准差,四、样本矩及其函数,1. 统计量的定义,一、统计量与抽样分布,是,不是,实例1,2. 几个常用统计量的定义,1) 样本均值,其观察值,(1) 样本矩,可用于推断:E(X).,它反映了总体均值 的信息,定义 设 为取自某总体的样本观察,其算术平均值称为样本均值,一般用表示,即,在分组样本场合,样本均值的近似公式为,其中k为组数,xi为第i组中值,fi为第i组的频数。,样本均值及其抽样分布,定理 若把样本中的数据与样本均值之差称为偏差,则样本所用偏差之和为0,即,定理 数据观察值与均值的偏差平方和最小, 即在形如 的函数中, 最小, 其中c为任意给定常数。,证明,

3、定理:设总体X的均值为,方差为 ,(X1,X2,Xn)是X的一个样本,则有,设X1,X2,Xn为来自某个总体的样本, 为样本均值。,则n较大时 的渐近分布为 ,常记为 这里渐近分布是指n较大时的近似分布。,(1)若总体分布为 则 的分布为 ;,(2)若总体分布未知或不是正态分布,但,2) 样本方差,其观察值,它反映了总体方差 的信息,可用于推断:D(X).,3) 样本标准差,其观察值,4) 修正样本方差,X 1,X2,Xn为从该总体得到的样本, 和 分别是样本均值和样本方差,则 .,定理 设总体X具有二阶矩,即,5) 样本 k 阶(原点)矩,其观察值,6)样本 k 阶中心矩,其观察值,特例:,

4、特例:,样本偏度样本峰度,峰度与偏度,第三节 次序统计量及其分布,次序统计量的概念 次序统计量的抽样分布 分位数 箱线图,次序统计量,特别地,,例如,有 5 个样本:,X1, X2 , X3 , X4 , X5 观察值: 1, 3, 0, 3, 2,排序成: 0, 1, 2, 3, 3 顺序统计量: X(1) ,X(2) ,X(3) ,X(4) ,X(5),定理,极差特征,R反映了样本观察值取值范围的大小 R刻画数据的离散程度不稳健,易受极端值的影响 当总体为正态总体时,在小样本情况下,R可用于估计总体标准差。,样本分位数与样本中位数 样本中位数是样本按大小次序排列后处在中间位置上的次序统计量

5、。 设X(1),X (n)是有序样本,则样本中位数m0.5定义为,中位数的特点,1. 不受极端值的影响 2. 各变量值与中位数的离差绝对值之和最小,即,箱线图 (box plot),箱线图由一组数据的5个特征值绘制而成,它由一个箱子和两条线段组成 其绘制方法是: 首先找出一组数据的5个特征值,即最大值、最小值、中位数Me 和两个四分位数(下四分位数QL和上四分位数QU) 连接两个四分(位)数画出箱子,再将两个极值点与箱子相连接,第四节 三大抽样分布,卡方分布 T分布 F分布,标准正态分布的上 分位数 z,设 X N (0,1) , 0 1, 称满足,的点 z 为X 的上 分位数,z,常用的几个

6、数据,1.,(175),性质1,性质2,定理,t 分布又称学生氏(Student)分布.,2.,(311),定理,定理 4 (两总体均值差的分布),3.,(321),定理 5 (两总体方差比的分布),若Tt(n), 问T2服从什么分布?,解,因为Tt(n),,可以认为,其中UN(0,1), V2(n),,U22(1),, F(1, n).,一个正态总体的抽样分布,两个正态总体的抽样分布,试确定Z的分布.,试确定Z的分布.,例 若Tt(n), 问T2服从什么分布?,解,因为Tt(n),,可以认为,其中UN(0,1), V2(n),,U22(1),, F(1, n).,第二章 参数估计,点估计 点

7、估计优劣的评价标准 区间估计 单侧置信限 比例的区间估计,第一节 点估计,矩估计 极大似然估计,1. 矩估计法,其基本思想是用样本矩估计总体矩 .,理论依据:,或格列汶科定理,它是基于一种简单的“替换”思想建立起来的一种估计方法 .,是英国统计学家K.皮尔逊最早提出的 .,大数定律,矩估计法是英国统计学家K.皮尔逊 最早提出来的 .,由辛钦定理 ,若总体 的数学期望 有限,则有,解,总体X的期望为,从而得到方程,所以的矩估计量为,例 : 设某炸药厂一天中发生着火现象的次数X服从,解,解,得到矩估计量分别为,例3,一般的,若总体的k阶中心距 存在时,其矩法估计为样本的k阶中心矩,矩估计法的具体做

8、法如下,设总体的分布函数中含有k个未知参数 ,它的前k阶矩 ,i=1,2, ,k,从这 k 个方程中解出,j=1,2,k,j=1,2,k,(3)用诸 的估计量 Ai 分别代替上式中的诸 ,即可得诸 的矩估计量 :,(4)矩估计量的观察值称为矩估计值 .,(1) 求出,(2),解 由于,所以由矩法估计,得,解得,所以,参数 的矩估计量为,例5 对容量为n的子样,求下列密度函数中参数 的 矩估计量。,解,设 是总体 的一个样本,,例6,(1),(2),(3),几个常见分布的矩估计,泊松分布 (),二项分布 B (N,p),N 已知,参数为 的指数总体,正态总体N (,2 ),均匀分布 U (a,b

9、),极大似然估计法,思想方法:一次试验就出现的事件有较大的概率,例如: 有两外形相同的箱子,各装100个球一箱 99个白球 1 个红球一箱 1 个白球 99个红球,现从两箱中任取一箱, 并从箱中任取一球, 结果所取得的球是白球.,答: 第一箱.,问: 所取的球来自哪一箱?,既然在一次试验中得到的样本值 ,,那么样本取该样本值的概率应较大,所以选取使,这似然函数 达到最大的参数值作为估计值 ,,称为最大似然估计法.,的概率为,则样本,极大似然估计法的具体作法,求极大似然估计的一般步骤归纳如下:,解,例,这一估计量与矩估计量是相同的。,解,总体X服从参数为的指数分布,则有,所以似然函数为,取对数,

10、令,解得的极大似然估计值为,极大似然估计量为,例 设总体 X N (, 2), X1, X2, Xn 是 X的样本值, 求 , 2 的极大似然估计。,7-26, 2 的极大似然估计量分别为,7-27,极大似然估计的不变性,设 是 的极大似然估计值, u( ),( )是 的连续函数,则 是 u( ) 的极大似然估计值。,7-35,如 在正态总体N (, 2)中, 2的极大似然估计值为,lg 的极大似然估计值为,几个常见分布的最大似然估计,泊松分布 (),二项分布 B (N,p),N 已知,参数为 的指数总体,正态总体N (,2 ),均匀分布 U (a,b),X(1) 、X(n),第二节 点估计的

11、评价标准,对于同一个未知参数, 不同的方法得到的估计量可能不同,于是提出问题,(3) 一致性,(2) 有效性,(1) 无偏性,无偏性,则称 为 的无偏估计 .,证,因而,由于,2有效性,例4:设(X1,X2, X3)是来自总体X的一个样本,证明下面的三个估计量都是总体均值E(X)的无偏估计量,证明,估计量。若对于任意的 ,当n 时,定义 设 是总体参数 的,则称,是总体参数 的相合估计量。,依概率收敛于 , 即,一致性,均方误差,第三节 区间估计,区间估计的概念 一个总体的区间估计 两个总体的区间估计,一、 置信区间定义:,则称随机区间 是 的置信水平(置信度)为 的置信区间.,由图1可以看出

12、,这100个区间中有91个包含参数真值15,另外9个不包含参数真值。,图1 的置信水平为0.90的置信区间,置信区间的意义可以解释如下:如果进行N次随机抽样,每次得到的样本值记为 ,k=1,2,.,N ;则我们随机地得到N个区间( , ),k=1,2,.,N.这N个区间中,有的包含参数的真值,有的不包含.但是,这些区间中,包含参数的真值的区间大约占100( )%.,1.设法构造一个样本和 的函数 使得G的分布不依赖于未知参数。一般称具有这种性质的G为枢轴量。,2.适当地选择两个常数 、 ,使对给定的 ,有p,枢轴量法,3.假如能将 进行不等式等价变形化为 ,则有,这表明 , 是 的 同等置信区

13、间。,一、正态总体方差已知时均值的区间估计,由总体服从正态分布可得,二、正态总体方差未知时均值的区间估计,均值未知时方差的区间估计,一个总体的区间估计,两个正态总体均值差的区间估计,1.枢轴量,1.枢轴量,置信区间为,两个正态总体方差之比的区间估计(均值未知),两个正态总体的区间估计,均值的估计,方差和标准差的估计(均值未知),第三章 假设检验,假设检验的基本概念 正态总体参数的假设检验 比率p的检验 p值 正态概率纸,1.假设(原假设和备择假设),假设是指有一定的理由提出,但有没有充足证据的有关总体分布参数的一种看法,在分析之前就必须陈述。 原假设:待检验的假设,又称“0假设”,记为备择假设

14、:与原假设对立的假设,记为其中,原假设:没有充分理由不能拒绝 备择假设:没有充分理由不能轻易接受 一般来说,零假设总是“受到保护的假设”,没有充分的证据是不能拒绝零假设的。,例如,对一家信誉很好的工厂的产品进行检验, 零假设就应该是“产品合格”;在医学界,如果希望 推出一种新药替代原来长期使用的药品,零假设就 是“新药不比旧药好”,,单侧假设的习惯规定,1. 检验质量是否合格, H0取合格情形.,2. 在技术革新后, 检验参数是否变大,(或变小), H0 取不变大(或不变小),情形, 即保守情形.,例 一项研究表明,改进生产工艺后,会使产品的废品率降低到2%以下。检验这一结论是否成立建立的原假设与备择假设应为H0: 2% H1: 2%,双侧检验 (原假设与备择假设的确定),例如,某种零件的尺寸,要求其平均长度为10cm,大于或小于10cm均属于不合格建立的原假设与备择假设应为H0: = 10 H1: 10,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 科普知识

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号