第一章多元正态分布说课讲解

上传人:youn****329 文档编号:136958440 上传时间:2020-07-04 格式:PPT 页数:76 大小:1.46MB
返回 下载 相关 举报
第一章多元正态分布说课讲解_第1页
第1页 / 共76页
第一章多元正态分布说课讲解_第2页
第2页 / 共76页
第一章多元正态分布说课讲解_第3页
第3页 / 共76页
第一章多元正态分布说课讲解_第4页
第4页 / 共76页
第一章多元正态分布说课讲解_第5页
第5页 / 共76页
点击查看更多>>
资源描述

《第一章多元正态分布说课讲解》由会员分享,可在线阅读,更多相关《第一章多元正态分布说课讲解(76页珍藏版)》请在金锄头文库上搜索。

1、第一章多元正态分布,目录上页下页返回结束,1.1多元分布的基本概念,1.2统计距离和马氏距离,1.3多元正态分布,1.4均值向量和协方差阵的估计,1.5常用分布及抽样分布,第一章多元正态分布,一元正态分布在统计学的理论和实际应用中都有着重要的地位。同样,在多变量统计学中,多元正态分布也占有相当重要的位置。原因是:许多随机向量确实遵从正态分布,或近似遵从正态分布;对于多元正态分布,已有一整套统计推断方法,并且得到了许多完整的结果。,目录上页下页返回结束,第一章多元正态分布,多元正态分布是最常用的一种多元概率分布。除此之外,还有多元对数正态分布,多项式分布,多元超几何分布,多元分布、多元分布、多元

2、指数分布等。本章从多维变量及多元分布的基本概念开始,着重介绍多元正态分布的定义及一些重要性质。,目录上页下页返回结束,1.1多元分布的基本概念,目录上页下页返回结束,1.1.1随机向量,1.1.2分布函数与密度函数,1.1.3多元变量的独立性,1.1.4随机向量的数字特征,横看表1-1,记,它表示第个样品的观测值。竖看表1-1,第列的元素表示对第个变量的n次观测数值。下面为表1-1,目录上页下页返回结束,1.1.1随机向量,2020/7/4,中国人民大学六西格玛质量管理研究中心,7,因此,样本资料矩阵可用矩阵语言表示为:,定义1.1设为个随机变量,由它们组成的向量称为随机向量。,目录上页下页返

3、回结束,1.1.1随机向量,若无特别说明,本书所称向量均指列向量,2020/7/4,中国人民大学六西格玛质量管理研究中心,8,定义1.2设是一随机向量,它的多元分布函数是,式中,并记成。,1.1.2分布函数与密度函数,描述随机变量的最基本工具是分布函数,类似地描述随机向量的最基本工具还是分布函数。,目录上页下页返回结束,多元分布函数的有关性质此处从略。,2020/7/4,中国人民大学六西格玛质量管理研究中心,9,1.1.2分布函数与密度函数,目录上页下页返回结束,定义1.3:设=,若存在一个非负的函数,使得,对一切成立,则称(或)有分布密度并称为连续型随机向量。,一个维变量的函数能作为中某个随

4、机向量的分布密度,当且仅当,2020/7/4,中国人民大学六西格玛质量管理研究中心,10,1.1.3多元变量的独立性,目录上页下页返回结束,注意:在上述定义中,和的维数一般是不同的。,若有密度,用分别表示和的分布密度,则和独立当且仅当(1.5),2020/7/4,中国人民大学六西格玛质量管理研究中心,11,1.1.4随机向量的数字特征,是一个维向量,称为均值向量.,目录上页下页返回结束,当为常数矩阵时,由定义可立即推出如下性质:,1、随机向量的均值设有个分量。若存在,定义随机向量的均值为,2020/7/4,中国人民大学六西格玛质量管理研究中心,12,1.1.4随机向量的数字特征,目录上页下页返

5、回结束,2、随机向量自协方差阵,称它为维随机向量的协方差阵,简称为的协方差阵。称为的广义方差,它是协差阵的行列式之值。,目录上页下页返回结束,1.1.4随机向量的数字特征,3、随机向量X和Y的协差阵,设分别为维和维随机向量,它们之间的协方差阵定义为一个矩阵,其元素是,即,当A、B为常数矩阵时,由定义可推出协差阵有如下性质:,目录上页下页返回结束,1.1.4随机向量的数字特征,(3)设X为维随机向量,期望和协方差存在记则,对于任何随机向量来说,其协差阵都是对称阵,同时总是非负定(也称半正定)的。大多数情形下是正定的。,目录上页下页返回结束,1.1.4随机向量的数字特征,4、随机向量X的相关阵若随

6、机向量的协差阵存在,且每个分量的方差大于零,则X的相关阵定义为:,也称为分量与之间的(线性)相关系数。,在数据处理时,为了克服由于指标的量纲不同对统计分析结果带来的影响,往往在使用某种统计分析方法之前,常需将每个指标“标准化”,即做如下变换,目录上页下页返回结束,1.1.4随机向量的数字特征,中国人民大学六西格玛质量管理研究中心,随机向量数字特征的例子,中国人民大学六西格玛质量管理研究中心,例1-1,例1-1焊接技术培训班有10名学生:基础焊接技术(BWT),焊接技术提高(AWT)和焊接车间实践(PWW)的成绩如表1-1所示(数据文件MV_焊接成绩.BTW)。,中国人民大学六西格玛质量管理研究

7、中心,例1-1,请注意:样本资料阵在形式上与在MINITAB软件中的工作表是完全一致的,工作表的第i行表示第i个样品,工作表的第j列表示对第j个变量的观测值,变量名称常列在表头,中国人民大学六西格玛质量管理研究中心,样本均值向量的计算,中国人民大学六西格玛质量管理研究中心,样本协方差阵(也称为样本方差阵)的计算,中国人民大学六西格玛质量管理研究中心,样本协方差阵(也称为样本方差阵)的计算,由于样本协方差阵是对称的,会话区窗口结果中只显示了协方差阵的下三角部分,所以整个样本协方差阵全部写出则应是:如果采用存储功能,则存储的样本协方差阵就是整个方阵而不是三角阵,这个矩阵对角线上的3个数74.622

8、2、70.2222、34.9,分别是基础焊接技术(BWT),焊接技术提高(AWT)和焊接车间实践(PWW)三门课成绩的样本方差。样本离差阵等于样本协方差阵乘以n1,所以例1-1样本离差阵就是,中国人民大学六西格玛质量管理研究中心,样本相关阵R计算:,中国人民大学六西格玛质量管理研究中心,样本相关阵R计算:,由于样本相关阵是对称的,对角线上全是1,会话区窗口结果中只显示了扣除对角线后的下三角部分,所以整个样本相关阵全部写出则应是:,如果采用存储功能,则存储的样本相关阵就是方阵而不是三角阵。,1.2统计距离和马氏距离,目录上页下页返回结束,欧氏距离,马氏距离,1.2统计距离和马氏距离,欧氏距离,在

9、多指标统计分析中,距离的概念十分重要,样品间的不少特征都可用距离去描述。大部分多元方法是建立在简单的距离概念基础上的。即平时人们熟悉的欧氏距离,或称直线距离.如几何平面上的点p=(x1,x2)到原点O=(0,0)的欧氏距离,依勾股定理有,目录上页下页返回结束,1.2统计距离和马氏距离,但就大部分统计问题而言,欧氏距离是不能令人满意的。这里因为,每个坐标对欧氏距离的贡献是同等的。当坐标轴表示测量值时,它们往往带有大小不等的随机波动,在这种情况下,合理的办法是对坐标加权,使得变化较大的坐标比变化小的坐标有较小的权系数,这就产生了各种距离。欧氏距离还有一个缺点,这就是当各个分量为不同性质的量时,“距

10、离”的大小竟然与指标的单位有关。,目录上页下页返回结束,1.2统计距离和马氏距离,目录上页下页返回结束,例如,横轴代表重量(以kg为单位),纵轴代表长度(以cm为单位)。有四个点A、B、C、D见图1.1,它们的坐标如图1.1所示,2020/7/4,中国人民大学六西格玛质量管理研究中心,29,1.2统计距离和马氏距离,目录上页下页返回结束,这时,显然AB比CD要长。,现在,如果用mm作单位,单位保持不变,此时A坐标为(0,50),C坐标为(0,100),则,结果CD反而比AB长!这显然是不够合理的。,1.2统计距离和马氏距离,目录上页下页返回结束,因此,有必要建立一种距离,这种距离要能够体现各个

11、变量在变差大小上的不同,以及有时存在着的相关性,还要求距离与各变量所用的单位无关。看来我们选择的距离要依赖于样本方差和协方差。因此,采用“统计距离”这个术语,以区别通常习惯用的欧氏距离。最常用的一种统计距离是印度统计学家马哈拉诺比斯(Mahalanobis)于1936年引入的距离,称为“马氏距离”。,1.2统计距离和马氏距离,目录上页下页返回结束,下面先用一个一维的例子说明欧氏距离与马氏距离在概率上的差异。,设有两个一维正态总体。若有一个样品,其值在A处,A点距离哪个总体近些呢?由图1-2,图1-2,2020/7/4,中国人民大学六西格玛质量管理研究中心,32,1.2统计距离和马氏距离,目录上

12、页下页返回结束,由图1-2可看出,从绝对长度来看,A点距左面总体G1近些,即A点到比A点到要“近一些”(这里用的是欧氏距离,比较的是A点坐标与到值之差的绝对值),但从概率观点来看,A点在右侧约4处,A点在的左侧约3处,若以标准差的观点来衡量,A点离比A点离要“近一些”。显然,后者是从概率角度上来考虑的,因而更为合理些,它是用坐标差平方除以方差(或说乘以方差的倒数),从而化为无量纲数,推广到多维就要乘以协方差阵的逆矩阵,这就是马氏距离的概念,以后将会看到,这一距离在多元分析中起着十分重要的作用。,1.2统计距离和马氏距离,马氏距离,设X、Y从均值向量为,协方差阵为的总体G中抽取的两个样品,定义X

13、、Y两点之间的马氏距离为,目录上页下页返回结束,1.2统计距离和马氏距离,设表示一个点集,表示距离,它是到的函数,可以证明,马氏距离符合如下距离的四条基本公理:,(2)当且仅当;,(3),(4),目录上页下页返回结束,1.3多元正态分布,多元正态分布是一元正态分布的推广。迄今为止,多元分析的主要理论都是建立在多元正态总体基础上的,多元正态分布是多元分析的基础。另一方面,许多实际问题的分布常是多元正态分布或近似正态分布,或虽本身不是正态分布,但它的样本均值近似于多元正态分布。本节将介绍多元正态分布的定义,并简要给出它的基本性质。,目录上页下页返回结束,1.3多元正态分布,目录上页下页返回结束,2

14、020/7/4,中国人民大学六西格玛质量管理研究中心,37,1.3.1多元正态分布的定义,|为协差阵的行列式。,目录上页下页返回结束,定义1.5:若元随机向量的概率密度函数为:,则称遵从元正态分布,也称X为元正态变量。记为,定理1.1将正态分布的参数和赋于了明确的统计意义。有关这个定理的证明可参见文献3。,多元正态分布不止定义1.5一种形式,更广泛地可采用特征函数来定义,也可用一切线性组合均为正态的性质来定义等,有关这些定义的方式参见文献3。,目录上页下页返回结束,1.3.1多元正态分布的定义,定理1.1:设则,1.3.2多元正态分布的性质,目录上页下页返回结束,1、如果正态随机向量的协方差阵

15、是对角阵,则X的各分量是相互独立的随机变量。证明参见文献4,p.33。,容易验证,但显然不是正态分布。,2、多元正态分布随机向量X的任何一个分量子集的分布(称为X的边缘分布)仍然遵从正态分布。而反之,若一个随机向量的任何边缘分布均为正态,并不能导出它是多元正态分布。例如,设有分布密度,2020/7/4,中国人民大学六西格玛质量管理研究中心,40,1.3.2多元正态分布的性质,目录上页下页返回结束,3、多元正态向量的任意线性变换仍然遵从多元正态分布。即设,而维随机向量,其中是阶的常数矩阵,是维的常向量。则维随机向量也是正态的,且。即遵从元正态分布,其均值向量为,协差阵为。,4、若,则若为定值,随

16、着的变化其轨迹为一椭球面,是的密度函数的等值面.若给定,则为到的马氏距离。,1.3.3条件分布和独立性,目录上页下页返回结束,我们希望求给定的条件分布,即的分布。下一个定理指出:正态分布的条件分布仍为正态分布。,设p2,将X、和剖分如下:,证明参见文献3。,目录上页下页返回结束,1.3.3条件分布和独立性,定理1.2:设,0,则,(1.28),目录上页下页返回结束,1.3.3条件分布和独立性,定理1.3:设,0,将X,剖分如下:,则有如下的条件均值和条件协差阵的递推公式:,(1.29),(1.30),证明参见3,目录上页下页返回结束,1.3.3条件分布和独立性,服装标准例子,定理1.2和定理1.3在20世纪70年代中期为国家标准部门制定服装标准时有成功的应用,见参考文献3。在制定服装标准时需抽样进行人体测量,现从某年龄段女子测量取出部分结果如下:,X1

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 中学教育 > 教学课件 > 高中课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号