多元正态分布何晓群多元统计分析详解演示文稿

上传人:那****丑 文档编号:290317645 上传时间:2022-05-09 格式:PPT 页数:56 大小:2.24MB
返回 下载 相关 举报
多元正态分布何晓群多元统计分析详解演示文稿_第1页
第1页 / 共56页
多元正态分布何晓群多元统计分析详解演示文稿_第2页
第2页 / 共56页
多元正态分布何晓群多元统计分析详解演示文稿_第3页
第3页 / 共56页
多元正态分布何晓群多元统计分析详解演示文稿_第4页
第4页 / 共56页
多元正态分布何晓群多元统计分析详解演示文稿_第5页
第5页 / 共56页
亲,该文档总共56页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《多元正态分布何晓群多元统计分析详解演示文稿》由会员分享,可在线阅读,更多相关《多元正态分布何晓群多元统计分析详解演示文稿(56页珍藏版)》请在金锄头文库上搜索。

1、多元正态分布何晓群多元统计分析详解演示(ynsh)文稿1页,共56页,星期一。2022/5/81优选多元(du yun)正态分布何晓群多元(du yun)统计分析2页,共56页,星期一。2022/5/82第一章第一章 多元多元(du yun)(du yun)正态分布正态分布一元正态分布在统计学的理论和实际应用中都有着重要(zhngyo)的地位。同样,在多变量统计学中,多元正态分布也占有相当重要(zhngyo)的位置。原因是:许多随机向量确实遵从正态分布,或近似遵从正态分布;对于多元正态分布,已有一整套统计推断方法,并且得到了许多完整的结果。 目录 上页 下页 返回 结束 3页,共56页,星期一

2、。2022/5/83第一章第一章 多元多元(du yun)(du yun)正态分布正态分布 多元正态分布是最常用的一种多元多元正态分布是最常用的一种多元概率分布。除此之外,还有多元对数正概率分布。除此之外,还有多元对数正态分布,多项式分布,多元超几何分布,态分布,多项式分布,多元超几何分布,多元多元 分布、多元分布、多元 分布、多元指数分布、多元指数分布等。本章从多维变量及多元分布的分布等。本章从多维变量及多元分布的基本概念开始,着重介绍多元正态分布基本概念开始,着重介绍多元正态分布的定义及一些重要性质。的定义及一些重要性质。 目录(ml) 上页 下页 返回 结束 4页,共56页,星期一。20

3、22/5/841.11.1多元多元(du yun)(du yun)分布的基本概念分布的基本概念 目录(ml) 上页 下页 返回 结束 1.1.1 随机向量随机向量1.1.2 分布函数与密度函数分布函数与密度函数1.1.3 多元变量的独立性多元变量的独立性1.1.4 随机向量的数字特征随机向量的数字特征5页,共56页,星期一。2022/5/851.1.1 1.1.1 随机随机(su j)(su j)向量向量 表示对同一个体观测的表示对同一个体观测的 个变量。若观测了个变量。若观测了 个个体,则可得到如下表个个体,则可得到如下表1-11-1的数据,称每一个个的数据,称每一个个体的体的 个变量为一个

4、样品,而全体个变量为一个样品,而全体 个样品形成一个样品形成一个样本。个样本。 假定所讨论的是多个变量的总体,所研究的数假定所讨论的是多个变量的总体,所研究的数据是同时观测据是同时观测 个指标(即变量),又进行了个指标(即变量),又进行了 次次观测得到的,把这观测得到的,把这 个指标表示为个指标表示为 常常用向量用向量 目录(ml) 上页 下页 返回 结束 6页,共56页,星期一。2022/5/86 横看表横看表1-11-1,记,记 , 它表示第它表示第 个样品的观测值。竖看表个样品的观测值。竖看表1-1,1-1,第第 列的元素列的元素 表示对表示对 第个变量第个变量 的的n n次观测数值。下

5、面为表次观测数值。下面为表1-11-1n 21 变量变量序号序号 目录 上页 下页 返回(fnhu) 结束 1.1.1 1.1.1 随机随机(su j)(su j)向量向量7页,共56页,星期一。2022/5/871.1.1 1.1.1 随机随机(su j)(su j)向量向量因此因此, ,样本资料矩阵样本资料矩阵(j zhn)(j zhn)可用矩阵可用矩阵(j zhn)(j zhn)语言表语言表示为示为: : 目录 上页 下页 返回 结束 若无特别说明,本书所称向量均指列向量若无特别说明,本书所称向量均指列向量定义定义1.1 设设 为为p个随机变量,由它们组成个随机变量,由它们组成的向量的向

6、量 称为随机向量。称为随机向量。 8页,共56页,星期一。2022/5/88 1.1.21.1.2 分布函数分布函数(hnsh)(hnsh)与密度与密度函数函数(hnsh)(hnsh) 描述随机描述随机(su j)变量的最基本工具是分布函数,类似地描述变量的最基本工具是分布函数,类似地描述随机随机(su j)向量的最基本工具还是分布函数。向量的最基本工具还是分布函数。 目录 上页 下页 返回 结束 多元分布函数的有关性质此处从略。多元分布函数的有关性质此处从略。定义定义1.2 设设 是以随机向量,它的多元分布是以随机向量,它的多元分布函数是函数是式中:式中:9页,共56页,星期一。2022/5

7、/891.1.21.1.2 分布分布(fnb)(fnb)函数与密度函数与密度函数函数 目录 上页 下页 返回(fnhu) 结束 定义1.3:设 = ,若存在一个非负的函数 ,使得 对一切对一切 成立,则称成立,则称 (或(或 )有分布)有分布密度密度 并称并称 为连续型随机向量。为连续型随机向量。 一个一个p p维变量的函数维变量的函数f()f()能作为能作为 中某个随机向量中某个随机向量的分布密度,当且仅当的分布密度,当且仅当10页,共56页,星期一。2022/5/8101.1.31.1.3 多元多元(du yun)(du yun)变量的独立变量的独立性性 目录 上页 下页 返回(fnhu)

8、 结束 定义定义1.4:两个随机向量:两个随机向量 和和 称为是相互独立的,若称为是相互独立的,若注意注意: :在上述定义中,在上述定义中, 和和 的维数一般是不同的。的维数一般是不同的。 对一切对一切 成立。若成立。若 为为 的联合分布函的联合分布函数,数, 分别为分别为 和和 的分布函数,则的分布函数,则 与与 独立独立当且仅当当且仅当 (1.41.4) 若若 有密度有密度 ,用,用 分别表示分别表示 和和 的分布密度,则的分布密度,则 和和 独立当且仅当独立当且仅当 (1.5)(1.5)11页,共56页,星期一。2022/5/8111.1.4 1.1.4 随机向量的数字随机向量的数字(s

9、hz)(shz)特征特征 是一个是一个p p维向量,称为均值向量维向量,称为均值向量. . 目录 上页 下页 返回(fnhu) 结束 当当 为常数矩阵时,由定义可立即推出如下性质:为常数矩阵时,由定义可立即推出如下性质:)(PPm)()6.1)( )(2121X=XEXEXEEmm1 1、随机向量、随机向量 X X的均值的均值 设设 有有P P个分量。若个分量。若 存在,我们定义随机向量存在,我们定义随机向量X X的均值为的均值为: :12页,共56页,星期一。2022/5/8121.1.4 1.1.4 随机向量随机向量(xingling)(xingling)的数字的数字特征特征 目录(ml)

10、 上页 下页 返回 结束 2、随机向量、随机向量 自协方差阵自协方差阵 称它为 维随机向量 的协方差阵,简称为 的协方差阵。称 为 的广义方差,它是协差阵的行列式之值。13页,共56页,星期一。2022/5/813 目录 上页 下页 返回(fnhu) 结束 1.1.4 1.1.4 随机随机(su j)(su j)向量的数字向量的数字特征特征3 3、随机向量、随机向量X X 和和Y Y 的协差阵的协差阵 设设 分别为分别为 维和维和 维随机向量,它们之间的协方差阵定义为一个维随机向量,它们之间的协方差阵定义为一个 矩矩阵,其元素是阵,其元素是 ,即即 当当A A、B B为常数矩阵时,由定义可推出

11、协差阵有如下性质:为常数矩阵时,由定义可推出协差阵有如下性质:14页,共56页,星期一。2022/5/814 目录(ml) 上页 下页 返回 结束 1.1.4 1.1.4 随机向量的数字随机向量的数字(shz)(shz)特征特征(3)设)设X为为 维随机向量,期望和协方差存在记维随机向量,期望和协方差存在记 则则 对于任何随机向量对于任何随机向量 来说,来说,其协差阵其协差阵都是对称阵,同时总是非负定(也称都是对称阵,同时总是非负定(也称半正定)的。大多数情形下是正定的。半正定)的。大多数情形下是正定的。15页,共56页,星期一。2022/5/815 目录(ml) 上页 下页 返回 结束 1.

12、1.4 1.1.4 随机随机(su j)(su j)向量的数字向量的数字特征特征 4 4、随机向量、随机向量X X 的相关阵的相关阵 若随机向量 的协差阵存在,且每个分量的方差大于零,则X X的相关阵定义为: 也称为分量 与 之间的(线性)相关系数。16页,共56页,星期一。2022/5/816 在数据处理时,为了克服在数据处理时,为了克服(kf)(kf)由于指标的量纲不同对统计分由于指标的量纲不同对统计分析结果带来的影响,往往在使用某种统计分析方法之前,常需将析结果带来的影响,往往在使用某种统计分析方法之前,常需将每个指标每个指标“标准化标准化”,即做如下变换,即做如下变换 目录(ml) 上

13、页 下页 返回 结束 1.1.4 1.1.4 随机向量的数字特征随机向量的数字特征17页,共56页,星期一。2022/5/8171.2 1.2 统计统计(tngj)(tngj)距离和马氏距离距离和马氏距离 目录 上页 下页 返回(fnhu) 结束 欧氏距离欧氏距离马氏距离马氏距离18页,共56页,星期一。2022/5/8181.2 1.2 统计统计(tngj)(tngj)距离和马氏距离距离和马氏距离欧氏距离欧氏距离(jl) 在多指标统计分析中,距离的概念十分重要,样品间的不少特征都可用距离去描述。大部分多元方法是建立在简单的距离概念基础上的。即平时人们熟悉的欧氏距离,或称直线距离.如几何平面上

14、的点p=(x1,x2)到原点O=(0,0)O=(0,0)的欧氏距离,依勾股定理有 目录 上页 下页 返回 结束 19页,共56页,星期一。2022/5/8191.2 1.2 统计统计(tngj)(tngj)距离和马氏距距离和马氏距离离 但就大部分统计问题而言,欧氏距离是不能令人满意的。这里因为,每个坐标对欧氏距离的贡献是同等(tngdng)的。当坐标轴表示测量值时,它们往往带有大小不等的随机波动,在这种情况下,合理的办法是对坐标加权,使得变化较大的坐标比变化小的坐标有较小的权系数,这就产生了各种距离。 欧氏距离还有一个缺点,这就是当各个分量为不同性质的量时,“距离”的大小竟然与指标的单位有关。

15、 目录 上页 下页 返回 结束 20页,共56页,星期一。2022/5/8201.2 1.2 统计统计(tngj)(tngj)距离和马氏距距离和马氏距离离 目录 上页 下页 返回(fnhu) 结束 例如,横轴 代表重量(以kg为单位),纵轴 代表长度(以cm为单位)。有四个点A、B、C、D见图1.1,它们的坐标如图1.1所示21页,共56页,星期一。2022/5/8211.2 1.2 统计统计(tngj)(tngj)距离和马氏距离距离和马氏距离 目录(ml) 上页 下页 返回 结束 这时显然AB比CD要长。结果CD反而比AB长!这显然是不够合理的。 现在,如果 用mm作单位, 单位保持不变,此

16、时A坐标为(0,50),C坐标为(0,100),则22页,共56页,星期一。2022/5/8221.2 1.2 统计统计(tngj)(tngj)距离和马氏距距离和马氏距离离 目录(ml) 上页 下页 返回 结束 因此,有必要建立一种距离,这种距离要能够体现各个变量在变差大小上的不同,以及有时存在着的相关性,还要求距离与各变量所用的单位无关。看来我们选择的距离要依赖于样本方差和协方差。因此,采用“统计距离” 这个术语,以区别通常习惯用的欧氏距离。最常用的一种统计距离是印度统计学家马哈拉诺比斯(Mahalanobis)于1936年引入的距离,称为“马氏距离”。 23页,共56页,星期一。2022/5/8231.2 1.2 统计统计(tngj)(tngj)距离和马氏距距离和马氏距离离 目录 上页 下页 返回(fnhu) 结束 下面先用一个一维的例子说明欧氏距离与马氏距离在概率上的差异。设有两个一维正态总体 。若有一个样品,其值在A处,A点距离哪个总体近些呢?由图1-2图1-224页,共56页,星期一。2022/5/8241.2 1.2 统计统计(tngj)(tngj)距离和马氏距离距离和马氏

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 心得体会

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号