品质管理基础_多元正态分布

上传人:aa****6 文档编号:51415509 上传时间:2018-08-14 格式:PPT 页数:60 大小:1.18MB
返回 下载 相关 举报
品质管理基础_多元正态分布_第1页
第1页 / 共60页
品质管理基础_多元正态分布_第2页
第2页 / 共60页
品质管理基础_多元正态分布_第3页
第3页 / 共60页
品质管理基础_多元正态分布_第4页
第4页 / 共60页
品质管理基础_多元正态分布_第5页
第5页 / 共60页
点击查看更多>>
资源描述

《品质管理基础_多元正态分布》由会员分享,可在线阅读,更多相关《品质管理基础_多元正态分布(60页珍藏版)》请在金锄头文库上搜索。

1、多元统计分析何晓群中国人民大学出版社Date1中国人民大学六西格玛质量管理研究中心第一章 多元正态分布目录 上页 下页 返回 结束 1.1 多元分布的基本概念1.2 统计距离和马氏距离1.3 多元正态分布1.4 均值向量和协方差阵的估计1.5 常用分布及抽样分布Date2中国人民大学六西格玛质量管理研究中心第一章 多元正态分布 一元正态分布在统计学的理论和实际应用 中都有着重要的地位。同样,在多变量统 计学中,多元正态分布也占有相当重要的 位置。原因是: 许多随机向量确实遵从正态分布,或近似 遵从正态分布; 对于多元正态分布,已有一整套统计推断 方法,并且得到了许多完整的结果。目录 上页 下页

2、 返回 结束 Date3中国人民大学六西格玛质量管理研究中心第一章 多元正态分布多元正态分布是最常用的一种多元 概率分布。除此之外,还有多元对数正 态分布,多项式分布,多元超几何分布 ,多元 分布、多元 分布、多元指 数分布等。本章从多维变量及多元分布 的基本概念开始,着重介绍多元正态分 布的定义及一些重要性质。目录 上页 下页 返回 结束 Date4中国人民大学六西格玛质量管理研究中心1.1多元分布的基本概念目录 上页 下页 返回 结束 1.1.1 随机向量1.1.2 分布函数与密度函数1.1.3 多元变量的独立性1.1.4 随机向量的数字特征Date5中国人民大学六西格玛质量管理研究中心1

3、.1.1 随机向量表示对同一个体观测的 个变量。若观测了 个个体,则可得到如下表1-1的数据,称每一个个 体的 个变量为一个样品,而全体 个样品形成一 个样本。假定所讨论的是多个变量的总体,所研究的数 据是同时观测 个指标(即变量),又进行了 次 观测得到的,把这 个指标表示为 常 用向量目录 上页 下页 返回 结束 Date6中国人民大学六西格玛质量管理研究中心横看表1-1,记 , 它表示第 个样品的观测值。竖看表1-1,第 列的元素表示对 第个变量 的n次观测数值。下面为表1-1n21变量 序号目录 上页 下页 返回 结束 1.1.1 随机向量Date7中国人民大学六西格玛质量管理研究中心

4、因此,样本资料矩阵可用矩阵语言表示为:定义1.1 设 为 个随机变量,由它们组成的向量 称为随机向量。目录 上页 下页 返回 结束 1.1.1 随机向量若无特别说明,本书所称向量均指列向量Date8中国人民大学六西格玛质量管理研究中心定义1.2 设 是一随机向量,它的 多元分布函数是式中, ,并记成 。1.1.2 分布函数与密度函数描述随机变量的最基本工具是分布函数,类似地描述 随机向量的最基本工具还是分布函数。目录 上页 下页 返回 结束 多元分布函数的有关性质此处从略。Date9中国人民大学六西格玛质量管理研究中心1.1.2 分布函数与密度函数目录 上页 下页 返回 结束 定义1.3:设

5、= ,若存在一个 非负的函数 ,使得对一切 成立,则称 (或 )有分布 密度 并称 为连续型随机向量。一个 维变量的函数 能作为 中某个随机向量 的分布密度,当且仅当Date10中国人民大学六西格玛质量管理研究中心1.1.3 多元变量的独立性目录 上页 下页 返回 结束 对一切 成立。若 为 的联合分布函 数, 分别为 和 的分布函数,则 与 独立 当且仅当 (1.4)定义1.4:两个随机向量 和 称为是相互独立的,若注意:在上述定义中, 和 的维数一般是不同的。若 有密度 ,用 分别表示 和 的分布密度,则 和 独立当且仅当(1.5)Date11中国人民大学六西格玛质量管理研究中心1.1.4

6、 随机向量的数字特征是一个 维向量,称为均值向量.目录 上页 下页 返回 结束 当 为常数矩阵时,由定义可立即推出如下性质 :1、随机向量 的均值设 有 个分量。若 存在,定义随机向量 的均值为)(PPm)()6.1)()(2121X= =XEXEXEEmmDate12中国人民大学六西格玛质量管理研究中心1.1.4 随机向量的数字特征目录 上页 下页 返回 结束 2、随机向量 自协方差阵称它为 维随机向量 的协方差阵,简称为 的协方差阵。称 为 的广义方差,它 是协差阵的行列式之值。Date13中国人民大学六西格玛质量管理研究中心目录 上页 下页 返回 结束 1.1.4 随机向量的数字特征3、

7、随机向量X 和Y 的协差阵设 分别为 维和 维随机向量,它们之间的协方差阵定义为一个 矩 阵,其元素是 ,即当A、B为常数矩阵时,由定义可推出协差阵有如下性质:Date14中国人民大学六西格玛质量管理研究中心目录 上页 下页 返回 结束 1.1.4 随机向量的数字特征(3)设X为 维随机向量,期望和协方差存在记 则对于任何随机向量 来说, 其协差阵都是对称阵,同时总是非负定(也称 半正定)的。大多数情形下是正定的。Date15中国人民大学六西格玛质量管理研究中心目录 上页 下页 返回 结束 1.1.4 随机向量的数字特征4、随机向量X 的相关阵若随机向量 的协差阵存在,且每 个分量的方差大于零

8、,则X的相关阵定义为:也称为分量 与 之间的(线性)相关系数。Date16中国人民大学六西格玛质量管理研究中心在数据处理时,为了克服由于指标的量纲不同对统计分 析结果带来的影响,往往在使用某种统计分析方法之前,常 需将每个指标“标准化”,即做如下变换目录 上页 下页 返回 结束 1.1.4 随机向量的数字特征Date17中国人民大学六西格玛质量管理研究中心1.2 统计距离和马氏距离目录 上页 下页 返回 结束 欧氏距离马氏距离Date18中国人民大学六西格玛质量管理研究中心1.2 统计距离和马氏距离欧氏距离在多指标统计分析中,距离的概念十分重要,样品间的不 少特征都可用距离去描述。大部分多元方

9、法是建立在简单 的距离概念基础上的。即平时人们熟悉的欧氏距离,或称 直线距离.如几何平面上的点p=(x1,x2)到原点O=(0,0)的 欧氏距离,依勾股定理有目录 上页 下页 返回 结束 Date19中国人民大学六西格玛质量管理研究中心1.2 统计距离和马氏距离但就大部分统计问题而言,欧氏距离是不 能令人满意的。这里因为,每个坐标对欧氏距 离的贡献是同等的。当坐标轴表示测量值时, 它们往往带有大小不等的随机波动,在这种情 况下,合理的办法是对坐标加权,使得变化较 大的坐标比变化小的坐标有较小的权系数,这 就产生了各种距离。欧氏距离还有一个缺点,这就是当各个分量 为不同性质的量时,“距离”的大小

10、竟然与指 标的单位有关。目录 上页 下页 返回 结束 Date20中国人民大学六西格玛质量管理研究中心1.2 统计距离和马氏距离目录 上页 下页 返回 结束 例如,横轴 代表重量(以kg为单位),纵轴 代表长度(以cm为单位)。有四个点A、B、C、D见 图1.1,它们的坐标如图1.1所示Date21中国人民大学六西格玛质量管理研究中心1.2 统计距离和马氏距离目录 上页 下页 返回 结束 这时显然AB比CD要长。现在,如果 用mm作单位, 单位保持不变, 此时A坐标为(0,50),C坐标为(0,100),则结果CD反而比AB长!这显然是不够合理的。 Date22中国人民大学六西格玛质量管理研究

11、中心1.2 统计距离和马氏距离目录 上页 下页 返回 结束 因此,有必要建立一种距离,这种距离要能够 体现各个变量在变差大小上的不同,以及有时存 在着的相关性,还要求距离与各变量所用的单位 无关。看来我们选择的距离要依赖于样本方差和 协方差。因此,采用“统计距离” 这个术语,以 区别通常习惯用的欧氏距离。最常用的一种统计 距离是印度统计学家马哈拉诺比斯(Mahalanobis )于1936年引入的距离,称为“马氏距离”。 Date23中国人民大学六西格玛质量管理研究中心1.2 统计距离和马氏距离目录 上页 下页 返回 结束 下面先用一个一维的例子说明欧氏距离与马氏距离在概 率上的差异。设有两个

12、一维正态总体 。若有 一个样品,其值在A处,A点距离哪个总体近些呢?由 图1-2图1-2Date24中国人民大学六西格玛质量管理研究中心1.2 统计距离和马氏距离目录 上页 下页 返回 结束 由图1-2可看出,从绝对长度来看,A点距左面总体G1近 些,即A点到 比A点到 要“近一些”(这里用的是欧氏 距离,比较的是A点坐标与 到 值之差的绝对值),但 从概率观点来看,A点在 右侧约4 处,A点在 的左侧 约3 处,若以标准差的观点来衡量,A点离 比A点离 要“近一些”。显然,后者是从概率角度上来考虑的,因 而更为合理些,它是用坐标差平方除以方差(或说乘以方 差的倒数),从而化为无量纲数,推广到

13、多维就要乘以协 方差阵的逆矩阵 ,这就是马氏距离的概念,以后将 会看到,这一距离在多元分析中起着十分重要的作用。 Date25中国人民大学六西格玛质量管理研究中心1.2 统计距离和马氏距离马氏距离设X、Y从均值向量为,协方差阵为的总体G中抽 取的两个样品,定义X、Y两点之间的马氏距离为(1.21) )()(),(1/2YXYXYX-=-dmXG(1.22) )()(),(1/2XXX-=-Gdm的马氏距离为与总体定义目录 上页 下页 返回 结束 Date26中国人民大学六西格玛质量管理研究中心1.2 统计距离和马氏距离设 表示一个点集, 表示距离,它 是到 的函数,可以证明,马氏距离符合如下距离的四条基本公 理 :;(1), (2) 当且仅当 ; (3) (4) 目录 上页 下页 返回 结束 Date27中国人民大学六西格玛质量管理研究中心1.3 多元正态分布 多元正态分布是一元正态分布的推广。迄今 为止,多元分析的主要理论都是建立在多元正态 总体基础上的,多元正态分布是多元分析的基础 。另一方面,许多实际问题的分布常是多元正态 分布或近似正态分布,或虽本身不是正态分布, 但它的样本均值近似于多元正态分布。本节将介绍多元正态分布的定义,并简要给 出它的基本性质。 目录 上页 下页 返回 结束 Date28中国人民大学六西格玛质量管

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > PPT模板库 > 教育/培训/课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号