多元统计分析方法

上传人:枫** 文档编号:432610010 上传时间:2024-01-16 格式:DOCX 页数:18 大小:98.44KB
返回 下载 相关 举报
多元统计分析方法_第1页
第1页 / 共18页
多元统计分析方法_第2页
第2页 / 共18页
多元统计分析方法_第3页
第3页 / 共18页
多元统计分析方法_第4页
第4页 / 共18页
多元统计分析方法_第5页
第5页 / 共18页
点击查看更多>>
资源描述

《多元统计分析方法》由会员分享,可在线阅读,更多相关《多元统计分析方法(18页珍藏版)》请在金锄头文库上搜索。

1、多元统计分析概述目录一、引言 3二、多元统计分析方法的研究对象和主要容 31. 多元统计分析方法的研究对象 32多元统计分析方法的主要容3三、各种多元统计分析方法 31回归分析32. 判别分析63聚类分析84主成分分析105因子分析106. 对应分析方法 1 17. 典型相关分析 1 1多元统计分析12多元统计分析12总结 1314四、方法的一般步骤 五、方法在各个自然领域中的应用 参考文献、引言统计分布是用来刻画 随机变量特征及规律 的重要手段,是进行统计分布的基 础和提 高。多元统计分析方法则是建立在 多元统计分布 基础上的一类处理多元统 计数据方法的 总称,是统计学中的具有丰富理论成果和

2、众多应用方法的重要分 支。在本文中, 我们将对 多元统计分析方法做一个大体的描述, 并通过一部分实 例来进一步了解多元统计分析方法 的具体实现过程。二、多元统计分析方法的研究对象和主要容(一)多元统计分析方法的研究对象由于大量实际问题都涉及到多个变量, 这些变量又是随机变量, 所以要讨论 多个随 机变量的统计规律性。 多元统计分析就是讨论多个随机变量理论和统计方 法的总称。 其 容包括一元统计学中某些方法的直接推广, 也包括多个随即便量特 有的一些问题,多元统 计分析是一类围很广的理论和方法。现实生活中,受多个随机变量共同作用和影响的现象大量存在。 统计分析中, 有两 种方法可同时对多个随机变

3、量的观测数据进行有效的分析和研究。 一种方法 是把多个随机 变量分开分析,一次处理一个随机变量,分别进行研究。 但是, 这样处理忽略了变量之间 可能存在的相关性, 因此,一般丢失的信息太多, 分析 的结果不能客观全面的反映整个 问题, 而且往往也不容易取得好的研究结论。 另 一种方法是同时对多个随机变量进行研 究分析, 此即多元统计方法。 通过对多个 随即便量观测数据的分析, 来研究随机变量总 的特征、 规律以及随机变量之间的 相互关系。所以,多元统计分析是研究多个随机变量之 间相互依赖关系及在统计 规律的一门统计学科。(二)多元统计分析方法的主要容 近年来,随着统计理论研究的不断深入, 多元

4、统计分析方法的容一直在丰富。 其 中,主要容包括多元正态总体参数估计、 假设检验和常用的多元统计方法。 多 元正态总 体参数估计、 假设检验是多元统计推断的核心和基础, 而常用的多元统 计分析方法则是 具体应用。从形式上,常用多元统计分析方法可划分为两类:一类属于单变量常用的统计方法在多元随机变量情况下的推广和应用, 如多 元回归 分析,典型相关分析等;另一类是对多元变量本身进行研究所形成的一些特殊方法。如主成分分析, 因子分 析,聚类分析,判别分析,对应分析等。三、各种多元统计分析方法具体来说,常用的多元统计分析方法主要包括:多元回归分析、聚类分析、 判别分 析、主成分分析、因子分析、对应分

5、析、典型相关分析等。下面我们对各 种多元统计分析 方法就行分别描述,(一) 回归分析回归分析是最灵活最常用的统计分析方法之一, 它用于分析一个因变量与一 个或多 个自变量之间的关系。特别是用于: (1)定量的描述和解释相互关系; (2) 估测或预 测因变量的值。回归分析方法是在众多的相关变量中, 根据实际问题考察其中一个或多个变 量与其 余变量的依赖关系。 如果只要考察一个变量与其余多个变量之间的相互依赖关系,我们称为多元回归问题。若要同时考察多个因变量与多个自变量之间的相互依赖关系,我们称为多因变量的多元回归问题。多元回归分析是研究因变量丫与m个自变量X., X2,丐X的相关关系,而i 2m

6、且总是假设因变量丫为随机变量,而x., x2, xm为一般变量。下面我们来看一下多元 线性回归模型的建立。假定因变量丫与X/ x X线性相关。收集到的n组数据|2m(yt,Xt.,Xt2,Lt t. t2Xt) (t=l,2,n)满足以下回归模型:tmytE(X0 1 t1) O,Var( )t+X (t m tm t 2,Cov(.1,2,L n)j)j0(.j)或N(0, 2),相互独立(t=l,2, L n).tMC=X.O MXn.n.X.m(.n MX)Xnmy.y2 MynE( ),D( )22I0.2 M ,mn则所建回归模型的矩阵形式为丫 C ,Nn(0, 2In ),并称它们

7、为经典多元回归模型,其中丫 是可观测的随机向量,是不可观测的随机向量,C是已知矩阵,2是未知参数,并设nm,且rank(C)二m+1。在经典回归分析中, 我们讨论模型中参数( 0, .,L , m) 和 2的估计和检0.m验问题。近代回归分析中讨论变量筛选、估计的改进,以及对模型中的一些假设进行诊 断等问题。我国国生产总值与基本建设投资额的大小有密切关系,研究发现两变量之间存在线性关系。根据省1990-2003年的国生产总值与基本建设投资额数据,研究它们的数 量规律性,探讨省基本建设投资额与国生产总值的数量关系,原始数据见下表。年份GDP (亿元)基本建设投资(亿元)1990242.829.0

8、41991271.3933.961992317.7939.221993372.2442.891994451.6658.191995553.3562.621996714.18101.421997781.34121.741998869.75157.141999931.98187.492000983.36208.2820011072.51228.6320021161.43263.0620031304.6307.3利用excel进行分析,具体输出以下数据,平方和自由度方差F检验值回归1553189.711553189.7残差59475.667124956.3056313.3765001离差161266

9、5.413复相关系数 R =.5333剩余标准差SY =70.48回归方差与剩余方差之比F =313.3各个自变量的t检验值17.70244334t检验的自由度N-P-1 =12F检验的自由度第一自由度=1,第二自由度=12各个自变量的偏回归平方和1553189.7各个自变量的偏相关系数0.981386594由输出结果,得以下结论:回归方程为丫=232.70+3.68捲其中,负相关系数为R2 = 09814,说明回归方程拟合优度较高。而回归系数的t=17.7024,查t分布表t25 ( 12)2.1788,小于t值,因此回归系数显著。查F分o 25布表,F 5 (1,12) 4.75,由下表知

10、,F=31337654.75,因此回归方程也显著。O.O5平方和自由度方差F检验值回归1553189.711553189.7313.3765001残差59475.667124956.3056离差1612665.413(二)判别分析判别分析是多元统计分析中用于判别样品所属类型的一种统计分析方法,是 一种在 已知研究对象用某种方法已经分成与若干类的情况下,确定新的样品属于哪一类的多元统 计分析方法。判别方法处理问题时,通常通常要给出用来衡量新样品与各已知组别的接近程度的 指数,即判别函数,同时也指定一种判别准则,借以判别新样品的归属。所谓判别准则是 用于衡量新样品与各已知组别接近程度的理论依据和方

11、法准则。常用的有,距离准则、 Fisher准则、贝叶斯准则等。距离判别的基本思想是:样 品和那个总体距离最近,就判断 它属于哪个总体。距离判别也称直观判别。已知有两个类6和幺,比如G是设备A生产的产品,G2是设备B生产的同类产品。设备A的产品质量高(如考察指标为耐磨度X),其平均耐磨度(1)=80,反映设备精度的方差反映设备精度的方差12 =025;设备B的产品质量稍差,其平均耐磨度2=75, ;=4。今有一产品X,测得耐磨度X0=78,试判断该产品0是哪一台设备生产的?F面考虑一种相对于分散性的距离。记X与G!或的相对平均距离为!2仅2 2 2d (X )或 d (X ),则有:d (x )

12、1 0 2 0 1 1)2= 0一加16,d (x ) =凶心5!_ =22.25。4.00因为 d (x ) =1 5v4=d (x ),2 o 1 。按这种距离准则应判X为设备B生产的。O般的,我们假设总体G的分布为N (1) 12),总体G2的分布为N (),则利用相对距离的定义,可以找出分界点(不妨设(1)12),(X)2xx212def1,和 x= 2 def1数。经验样品中,第一类取11 (主茎型)个样品,第二类(分蘖型)取12个样 品,数据如下表所示X1X2X3 判别归类X1X2X3判别归类10.713.8012.00111.004. 2515.162第20.783.8612.1

13、71第21.003.4316.25231.002.105.70131.003.7011.402类40.701.705.901二41.003.8012.402一50.301.806.101一51.004.0013.602主60.603.4010. 201分61.004.0012.802茎71.003.6010. 201蘖71.004. 2013.402型80.503.5010.501型81.004.3014.002)90.505.0011.501)91.005.7015.802100.714.0011. 251101.004. 7020.402111.004.5012.002111.004.6014.002121.004.5614.602一-Xi0.70913.38739.7746Xi0.984.2714.4842表计

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 建筑/环境 > 建筑资料

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号