多元统计相关分析.ppt

上传人:资****亨 文档编号:130029214 上传时间:2020-04-24 格式:PPT 页数:55 大小:1.41MB
返回 下载 相关 举报
多元统计相关分析.ppt_第1页
第1页 / 共55页
多元统计相关分析.ppt_第2页
第2页 / 共55页
多元统计相关分析.ppt_第3页
第3页 / 共55页
多元统计相关分析.ppt_第4页
第4页 / 共55页
多元统计相关分析.ppt_第5页
第5页 / 共55页
点击查看更多>>
资源描述

《多元统计相关分析.ppt》由会员分享,可在线阅读,更多相关《多元统计相关分析.ppt(55页珍藏版)》请在金锄头文库上搜索。

1、多元统计分析 典型相关分析及应用 研究多个变量与多个变量之间的相关性 典型相关分析 典型相关分析基本理论 典型相关分析求解方法 典型相关系数的假设检验 典型相关分析在SPSS中的运用 统计思想和基本理论 典型相关分析 CanonicalCorrelationAnalysis 是研究两组变量之间相关关系的一种多元计方法 它能够揭示出两组变之间的内在联系 也是一种运用于多元统计中的降维技术 其目的是识别并量化两组变量之间的联系 将两组变量相关关系的分析 转化为一组变量的线性组合与另一组变量线性组合之间的相关关系分析 统计思想和基本理论 典型相关分析最早由1936年霍特林Hotelling在 生物统

2、计 上发表的论文 两组变量之间的关系 提出 其计算方法后经过多年的应用日趋完善 哈罗德 霍特林 HaroldHotelling 1895 1973 统计学界 经济学界 数学界公认大师 典型相关分析相关实例 典型相关分析的应用十分广泛 例如 典型相关分析相关实例 再如 考察一些与财政政策有关的指标 如财政支出总额的增长率 财政赤字增长率 税率降低 和与经济发展的一系列指标如国内GDP增长率 就业增长率 物价上涨率等 来研究扩张性财政政策实施后对宏观经济发展的影响 典型相关分析求解方法 一元统计分析 用相关系数来衡量两个随机变量之间的线性相关关系 用复相关系数研究一个随机变量和多个随机变量的线性相

3、关关系 Q 遇到比较两组变量的相关性问题 怎么办 多元统计分析 运用典型相关分析研究两组变量x1 x2 xp与y1 y2 yq之间的线性关系 将每一组变量作为一个整体进行分析 两组变量间的相关关系 典型相关分析求解方法 典型相关分析通常可采取两种方法 方法1讨论第一组每个变量和第二组每个变量的相互关系 得到pq个相关系数 再用这些相关系数反应两组变量的关系 BUT 在两组变量较多时 方法繁琐也不容易抓到问题实际 简单相关系数的局限性 只是孤立考虑单个X与单个Y间的相关 没有考虑X Y变量组内部各变量间的相关 两组间有许多简单相关系数 例 每组30个变量 使问题显得复杂 难以从整体描述 难以抓到

4、重点 用来描述两个变量的之间的线性相关性 典型相关分析求解方法 方法2在每组变量中选择若干个由代表性的综合指标 这些指标是原始变量的线性组合 代表了原始变量的大部分信息 且两组综合指标的相关程度最大 类似于主成分分析法 新产生的综合指标成为典型相关变量CanonicalVariable 通过少数的几个综合变量来反应两组变量的相关性质 方法2更为简洁直接 典型相关分析的中心思想 典型相关分析的基本思想 首先在每组变量中找出变量的线性组合 使得两组的线性组合之间具有最大的相关系数 然后选取和最初挑选的这对线性组合不相关的线性组合 使其配对 并选取相关系数最大的一对 如此继续下去 直到两组变量之间的

5、相关性被提取完毕为此 被选出的线性组合配对称为典型变量 它们的相关系数称为典型相关系数 典型相关系数度量了这两组变量之间联系的强度 典型相关分析的基本思想 一般情况 设为两个相互关联的随机向量 分别在两组变量中选取若干有代表性的综合变量Ui Vi 使得每一个综合变量是原变量的线性组合 即 典型相关分析的基本思想 与 典型相关分析的基本思想 典型相关分析的基本思想 第一步 估计组合系数使得对应的典型变量和相关系数达到最大 最大的相关系数为第一典型相关系数 且称有最大相关系数的这对典型变量为典型相关变量 第二步 再次估计组合相关系数 找出第二大的典型相关系数 称为第二典型相关西湖 称有第二大相关系

6、数的这对典型变量为第二典型相关变量 设两组的变量个数为p q p q 那么寻求典型变量的过程可一直重复 直到得到P对典型变量 典型相关分析的基本思想 当有少数几对或者一对典型变量能够反映原数据的主要信息 那么两个变量组的相关程度的分析就可以转化为对少数几对 或者对一对典型变量的相关分析 这就是典型相关分析的基本目的 典型相关分析与主成分分析 典型相关分析在某些方面与主成分分析类似 但并不完全相同 二者均是通过构造原变量的适当线性组合提取不同信息 主成分分析着眼于考虑变量的 分散性 信息 考虑的是一组变量内部各个变量直接的相关关系 而典型相关分析则立足于识别和量化二组变量的统计相关性 是两个随机

7、变量之间的相关性在两组变量之下的推广 典型相关分析求解方法 例 1985年中国28省市城市男生 19 22岁 的调查数据 记形态指标身高 cm 坐高 体重 kg 胸围 肩宽 盆骨宽分别为X1 X2 X6 机能指标脉搏 次 分 收缩压 mmHg 舒张压 变音 舒张压 消音 肺活量 ml 分别为Y1 Y2 Y5 现欲研究这两组变量之间的相关性 简单相关系数矩阵 Corr X R11 Corr X R11 Corr X R11 Corr Y R22 典型相关系数和典型变量的求法 在约束条件 下 求a1和b1 使 uv达到最大 令 23 根据数学分析中条件极值的求法 引入Lagrange乘数 求极值问

8、题 则可以转化为求 的极大值 其中 和 是Lagrange乘数 将上面的3式分别左乘和 由 3 式的第二式 得 代入 3 式的第一式 得 的特征根是 相应的特征向量为 由 3 式的第一式 得 代入 3 式的第二式 得 的特征根是 相应的特征向量为 结论 既是M1又是M2的特征根 和是相应于M1和M2的特征向量 至此 典型相关分析转化为求M1和M2特征根和特征向量的问题 第一对典型变量提取了原始变量X与Y之间相关的主要部分 如果这部分还不能足以解释原始变量 可以在剩余的相关中再求出第二对典型变量和他们的典型相关系数 在剩余的相关中再求出第二对典型变量和他们的典型相关系数 设第二对典型变量为 在约

9、束条件 求使达到最大的和 例 Textbookp277 典型相关系数的假设检验 全部总体典型相关系数均为0部分总体典型相关系数为0 例家庭特征与家庭消费之间的关系 为了了解家庭的特征与其消费模式之间的关系 调查了70个家庭的下面两组变量 分析两组变量之间的关系 变量间的相关系数矩阵 两个反映消费的指标与第一对典型变量中u1的相关系数分别为0 9866和0 8872 可以看出u1可以作为消费特性的指标 第一对典型变量中v1与Y2之间的相关系数为0 9822 可见典型变量v1主要代表了了家庭收入 u1和v1的相关系数为0 6879 这就说明家庭的消费与一个家庭的收入之间其关系是很密切的 第二对典型

10、变量中u2与x2的相关系数为0 4614 可以看出u2可以作为文化消费特性的指标 第二对典型变量中v2与Y1和Y3之间的分别相关系数为0 8464和0 3013 可见典型变量v2主要代表了家庭成员的年龄特征和教育程度 u2和v2的相关系数为0 1869 说明文化消费与年龄和受教育程度之间的相关性 4 各组原始变量被典型变量所解释的方差 X组原始变量被ui解释的方差比例 X组原始变量被vi解释的方差比例 y组原始变量被ui解释的方差比例 y组原始变量被vi解释的方差比例 典型相关分析在SPSS中的运用 一 操作步骤在SPSS中没有提供典型相关分析的专门菜单项 要想利用SPSS实现典型相关分析 必

11、须在语句窗口中调用SPSS的Canonicalcorrelation sps宏 具体方法如下 1 按 Syntax的顺序新建一个语句窗口 在语句窗口中输入下面的语句 INCLUDE 路径 Canonicalcorrelation sps CANCORRSET1 x1x2x3x4 SET2 y1y2y3 典型相关分析在SPSS中的运用 2 点击语句窗口Run菜单中的All子菜单项 运行典型相关宏命令 得出结果 典型相关分析求解方法 典型相关分析在SPSS中的运用 二 主要运行结果解释1 CorrelationsforSet 1 CorrelationsforSet 2 CorrelationsB

12、etweenSet 1andSet 2 分别给出两组变量内部以及两组变量之间的相关系数矩阵 2 CanonicalCorrelations 给出典型相关系数 3 Testthatremainingcorrelationsarezero 给出典型相关的显著性检验 4 RawCanonicalCoefficients 分别给出两组典型变量的未标准化系数 5 StandardizedCanonicalCoefficients 分别给出两组典型变量的标准化系数 7 RedundancyAnalysis 分别给出两组典型变量的冗余分析 6 CanonicalLoadingsforSet 1 2 分别给出

13、两组数据中的典型载荷包括交叉载荷 典型载荷是衡量原始变量与典型变量的相关程度的指标 典型相关分析在SPSS中的运用 例2 第277页SPSS算法C R Rao 1952 关于典型相关的经典例子进行分析 列举了25个家庭的成年长子和次子的头长和头宽 利用典型相关分析法分析长子和次子头型的相关性 典型相关分析求解方法 典型相关分析在SPSS中的运用 典型相关分析求解方法 典型相关分析在SPSS中的运用 典型相关分析求解方法 典型相关分析在SPSS中的运用 SPSS操作步骤1 按 Syntax的顺序新建一个语句窗口 在语句窗口中输入下面的语句 INCLUDE Canonicalcorrelation

14、 sps CANCORRSET1 x1x2 SET2 y1y2 2 点击语句窗口Run菜单中的All子菜单项 运行典型相关宏命令 得出结果 典型相关分析求解方法 典型相关分析在SPSS中的运用 主要运行结果解释1 典型相关系数和典型相关的显著性检验从下表可以看出 两队典型变量中 第一对的典型相关系数达到0 788 属于强相关 而第二对典型变量的相关则比较弱 在之后的显著性检验的结果在0 05的显著性水平下 只有第一对典型相关是显著的 典型相关分析求解方法 典型相关分析求解方法 典型相关分析求解方法 典型相关分析求解方法 典型相关分析求解方法 冗余分析以原变量与典型变量间相关为基础 通过计算X Y变量组由自己的典型变量解释与由对方的典型变量解释的方差百分比与累计百分比 反映由典型变量预测原变量的程度 在我们的例子中 长子的头型变量被自身的第一典型变量解释了86 7 次子的头型变量被自身的第一典型变量解释了91 8 此课件下载可自行编辑修改 此课件供参考 部分内容来源于网络 如有侵权请与我联系删除 感谢你的观看

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号