多元统计分析——对应分析ppt课件

上传人:资****亨 文档编号:135789755 上传时间:2020-06-18 格式:PPT 页数:37 大小:245.50KB
返回 下载 相关 举报
多元统计分析——对应分析ppt课件_第1页
第1页 / 共37页
多元统计分析——对应分析ppt课件_第2页
第2页 / 共37页
多元统计分析——对应分析ppt课件_第3页
第3页 / 共37页
多元统计分析——对应分析ppt课件_第4页
第4页 / 共37页
多元统计分析——对应分析ppt课件_第5页
第5页 / 共37页
点击查看更多>>
资源描述

《多元统计分析——对应分析ppt课件》由会员分享,可在线阅读,更多相关《多元统计分析——对应分析ppt课件(37页珍藏版)》请在金锄头文库上搜索。

1、第7章对应分析CorrespondenceAnalysis 7 1列联表及列联表分析7 2对应分析 7 1列联表及列联表分析 一 列联表及其作用1 列联表是观测数据按两个或更多属性变量 定类尺度或定序尺度 分类时所列出的频数表 2 列联表用于考察两个 或多个 分类变量的统计学关联 如行变量与列变量之间的关联性 一般 若总体中的个体可按两个属性A与B分类 A有n类A1 A2 An B有p类B1 B2 Bp 属于Ai和Bj的个体数目为nij i 1 2 n j 1 2 p nij称为频数 则可形成n p的二维列联表 简称n p表 若所考虑的属性多于两个 也可按类似的方式作出列联表 称为多维列联表

2、列联表 频率意义上的列联表 列联表独立性检验 对于数值型变量相关关系 通常是计算相关系数和进行回归分析 描述两个定性变量之间的相关性是指广义的相关性 称为关联性 两个定性变量的关联程度在某种意义上就是指的 不独立 它与独立的情形差距越大 就表明彼此的关系越密切 这种关系不一定是线性关系 在实际问题中 重要的是判断变量之间是否独立 因为不独立就意味着关联 最常用的检验办法是列联表独立性检验 列联表检验的零假设是两变量X和Y相互独立 计算一个卡方统计量 与列联表中频数取值和零假设下期望取值之差有关 当卡方很大时否定零假设 例吸烟与慢性支气管炎调查表 为了探讨吸烟与慢性支气管炎有无关系 调查了339

3、人 情况如表所示 设想有两个随机变量A B A 1表示吸烟 2表示不吸烟 B 1表示患慢性支气管炎 2表示未患 零假设为 H0 A与B相互独立 STATISTICSFORTABLEOFSMOKEBYBRONStatisticDFValueProbChi Square17 4690 006LikelihoodRatio17 9250 005Chi SquareContinuityAdj Chi Square16 6740 010Mantel HaenszelChi Square17 4470 006Fisher sExactTest Left 4 09E 03 Right 0 998 2 Tai

4、l 6 86E 03PhiCoefficient 0 148ContingencyCoefficient0 147Cramer sV 0 148SampleSize 339 列联表中列出了表格单元频数和在零假设下的期望频数 可以看出 吸烟人中患病的数目比期望数目大 检验的结果只要看后面的统计量部分的Chi Square一行 其值为7 469 p值为0 006 所以应否定零假设 吸烟与患慢性支气管炎是不独立的 对应分析又称为相应分析 也称R Q分析 是因子分子基础发展起来的一种多元统计分析方法 它主要通过分析属性 定性 变量构成的列联表来揭示变量之间的关系 可以用对应分析图 二维图 显示列联表中

5、每一个单元格的相对位置 以简单 直观地表明列联表的行与列的关系 对应分析也是利用降维的思想以达到简化数据结构的目的 不过 在因子分析中 R型因子分析和Q型因子分析是分开进行的 对应分析的基本思想是将一个联列表的行和列中各元素的比例结构以点的形式在较低维的空间中表示出来 在对应分析中 会同时对行与列进行处理 寻求以低维图形表示数据表中的行与列的关系 对同一观测数据施加R和Q型因子分析 并分别保留两个公共因子 则是对应分析的初步 7 2对应分析 对应分析基本步骤 1 获取对应分析数据确定研究目的 选择对应分析所需数据 应该包括的背景资料 2 建立列联表3 对应分析4 利用对应图解释结果 二 对应分

6、析的原理 由于R型因子分析和Q型因子分析是反映一个整体的不同侧面 R型因子分析是从列来讨论 对变量 Q型因子分析是从行来讨论 对样品 因此他们之间存在内在的联系 设原始数据矩阵为 由于因子分析都是基于协方差矩阵或相关系数矩阵完成的 所以必须从变量和样品的协方差矩阵入手来进行分析 变量的叉积矩阵 样品的叉积矩阵 显而易见 变量和样品的叉积矩阵的阶数不同 一般来说 他们的非零特征根也不一样 那么能否将观测值做变换 一 规格化矩阵 我们可以把pij解释成概率 因为所有的元素之和为1 称为行轮廓 即把第i行表示成在p维欧氏空间中的一个点 行轮廓矩阵为 由此 我们可以将属性变量A的n个取值可以用P维空间

7、的n个点来表示 n个点的坐标即为该行轮廓矩阵 但是 因为原始变量的数量等级可能不同 所以为了尽量减少各变量尺度差异 将行轮廓中的各列元素均除以其期望的平方根 得矩阵D R 第j个变量的期望为 矩阵D R 是消除了变量B的各个状态概率影响的P维空间n个点的相对坐标 则这n个点的重心 也有p维坐标 设其第j个分量为 N个点的重心为 总惯量由矩阵D R 定义的n个点与其重心的欧氏距离之和称为行轮廓矩阵N R 的总惯量 记为 同时 可证明 称为列轮廓 同理 列轮廓矩阵为 因为原始变量的数量等级可能不同 所以为了尽量减少各变量尺度差异 将列轮廓中的各行元素均除以其期望的平方根 得矩阵D Q 利用行轮郭矩

8、阵 可得第i个样品与第j个样品的协方差 令Z为zij所组成的矩阵 则 利用列轮廓矩阵 可得第i个变量与第j个变量的协方差 令Z为zij所组成的矩阵 则 设是A Z Z的非零特征根 则 令Z为zij所组成的矩阵 则 因此将矩阵变换成矩阵Z 则很容易求出A和B存在着的简单对应关系 由特征根和特征向量的性质 A和B有相同的非零特征根 在上式的两边都左乘Z 则可见也是ZZ 的特征根 相应的特征向量是 三 对应图 设 1 2 l 0 i min n p 为矩阵A和B的非零特征根 其相应的特征向量为 我们知道因子载荷矩阵的含义是原始变量与公共因子之间的相关系数 所以如果我们构造一个平面直角坐标系 将第一公

9、共因子的载荷与第二个公共因子的载荷看成平面上的点 在坐标系中绘制散点图 则构成对应图 例某地环境检测部门对该地所属8个地区的大气污染状况进行了系统的的检测 每天4次同时在各个地区抽取大气样品 则定其中的氯 硫化氢 二氧化硫 碳4 环氧氯丙烷 环已烷6种气体的浓度 有资料如下 0 0560 0840 0310 0380 00810 0220 0490 0550 10 110 0220 00730 0380 130 0790 170 0580 0430 0340 0950 0580 160 20 0290 0840 0660 0290 320 0120 0410 0640 0720 10 210

10、0281 380 0480 0890 0620 260 0380 0360 0690 0870 0270 050 0890 021 F1和G1 F2和G2尺度相同 所以可以在同一个直角坐标系中作出两种因子的载荷图 这种图称为对应图 0 20 0 15 0 10 0 05 0 00 0 05 0 10 0 15 0 20 0 25 0 30 0 6 0 5 0 4 0 3 0 2 0 1 0 0 0 1 0 2 0 3 变量 样品 对应图 由图我们可以看出 全部变量与样品分为3类 每一类聚合一些变量和样品 第一类 聚合了环氧氯丙烷X5和D和H两个地区 表明D和H两个地区主要大气污染物为环氧氯丙烷

11、 第二类 包含变量X1 X2 X3 X4和样品A B C E和G地区 这5个地区的主要污染物是氯 硫化氢 二氧化硫 碳4 第三类 包含X6和地区F 该地区的主要污染物是环已烷 1992 1994年在北京市进行的 北京老龄化多维纵向研究 在这项研究中 先后在两年时间里 对一批60岁以上的老年人进行了纵向追踪调查 有2703位老年人在两次调查中都被调查 了解对被调查的老年人 日常生活自理能力 和 自评健康情况 得如下资料 InertiaandChi SquareDecompositionSingularPrincipalChi ValuesInertiasSquaresPercents1836547290 0 296150 08770237 06092 45 0 084630 0071619 3587 55 0 09486256 418 DegreesofFreedom 10 RowCoordinatesDim1Dim21 0 25463 0 076812 0 12566 0 026713 0 09409 0 0018440 338420 1530151 38102 0 4086361 18558 0 10506 ColumnCoordinatesDim1Dim21 158972 02163720 2317290 19196030 734563 109719

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号