大学课程《统计分析方法及应用》PPT课件:(第十二章)

上传人:O**** 文档编号:214775400 上传时间:2021-11-24 格式:PPT 页数:36 大小:1.06MB
返回 下载 相关 举报
大学课程《统计分析方法及应用》PPT课件:(第十二章)_第1页
第1页 / 共36页
大学课程《统计分析方法及应用》PPT课件:(第十二章)_第2页
第2页 / 共36页
大学课程《统计分析方法及应用》PPT课件:(第十二章)_第3页
第3页 / 共36页
大学课程《统计分析方法及应用》PPT课件:(第十二章)_第4页
第4页 / 共36页
大学课程《统计分析方法及应用》PPT课件:(第十二章)_第5页
第5页 / 共36页
点击查看更多>>
资源描述

《大学课程《统计分析方法及应用》PPT课件:(第十二章)》由会员分享,可在线阅读,更多相关《大学课程《统计分析方法及应用》PPT课件:(第十二章)(36页珍藏版)》请在金锄头文库上搜索。

1、第十二章 对应分析v对应分析(correspondence analysis)是用于寻求列联表的行和列之间联系的一种低维图形表示法,它可以从直觉上揭示出同一分类变量的各个类别之间的差异,以及不同分类变量各个类别之间的对应关系。v对应分析是由法国人Benzecri于1970年提出的,起初在法国和日本最为流行,然后引入美国。v在对应分析中,列联表的每一行对应(通常是二维)图中的一点,每一列也对应同一图中的一点。本质上,这些点都是列联表的各行各列向一个二维欧式空间的投影,这种投影最大限度地保持了各行(或各列)之间的关系。第十二章 对应分析v12.1 行轮廓和列轮廓v12.2 独立性的检验和总惯量v1

2、2.3 行、列轮廓的坐标v12.4 对应分析图12.1 行轮廓和列轮廓v一、列联表v二、对应矩阵v三、行、列轮廓一、列联表其中,nij是第i行、第j列类别组 合的频数,i=1,2,p, j=1,2,q ; 为第i行的频数之和,i=1,2,p; 为第j列的频数之和,j=1,2,q; 为所有类别组 合的频数总和。表9.1.1 pq列联表 表9.1.1 pq列联表 表9.1.1 pq列联表 列12q合 计行1n11n12n1qn12n21n22n2qn2pnp1np 2npqnp合 计n1n2nqn表12.1.1 pq列联表二、对应矩阵这里, 。显然有 。 列12q合 计行1p11p12p1qp12

3、p21p22p2qp2ppp1pp 2ppqpp合 计p1p2pq1表12.1.2 对应矩阵v称 为对应矩阵。将对应矩阵表中的最后一列用r表示,即其中 是元素均为1的q维向量,最后一行用 表示,即 其中 是元素均为1的p维向量,向量r和c的元素有时称为行和列密度(masses)。三、行、列轮廓v第i行轮廓(profile):其各元素之和等于1,即 。v第j列轮廓:其各元素之和等于1,即 。行轮廓矩阵 其中 。列轮廓矩阵 其中 。可见, r可以表示成各列轮廓的加权平均。类似地,即 可以表示成各行轮廓的加权平均。 例12.1.1v将由n=1660个人组成的样本按心理健康状况与社会经济状况进行交叉分

4、类,分类结果见表12.1.3。 表12.1.3 心理健康状况-社会经济状况数据社会经济状况A(高)BCDE(低)心理健康状况0(好)121577236211(轻微症状形成)18810514197712(中等症状形成)112657754543(受损)8660947871将表12.1.3中的数据除以n,得到对应矩阵,列于表12.1.4中。表12.1.4给出的行密度和列密度向量为表12.1.4 从表12.1.3算得的对应矩阵社会经济 状况A(高)BCDE(低)合 计心理健康状况0(好)0.0730.0340.0430.0220.0130.1851(轻微症状形成)0.1130.0630.0850.05

5、80.0430.3632(中等症状形成)0.0670.0390.0460.0330.0330.2183(受损)0.0520.0360.0570.0470.0430.234合 计0.3050.1730.2310.1600.1311.000行轮廓矩阵为 列轮廓矩阵为两个马赛克图 对心理健康的每一种状况,A、B、C、D、E五个小方块的宽度显示了行轮廓,0、1、2、3四种心理健康状况的小方块高度显示了行密度。 对社会经济的每一种状况,0、1、2、3四个小方块的高度显示了列轮廓,A、B、C、D、E五种社会经济状况的小方块宽度显示了列密度。12.2 独立性的检验和总惯量v一、行、列独立的检验 v二、总惯量

6、一、行、列独立的检验v在列联表中,检验行变量和列变量相互独立假设的统计量为当独立性的原假设为真,且样本容量n充分大,期望频数 时, 2近似服从自由度为(p1) (q1)的卡方分布。拒绝规则为 若 ,则拒绝独立性的原假设其中 是2(p1) (q1)的上分位点。二、总惯量总惯量还可以行轮廓和列轮廓的形式表达如下:其中称为第i行轮廓ri到行轮廓中心c的卡方(2)距离,它可看作是一个加权的平方欧氏距离。同样,是第j列轮廓cj到列轮廓中心r的卡方距离。故总惯量可看成是行轮廓到其中心的卡方距离的加权平均,也可看成是列轮廓到其中心的卡方距离的加权平均。它既度量了行轮廓之间的总变差,也度量了列轮廓之间的总变差

7、。总惯量为零的等价情形 v总惯量为零与以下三种情形的任一种等价:(1) ,或表示为 ;(2)所有的行轮廓相等,即 ;(3)所有的列轮廓相等,即 。v所以,如果行变量与列变量相互独立,则我们可以期望(由样本数据构成的)列联表中所有的行有相近的轮廓,所有的列亦有相近的轮廓。总惯量的分解v对 构造标准化矩阵其元素为记k=rank(Z),有kmin(p-1,q-1),因为 对Z进行奇异值分解,得其中U=(u1,u2,uk),V=(v1,v2,vk),=diag(1,2, k),这里u1,u2,uk是一组p维正交单位向量,v1,v2,vk是一组q维正交单位向量,即有,1,2,k是Z的k个奇异值。于是,

8、是 的正特征值。因此总惯量=例12.2.1 例12.1.1中,2=45.59421.026=故拒绝心理健康状况与社会经济状况相互独立的原假设(p=8.1510-6)。12.3 行、列轮廓的坐标其中由于 ,从而 上式常被称为广义奇异值分解。v将行轮廓矩阵R中心化(即每一行减去 ),得 其中 v上式也可表达为 即中心化的第i行轮廓在由b1,b2,bk构成的坐标系中的坐标为(xi1,xi2, ,xik), i=1,2,p。v类似地,将列轮廓矩阵C中心化(即每一列减去r),得 其中v上式亦可表达为 即中心化的第j列轮廓在由a1,a2,ak构成的坐标系中的坐标为 (yj1,yj2,yjk), j=1,2

9、,q。v由关系式知即有于是v即各行点和列点在第i坐标轴上的坐标平方的加权平均都等于,称之为第i主惯量,i=1,2,k。v主惯量度量了在每一坐标轴上的有关变差的信息量,类似于主成分分析中的方差。v在作图时可将行点和列点置于同一个坐标系中,并使用同一坐标刻度。v由总惯量= 知,总惯量可以分解为各主惯量之和。12.4 对应分析图v 的降秩到2的最优逼近为 于是其中 ,B1=( b1, b2)。X1是由X的前2列构成的,即故X1的第i行 是中心化的第i行轮廓 在由b1和 b2构成的平面坐标系中的坐标,i=1,2,p。v类似地,其中 。Y1是由Y的前2列构成的,即故Y1的第j行 是中心化的第j列轮廓cj

10、r在由a1和a2构成的平面坐标系中的坐标,j=1,2,q。v将上述两个平面坐标系重叠在一个坐标系中,b1和a1重叠在第一维坐标轴上,具有同一主惯量 ,其对总惯 量的贡献率为 。b2和a2重叠在第二维坐标轴上,具有同一主惯量 ,其对总惯量的贡献率为 。前二维的坐标轴对总惯 量的累计贡献率为 ,该值如很大,则说明所作的对应分析图几乎解释了数据的所有变差(包括有关行与列之间的联系)。v在累计贡献率 足够大的对应分析图 中,如果两个行(列)点接近,则表明相应的两个行(列)轮廓是类似的;反之,如果两个行(列)点远离,则表明相应的两个行(列)轮廓是非常不同的。v如果一个行点和一个列点相近,则表明行、列两个

11、变量的相应类别组合发生的频数会高于这两个变量相互独立情形下的期望值。v需要指出的是,行点与列点之间并没有直接的距离关系。例12.4.1v在例12.1.1中,经计算,奇异值、主惯性以及贡献率等的计算结果列于表12.4.1中。总惯量的94.75%可由第一维来解释,前二维解释了高达99.76%的总惯量,几乎解释了列联表数据的所有变差。表12.4.1 奇异值、主惯量以及贡献率维 数123奇异值0.16130.03710.0082总 值主惯量0.02600.00140.00010.0275贡献率0.94750.05010.00241.0000累计贡献率0.94750.99761.0000例12.4.1行点和列点的前二维坐标矩阵为 将各行点和列点置于同一坐标系中,构成对应分析图,如下图所示。 表12.4.2 行点和列点靠近的分类组合频数及行、列独立情形下的频数期望值社会经济 状况A(高)BCDE(低)心理健康状况0(好)121(93.8)577236211(轻微症状形成)188105(104.1)141(139.3)97712(中等症状形成)11265(62.6)7754543(受损)86609478(62.1) 71(50.9)输出12.4.1 行轮廓和列轮廓输出12.4.2 惯量和2的分解输出12.4.3 行点坐标和列点坐标

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号