应用统计学第九章对应分析

上传人:j****9 文档编号:57181572 上传时间:2018-10-19 格式:PPT 页数:39 大小:750.50KB
返回 下载 相关 举报
应用统计学第九章对应分析_第1页
第1页 / 共39页
应用统计学第九章对应分析_第2页
第2页 / 共39页
应用统计学第九章对应分析_第3页
第3页 / 共39页
应用统计学第九章对应分析_第4页
第4页 / 共39页
应用统计学第九章对应分析_第5页
第5页 / 共39页
点击查看更多>>
资源描述

《应用统计学第九章对应分析》由会员分享,可在线阅读,更多相关《应用统计学第九章对应分析(39页珍藏版)》请在金锄头文库上搜索。

1、第九章 对应分析Correspondence Analysis,列联表(contingency table)分析 对应分析的基本思路 对应分析的理论推导 对应分析的SPSS实现,一、列联表分析,列联表contingency table 用来描述定类尺度和定序尺度数据的各种状态或是相关关系,从上表可以得到的信息:不同年龄顾客对公司产品的偏好、所有顾客整体评价、顾客结构、年龄结构与偏好的相关关系,两变量列联表的一般形式,频数,频率表:,联合概率:特性A第i种状态与特性B第j种状态出现的概率,边缘概率,边缘概率,两变量间相关关系的检验,如果变量A和B是独立的,则应有,检验假设:,如果拒绝原假设,我们

2、希望进一步了解两变量各种状态之间的关系对应分析,例:手机消费者产品偏好研究,列联表分析例:收入水平与PDA,analyzedescriptive statistics crosstab,显示频数分布柱形图,控制变量/分层变量,Cell: 单元格输出内容,显示观测频数,显示频率,显示行百分比,显示列百分比,显示总百分比,Statistics:,2检验,列联表分析例:收入水平与PDA,频率表: row,随着收入的水平的提高,拥有PDA的人数增多,频率表:total,检验:不同收入水平拥有PDA数量上的差异是否来自于纯随机性?,检验结果:拒绝原假设,两变量间有显著相关性,控制第三变量:受教育水平,通

3、常受教育水平越高,工资越高,收入与PDA的相关性实质上主要来自于受教育水平与PDA的相关性,受教育水平与PDA:控制收入水平,二、对应分析的基本思路:对行元素与列元素提取主成分,Row Profile Matrix,Column Profile Matrix,Principal Coordinates,Can we put them on the same axes?,Principal Correspondence Analysis,一个实例:郑州潜在手机顾客偏好调查,手机潜在用户:7个特征属性 4个年龄特征“18-25岁”、“26-35岁”、“36-45岁”、“46-55岁” 3个文化程度

4、特征“初中以下”、“高中/中专”和“大学及以上”。 手机: 7个特征属性 “待机时间长”、“大显示屏”、“操作简单”、“外观时尚”、“功能强”、“价格合理”和“信号接收好”。 研究人员希望通过对应分析发现不同特征属性的手机潜在顾客对手机属性特征的偏好。,表一 潜在用户调研基础数据:行元素、列元素均为七维空间中的点,计算惯量,确定维度:行、列均简化到二维空间,各维度的惯量、奇异值,六个非零特征根,累积方差贡献,(1)各类别在行维度上的得分(投影),计算行、列在各维度的得分(投影),(2)各类别在列维度上的得分(投影),计算行、列在各维度的得分(投影),对应分析图(定位图):行、列主成分得分放在一

5、张图中,(1)“初中及以下”学历:“操作简单”。 (2)年龄“18-25” 青年: “外观时尚” (3)年龄“46-55”之间、“高中/中专”学历:“大屏显示”。 (4)年龄“26-45”之间: “待机时间长”和“信号接收好”。,三、对应分析的理论推导,数据规格化: 行截面:Rp中的n个点 列截面:Rn中的p个点,数据规格化-续,行截面:概率加权坐标向量 样品间欧式距离 加权欧式距离,不同指标间数量级差异会开来困扰,可以看成点,间的欧式距离,行截面提取主成分,变换后的行截面矩阵为Pr的协方差阵为:,列截面提取主成分:与行截面类似有,根据矩阵知识可知,r=ZZ和c=ZZ有完全相同的非零特征根,设

6、为1 2 p,设1r为对应1 r的r的特征向量,则有:,两边左乘Z:,(Zj)即为对应j的c的特征向量,这建立了R型因子分析与Q型因子分析的关系,且因r和c有相同非零特征根,因此提取公因子数和累积方差贡献都相同,四、对应分析的SPSS实现,analyzedata reductioncorrespondence analysis,定义变量取值范围,模型:,提取因子数,主要分析行列变量的联系,输出统计量,列联表,行变量之因子载荷、方差贡献等,频数的行百分比,输出图形,行列变量对应图,行变量载荷图,行变量各分类因子载荷图,例:收入水平与学历,总惯量,非零特征根,累积方差贡献,2统计量及其p值 2 =n总惯量,显著:列联表行列之间有较强的相关性,边缘概率,因子得分,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 科普知识

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号