典型相关分析典型相关分析〔Canonical correlation〕又称规则相关分析,用以分析两组变量间关系的一种方法; 两个变量组均包含多个变量, 所以简单相关和多元回归的解惑都是规则相关的特例典型相关将各组变量作为整体对待, 描述的是两个变量组之间整体的相关, 而不是两个变量组个别变量之间的相关典型相关与主成分相关有类似, 不过主成分考虑的是一组变量, 而典型相关考虑的是两组变量间的关系, 有学者将规则相关视为双管的主成分分析; 因为它主要在寻找一组变量的成分使之与另一组的成分具有最大的线性关系典型相关模型的基本假设: 两组变量间是线性关系, 每对典型变量之间是线性关系, 每个典型变量与本组变量之间也是线性关系; 典型相关还要求各组内变量间不能有高度的复共线性典型相关两组变量地位相等,如有隐含的因果关系,可令一组为自变量,另一组为因变量典型相关会找出一组变量的线性组合X*a x与Y*=b y,称为典型变量;以iijj使两个典型变量之间所能获得相关系数到达最大, 这一相关系数称为典型相关系数ai和bj称为典型系数如果对变量进行标准化后再进行上述操作,得到的是标准化的典型系数典型变量的性质每个典型变量智慧与对应的另一组典型变量相关, 而不与其他典型变量相关; 原来所有变量的总方差通过典型变量而成为几个相互独立的维度。
一个典型相关系数只是两个典型变量之间的相关,不能代表两个变量组的相关; 各对典型变量构成的多维典型相关, 共同代表两组变量间的整体相关典型负荷系数和交叉负荷系数典型负荷系数也称结构相关系数, 指的是一个典型变量与本组所有变量的简单相关系数,交叉负荷系数指的是一个典型变量与另一组变量组各个变量的简单相关系数 典型系数隐含着偏相关的意思, 而典型负荷系数代表的是典型变量与变量间的简单相关, 两者有很大区别重叠指数如果一组变量的部分方差可以又另一个变量的方差来解释和预测, 就可以说这部分方差与另一个变量的方差之间相重叠, 或可由另一变量所解释 将重叠应用到典型相关时, 只要简单地将典型相关系数平方〔CR〕,就得到这对典型变量方差的共同比例,代表一个典型变量的方差可有另一个典型变量解释的比例, 如果将此比例再乘以典型变量所能解释的本组变量总方差的比例, 得到的就是一组变量的方差所能够被另一组变量的典型变量所能解释的比例,即为重叠系数例 1:CRM〔Customer Relationship Management〕即客户关系管理案例,有三组变量,分别是公司规模变量两个〔资本额,销售额〕 ,六个 CRM 实施程度变量〔WEB 网站,电子邮件,客服中心,DM 快讯广告 Direct mail 缩写,无线上网,简讯服务〕 ,三个CRM 绩效维度〔行销绩效,销售绩效,服务绩效〕 。
试对三组变量做典型相关分析2数据的格式如上所示,以下对三组变量两两做典型相关分析首先对公司规模和 CRM 实施程度做典型相关分析SPSS 并未提供典型相关分析的交互窗口,只能直接在synatx editor 窗口中呼叫 SPSS 的CANCORR 程序来执行分析并且cancorr 不能读取中文名称,需将变量改为英文名称打开文件后File- new--synatx editor打开语法窗口输入语句INCLUDE 'D:\spss19\Samples\English\Canonical correlation.sps'.CANCORR Set1=Capital Sales/Set2=Web Mail Call DM Mobile ShortM.小写字母也行,但是变量名字必须严格一致include 'D:\spss19\Samples\English\Canonical correlation.sps'.cancorr set1=Capital Sales/set2=Web Mail Call DM Mobile ShortM.注意第三行的“/”不能为“\”runall 得到典型相关分析结果第一组变量间的简单相关系数第一对典型变量的典型相关系数为CR1=,第二对典型变量的典型相关系数为CR2=0.298.此为检验相关系数是否显著的检验,原假设:相关系数为0.每行的检验都是对此行及以后各行所对应的典型相关系数的多元检验。
第一行看出,第一对典型变量的典型相关系数是不为0 的,相关性显著第二行sig 值,在5%显著性水平下不显著第一个典型变量的标准化典型系数为和-0.774.—————典型负荷系数和交叉负荷系数表重叠系数分析 Redundancy index0.157=CR120.08=CR1 *0.4252此为计算的典型变量,保存到原文件后部公司规模与 CRM 绩效的典型相关分析CRM 绩效与 CRM 实施程度典型相关分析自变量因变量规则相关系数检验的 P 值公司规模CRM 实施程度CRM 实施程度CRM 绩效公司规模CRM 绩效由上表知,公司规模与CRM 实施程度显著相关,且公司规模越大实施程度越高;此外CRM实施程度越高越能实现 CRM 绩效,但公司规模与CRM 绩效并不显著相关;就整体而言,公司规模不直接影响 CRM 绩效,而是通过CRM 实施程度间接影响 CRM 绩效影响CRM 绩因素很多,光靠较大公司规模还不是CRM 绩效的保证,还有其他因素影响CRM 绩效例 2:全国30 省市自治区农村收入与支出的指标, x1—x4 反映农村收入,y1---y8 反映农村生活费支出,对收入与支出进行典型相关分析。
语法输入INCLUDE 'D:/spss19/Samples/English/Canonical correlation.sps'.cancorrset1=x1x2x3x4/set2=y1 y2 y3 y4 y5 y6 y7 y8.只有前两对典型相关系数是显著的;分别为CR1=和 CR2=0.910.第一对典型变量说明靠劳动报酬和转移收入为主的家庭其对应的消费主要在家庭设备和服务,交通和通讯支出上,在居住支出上比较少例三:已知 294 个被调查者的 cesd〔抑郁症〕,health 与 sex , age ,education,income两组指标建立数据文件对两组进行典型相关分析语法输入INCLUDE 'D:/spss19/Samples/English/Canonical correlation.sps'.CANCORR Set1=cesd health/Set2=sex age educ income.结果选录从第一对典型变量的表达式看出,年龄较大, 教育程度较低,相对的无抑郁症趋势;显然健康比较差第二对典型变量说明,年龄小,教育度低,收入低的女性相对的有抑郁症。