SAS讲义 第十章典型相关分析

上传人:飞*** 文档编号:27046318 上传时间:2018-01-05 格式:DOC 页数:70 大小:358KB
返回 下载 相关 举报
SAS讲义 第十章典型相关分析_第1页
第1页 / 共70页
SAS讲义 第十章典型相关分析_第2页
第2页 / 共70页
SAS讲义 第十章典型相关分析_第3页
第3页 / 共70页
SAS讲义 第十章典型相关分析_第4页
第4页 / 共70页
SAS讲义 第十章典型相关分析_第5页
第5页 / 共70页
点击查看更多>>
资源描述

《SAS讲义 第十章典型相关分析》由会员分享,可在线阅读,更多相关《SAS讲义 第十章典型相关分析(70页珍藏版)》请在金锄头文库上搜索。

1、1第十章 典型相关分析第一节 总体典型相关二典型相关变量的解法定理 10.1 设 , 为 p 维随机向量, 为 q 维YXZ,1X ,1Y随机向量(不妨设 ) 。已知 ,记qp 0,021DZE, 阶方阵 的特征值依次为 ,211TT )(2ip为相应的单位正交特征向量。令 ,则pll,2 kkkk abla211,为 的第 k 对典型相关变量, 为第 k 个典型相关系数。YbWXaVkk ,三典型变量的性质(1)设 为 的第 k 对典型相关变量,则kk,YX,, 。pIVDpdiag,1此性质说明 互不相关; 互不相关; 与 互不),21(i),2(jW iV)(jWj相关; 。iiWV),

2、(2)原始变量与典型变量的相关性记 为 矩阵, 为 矩阵, ,paA,1pbB,1qYXZ,则021DZ, ,AXCovVXv1, BYXCovWov12, , 。Y2 Y(3)令 ,DBA*,*如 是 的第 i 对典型相关变量的系数,则 的典型相关变量为iba,X, *,X; ,即线性变换不改变相关性。iii 11)(,*YbabXaiiii2第二节 样本典型相关一样本典型相关变量和典型相关系数 S二典型相关系数的显著性检验1. 检验 0:120H如果总体 的两组变量 和 不相关,即Z,1pX ,1qY,则讨论样本的相关性毫无意义。),(12YXCOV设总体 ,用似然比方法可导出检验 的似然

3、比统计量,qpN0:120H21S其中 分别为 的最大似然估计。21,S21,Wilks Lambda, Pillais Trace, Hotelling-Lawley Trace,Roys Greatest Root2. 检验 piHii ,0:)(0当否定 时,表明 相关,从而可得出至少第一个典型相关系数 。12YX 01相应的第一对典型相关变量可能已经提取了两组变量相关关系的绝大部分信息。余下的部分认为不相关 。故在否定 后,有必要检验pii ,00:120H,即检验第 个及以后的所有典型相关系数均为 0。似然比方法。Hii ,2:)(0 i三样本典型变量的得分值经检验有 个典型相关系数

4、显著不为 0,则可得 对典型相关变量 。将)(prr),(iWV样品 代入第 对典型变量中,令)()(ttYXZiYbwXavtitititi )()(, n,21称 为第 t 个样品 的第 i 对样本典型变量的得分值。它应该近似在一条直线上。),(tiwv)(tZ第三节 CANCORR 过程与应用例子一CANCORR 过程的功能3CANCORR 过程可完成以下几个方面的计算:1完成两组变量间的典型相关分析。2假设检验。3计算标准化和没有标准化的典型系数,典型变量和原始变量的所有相关;同时可以进行典型冗余分析。4回归分析。5很多计算结果,如简单统计量、相关阵等。6在偏相关阵基础上进行典型相关分

5、析。二语句说明基本语句:Proc Cancorr options;With variables;(必需语句)Var variables;Partial variables;Freq variable;Weight variable;By variables;(可选择语句)通常只有 Var 和 With 语句同 Proc Cancorr 语句一起使用,且 With 语句是必需的。1Proc Cancorr 语句的选项(1) Data=SAS-data-set(2) Out= SAS-data-set:生成包含原始数据和典型变量得分的输出数据集。(3) Outstat= SAS-data-set

6、:生成包含各种统计量的 SAS 数据集,它包括典型相关和系数,以及要求的多元回归统计量。(4) Vname=label| Vn=label:在输出时对 Var 语句中的变量规定最多 40 个字符常数作为变量的标签。若省略,这些变量的标签为Var variables 。(5) Vprefix=name| Vp=name:规定来自 Var 语句的典型变量名字的前缀。缺省时这些典型变量命名为 V1,V2 等。(6) Wname= name| Wn=name:在输出时对 With 语句中的变量规定最多 40 个字符常数作为变量的标签。若省略,这些变量的标签为With variables 。(7) Wp

7、refix= name| Wp=name:规定来自 With 语句的典型变量名字的前缀。缺省时这些典型变量命名为 W1,W2 等。(8) 控制打印输出的选项有: All; Corr(输出原始变量之间的相关系数); Ncan=n(规定要求输出的典型变量的个数); Noprint; Short(除典型相关和多元统计列表外,不显示典型相关分析所有缺省时的输出); Simples|S(输出均值和标准差) 。2With 语句With 语句用来列出被分析的两组变量中的第二组变量,是数值变量。不能缺省。3Var 语句Var 语句用来列出被分析的两组变量中的第一组变量,是数值变量。若省略,则其他语句中没有涉及

8、到的所有数值型变量组成第一组变量集。三应用例子例 10.3.1 为了了解某矿区下部矿 Pt(铂) 、Pd(钯)与 Cu(铜) 、Ni(镍)的共生组合规律。我们从其钻孔中取出 27 个样品,试用典型相关分析研究 Pt(铂) 、Pd(钯)与4Cu(铜) 、Ni(镍)的相关关系。解 程序如下:data D1031;input X1 X2 Y1 Y2;n=_n_;%用于记录观测序号cards;0.14 0.30 0.03 0.140.20 0.50 0.14 0.220.06 0.11 0.03 0.020.07 0.11 0.04 0.130.12 0.22 0.06 0.120.52 0.87 0

9、.19 0.200.23 0.47 0.14 0.101.19 0.38 0.09 0.110.37 0.66 0.14 0.150.36 0.60 0.12 0.140.42 0.77 0.17 0.100.35 0.85 0.30 0.190.50 0.87 0.23 0.220.56 1.15 0.29 0.280.43 0.90 0.13 0.220.47 0.97 0.26 0.220.49 0.79 0.21 0.200.47 0.77 0.51 0.220.40 0.88 0.33 0.190.66 1.30 0.21 0.300.63 1.30 0.45 0.280.52 1.

10、43 0.31 0.230.44 0.87 0.17 0.250.03 0.07 0.05 0.080.20 0.28 0.04 0.080.04 0.10 0.11 0.070.17 0.28 0.15 0.09;proc cancorr data=D1031 simple corr vprefix=v wprefix=w out=O1031;%“simple corr”输出均值、标准差和相关系数;“vprefix=v wprefix=w”规定典型变量的前缀名字;“out=O1031”生成名字为O1031的输出数据集,包括原始数据和典型变量得分。var X1 X2; % 被分析的两组变量中的

11、第一组变量with Y1 Y2; % 被分析的两组变量中的第二组变量run;proc print data=O1031;var V1 W1 X1 X2 Y1 Y2;run;Comment 微微微微1: 绘制第一对典型变量得分值的散点图Comment 微微微微2: 两组变量间最大的相关系数 2,0.8691XYComment 微微微微3: 第一典型相关系数 10.8945proc plot data=O1031;plot W1*V1 $ n=*/vref=0 href=0;run;输出结果及分析The CANCORR ProcedureVAR Variables 2WITH Variables

12、2Observations 27Means and Standard DeviationsVariable Mean Standard DeviationX1 0.371852 0.249014X2 0.659259 0.396435Y1 0.181481 0.123870Y2 0.168519 0.073626Correlations Among the Original VariablesCorrelations Among the VAR VariablesX1 X2X1 1.0000 0.6209X2 0.6209 1.0000Correlations Among the WITH V

13、ariablesY1 Y2Y1 1.0000 0.6818Y2 0.6818 1.0000Correlations Between the VAR Variables and the WITH VariablesY1 Y2X1 0.4477 0.5273X2 0.7471 0.8691Canonical Correlation AnalysisAdjusted Approximate SquaredCanonical Canonical Standard CanonicalCorrelation Correlation Error Correlation1 0.894618 0.889469

14、0.039156 0.8003412 0.009496 . 0.196098 0.000090第一典型相关系数 ,比两组变量间最大的相关系数 大。0.89462,0.8691XYTest of H0: The canonical correlations in the current row and all that follow are zeroLikelihood Ratio Approximate F Value Num DF Den DF Pr F0.19964137 14.24 4 46 (见第二行) ,认为第二个典型相关是p不显著的。Multivariate Statistics and F ApproximationsS=2 M=-0.5 N=10.5Statistic Value F Value

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号