通径分析及其简单实现

上传人:飞*** 文档编号:29252672 上传时间:2018-01-23 格式:DOC 页数:5 大小:79.50KB
返回 下载 相关 举报
通径分析及其简单实现_第1页
第1页 / 共5页
通径分析及其简单实现_第2页
第2页 / 共5页
通径分析及其简单实现_第3页
第3页 / 共5页
通径分析及其简单实现_第4页
第4页 / 共5页
通径分析及其简单实现_第5页
第5页 / 共5页
亲,该文档总共5页,全部预览完了,如果喜欢就下载吧!
资源描述

《通径分析及其简单实现》由会员分享,可在线阅读,更多相关《通径分析及其简单实现(5页珍藏版)》请在金锄头文库上搜索。

1、通径分析及其简单实现搜集变量资料是农业科学研究经常采用的方法,如:搜集作物的产量与其构成因素穗数、粒数、粒重等资料,研究这些变量的目的想知道这些变量之间的关系,许多人往往采用简单回归和相关或多元回归分析。但是,多元回归分析虽然在一定程度上能反映各个变量的真实关系,然而多元回归在分析偏回归系数时带有单位,使自变量对依变量的效应不能直接进行比较,从而不能比较各自变量的相对重要性。要解决这个问题,进行通径分析(即为通径系数的分析) 是一个比较好的选择。然而令人感到棘手的是,面对繁杂的计算公式往往感到无从下手,下面从通径系数的概念入手,引出通径系数的求算方法,并利用 SAS 完成通径分析全过程。1.

2、通径和通径系数的概念1.1 通径设依变量 y 和两个自变量 x1、x 2 之间有如下关系:x1yx2图 1 通径图在图 1 中“”中表示变量间存在因果关系,箭头方向是原因到结果,称为通径。 “ ”表示变量间存在相关关系,称为相关线,x 1y,x 2y 为直接通径,由于 x1,x2 存在相关关系,又产生了两条间接通径,一条是 x1 是通过 x2 而作用于 Y 的通径,记作 x1x 2Y,一条是 x2 是通过 x1而作用于 y的通径,记作 x2x 1y。这种情况可以推广到 i 个自变量,并记直接通径为 iy(i=1,2,3m),间接通径为 ijy(i=1,2,3m,ij ) ,但也可统一记作 ij

3、y,当 i=j 时为直接通径,i j 时为间接通径。1.2 通径系数表示各条通径对于改变依变量的相对重要性的统计数就叫通径系数, 记作 PijY 或简写为 PijY。 通径系数的定义可以由偏回归系数导出。例如水稻单株产量 y(kg)与 x1(穗数) 、x 2(单穗粒数) 、x 3(粒重)间存在着线性回归关系。其回归关系为:y=b 0+b1x1+b2x2+b3x3,此式中 b0 为常数,b 1、b 2、b 3 分别表示 y 对 x1,y 对 x2, y 对 x3 的偏回归系数,偏回归系数是带有单位的,如 b1、b 2 的单位分别为:kg/穗,kg/ 粒。所以不便于偏回归系数进行直接比较。所以常常

4、将其标准化之后以便于消去单位,进行直接比较。下面进行回归方程的标准化:y=b0+b1x1+b1x2+b1x3 (1 ) 由(1)对 y 求平均数得:y=b0+b1x1+b1x2+b1x3 ( 2)用(1)式减(2)得:y- y= b1(x1- x1)+ b2(x2- x2)+ b3(x3- x3) (3)由(3)式除 y 得:(y- y)/ y = b1(x1- x1)/y + b2(x2- x2) /y+ b3(x3- x3)/y (4)将(4)式做相应得恒等变换:(y-y)/y= b1(x1/y)(x1- x1)/x1+ b2(x2/y)(x2- x2)/x2+ b3(x3/y)(x3-

5、x3)/x3 (5)其中 y, x1, x2, x3 分别为 y,x 1 ,x 2,x 3 的标准差,并令:y=(y-y)/ y,x 1= (x1- x1)/x1,x 2 = (x2- x2)/x2,x 3 = (x3- x3)/x3 ,y、x 1、x 2、x 3 即为变量 y、x 1、x 2、x 3 的标准化,将(5)式改写成下式:yb 1(x1/y) x1+ b2(x2/y) x2 + b3(x3/y) x3则 b1(x1/y),b 2(x2/y),b 3(x3/y)为变量标准化后的偏回归系数,它是不带单位的相对数,这样就可以用以估计x 1, x2, x3 对y 直接影响效应的大小,并比较

6、其重要性。因此通径系数的定义:若相关变量 y 与 x1、x 2 xk 间存在着直线回归关系,其回归方程为: y=b0+b1x1+b1x2+ +bkxk,则变量标准化后的各偏回归系数 b1(x1/y),b 2(x2/y),b k(xk/y)分别为自变量 x1 x2 xk 对依变量的直接通径系数,即:P 1y= b1(x1/y),P 2y= b2(x2/y), , Pky= bk(xk/y),简言之,通径系数是变量标准化的各偏回归系数,用以表示相关变量因果关系的一个统计量。2. 通径系数的类型通径系数包括直接通径系数和间接通径系数两种类型。2.1 直接通径系数对于回归方程 y= b0+b1x1+b

7、2x2+b3x3+bkxk,则有 x1 对 y 的直接通径系数为 P1y=b1*x 1/y, x2对 y 的直接通径系数为 P2y=b1*x 2/y,x k对 y 的接通径系数为 Pky=b1*x k/y,其中x1、x2、y 分别为 x1 、x 2、 x k的方差。2.2 间接通径系数由许多自变量影响着依变量,但是它们的重要性是不同的,其中一个自变量可能通过其它自变量对依变量起作用,这时可用间接通径系数来表示它。如 xi 通过 xj 对 y 起作用,间接通径系数为:rijPjy,r ij 表示 xi 和 xj 之间的相关系数,P jy 表示 xj 对 y 的直接通径系数。2.3 直接、间接通径

8、系数和相关系数的关系依据回归系数和通径系数的定义以及最小二乘法原理可得到:r ij = Piy + rijPjy(ij,i 、j=1,2,3.K) 即:一个自变量对因变量的直接通径系数和间接通径系数的总和等于这个自变量与因变量之间的相关系数。例如:对 多元回归方程y=bo+b1x1+b2x2+b3x3, 有 r1y=P1y+r12P2y+r13P3y, r2y=P2y+r21P1y+r23P3y , r3y=P3y+r3P1y+r32P2y。并可以得到表1:表 1 直接通径系数和间接通径系数表注:斜体部分为直接通径系数,其它为间接通径系数。3. 通径系数的性质通径系数有以下几个性质:1)一个具

9、有 k 个自变量的反应系统,共有 m 个直接通径系数和 m(m-1)个间接通径系数。2)进行通径分析的基础是 Y 和 Xi 都具有线性关系,而且 Y 可以被线性分解。3)通径系数是具有向量的。如:X i 和 Y 不可以互换,即:Piy Pyi。它的取值在实数范围内可以大于 1或小于-1 。4)通径系数是变量标准化的偏回归系数,它能够表示变量间的因果关系,故具有回归系数X1 X2 X3 YX1X2X3r11P1yr21P1yr31P1yr12P2yr22P2yr32P2yr13P3yr23P3yr33P3yr1yr2yr3y性质。5)通径系数不带具体单位,因而又具有相关系数的性质,表示原因与结果

10、的相关关系。所以通径系数是介于回归系数和相关系数之间的一种统计量。6)通径系数可以表示某个自变量的相对重要性。4. 应用 SAS 进行通径分析的具体过程SAS 是美国使用的最为广泛的三大著名统计分析软件(SAS, SPSS 和 SYSTAT)之一,是目前国际上最为流行的一种大型的统计分析系统,被誉为统计分析的标准软件。对于通径系数,如采用其它常规的统计方法,往往颇费周折。如采用 SAS 软件,往往比较简单,较快的完成分析过程。下面通过一个实例,介绍应用 SAS 进行通径分析的基本作法。例:测定丰产 3 号小麦的每株穗数( 1),每穗结实小穗数( 2,主茎) ,百粒重( 3,克) ,和每株籽粒产

11、量(Y,克)的关系,得结果于表 1,试求 Y 依 Xi 的最优线性回归方程,并作通径分析表 1 丰产 3 号小麦的每株穗数( 1) 、每穗结实小穗数( 2) 、百粒重( 3) 、株高( 4)和每株籽粒产量(Y)的关系X1 X2 X3 y1091013101081010101086892320222122232324202123212321223.63.63.73.73.63.53.33.43.43.43.93.53.23.73.615.714.517.522.515.516.98.617.013.713.420.310.27.411.612.34.1 直接通径系数的求法在sas的程序窗口中输入

12、以下程序:DM log;clear;output;clear;ods rtf file=D:sas2003tongjing.rtf;PROC IMPORT OUT= MYSAS.tongjing DATAFILE= D:sas2003tongjing.xls DBMS=EXCEL2000 REPLACE;SHEET=Sheet1$; GETNAMES=YES;RUN;proc reg corr;model y=x1-x3/selection=stepwise sls=.05 sle=.05 STB;run;quit;ods rtf close;此段程序中,new表示临时数据集;proc reg

13、 corr 语句表示调用reg和corr程序,进行回归分析和相关分析;model语句表示选用逐步回归法进行分析,sls= 和sle=定义选入和剔除自变量的限制水平(0.05),STB给出直接通径系数。运行可以得到以下部分结果:SAS 系统 11:02 Tuesday, June 4, 2002 1The REG ProcedureCorrelationVariable Label X1 X2 X3 yX1 X1 1.0000 -0.1357 0.5007 0.8973X2 X2 -0.1357 1.0000 -0.1489 0.0462X3 X3 0.5007 -0.1489 1.0000 0

14、.6890y y 0.8973 0.0462 0.6890 1.0000SAS 系统 11:02 Tuesday, June 4, 2002 2The REG ProcedureModel: MODEL1Dependent Variable: y yStepwise Selection: Step 1Variable X1 Entered: R-Square = 0.8052 and C(p) = 15.9479Analysis of VarianceSum of MeanSource DF Squares Square F Value Pr FModel 1 193.15219 193.15219 53.73 FIntercept -8.06429 3.11354 24.11809 6.71 0.0224X1 2.39762 0.32711 193.15219

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号