7第八章相关分析和回归分析

上传人:公**** 文档编号:575866109 上传时间:2024-08-18 格式:PPT 页数:91 大小:1.32MB
返回 下载 相关 举报
7第八章相关分析和回归分析_第1页
第1页 / 共91页
7第八章相关分析和回归分析_第2页
第2页 / 共91页
7第八章相关分析和回归分析_第3页
第3页 / 共91页
7第八章相关分析和回归分析_第4页
第4页 / 共91页
7第八章相关分析和回归分析_第5页
第5页 / 共91页
点击查看更多>>
资源描述

《7第八章相关分析和回归分析》由会员分享,可在线阅读,更多相关《7第八章相关分析和回归分析(91页珍藏版)》请在金锄头文库上搜索。

1、7 7第八章第八章 相关分析和回归相关分析和回归分析分析8.1相关、回归分析概述相关、回归分析概述相关分析计算反映各变量之间相关密切程度和性质的统计数。相关分析计算反映各变量之间相关密切程度和性质的统计数。8.1.1相关分析概述相关分析概述简单相关简单相关:研究两变量直线相关的密切程度和性质,也:研究两变量直线相关的密切程度和性质,也称直线相关。称直线相关。偏相关偏相关:排除其余的影响因子,求出:排除其余的影响因子,求出x与与y的纯相关,这的纯相关,这种相关称偏相关。种相关称偏相关。复相关复相关:研究一个变量与一组变量之间的相关性关系。:研究一个变量与一组变量之间的相关性关系。典型相关典型相关

2、:研究两组变量的相关性。:研究两组变量的相关性。8.1.2回归分析概述回归分析概述由自变数预测因变数的问题都叫回归分析。由自变数预测因变数的问题都叫回归分析。相关分析反映各变量间相关密切程度,回归分析反映相关分析反映各变量间相关密切程度,回归分析反映因变量因变量(Y)和自变量和自变量(X)之间的数量关系,用回归方程表之间的数量关系,用回归方程表示。回归模型不一定是因果关系,自变量可多于一个。示。回归模型不一定是因果关系,自变量可多于一个。回归分析依回归分析依自变量个数自变量个数的多少分为:的多少分为:一元回归和多元回归一元回归和多元回归因变量和自变量间因变量和自变量间关系的性质分关系的性质分:

3、线性回归和非线性回归线性回归和非线性回归回归分析的回归分析的SAS过程:主要有过程:主要有REG(回归分析)回归分析)GLM (广义线性模型)(广义线性模型)如由温度表水银柱高度(如由温度表水银柱高度(X)来估计温度()来估计温度(Y)时,)时,自变量实际上是依赖于因变量。自变量实际上是依赖于因变量。n1简单相关简单相关n2偏相关偏相关n3复相关复相关8.2相关分析相关分析(AnalysisofCorrelation)补:秩相关补:秩相关1简单相关简单相关简单相关简单相关:是对有联系的两类事物(是对有联系的两类事物(x与与y)表面关)表面关系密切程度的衡量。系密切程度的衡量。(SimpleCo

4、rrelation)一、简单相关系数一、简单相关系数相关系数相关系数r(无单位)(无单位)的取值:的取值:即:即:二、简单相关系数二、简单相关系数r的显著性测验的显著性测验由由d.f=n-2查出相关系数的临界值查出相关系数的临界值r0.05、r0.01(degree of freedom)SAS直接输出直接输出prob|r|概率值,记为概率值,记为a.统计假设统计假设H0:总体相关系数:总体相关系数=0若若a0.05,接受,接受H0,相关不显著,即总体相关不显著,即总体x与与y间不存在相关关系。间不存在相关关系。若若0.01a0.05,拒绝,拒绝H0,相关显著,即总体相关显著,即总体x与与y间

5、存在相关关系。间存在相关关系。若若a|R|underHo:Rho=0/N=26XYX1.000000.710190.00.0001Y0.710191.000000.00010.0结论:因结论:因r=0.71019,其出现的概率,其出现的概率=0.0001|r|x1x2x3x11.000000.799490.00100.775490.0018x20.799490.00101.000000.869310.0001x30.775490.00180.869310.00011.00000CORR过程过程1Partial变量:变量:x32变量:变量:x1x2简单统计量简单统计量变量变量N均值均值标准偏差标

6、准偏差总和总和最小值最小值最大值最大值偏方差偏方差偏标准偏差偏标准偏差x31315.738460.99544204.6000013.7000017.90000x11328.6076920.18875371.900000.4000052.30000177.2425913.31325x21315.484621.13420201.3000013.1000017.600000.342840.58552Pearson偏相关系数偏相关系数,N=13当当H0:PartialRho=0时,时,Prob|r|x1x2x11.000000.401690.1956x20.401690.19561.00000统计结论

7、: r12=0.79949 p=0.0010.01 相关极显著 r13=0.77549 p=0.00180.01 相关极显著 r23=0.86931 p=0.00010.05 相关不显著 r13.2=0.27108 p=0.271080.05 相关不显著实例:实例:p170例例8.2 8.2 腰果分期播种腰果分期播种试验试验,采用,采用1010天播种一次,每次天播种一次,每次播种播种1010粒。粒。19861986年年4 4月至月至19871987年年3 3月,共月,共进进行行3333次分期次分期播种。表播种。表1111是腰果种子是腰果种子发发芽芽“普遍期普遍期”天数、平均气天数、平均气温、平

8、均最低气温、及平均最高气温的温、平均最低气温、及平均最高气温的观观察察资资料。料。试试求求简单简单相关系数及二相关系数及二级级偏相关系数。偏相关系数。普遍天数普遍天数平均气温平均气温平均最低气温平均最低气温平均最高气温平均最高气温121229.029.024.224.234.634.6151527.827.823.623.632.632.6424219.219.214.914.925.225.2表8.3 腰果种子“普遍期”天数与气温表datacashew;inputx1x2x3x4;cards;1229.024.234.6.4219.214.925.2;proccorr;varx1x2x3x4

9、;proccorr;varx3x4;partialx2;proccorr;varx1x4;partialx2x3;run; Correlation Analysis 2 PARTIAL Variables: X2 X3 2 VAR Variables: X1 X4Pearson Partial Correlation Coefficients / Prob |R| under Ho: Partial Rho=0 / N = 33 X1 X4 X1 1.00000 0.07517 0.0 0.6878 X4 0.07517 1.00000 0.6878 0.0统计结论统计结论:r34.2=-0.

10、8031p=0.00010.05相关不显著相关不显著部分输出结果:部分输出结果: 组合代号组合代号 X1 X2 X3 Y X1 X2 X3 Y 1 10.37 29.56 33.31 10.520 1 10.37 29.56 33.31 10.520 2 10.47 34.25 29.05 10.070 2 10.47 34.25 29.05 10.070 3 9.67 35.25 37.65 12.790 3 9.67 35.25 37.65 12.790 4 9.87 29.25 31.52 9.230 4 9.87 29.25 31.52 9.230 5 8.20 37.85 33.62

11、 10.360 5 8.20 37.85 33.62 10.360 6 8.67 37.78 38.09 12.570 6 8.67 37.78 38.09 12.570 7 10.03 40.97 30.42 12.560 7 10.03 40.97 30.42 12.560 8 9.00 46.00 29.10 11.388 8 9.00 46.00 29.10 11.388 9 10.07 39.73 32.06 12.830 9 10.07 39.73 32.06 12.830实习四实习四实实习习作业作业:21个小麦双列杂交组合个小麦双列杂交组合F1的单株产量的单株产量y(克),每株穗

12、(克),每株穗数数x1,每穗的粒数,每穗的粒数x2,千粒重千粒重x3(克)数据如下:(克)数据如下: 组合代号组合代号 X1 X2 X3 Y X1 X2 X3 Y 10 10.57 36.30 30.59 11.800 10 10.57 36.30 30.59 11.800 11 8.73 37.10 27.17 8.730 11 8.73 37.10 27.17 8.730 12 10.20 35.67 32.21 11.790 12 10.20 35.67 32.21 11.790 13 8.93 35.44 33.22 10.420 13 8.93 35.44 33.22 10.420

13、14 9.83 34.28 28.40 9.830 14 9.83 34.28 28.40 9.830 15 8.60 33.31 35.49 10.920 15 8.60 33.31 35.49 10.920 16 8.83 35.10 27.54 8.440 16 8.83 35.10 27.54 8.440 17 8.80 34.45 34.20 10.500 17 8.80 34.45 34.20 10.500 18 8.80 30.65 29.47 7.940 18 8.80 30.65 29.47 7.940 19 9.40 31.20 30.75 8.830 19 9.40 31

14、.20 30.75 8.830 20 10.03 39.27 29.21 11.330 20 10.03 39.27 29.21 11.330试求试求ry1、ry3、ry1.2、ry1.23,并确定其显著性。并确定其显著性。&8.3直线回归分析直线回归分析(一元线性回归一元线性回归)一、直线回归方程一、直线回归方程正相关正相关r0曲线相关曲线相关负相关负相关rF0.05,显著,即,显著,即x与与y之间的直线回归关系显著。之间的直线回归关系显著。若若FF0.01,极显著。,极显著。若若FF0.05,不显著。,不显著。即两变量间不存在线性关系即两变量间不存在线性关系目的:了解样本所来自的集团中两变

15、数间是否确实存目的:了解样本所来自的集团中两变数间是否确实存在回归关系。在回归关系。二、回归的显著性测验二、回归的显著性测验但必须注意,应用时但必须注意,应用时X的取值范围只能在拟合回归方的取值范围只能在拟合回归方程时所用样本的范围内,不能外推。程时所用样本的范围内,不能外推。,可用于预测、控制等,可用于预测、控制等,1.1.预测:当预测:当X=xX=x0 0时,用回归方程预测值时,用回归方程预测值三、用直线方程预测三、用直线方程预测P175例例8.3:橡胶树大型系比:橡胶树大型系比试验,刺检干胶量(试验,刺检干胶量(x:毫克)毫克)与正式割胶产量(与正式割胶产量(y:克)如克)如下下:编号编

16、号刺检干胶量刺检干胶量正式割胶产量正式割胶产量Xy12.26778.8647.9.733.5试求试求y关于关于x的回归方程,的回归方程,并对回归方程作显著性测验。并对回归方程作显著性测验。datalatex;inputxy;cards;778.8647.9733.5;procregcorr;modely=x/cliclm;/*CLI输出输出Y值的值的95%预测区间预测区间*/Ploty*x/conf95;run;其其SAS程序:程序:四、直线回归实例四、直线回归实例conf95在散点图(在散点图(x,y)上附加回归直线和均值置信区间)上附加回归直线和均值置信区间/*选项选项CORR,要求输出简

17、单相关系数,要求输出简单相关系数*/clm输出条件总体平均数的输出条件总体平均数的95%置信区间置信区间SAS系统系统TheREGProcedureCorrelationVariablexyx1.00000.7057y0.70571.0000SAS输出结果:输出结果:说明:说明:procregcorr;选项选项corr输出变量间的简单输出变量间的简单相关系数相关系数TheREGProcedureModel:MODEL1DependentVariable:yAnalysisofVarianceSourceDFSumofSquaresMeanSquareFValuePrFModel1137.809

18、02137.8090223.81|t|Intercept12.007461.530371.310.2020x10.077090.015804.88.0001截距 截距截距a=2.00746,其标准误为,其标准误为1.53037。回归系数回归系数b=0.07709,其标准误为,其标准误为0.01580,t=4.88,pFModel22852.83453 1426.4172615.37 0.0027Error7649.6094792.80135CorrectedTotal93502.44400RootMSE9.63335 R-Square0.8145DependentMean28.56000 Ad

19、jR-Sq0.7615CoeffVar33.73020 ParameterEstimatesVariableDFParameterEstimateStandardErrortValuePr|t|Intercept1-135.0996261.37574-2.200.0636x1110.195684.316042.360.0502x211.283601.370170.940.3800求二元回归方程求二元回归方程OutputStatisticsObsDependentVariablePredictedValueStdErrorMeanPredict95%CLPredictResidual111.80

20、0021.67184.9777-3.968747.3123-9.8718100.5000-1.53626.7356-29.331426.25902.036211.31.09738.9945-0.067562.2621.预测出预测出1977年最终病情指数值年最终病情指数值95%的预测区间为的预测区间为-0.0675,62.26212:三元线性回归:三元线性回归P180P180例例8.4 8.4 甘蔗糖分与气象甘蔗糖分与气象资资料如表料如表8.58.5。试试求求y y关于关于x x1 1,x x2 2,x x3 3的的线线性回性回归归方程,并方程,并对对方程作方程作显显著性著性测验测验。当。当方程

21、达方程达显显著著时时,再,再对对19841984年糖分作年糖分作预测预测。年份年份糖份糖份(y y)9 91212月份降月份降雨量(雨量(x x1 1)1010月份相月份相对对湿度(湿度(x x2 2)1212月份最低月份最低温度(温度(x x3 3)64/6564/6513.9313.93408.6408.683834.34.365/6665/6613.8513.85460.9460.983833.03.066/6766/6714.2114.21151.8151.882824.74.783/8483/84390.0390.080804.64.6datasgca;inputyx1-x3;car

22、ds;13.93408.6834.313.85460.9833.0.11.59480.4831.5.390.0804.6;procreg;modely=x1-x3/stbcli;run;SAS结果及解释结果及解释P147AnalysisofVarianceSourceDFSumofSquaresMeanSquareFValue PrFModel37.79038 2.596799.08 0.0011Error154.29100 0.28607CorrectedTotal18 12.08138ParameterEstimatesVariableDFParameterEstimateStandard

23、ErrortValuePr|t|StandardizedEstimateIntercept119.714623.189266.18FModel14.288054.288059.350.0071Error177.793330.45843CorrectedTotal1812.08138VariableParameterEstimateStandardErrorTypeIISSFValuePrFIntercept24.903503.5133123.0336750.24FModel26.215533.107778.480.0031Error165.865850.36662CorrectedTotal1

24、812.08138VariableParameterEstimateStandardErrorTypeIISSFValuePrFIntercept22.951993.2550818.2275349.72FModel37.790382.596799.080.0011Error154.291000.28607CorrectedTotal1812.08138VariableParameterEstimateStandardErrorTypeIISSFValuePrFIntercept19.714623.1892610.9311238.21FModel27.076633.5383111.310.000

25、9Error165.004750.31280CorrectedTotal1812.08138VariableParameterEstimateStandardErrorTypeIISSFValuePrFIntercept14.727280.47031306.71958980.570 B20 B30 的图象 的图象 最简单的多项式是最简单的多项式是二次多项式二次多项式,其方程为:,其方程为:b20 B2FModel129.0002429.000240.9980.3563Error6174.3347629.05579CTotal7203.33500RootMSE5.39034R-square0.1

26、426DepMean9.72500AdjR-sq-0.0003C.V.55.42769ParameterEstimatesParameterStandardTforH0:VariableDFEstimateErrorParameter=0Prob|T|INTERCEP15.1547624.955710211.0400.3384X10.8309520.831747920.9990.3563Model:MODEL2SourceDFSumofSquaresMeanSquareFValuePrFModel2198.6040599.30202104.95|t|Intercept130.273812.07

27、84214.57.0001x1-10.221430.83905-12.18.0001x211.004760.0750513.39FModel3201.4895067.16317145.570.0002Error41.845500.46137CorrectedTotal7203.33500RootMSE0.67925 R-Square0.9909DependentMean9.72500 AdjR-Sq0.9841CoeffVar6.98453 ParameterEstimatesVariableDFParameterEstimateStandardErrortValuePr|t|Intercep

28、t122.223813.531026.290.0033x1-4.541132.34574-1.940.1250x21-0.145240.46283-0.310.7694x310.069700.027872.500.0667回归方程为:datanew;inputxy;cards;213.039.246.654.764.077.1813.2920.0;ProcGLM;MODELY=XX*X;RUN;ParameterEstimateStandardErrortValuePr|t|Intercept30.273809522.0784152814.57.0001x-10.221428570.83905

29、350-12.18.0001x*x1.004761900.0750472313.39|t|Intercept130.62358633.1443691641.54|t|Intercept128.71479142.5450337050.57.0001rate-21.43266682.17191314-9.87|r|x1x2x11.000000.878790.0008x20.878791.000000.0008KendallTaub相关系数相关系数,N=10当当H0:Rho=0时,时,Prob|r|x1x2x11.000000.733330.0032x20.733331.000000.0032结束语结束语谢谢大家聆听!谢谢大家聆听!91

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 研究生课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号