第十四章双变量回归与相关simplelinearregressionand

上传人:彩*** 文档编号:275922189 上传时间:2022-04-11 格式:PPT 页数:91 大小:1.98MB
返回 下载 相关 举报
第十四章双变量回归与相关simplelinearregressionand_第1页
第1页 / 共91页
第十四章双变量回归与相关simplelinearregressionand_第2页
第2页 / 共91页
第十四章双变量回归与相关simplelinearregressionand_第3页
第3页 / 共91页
第十四章双变量回归与相关simplelinearregressionand_第4页
第4页 / 共91页
第十四章双变量回归与相关simplelinearregressionand_第5页
第5页 / 共91页
点击查看更多>>
资源描述

《第十四章双变量回归与相关simplelinearregressionand》由会员分享,可在线阅读,更多相关《第十四章双变量回归与相关simplelinearregressionand(91页珍藏版)》请在金锄头文库上搜索。

1、第十四章章 双变量回归与相关双变量回归与相关 simple linear regression simple linear regression and correlationand correlation 4/8/2022宇传华 制作(http:/)回归分析与相关分析回归分析与相关分析变变量量间间关关系系问问题题:年年龄龄身身高高、肺肺活活量量体体重重、药物剂量与动物死亡率等药物剂量与动物死亡率等。两个关系:两个关系:(1)依依存存关关系系:应应变变量量(dependent variable)Y随随自自变变量量(independentvariable)X变化而变化。变化而变化。 回归分析回归

2、分析(2)互依关系:互依关系:应变量应变量Y与自变量与自变量 X间间的彼此关系的彼此关系 相关分析相关分析4/8/2022http:/ 第一节第一节直线回归直线回归第二节第二节直线相关直线相关第三节第三节Spearman等级相关等级相关(秩相关)(秩相关)第四节第四节秩回归秩回归第五节第五节加权直线回归加权直线回归第六节第六节两条回归直线的比较两条回归直线的比较第七节第七节曲线回归曲线回归4/8/2022http:/ 实实例例例例14-1 某地方病研究所调查了某地方病研究所调查了 8名正常儿童的尿肌酐名正常儿童的尿肌酐含量(含量(mmol/24h)如表)如表9-1。估计尿肌酐含量。估计尿肌酐含

3、量(Y)对其年龄()对其年龄(X)的回归方程。)的回归方程。 表表14-1 8名正常儿童的年龄名正常儿童的年龄 X(岁岁)与尿肌酐含量与尿肌酐含量 Y(mmol/24h) 编号编号12345678年龄年龄X131196810127尿肌酐含量尿肌酐含量Y3.543.013.092.482.563.363.182.654/8/2022http:/ 4/8/2022http:/ 第一节第一节直线回归直线回归函数关系函数关系函数关系函数关系:确定。例如确定。例如园周长与半径:园周长与半径:y=2r回回回回归归归归关关关关系系系系:不不确确定定。例例如如血血压压和和年年龄龄的的关关系系,称称为为直直线线

4、回归回归(linearregression)。 目的目的:建立直线回归方程建立直线回归方程(linearregressionequation)4/8/2022http:/ “回归回归”名称的由来名称的由来 英国统计学家英国统计学家英国统计学家英国统计学家FGaltonFGalton(18221911 18221911 年)和他年)和他年)和他年)和他的学生、现代统计学的奠基者之一的学生、现代统计学的奠基者之一的学生、现代统计学的奠基者之一的学生、现代统计学的奠基者之一KPearson(1856KPearson(18561936 1936 年年年年) )在研究父母身高与其子女身高的遗传问题在研究

5、父母身高与其子女身高的遗传问题在研究父母身高与其子女身高的遗传问题在研究父母身高与其子女身高的遗传问题时,观察了时,观察了时,观察了时,观察了1078 1078 对夫妇,以每对夫妇中父亲的身高对夫妇,以每对夫妇中父亲的身高对夫妇,以每对夫妇中父亲的身高对夫妇,以每对夫妇中父亲的身高作为解释变量作为解释变量作为解释变量作为解释变量X X,而取他们的一个成年儿子的身高作而取他们的一个成年儿子的身高作而取他们的一个成年儿子的身高作而取他们的一个成年儿子的身高作为被解释变量为被解释变量为被解释变量为被解释变量Y Y(应变量),将结果在平面直角坐标(应变量),将结果在平面直角坐标(应变量),将结果在平面

6、直角坐标(应变量),将结果在平面直角坐标系上绘成散点图,发现趋势近乎一条直线。计算出系上绘成散点图,发现趋势近乎一条直线。计算出系上绘成散点图,发现趋势近乎一条直线。计算出系上绘成散点图,发现趋势近乎一条直线。计算出的回归直线方程为的回归直线方程为的回归直线方程为的回归直线方程为 : 4/8/2022http:/ Galton数据散点图(英寸)数据散点图(英寸)4/8/2022http:/ 其他类型的散点图其他类型的散点图XYXYX00000YXYXYXY4/8/2022http:/ 一、一、 直线回归方程直线回归方程 一般表达式一般表达式:或或a:截距截距(intercept),直线与直线与

7、Y轴交点的纵坐标轴交点的纵坐标(X0)。b:斜率斜率(slope),回归系数回归系数(regressioncoefficient)。意义:意义:X每改变一个单位,每改变一个单位,Y平均改变平均改变b个单位个单位。b0,Y随随X的的增大增大而而增大(减少增大(减少而而减少)减少)斜上;斜上;bFPrFModel10.81343Model10.813430.813430.8134320.9720.970.00380.0038Error60.232760.03879Error60.232760.03879CorrectedTotal71.04619CorrectedTotal71.04619Root

8、MSERootMSE0.196960.19696R-SquareR-Square0.77750.7775DependentMean2.98375DependentMean2.98375AdjAdjR-Sq0.7404R-Sq0.7404CoeffCoeff VarVar6.601076.60107ParameterEstimatesParameterEstimatesParameterStandardParameterStandardVariableDFEstimateErrortValuePr|t|95%VariableDFEstimateErrortValuePr|t|95%Confide

9、nceLimitsConfidenceLimitsIntercept1Intercept11.661671.661670.297005.590.00140.934940.297005.590.00140.934942.388402.38840 x1x10.139170.139170.030394.580.00380.030394.580.00380.064800.213530.064800.213534/8/2022http:/ The REG Procedure Model: MODEL1 Dependent Variable: y Output Statistics Dep Var Pre

10、dicted Std Error Obs y Value Mean Predict 95% CL Mean 95% CL Predict Residual 1 3.5400 3.4708 0.1271 3.1597 3.7819 2.8972 4.0445 0.0692 2 3.0100 3.1925 0.0832 2.9888 3.3962 2.6693 3.7157 -0.1825 3 3.0900 2.9142 0.0713 2.7398 3.0886 2.4016 3.4267 0.1758 4 2.4800 2.4967 0.1271 2.1856 2.8078 1.9230 3.0

11、703 -0.0167 5 2.5600 2.7750 0.0832 2.5713 2.9787 2.2518 3.2982 -0.2150 6 3.3600 3.0533 0.0713 2.8789 3.2277 2.5408 3.5659 0.3067 7 3.1800 3.3317 0.1031 3.0795 3.5839 2.7877 3.8756 -0.1517 8 2.6500 2.6358 0.1031 2.3836 2.8880 2.0919 3.1798 0.0142 Sum of Residuals 0 Sum of Squared Residuals 0.23276 Pr

12、edicted Residual SS (PRESS) 0.342204/8/2022http:/ Pearson Correlation Coefficients, N = 8 Prob |r| under H0: Rho=0 x y x 1.00000 0.88177 0.0038 y 0.88177 1.00000 0.0038 Spearman Correlation Coefficients, N = 8 Prob |r| under H0: Rho=0 x y x 1.00000 0.85714 0.0065 y 0.85714 1.00000 0.00654/8/2022http

13、:/ SPSS实现直线回归与相关实现直线回归与相关(一)直线回归分析数据格式:1个自变量“x”,1个因变量“y”。Analyze RegressionLinear Dependent: y Independent(s) x Statistics Estimates Confidence Interval Model fit(二)直线相关分析Analyze Correlate BivariateVariables: x / yCorrelation Coefficients Pearson Spearman4/8/2022http:/ Curve fitting 曲线拟合曲线拟合 医学研究中,医

14、学研究中,X X与与Y Y两变量的数量关系并两变量的数量关系并非总是线性的,如非总是线性的,如毒物剂量毒物剂量动物死亡率动物死亡率年龄年龄身高身高时间时间血血药物浓度药物浓度 可用可用曲线直线化估计曲线直线化估计(Curve estimation) (Curve estimation) 或或 非线性回归非线性回归(Nonlinear regression) (Nonlinear regression) 方法进行统计学分析。方法进行统计学分析。 绘制散点图,根据图形和专业知识选取绘制散点图,根据图形和专业知识选取曲线类曲线类型型(可同时选取几类)(可同时选取几类)按按曲线类型曲线类型,作曲线直线

15、化变换,作曲线直线化变换建立变换数据间的建立变换数据间的直线回归方程直线回归方程直线回归方程直线回归方程 (假设检验,计算决定系数)比较比较决定系数决定系数选取选取“最佳最佳”方程方程写出曲线方程写出曲线方程曲线直线化估计的步骤曲线直线化估计的步骤 常见的曲线回归方程常见的曲线回归方程 对数:幂函数: 或 指数函数:多项式: 或 logistic: 或 一、利用线性回归拟合曲线(例1)例例 上海医科大学微生物学教研室以已知浓度上海医科大学微生物学教研室以已知浓度X的免疫球蛋的免疫球蛋白白A(IgA, g/ml)作火箭电泳作火箭电泳, 测得火箭高度测得火箭高度Y(mm)如表如表1所示。试拟合所示

16、。试拟合Y关于关于X的非线性回归方程。的非线性回归方程。编号编号编号编号 XYXYXXXXlnXlnXlnXlnX 10.27.6-1.609410.27.6-1.609420.412.3-0.916320.412.3-0.916330.615.7-0.510830.615.7-0.510840.818.2-0.223140.818.2-0.223151.018.7051.018.7061.221.40.182361.221.40.182371.422.60.336571.422.60.336581.623.80.470081.623.80.4700合计合计合计合计140.3-2.2708140.3-2.2708(一)绘制散点图,决定曲线类型绘制散点图,决定曲线类型(二)曲线直线化变换(二)曲线直线化变换 =a+blnX (三)建立直线回归方程 XYXYXXXXlnXlnXlnXlnX(lnX)2Y2(lnX)Y残差平方残差平方 0.27.6-1.60940.27.6-1.60940.412.3-0.91630.412.3-0.91630.615.7-0.51080.615.7-0.5

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 事务文书

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号