回归分析曲线拟合.

上传人:我** 文档编号:117886760 上传时间:2019-12-11 格式:PPT 页数:73 大小:740.50KB
返回 下载 相关 举报
回归分析曲线拟合._第1页
第1页 / 共73页
回归分析曲线拟合._第2页
第2页 / 共73页
回归分析曲线拟合._第3页
第3页 / 共73页
回归分析曲线拟合._第4页
第4页 / 共73页
回归分析曲线拟合._第5页
第5页 / 共73页
点击查看更多>>
资源描述

《回归分析曲线拟合.》由会员分享,可在线阅读,更多相关《回归分析曲线拟合.(73页珍藏版)》请在金锄头文库上搜索。

1、回归分析、线性回归和曲线估计 n回归分析 n线性回归 n曲线估计 什么是回归分析? 1、重点考察一个特定的变量(因变量), 而把其他变量(自变量)看作是影响这一 变量的因素,并通过适当的数学模型将 变量间的关系表达出来 2、利用样本数据建立模型的估计方程 3、对模型进行显著性检验 4、进而通过一个或几个自变量的取值来 估计或预测因变量的取值 回归分析 回归分析的模型 一、分类 按是否线性分:线性回归模型和非线性回归模型 按自变量个数分:简单的一元回归和多元回归 二、基本的步骤 利用SPSS得到模型关系式,是否是我们所要的? 要看回归方程的显著性检验(F检验) 回归系数的显著性检验(T检验) 拟

2、合程度R2 (注:相关系数的平方,一元回归用R Square,多元回 归用Adjusted R Square) 回归分析的过程 在回归过程中包括: nLiner:线性回归 nCurve Estimation:曲线估计 Binary Logistic: 二分变量逻辑回归 Multinomial Logistic:多分变量逻辑回归; Ordinal 序回归;Probit:概率单位回归; Nonlinear:非线性回归; Weight Estimation:加权估计; 2-Stage Least squares:二段最小平方法; Optimal Scaling 最优编码回归 n我们只讲前面2个简单的

3、(一般教科书的讲法) 线性回归 线性回归分为一元线性回归和多元线性回归 。 一、一元线性回归: 1、涉及一个自变量的回归 2、因变量y与自变量x之间为线性关系 n被预测或被解释的变量称为因变量(dependent variable) ,用y表示 n用来预测或用来解释因变量的一个或多个变量称为自变量 (independent variable),用x表示 3、因变量与自变量之间的关系用一个线性 方程来表示 线性回归的过程 一元线性回归模型确定过程 一、做散点图(Graphs -Scatter-Simple) 目的是为了以便进行简单地观测(如: Salary与Salbegin的关系)。 二、建立方

4、程 若散点图的趋势大概呈线性关系,可以建立线性 方程,若不呈线性分布,可建立其它方程模型,并比 较R2 (-1)来确定一种最佳方程式(曲线估计)。 多元线性回归一般采用逐步回归方法-Stepwise。 (一) 一元线性回归模型 (linear regression model) 1、描述因变量 y 如何依赖于自变量 x 和误差项 的方程称为回归模型 2、一元线性回归模型可表示为 y = 0 + 1 x + 注:线性部分反映了由于x的变化而引起的y的 变化;误差项反映了除x和y之间的线性关系 之外的随机因素对y的影响,它是不能由x和y 之间的线性关系所解释的变异性。 Y是x 的线性函数( 部分)

5、加上误差项 0 和 1 称为模 型的参数 误差项 是随机 变量 一元线性回归模型(基本假定 ) 1、因变量x与自变量y之间具有线性 关系 2、在重复抽样中,自变量x的取值 是固定的,即假定x是非随机的 3 、误差项 满足条件 误差项 满足条件 l正态性。 是一个服从正态分布的随机变量, 且期望值为0,即 N(0 , 2 ) 。对于一个给定的 x 值,y 的期望值为E(y)=0+ 1x l方差齐性。对于所有的 x 值, 的方差一个特 定的值,的方差也都等于 2 都相同。同样,一个特 定的x 值, y 的方差也都等于2 l独立性。独立性意味着对于一个特定的 x 值 ,它所对应的与其他 x 值所对应

6、的不相关;对于 一个特定的 x 值,它所对应的 y 值与其他 x 所对 应的 y 值也不相关 估计的回归方程 (estimated regression equation) 1. 总体回归参数0和1是未知的,必须利用样本数 据去估计 2. 用样本统计量 和 代替回归方程中的未知参 数0和1 ,就得到了估计的回归方程 3. 一元线性回归中估计的回归方程为 其中: 是估计的回归直线在 y 轴上的截距, 是直线的 斜率,它表示对于一个给定的 x 的值, 是 y 的估计值, 也表示 x 每变动一个单位时, y 的平均变动值 x y 1 0 += 0 y 1 1 0 SPSS 线性回归分析 n多元线性回

7、归分析基本结构与一元线性回归相同。 而他们在SPSS下的功能菜单是集成在一起的。下面 通过SPSS操作步骤解释线性回归分析问题。 SPSS过程 n步骤一:录入数据,选择分析菜单中的 Regression=liner 打开线性回归分析对话框; n步骤二:选择被解释变量和解释变量。其中因 变量列表框中为被解释变量,自变量为回归分 析解释变量。 n注:要对不同的自变量采用不同引入方法时, 选NEXT按钮把自变量归入不同自变量块中。 n第三步:选择个案标签。在变量列表中选择变 量至个案标签中,而被选择的变量的标签用于 在图形中标注点的值。 n第四步:选择加权二乘法(WLS)。在变量 列表框中选择变量至

8、WLS中。但是该选项仅 在被选变量为权变量时选择。 n第五步:如果点击OK,可以执行线性回归分 析操作。 Method选项 Enter:强迫引入法,默认选项。全部被选变量一次性进 入回归模型。 Stepwise:强迫剔除法。每一次引入变量时,概率F最小 值的变量将引入回归方程,如果已引入回归方程的变 量的F大于设定值,将被剔除回归方程。当无变量被 引入或剔除,时终止回归方程 Remove:剔除变量。不进入方程模型的被选变量剔除。 Backward:向后消去 Forward:向前引入 Rule选项 n选择一个用于指定分析个案的选择规则的变量 。 选择规则包括: 等于、不等于、大于、小于、大于或等

9、于、小 于或等于。 Value中输入相应变量的设定规则的临界值。 Statistics 选项 回归系数框 估计值:显示回 归系数的估计值 、回归系数的 标准差、标准化 回归系数、回归 系数的的t估 计值和双尾显著 性水平。 置信区间 协方差矩阵 模型拟合:复相关 系数、判定系数、 调整R2、估计值的标 准误及方差分析 R2改变量:增加或删 除一个自变量产生 的改变量 描述性统计量:变 量的均数、标准差 、相关系数矩阵、 单尾检验 部分及偏相关系数 :显示零阶相关、 偏相关、部分相关 系数 共线性诊断:显示 变量容差、方差膨 胀因子和共线性的 诊断表 残差统计量 D-W检验统计量:显示残差相关的

10、D-W检验和残差与预测值的综述统计。 个案诊断:1、超过n倍标准差以上的个案为奇异值;2、显示所有变量的标准化 残差、观测值和预测值、残差 Plots选项 该对话框可以分析资料的正态性、线性和方差齐性,还 可以检测奇异值或异常值等。 1、因变量 2、标准化预测值 3、标准化残差 4、删除残差 5、调整预测值 6、Student残差 7、Student删除残差 Histogram:标准化残差的直方图,并给出正态曲线。 Normal probality plot:标准化残差的正态概率图 Produce all partial plots:产生所有偏残差图,生成每个自变量残差与因变 量残差的散点图。

11、 Save对话框 预测值 包括非标准化的预测值 、标准化的预测值、调 整预测值、预测值均数 标准误 距离 包括自变量个案值与所 有个案平均值距离、一 个个案参与计算回归线 系数时,所有个案残差 变化的大小。 杠杆值 残差 非标准化残差 标准化残差 Student残差 删除残差 Student删除残差 影响统计量 DFBeta值,删除一个个 案后回归系数改变的大 小。 标准化DfBeta DfFit值,拟合值之差 标准化DfFit 协方差矩阵的比率 预测区间 平均预测区间 个体预测区间 Options选项 逐步回归方法准则 使用F显著水平值 Entry:当候选变量中最大F值概 率小于等于引入值时

12、,引入相应 变量。 Removal:剔除相应变量 实例分析 例:某单位对8名女工进行体检,体检项目包括体重和 肺活量,数据如下: 利用回归分析描述其关系。 体重4242464646505050 肺活量2.552.22.752.42.82.813.413.1 结果分析 n描述性统计量 相关系数 n表中Pearson相关系数为0.613,单尾显著性检 验的概率p值为0.000,小于0.05.所以体重和肺 活量之间具有较强的相关性 引入或剔除变量表 n表中显示回归分析的方法以及变量被剔除或引 入的信息。Method项为Enter,表明显示回归 方法用得是强迫引入法引入变量。这里自变量 只有一个,所以

13、此表意义不大。 模型摘要 n两变量相关系数为0.613,判定系数为0.375 ,调整判定系数为0.352,估计值的标准误差 为360.997 方差分析表 n该表为回归分析的方差分析表。可以看出回归的均方 为2115016.203,剩余的均方为130318.685,F检验统 计量的观察值为16.230,p值为0.000小于0.05,可以 认为体重和肺活量之间存在线性关系。 回归系数 n下表给出了回归方程中的参数和常数项的估计 值。其中常数项系数为405.819,回归系数为 47.835,线性回归参数的标准误差为11.874 ,标准化回归系数为0.613,回归系数t检验的t 统计量观察值为4.02

14、9,t检验的p值为0.00,小 于0.05可以认为回归系数有显著意义 回归诊断 n下表对全部的观察单位进行回归诊断,结果表 明,每一例的标准化残差、因变量观测值和预 测值以及残差 残差统计量 n表中显示了预测值、标准化预测值、残差、标 准化残差等统计量的最小值、最大值、均数、 标准差 回归标准化残差的直方图 n在回归标准化 残差的直方图 中,正态曲线 也被显示,用 来判断标准化 残差是否呈正 态分布 回归标准化的正态P-P图 n图中给出了 观察值的残 差分布与假 设的正态分 布比较,如 果标准化残 差呈正态分 布,则标准 化残差点应 该分布在直 线上或靠近 直线 因变量与回归标准化预 测值的散

15、点图 n其中横坐 标变量为 标准化预 测值 数据编辑窗口新增变量 n从表中可以看到非标准化预测值,非标准化残 差,预测值均数的标准误差,均值的预测区间 、个体预测区间。 n在十九世纪四、五十年代,苏格兰物理 学家James D.Forbes,试图通过水的沸 点来估计海拔高度。由于可以通过气压 来估计海拔,他在阿尔卑斯山以及苏格 兰收集了沸点及海拔的数据如表所示。 现在通过线形回归拟合气压与沸点的关 系。 散点图 n执行【Analyze】/【 Regression】/【Linear】命令 ,弹出【Linear】对话框 程序 n结果解读 n模型拟合度检验 n方差分析表 n回归分析结果 对残差统计量的分析 n数据中无离群值,且数据的标准差比较小 ,可以认为模型是健康的。 n残差统计量检验 多元线性回归的例子 n某大型金融机构中做了一项关于雇员对其主管满意度的调 查,其中一个问题设计为对主管的工作业绩的综合评价, 另外若干个问题涉及主管与其雇员间相互关系的具体方面 。该研究试图解释主管性格与雇员对其整体满意度之间的 关系。 n雇员对其主管满意度的调查 模型拟合度检验 方差分析 回归分析结果 n拟合结果为:Y=A*X1+B*X2+C*X3+D ? n结果解读

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号