应用回归分析(PPT530)

上传人:l**** 文档编号:128131561 上传时间:2020-04-08 格式:PPT 页数:531 大小:10.65MB
返回 下载 相关 举报
应用回归分析(PPT530)_第1页
第1页 / 共531页
应用回归分析(PPT530)_第2页
第2页 / 共531页
应用回归分析(PPT530)_第3页
第3页 / 共531页
应用回归分析(PPT530)_第4页
第4页 / 共531页
应用回归分析(PPT530)_第5页
第5页 / 共531页
点击查看更多>>
资源描述

《应用回归分析(PPT530)》由会员分享,可在线阅读,更多相关《应用回归分析(PPT530)(531页珍藏版)》请在金锄头文库上搜索。

1、应用回归分析 AppliedRegressionAnalysis 教材何晓群 刘文卿 应用回归分析 第二版 中国人民大学出版社 2007年 统计软件 SPSS13 0StatisticalPackagefortheSocialScience 章节目录 第1章回归分析概述第2章一元线性回归第3章多元线性回归第4章违背基本假定的情况第5章自变量选择与逐步回归第6章多重共线性的情形及其处理第7章岭回归第8章非线性回归第9章含定性变量的回归模型 第1章回归分析概述 1 1变量间的统计关系1 2回归方程与回归名称的由来1 3回归分析的主要内容及其一般模型1 4建立实际问题回归模型的过程1 5回归分析应用

2、与发展述评思考与练习 1 1变量间的统计关系 函数关系商品的销售额与销售量之间的关系y px圆的面积与半径之间的关系S R2原材料消耗额与产量 x1 单位产量消耗 x2 原材料价格 x3 之间的关系y x1x2x3 1 1变量间的统计关系 1 1变量间的统计关系 相关关系的例子子女身高 y 与父亲身高 x 之间的关系收入水平 y 与受教育程度 x 之间的关系粮食亩产量 y 与施肥量 x1 降雨量 x2 温度 x3 之间的关系商品的消费量 y 与居民收入 x 之间的关系商品销售额 y 与广告费支出 x 之间的关系 1 1变量间的统计关系 对变量间统计依赖关系的考察主要是通过相关分析 correl

3、ationanalysis 或回归分析 regressionanalysis 来完成的 注意 不线性相关并不意味着不相关 有相关关系并不意味着一定有因果关系 回归分析 相关分析研究一个变量对另一个 些 变量的统计依赖关系 但它们并不意味着一定有因果关系 相关分析对称地对待任何 两个 变量 两个变量都被看作是随机的 回归分析对变量的处理方法存在不对称性 即区分应变量 被解释变量 和自变量 解释变量 前者是随机变量 后者不是 回归分析构成计量经济学的方法论基础 其主要内容包括 1 根据样本观察值对经济计量模型参数进行估计 求得回归方程 2 对回归方程 参数估计值进行显著性检验 3 利用回归方程进行

4、分析 评价及预测 1 2回归方程与回归名称的由来 成年儿子身高 父母平均身高 英国统计学家F Galton 1822 1911年 F Galton和他的学生 现代统计学的奠基者之一K Pearson 1856 1936年 在研究父母身高与其子女身高的遗传问题时 观察了1078对夫妇 1 3回归分析的主要内容及其一般模型 回归分析的一般形式 随机误差项主要包括下列因素 在解释变量中被忽略的因素的影响 变量观测值的观测误差的影响 模型关系的设定误差的影响 其他随机因素的影响 回归模型研究的问题 1 4建立实际问题回归模型的过程 1 5回归分析应用与发展述评 从高斯提出最小二乘法算起 回归分析已经有

5、200年的历史 从1969年设立诺贝尔经济学奖以来 已有近50位学者获奖 其中绝大部分获奖者是统计学家 计量经济学家 数学家 他们对统计学及回归分析方法的应用都有娴熟的技巧 第2章一元线性回归 2 1一元线性回归模型2 2参数 0 1的估计2 3最小二乘估计的性质2 4回归方程的显著性检验2 5残差分析2 6回归系数的区间估计2 7预测和控制2 8本章小结与评注 2 1一元线性回归模型 例2 1表2 1列出了15起火灾事故的损失及火灾发生地与最近的消防站的距离 表2 1火灾损失表 2 1一元线性回归模型 例2 2全国人均消费金额记作y 元 人均国民收入记为x 元 表2 2人均国民收入表 2 1

6、一元线性回归模型 一元线性回归模型y 0 1x 回归方程E y x 0 1x 2 1一元线性回归模型 样本模型yi 0 1xi i i 1 2 n 回归方程E yi 0 1xi var yi 2 样本观测值 x1 y1 x2 y2 xn yn 经验回归方程 2 2参数 0 1的估计 一 普通最小二乘估计 OrdinaryLeastSquareEstimation 简记为OLSE 最小二乘法就是寻找参数 0 1的估计值使离差平方和达极小 称为yi的回归拟合值 简称回归值或拟合值 称为yi的残差 2 2参数 0 1的估计 2 2参数 0 1的估计 经整理后 得正规方程组 2 2参数 0 1的估计

7、得OLSE为 记 2 2参数 0 1的估计 续例2 1 回归方程 2 2参数 0 1的估计 二 最大似然估计 连续型 是样本的联合密度函数 离散型 是样本的联合概率函数 似然函数并不局限于独立同分布的样本 似然函数 在假设 i N 0 2 时 由 2 10 式知yi服从如下正态分布 2 2参数 0 1的估计 二 最大似然估计 y1 y2 yn 的似然函数为 对数似然函数为 与最小二乘原理完全相同 2 3最小二乘估计的性质 一 线性 是y1 y2 yn的线性函数 其中用到 2 3最小二乘估计的性质 二 无偏性 2 3最小二乘估计的性质 三 的方差 2 3最小二乘估计的性质 三 的方差 在正态假设

8、下 Gauss Markov条件 2 4回归方程的显著性检验 一 t检验 原假设 H0 1 0对立假设 H1 1 0 由 当原假设H0 1 0成立时有 2 4回归方程的显著性检验 一 t检验 构造t统计量 其中 2 4回归方程的显著性检验 二 用统计软件计算 1 例2 1用Excel软件计算 什么是P值 P value P值即显著性概率值SignificenceProbabilityValue是当原假设为真时得到比目前的样本更极端的样本的概率 所谓极端就是与原假设相背离它是用此样本拒绝原假设所犯弃真错误的真实概率 被称为观察到的 或实测的 显著性水平 双侧检验的P值 2 2 t 拒绝 拒绝 H

9、0值 临界值 计算出的样本统计量 计算出的样本统计量 临界值 1 2P值 1 2P值 左侧检验的P值 H0值 临界值 a 样本统计量 拒绝域 抽样分布 1 置信水平 计算出的样本统计量 P值 右侧检验的P值 H0值 临界值 a 拒绝域 抽样分布 1 置信水平 计算出的样本统计量 P值 利用P值进行检验的决策准则 若p 值 不能拒绝H0若p 值 拒绝H0双侧检验p 值 2 单侧检验p 值 2 4回归方程的显著性检验 二 用统计软件计算 2 例2 1用SPSS软件计算 2 4回归方程的显著性检验 二 用统计软件计算 2 用SPSS软件计算 2 4回归方程的显著性检验 三 F检验 平方和分解式 SS

10、T SSR SSE 构造F检验统计量 2 4回归方程的显著性检验 三 F检验 一元线性回归方差分析表 2 4回归方程的显著性检验 四 相关系数的显著性检验 2 4回归方程的显著性检验 四 相关系数的显著性检验 2 4回归方程的显著性检验 四 相关系数的显著性检验 附表1相关系数 0的临界值表 2 4回归方程的显著性检验 四 相关系数的显著性检验 用SPSS软件做相关系数的显著性检验 2 4回归方程的显著性检验 四 相关系数的显著性检验 两变量间相关程度的强弱分为以下几个等级 当 r 0 8时 视为高度相关 当0 5 r 0 8时 视为中度相关 当0 3 r 0 5时 视为低度相关 当 r 0

11、3时 表明两个变量之间的相关程度极弱 在实际应用中可视为不相关 2 4回归方程的显著性检验 五 三种检验的关系 H0 b 0 H0 r 0 H0 回归无效 2 4回归方程的显著性检验 六 样本决定系数 可以证明 2 5残差分析 一 残差概念与残差图 残差 误差项 残差ei是误差项ei的估计值 2 5残差分析 一 残差概念与残差图 2 5残差分析 一 残差概念与残差图 图2 6火灾损失数据残差图 2 5残差分析 二 残差的性质 性质1E ei 0 证明 2 5残差分析 二 残差的性质 性质2 其中 称为杠杆值 2 5残差分析 二 残差的性质 2 5残差分析 二 残差的性质 性质3 残差满足约束条

12、件 2 5残差分析 三 改进的残差 标准化残差 学生化残差 2 6回归系数的区间估计 等价于 1的1 置信区间 2 7预测和控制 一 单值预测 2 7预测和控制 二 区间预测 找一个区间 T1 T2 使得 需要首先求出其估计值 的分布 1 因变量新值的区间预测 二 区间预测1因变量新值的区间预测 以下计算 的方差 从而得 二 区间预测1因变量新值的区间预测 记 于是有 则 二 区间预测1因变量新值的区间预测 y0的置信概率为1 的置信区间为 y0的置信度为95 的置信区间近似为 二 区间预测2因变量平均值的区间估计 得E y0 的1 的置信区间为 E y0 0 1x0是常数 二 区间预测计算

13、对例2 1的火灾损失数据 假设保险公司希望预测一个距最近的消防队x0 3 5公里的居民住宅失火的损失 点估计值 95 区间估计单个新值 22 32 32 67 平均值E y0 26 19 28 80 的95 的近似置信区间为 27 50 2 2 316 27 50 2 2 316 22 87 32 13 三 控制问题 给定y的预期范围 T1 T2 如何控制自变量x的值才能以1 的概率保证 用近似的预测区间来确定x 如果 0 05 则要求 把 带入 2 8本章小结与评注 一 一元线性回归模型从建模到应用的全过程例2 2全国人均消费金额记作y 元 人均国民收入记为x 元 表2 2人均国民收入表 2

14、 8本章小结与评注 二 有关回归假设检验问题1973年Anscombe构造了四组数据 这四组数据所建的回归方程是相同的 决定系数 F统计量也都相同 且均通过显著性检验 2 8本章小结与评注 第三章多元线性回归 3 1多元线性回归模型3 2回归参数的估计3 3参数估计量的性质3 4回归方程的显著性检验3 5中心化和标准化3 6相关阵与偏相关系数3 7本章小结与评注 3 1多元线性回归模型 一 多元线性回归模型的一般形式 y 0 1x1 2x2 pxp 3 1多元线性回归模型 一 多元线性回归模型的一般形式 对n组观测数据 xi1 xi2 xip yi i 1 2 n 线性回归模型表示为 3 1多

15、元线性回归模型 一 多元线性回归模型的一般形式 写成矩阵形式为 y X 其中 3 1多元线性回归模型 二 多元线性回归模型的基本假定 1 解释变量x1 x2 xp是确定性变量 不是随机变量 且要求rk X p 1 n 表明设计矩阵X中的自变量列之间不相关 X是一满秩矩阵 3 1多元线性回归模型 二 多元线性回归模型的基本假定 2 随机误差项具有0均值和等方差 即 这个假定称为Gauss Markov条件 3 1多元线性回归模型 二 多元线性回归模型的基本假定 3 正态分布的假定条件为 用矩阵形式 3 5 式表示为 N 0 s2In 3 1多元线性回归模型 二 多元线性回归模型的基本假定 在正态

16、假定下 y N X s2In E y X var y s2In 3 1多元线性回归模型 三 多元线性回归方程的解释 y表示空调机的销售量 x1表示空调机的价格 x2表示消费者可用于支配的收入 y 0 1x1 2x2 E y 0 1x1 2x2 在x2保持不变时 有 在x1保持不变时 有 3 1多元线性回归模型 三 多元线性回归方程的解释 考虑国内生产总值GDP和三次产业增加值的关系 GDP x1 x2 x3 现在做GDP对第二产业增加值x2的一元线性回归 得回归方程 3 1多元线性回归模型 3 1多元线性回归模型 三 多元线性回归方程的解释 建立GDP对x1和x2的回归 得二元回归方程 2914 6 0 607x1 1 709x2 你能够合理地解释两个回归系数吗 3 2回归参数的估计 一 回归参数的普通最小二乘估计 最小二乘估计要寻找 3 2回归参数的估计 一 回归参数的普通最小二乘估计 3 2回归参数的估计 一 回归参数的普通最小二乘估计 经整理后得用矩阵形式表示的正规方程组 移项得 存在时 即得回归参数的最小二乘估计为 3 2回归参数的估计 二 回归值与残差 为回归值 称为帽子矩阵

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 工作范文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号