中科院心理所心理统计学7回归分析

上传人:wm****3 文档编号:51658603 上传时间:2018-08-15 格式:PPT 页数:49 大小:201KB
返回 下载 相关 举报
中科院心理所心理统计学7回归分析_第1页
第1页 / 共49页
中科院心理所心理统计学7回归分析_第2页
第2页 / 共49页
中科院心理所心理统计学7回归分析_第3页
第3页 / 共49页
中科院心理所心理统计学7回归分析_第4页
第4页 / 共49页
中科院心理所心理统计学7回归分析_第5页
第5页 / 共49页
点击查看更多>>
资源描述

《中科院心理所心理统计学7回归分析》由会员分享,可在线阅读,更多相关《中科院心理所心理统计学7回归分析(49页珍藏版)》请在金锄头文库上搜索。

1、回归分析任课教师:禤宇明 中国科学院心理研究所1本章基本内容l相关和回归l一元回归分析最小二乘估计、回归系数、回归估计的标准误、 决定系数回归方程的有效性检验l多元回归分析多元决定系数21.相关和回归 1.1 散点图 scatter diagram341.2 平方和、积矩和、协方差 sum of squares sum of products covariance51.3 回归分析 regression analysisl回归分析:确定变量之间数量关系的可能 形式,并用一个数学模型来表示这种关系 形式它可以从一个变量的变化来预测或估计另一个变 量的变化只有一个自变量的线性回归叫一元线性回归或简

2、 单线性回归l寻找一条最佳拟合直线best-fitting line,使得预测值 predicted value和观测值observed value之间的误差最 小62.一元回归分析 2.1 回归线 the regression line7最佳拟合直线 best-fitting line82.2 回归线的求解正规方程组 normal equationsQ9102.3 对回归系数的解释112.4 从给定的X来估计对应的Yl无穷大的样本取给定X对应的所有Y的均值作为估计值l对应于某个X的所有Y称为Y的条件分布conditional distributionl有限样本 122.5 预测的准确性l如果

3、需要你去猜测某个班的每个学生的某 次考试的成绩,而只告诉你该班的平均分 ,怎样猜才能误差最小?标准差作为误差的度量13估计的标准误 P208 倒数第12行 standard error of estimate142.6 回归的有效性检验 2.6.1 误差平方和(公式推导参考P207)l相关越高,误差越小相关越高,从X预测Y就越准确,误差就越小152.6.2 因变量变异的分解16l研究吸烟量X和寿命Y之间的关系人的寿命总是有差异SSY吸烟的多少有差异SSXl从X来预测Y,预测值为的变异SS可从X的变异来解释l吸烟量X变化,预测寿命才变化l吸烟量X不变,预测寿命不变lY的部分变异X是无法解释的 S

4、Se吸烟量一样的人也会有不同的寿命17l极端所有不抽烟的人寿命为72岁,所有抽烟的人抽一 样多的烟且寿命都是68岁l此时,寿命的变异可完全从抽烟的变异来预测l实际寿命的变异有的可以从抽烟的变异来预测,其余 部分不能从抽烟的变异来解释182.6.3 决定系数(测定系数)r2 coefficient of determinationl衡量回归方程有效性 高低的指标l回归平方和在总离差 平方和中所占的比例因变量的变异中可以从 自变量的变异来解释的 比例 192.6.4 回归有效性检验 对r的显著性的检验(复习)20对回归的有效性检验21对回归的有效性检验 对r的显著性检验P160222.7 样本回归

5、线和总体回归线l根据样本数据的回归分析结果为样本回归 线 = a + bXl不同的样本对应于不同的样本回归线l所有样本回归线都是总体回归线 = a + X 的一个估计所有样本回归线会在总体回归线附近波动对给定X,对应的总体回归线的也称为主值, 而某条样本回归线对应的i只是的一个点估计l所有i的平均值将为23iX242.8 回归分析的应用l预测已知X0,预测总体回归线对应的0(主值)已知X0,预测新的观测值Y0l控制已知Y的范围,控制X的范围252.8.1 从X0预测总体回归线对应 的0262.8.2 从X0预测新的观测值Y027离样本平均数越近,估计越准确2829P203 例 7-130P21

6、2 例 7-4312.8.3 从X预测Y和从Y预测X322.9 一元线性回归的数学模型l从X预测Y Y=0+1X+Y=a+bX+elY与X的关系分为两部分0+1X是由于X的变化引起线性变化的部分;是全体一切随机因素造成的部分 N(0, s2)332.10 一元线性回归的基本假设lX与Y在总体上具有线性关系l变量X没有测量误差(看成精确变量)l(Xi,Yi) 和 (Xj,Yj) 彼此独立;l与某一个Xi值对应的Y值构成变量Y上一个 子总体,这样的子总体服从正态分布,且 它们的方差相等li 是Xi对应Y的子总体的平均数的无偏估计34小结寻找一条最佳拟合直线用方差分析 检验回归方程有效性有效性高低指

7、标: 决定系数r2回归估计的标准误SYX353 多元线性回归 3.1多元线性回归的数学模型l从X1, X2, , Xk(凭经验选取)预测Y Y=0+1X1+ 2X2 + + kXk+ N(0, s2)l根据样本数据建立的回归方程 =b0+b1X1+ b2X2 + + bkXkbi称为(偏)回归系数l偏回归系数表示其它自变量假设不变时,某一个自变 量变化而引起因变量变化的比率363.2 标准回归方程、标准偏回归 系数l把所有原始数据转换成标准分数,以标准 分数建立的回归方程为标准回归方程 Y = 1Z1+ 2Z2 + + kZkl标准回归方程的回归系数称为标准(偏)回归 系数,其大小可直接反映对

8、应的变量在预 测时做的贡献lbi=iSY/SXi373.3 偏回归系数的计算l基本原理最小二乘法:预测值和观测值的误差平方和最小l一般借助于计算机ExcelSPSSSASMinitab383.4 多元测(决)定系数r2l其中 r 称为复相关系数 multiple correlation coefficientr 实际上就是预测值和观测值Y之间的相关系数393.5 多元线性回归方程的检验l方差分析403.6 偏回归系数的显著性检验l回归方程显著并不意味着所有的回归系数 都显著l某个偏回归系数不显著意味着对应的自变 量在回归方程中没什么贡献可以去掉该变量,重新建立回归方程l检验方法413.7 选择

9、有效自变量的方法l逐步回归 stepwise regression对不显著变量,只剔除对回归贡献最小的那个变 量;然后重新建立新的回归方程,如仍有不显著 变量,仍仅剔除对回归贡献最小的那个变量,重 新建立新的回归方程,直至所有变量都显著l前进法 forward regression逐步加入自变量,检验显著就保留l后退法 backward regression将所有自变量引入回归方程,逐渐剔除那些对回 归方程作用不大的自变量423.8 Excel:工具-数据分析-回归43Excel的多元回归结果443.9 应用多元回归的注意事项l多重共线性 Multi-collinearityX1, X2, ,

10、 Xk之间存在密切的线性关系,称它们之间 存在着多重共线性。此时对回归系数的估计不稳定l因果关系回归分析能表现出变量彼此关联或有联系,但不能证 明其因果关系l回归系数的大小计量单位相同或数据标准化时才能直接比较l样本容量r2 受 n 对于自变量个数 k 的影响。一般观测数n至少 等于自变量个数 k 的1015倍。 454. 回归分析与相关分析的区别l回归分析中,变量Y称为因变量,处于被解 释的地位。而在相关分析中,X与Y处于平 等地位;l相关分析中,X和Y全是随机变量,而在回 归分析中,因变量Y是随机变量,自变量X 可以是随机变量,也可以是非随机的。通 常回归模型中假定X是非随机的精确变量;l相关分析的研究是为了刻画两变量间线性 相关的密切程度。而回归分析不仅可以揭 示X对Y的影响大小,还可以由回归方程进 行预测和控制。46P229第1题47P229第2题 变量X1不显著48P229第2题 剔除变量X1的回归结果49

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 生活休闲 > 社会民生

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号