体育统计教程 教学课件 ppt 作者 雷福民 权德庆 第7章 回归分析

上传人:E**** 文档编号:89503240 上传时间:2019-05-26 格式:PPT 页数:18 大小:612.50KB
返回 下载 相关 举报
体育统计教程 教学课件 ppt 作者 雷福民 权德庆 第7章 回归分析_第1页
第1页 / 共18页
体育统计教程 教学课件 ppt 作者 雷福民 权德庆 第7章 回归分析_第2页
第2页 / 共18页
体育统计教程 教学课件 ppt 作者 雷福民 权德庆 第7章 回归分析_第3页
第3页 / 共18页
体育统计教程 教学课件 ppt 作者 雷福民 权德庆 第7章 回归分析_第4页
第4页 / 共18页
体育统计教程 教学课件 ppt 作者 雷福民 权德庆 第7章 回归分析_第5页
第5页 / 共18页
点击查看更多>>
资源描述

《体育统计教程 教学课件 ppt 作者 雷福民 权德庆 第7章 回归分析》由会员分享,可在线阅读,更多相关《体育统计教程 教学课件 ppt 作者 雷福民 权德庆 第7章 回归分析(18页珍藏版)》请在金锄头文库上搜索。

1、第7章 回归分析,多元线性回归分析,线性回归分析SPSS例解,3,一元线性回归分析,1,2,7.1 一元线性回归分析 在研究两个变量之间的关系时,一般是先将两个变量的n对观察值所对应的点在直角坐标系中做出散点图,当散点图呈直线趋势时,也就是两变量具有直线相关关系时,从专业知识角度分析两个变量间存在因果关系,常把其中的原因变量叫自变量,用X表示,而把结果变量(依赖于X而变化的量)叫因变量,用Y表示,这时可采用一元线性回归分析法。 7.1.1 模型的求法 1. 理论回归模型 从理论上讲因变量与自变量的线性关系可用下式表示: (7-1) 式7-1中, 和 是固定的但未知的参数, 是常数项, 是理论回

2、归系数; 是随机误差项,它可由多种因素引起。对于每一组可以观察到的因变量、自变量数值 ,式7-1可以表示成: (7-2) 其中,假定各个 是互不相关的,其总体均值0,总体方差为 。 2. 实际回归模型的求法,7.1.2 回归模型的检验 利用样本数据建立回归模型时,做以下几种假定: 变量X与Y存在线性关系; 回归余项线性独立; 回归余项服从正态分布,即 。 在这种条件下得到的估计值a、b是参数 、 的最小方差无偏估计,但尽管这些估计值是较理想和实用的,但此回归模型是否合理,以及回归模型的优劣需要被评价,回归模型的检验就是用各种统计检验方法来判别模型的实用性。 1. 回归方程的检验(方差分析) 在

3、计算时,常用如下公式: (7-10) 上述回归方程检验问题常总结于方差分析表(简称ANOVA)中,由表7-2给出。,2. 回归系数的检验 建立回归方程后,不仅可以用方差分析法检验回归方程的效果是否显著,还可以通过与其等价的回归系数的t检验方法得到判别。,3. 回归剩余标准差的检验 (1)回归剩余标准差的检验 回归残差 有助于衡量回归模型拟合样本数据的程度。应用线性回归分析,需要计算回归剩余标准差,回归剩余标准差是表示回归方程用来预测的精度标志,可用来检验模型预测的可靠程度。回归剩余标准差记作 : (7-12) 注意:在体育科研中一般都是进行微观研究,比如预测运动员的运动成绩,这时用回归方程进行

4、预测的效果通常不能满足实际需要,回归方程的预测对于宏观研究效果会更好。,4. 拟合优度检验,7.2 多元线性回归分析 7.2.1 模型的求法 1. 理论回归模型,2. 实际回归模型的求法,式7-15写成矩阵形式,其中: 注意:在求多元回归方程的回归系数时,要求自变量之间不能存在线性关系,在应用中应多加注意。,7.2.2 回归模型的检验 1. 回归方程的检验(方差分析) 2. 回归系数的显著性检验,3. 拟合优度检验,7.2.3 异方差问题 1. 异方差产生的原因 体育社会现象是错综复杂的,因而在建立回归模型时,经常会出现某一因素或一些因素随着解释变量(自变量)观测值的变化而对被解释变量(因变量

5、)产生不同的影响,导致随机误差项产生不同的方差;当样本数据为时间序列数据时也会出现异方差,因为此时随机误差项会随时间而变化;异常值(离群点)会导致异方差;用样本平均数作为样本数据时也会出现异方差;等等。 2. 异方差带来的问题 当在多元回归分析时存在异方差问题时,仍用普通的最小二乘法求回归系数,将会使最小二乘法的使用的有效性遭到破坏。会使得到的回归系数估计值虽是无偏的,但不满足渐近有效性,并使得参数的显著性检验失效,使得到的回归方程效果不理想。 3. 异方差的诊断方法 关于异方差的诊断,统计学家进行了大量地研究,目前,已有很多种方法问世,但没有一种最权威的方法。常见的诊断方法有残差图分析法、数

6、据变换法、加权最小二乘法、基于得分统计量的异方差检验法等等,在此只介绍常用的残差图分析法。 残差图分析法是一种直观、方便的分析方法,它以残差 为纵坐标,以任何其他的量为横坐标画散点图。常用的横坐标有:以拟合值为横坐标、以 为横坐标、以观测时间或序号为横坐标。一般情况下,当模型满足所有假定时,残差图上的n个点的散布应是随机、无任何规律的。如果回归模型存在异方差,残差图上的点的散布会呈现出一定的趋势。残差图分析法缺点是凭主观判断有其随意性。,4. 异方差问题的处理方法 当进行回归分析时诊断出存在异方差性时,不宜用普通最小二乘法求回归方程,必须对原来的模型进行变换,使变换后模型的随机误差项满足同方差

7、的假定,然后才能得到理想的回归模型。在SPSS软件中提供了加权最小二乘法(Weighted Least Square,即WLS)。 7.2.4 多重共线性问题 1. 多元共线性问题产生的原因 多重共线性问题在体育研究中常常会遇到。例如,要研究百米跑运动员的运动成绩,影响百米跑运动成绩的因素有很多,如步幅、步频、起跑时间、加速跑时间、途中跑时间、终点冲刺跑时间等,这些因素显然对运动员百米跑成绩产生重要影响,而它们之间又有很强的相关性。又如在居民体育消费额的回归分析中,选择家庭收入、家庭储蓄、家庭人口、前期消费额等作为自变量时,这些自变量间也存在很强的相关性。 从这些例子可以看出,在研究体育运动、

8、社会经济现象等问题时,由于问题本身的复杂性,涉及的因素很多,在建立回归方程时,往往很难在众多的因素中找到一组互不相关又对因变量有显著影响的自变量,会不可避免地出现多重共线性问题。,2. 多重共线性的影响 当多重共线性存在时,任何一个自变量的回归系数,依赖于包括在模型中的其它自变量,所以回归系数并不反映方程中任何一具体自变量对因变量的影响,且其方差较大,使回归系数不能令人满意。 存在多重共线性时,一个自变量引起总离差平方和的减少必须看作是与包括在同一方程中的其它自变量相关联。此外多重共线性还会影响预测值的方差,但其效果不太明显。 3. 多重共线性的识别 (1)非正式方法 在进行多元回归分析中,如

9、果下列情况存在时往往表明存在多重共线性: 模型中增加或删除一个自变量,回归系数值会发生较大变化; 回归模型的检验通过,而有的回归系数的检验未通过; 一些重要的自变量在回归方程中没有通过显著性检验; 有些自变量的回归系数值的符号与实际经验相反时; 自变量的相关阵中,两个自变量的相关系数较大时。 (2)正规识别方法,判定系数法 特征值法 方差膨胀因子 容忍度,4. 消除多重共线性的方法 进行多元回归分析中,如果发现了多重共线性,可采用下面几种常用方法消除多重共线性。 删除共线性组中与因变量相关系数小,而与其它自变量高度相关的变量,然后重建回归方程;增大样本含量;采用岭回归、主成分回归和偏最小二乘法

10、一类有偏估计的方法;等等。 7.2.5 自变量的选择问题 1. 选择自变量的统计学标准 1)残差平方和最小,等价于复相关系数或判定系数最大。 2)残差均方 或剩余标准差最小,等价于调整的 最大。 3)其他的还有 准则( 统计量最小)、 准则等。 2. 变量的选择方法,1)向前选择法(Forward):向前选择法的初始模型中没有变量,自变量有少到多一个一个引入回归方程。 2)向后削去法(Backward):自变量由多到少一个一个从方程中剔除。首先对全部后选变量作总的回归,每次剔除一个偏回归平方和最小又能使F检验不能拒绝 者,直到再不能剔除为止。 3)逐步回归法(Stepwise):逐步回归法是向前选择法和向后削去法策略的综合。逐步回归法是在向前选择法策略的基础上,结合向后削去法,在每个变量进入方程后再次判断是否存在应该剔除出方程的变量,直到方程外无可引入的变量而方程内也没有可以剔除的变量时为止。 7.3 线性回归分析SPSS例解(见书),

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号