《管理统计学》第八章

上传人:豆浆 文档编号:48619830 上传时间:2018-07-18 格式:PPT 页数:87 大小:2.05MB
返回 下载 相关 举报
《管理统计学》第八章_第1页
第1页 / 共87页
《管理统计学》第八章_第2页
第2页 / 共87页
《管理统计学》第八章_第3页
第3页 / 共87页
《管理统计学》第八章_第4页
第4页 / 共87页
《管理统计学》第八章_第5页
第5页 / 共87页
点击查看更多>>
资源描述

《《管理统计学》第八章》由会员分享,可在线阅读,更多相关《《管理统计学》第八章(87页珍藏版)》请在金锄头文库上搜索。

1、第八章 相关分析与回归分析 第一节 相关分析 第二节 简单回归分析 第三节 多重线性回归分析 第四节 时间序列分析相关分析n总体相关与样本相关n偏相关n距离相关n品质相关交叉列联表分析相关分析变量之间的相关关系确定型的关系函数关系不确定型的关系相关关系相关分析是研究变量之间不确定关系的统 计方法。其中最为常见的是两个或多个随机变量之 间的线性相关关系。相关关系的内容有(一)按相关程度划分完全相关 不完全相关 不相关(二)按相关方向划分正相关:同方向变动 负相关:反方向变动(三)按相关形式划分线性相关 非线性相关(四)按变量多少划分单相关:两变量间的相关 复相关 偏相关(五)按相关性质划分真实相

2、关 虚假相关Kendalls tua-b 相关系数二、普通相关系数的种类及计算总体相关系数(一)积矩相关系数 样本相关系数(参数相关)(二)等级相关系数等级相关系数适用于顺序级和刻度级的配对样本。(非参数相关)Spearman相关系数(三)偏相关系数 (四)复相关系数1.总体相关系数2.样本相关系数积矩相关系数适用于等间隔测度的数据或比例数据之间的线性 关系的密切程度。图中,普通相关系数的几何解释与即,表示向量一组角的余弦就是配对样本的相关系数。的模。 样本,可以视为一个向量。相关系数为0的两个随机变量,不相关,但不 一定相互独立。相关系数为0的两个服从正态分布的随机变量, 一定相互独立。 相

3、互独立的随机变量间的相关系数,必然为0。普通相关系数的取值范围样本相关系数也是区间-1,1之间的一个量。普通相关系数的直观散点图设有配对样本观察值与则其直观散点图中,标是()。每个点的平面坐散点图散点图(Graphs Scatter)积矩相关系数的检验 检验的种类 偏相关系数的检验相关系数异于零的显著性检验积矩相关系数的检验式中, 是样本容量,是简单相关系数(Pearson)检验统计量等级相关系数的检验这是一个双尾检验问题设定假设:练习,某企业产品广告费和销售收入资料如下, 判断广告费和销售收入之间关系密切程度如何?3 10 28 40 66 117 140 404序号广告费 (万元)销售收入

4、 (百万元) 1 2 3 4 5 6 73 5 7 8 11 13 14 611 2 4 5 6 9 10 379 25 49 64 121 169 196 6331 4 16 25 36 81 100 263合计普通相关分析的SPSS的实现过程:Analyze菜单Correlate项中选择Bivariate命令。Flag Significant Correlation:是否用星号标明输 出结果的显著性。 Means and Standard Deviations:输出所选变量 的均值、标准差和样本个数。 Cross Product Deviations and Covariances:输 出

5、平方和及协方差。回归分析n一元回归n多元回归n n全部强行进入回归全部强行进入回归n n逐步回归逐步回归回归:揭示出不确定数量关系的内在数量变 化规律,并通过一定的表达式描述数量之间的这种内在关系的方法。不确定性的函数关系回归的涵义数据之间的关系 函数确定性的函数关系回归方程回归分析的任务(1)通过分析大量的样本数据,确定变量之 间的统计关系,并以数学表达式形式给出; (2)对确定的数学关系式的可信度进行统计 检验,找出对某一特定变量影响较为显著的变 量和不显著的变量; (3)利用确定的数学关系式,根据自变量预 测或控制因变量的取值,并找出这种预测或控 制的精确度。 回归分析时变量的设定n回归

6、分析的被解释变量必须是刻度级的, 如果是顺序级的,要用Numeric型的来表示。如果被解释变量是名义级的,将用 Logistic回归等方法处理。n解释变量可以是刻度级、顺序级、名义级 的变量,不论是什么级别的数据,都必须 用Numeric型的来表示。一元线性回归分析n一元线性回归模型的求解n一元线性回归模型的SPSS实现n一元线性回归模型的设定n一元线性回归模型的检验样本回归模型:样本回归直线:一元线性回归模型的求解n最小平方法回归方程的显著性检验 线性回归方程的检验回归系数的显著性检验回归效果的检验回归方程的显著性检验F检验:回归方程不显著:回归方程显著:总离差平方和:剩余平方和/残差平方和

7、:回归离差平方和若全部观测值都落在回归直线上,则 判定相关系数越接近1,表明回归平方和占 总离差平方和的比例越大,用x的变动解释y 值变动的部分就越多,回归的效果就越好。回归效果的检验判定相关系数检验若x完全无助于解释y的变动,则 F检验校正的判定系数统计量 中不含有自由度。所谓校正的判 定系数是指“考虑了自由度的判定系数 ”。其定义如下:剔除了自由度的影响。校正的判定系数Adjusted式中:回归效果的检验F检验:样本容量:自变量的个数(含常数项):判定系数回归系数的显著性检验T检验成立,即当时显著异于0。针对回归系数的统计量的显著性检验决定了相应的变量能否作为解释变量进入回归方程。 回归系

8、数的显著性检验T检验成立,即当时显著异于0。针对回归系数的统计量的显著性检验决定了相应的变量能否作为解释变量进入回归方程。 SPSS的实现:Analyze菜单Regression项中 选择Linear命令。Enter:强行进入法,即所选自变量全部进入模型。 Remove:强制剔除法,即建立回归方程时,根据设 定的条件从回归方程中剔除部分自变量。 Backward:向后剔除法,根据Option对话框中设定 的判据,先建立全模型,然后根据设置的判据,每 次剔除一个使方差分析中的F值最小的自变量,直到 回归方程中不再含有不符合判据的自变量为止。 Forward:向前选择法。 Stepwise:逐步进

9、入法,根据Option对话框中设定的 判据及方差分析结果,选择符合判据的自变量与因 变量相关程度最高的进入回归方程。依据Forward选 入自变量,依据Backward将模型中F值最小且符合 剔除判据的变量剔除,重复。Method处下拉菜单,共有5个选项:WLS选项是存在异方差时,利用加权最小二 乘法替代普通最小二乘法估计回归模型参数。通 过WLS可以选定一个变量作为加权变量。在实际问题中,如果无法自行确定权重变量, 可以用SPSS的权重估计来实现。Descriptives:输出自变量和因变量的均值、标准差 相关系数矩阵及单侧检验概率。Estimates:输出与回归系数相关统计量。有:回归 系

10、数、回归系数的标准误差、标准回归系数、T统计 量和相应的相伴概率、各自变量的容忍度。 Confidence intervals:输出每一个非标准化回归系数 95%的可信区间。 Covariance matix:输出方程中各自变量间的相关系 数矩阵及各变量的协方差矩阵。 Model fit:输出判定系数、调整的判定系数、回归方 程的标准误差,F检验的ANOVA方差分析表。 R squared change:当回归方程中引入或剔除一个自 变量后,判定系数、F值产生的变化。Casewise diagnostics:输出标准化残差绝对值3的 样本数据点的相关信息,包括:标准化残差、观测值 预测值、最小

11、(最大)预测值、残差、最小(最大)残差 以及它们的均值和标准差。Outliers outside standard devistion:设置奇异值 的判据,默认3倍的标准差。All case:输出所有样本数据有关残差值。Part and partial correlation:输出方程中各自变量 与因变量之间的简单相关系数、偏相关系数与部分 相关系数。 Collinearity diagnostics:多重共线性分析,输出各 自变量的容限度、方差膨胀因子、最小容忍度、特 征值、条件指标及方差比例等。 Durbin-Watson:输出Durbin-watson检验值。Plots对话框用来检验残差

12、序列的正态性、随 机性和是否存在异方差现象。 Produce all partial plots:输出每一个自变量残差相 对于因变量残差的散布图。 * ZPRED选项:标准化预测值。 * ZRESID选项:标准化残差。 * DRESID选项:剔除残差。 * ADJPRED选项:修正后预测值。 * SRESID选项:t分析残差。 * SDRESID选项:t分析剔除残差。Mahalanobis:保存Mahalanobis距离 Cooks:保存Cook距离 Leverage values:保存中心点杠杆值 Individual:保存一个观测量上限与下限的预测 区间。 Studentized:标准化残

13、差 Deleted:剔除残差 Studentized deleted:标准化剔除残差 DfBeta(s):因排除一个特定的观察值所引起的 回归系数的变化。若该值2,则被排除的观 测值有可能是影响点。 DfFit:因排除一个特定的观测值所引起的观 测值的变化。Use probalitlity of F:以回归系数显著性检验中 各自变量的F统计量的相伴概率作为自变量是否引 入模型或者从模型中剔除的标准。实际应用中,应 使Entry值小于Remove值,否则,自变量一进入方 程就会被立即剔除。Use F value:以回归系数显著性检验中的各自 变量的F统计量作为自变量进入模型或者从模型中 剔除的标

14、准。Include constant in equationF:表示回归方程 中将包含常数项。练习,某企业产品广告费和销售收入资料如下, 判断广告费和销售收入之间关系密切程度如何?3 10 28 40 66 117 140 404序号广告费 (万元)销售收入 (百万元) 1 2 3 4 5 6 73 5 7 8 11 13 14 611 2 4 5 6 9 10 379 25 49 64 121 169 196 6331 4 16 25 36 81 100 263合计多元线性回归分析一个被解释变量(因变量),的线性模型,多个解释变量(自变量)多元回归的种类全部强行进入回归:所有 自变量全部进入

15、回归模型逐步回归:所有的自变量 依次进入回归模型多元回归方程为回归方程的显著性检验多元线性回归的检验与估计二、多元线性回归三、回归系数的显著性检验四、回归分析的置信区间五、标准回归系数回归效果的检验回归系数总体均值方程的检验多元回归的SPSS处理按数列中所排列指标的表现形式不同分为:按数列中所排列指标的表现形式不同分为:绝对数数列相对数数列平均数数列 (平均指标数列)(平均指标数列)(相对指标数列)(相对指标数列)时点数列时期数列时间数列分析时间数列分析(总量指标列总量指标列)时间序列的基本构成要素 年份国内生产总值产总值 (亿亿元)年份国内生产总值产总值 (亿亿元) 1997 1998 19

16、99 2000 2001 200248 198 60 794 71 177 78 973 84 402 89 6772003 2004 2005 2006 2007 200899 215109 655 120 333135 823159 878182 321要素一:时间要素一:时间t t要素二:指标数值要素二:指标数值a a影响时间数列变动的因素可分解为影响时间数列变动的因素可分解为:(1)长期趋势(T)(2)季节变动(S)(3)循环变动(C)(4)不规则变动(I)可解释的变动不可解释的变动长期趋势 ( )现象在较长时期内受某种根本性因素作用 而形成的总的变动趋势季节变动 ( )现象在一年内随着季节的变化而发生的有 规律的周期性变动循环变动 ( ) 现象以若干年为周期所呈现出的波浪起伏形 态的有规律的变动不规则变动 ( )是一种无规律可循的变动,包括严格的随机 变动和不规则的突发性影响很大的变动两种 类型时间序列的分解分析 (一)时间数列的组合模型1 加法模型

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 建筑/环境 > 综合/其它

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号