统计学实验:方差回归分析

上传人:第*** 文档编号:55702053 上传时间:2018-10-04 格式:PPT 页数:69 大小:2.90MB
返回 下载 相关 举报
统计学实验:方差回归分析_第1页
第1页 / 共69页
统计学实验:方差回归分析_第2页
第2页 / 共69页
统计学实验:方差回归分析_第3页
第3页 / 共69页
统计学实验:方差回归分析_第4页
第4页 / 共69页
统计学实验:方差回归分析_第5页
第5页 / 共69页
点击查看更多>>
资源描述

《统计学实验:方差回归分析》由会员分享,可在线阅读,更多相关《统计学实验:方差回归分析(69页珍藏版)》请在金锄头文库上搜索。

1、1,实验3:方差分析,单因素方差分析 双因素方差分析,2,方差分析(Analysis of Variance,ANOVA) 1928年由英国统计学家R.A. Fisher 首先提出,为纪念Fisher,以F 命名,故方差分析又称为 F检验。,3,方差分析(ANOVA),检验多个总体均值是否相等 研究一个或多个分类型自变量对一个数值型因变量的影响 有单因素方差分析和双因素方差分析 单因素方差分析:涉及一个分类的自变量 双因素方差分析:涉及两个分类的自变量 无交互作用的双因素方差分析; 有交互作用的双因素方差分析;,4,方差分析检验假定 总体是服从正态分布的;总体方差是相等的; 随机样本是独立的。

2、,单因素方差分析,用于检验由单一因素影响的一个(或几个相互独立的)因变量按因素各水平分组的均值之间是否具有显著性差异,也可用于进行两两组间均值的比较; 可通过One-Way ANOVA对话框实现。,6,建立的假设组为:,提出假设 H0 : 1 2 k 自变量对因变量没有显著影响,没有系统误差 H1 : 1 , 2 , ,k 不全相等 自变量对因变量有显著影响 注意:拒绝原假设,只表明至少有两个总体的均值不相等,并不意味着所有的均值都不相等,单因素方差分析,某企业需要一种零件,现有三个不同的地区的企业生产的同种零件可供选择,为了比较这三个零件的强度是否相同,每个地区的企业抽出6件产品进行强度测试

3、,其值如表所示。假设每个企业零件的强度值服从正态分布,试检验这三个地区企业的零件强度是否存在显著差异。,8,1、单击分析(Analyze) 比较均值(Compare Means) 单因素( One-Way ANOVA),打开对话框。,步骤:,2、从左框中选择因变量”零件强度”进入因变量框内,选择“地区”进入因子框内。 点击确定。,9,可以得到方差分析表,由于F统计量值的P值明显小于显著性水平0.05,故拒绝假设H0,认为这三个地区的零件强度有显著差异。 如果需要对各地区间的零件强度进行进一步的比较和分析,可以通过按纽选项Option选项,contrast对比,Post Hoc两两比较去实现。,

4、10,3、单击选项Option按纽,打开对话框如图所示,选择输出项。主要有不同水平下样本方差的齐性检验,缺失值的处理方式及均值的图形。,本例中选择描述性(Descriptive)进行基本统计描述,以及方差同质检验(Homogeneity of variance test)进行不同水平间方差齐性的检验。在缺失值(Missing Value)栏中选择系统默认项。,11,完成所有选择后返回主对话框,然后单击OK,就可以得到三个地区零件强度分析表。,基本统计描述,方差齐性检验,P值大于0.05,所以因素变量的各水平间的方差是没有显著差异的。,Levene检验是一种非参数检验方法,与F检验类似,但不依赖

5、与正态性假设,比F检验更稳健。,12,4、如果需要将水平间两两比较,可以单击两两比较Post Hoc 按纽,打开多重比较对话框。如图所示:,如果满足在水平间方差相等的条件,常用LSD(最小显著性差异法),用 t 检验完成各组均值间的配对比较。 当方差不等的情况下,可以选择Tamhanes T2, 用t检验进行各组均值间的配对比较。,13,选择多重比较方式后,点击OK,得到输出结果。,从表中可以看出,地区2与地区3之间的差异是非常显著的,它们均值差的检验的尾概率为0.005,明显小于显著性水平0.05。,14,某大型连锁超市为了解不同促销手段对商品销售额的影响,在其下属五个分店中,对同一类日常生

6、活用品分别采用不同促销方式进行了为期四个月的销售对比试验(销售对比试验结果见所附数据集SY-22)。试利用方差分析方法,检验不同促销方式下的商品销售量是否存在显著性差异(试验前该类商品在五个分店内的月销售额基本处于同一水平)。,例2,分析思路:,这是单一因素影响下的方差分析问题,可以以月销售额为因变量,以促销方式为影响因素变量进行分析; 分析过程利用SPSS软件中的One-Way ANOVA菜单实现。,15,操作步骤:,打开数据集SY-22,变量SALE和A分别表示月销售额和促销方式 。 依次选择Analyze Compare Means One-Way ANOVA,展开单因素方差分析对话框,

7、将变量SALE送入Dependent list框,将影响因素变量A送入Factor框。 单击Post Hoc项,在打开的对话框中,选中LSD复选框,以进行各组均值间的两两比较。继续单击Continue按钮,返回到主对话框。 单击OK按钮,即得出单因素方差分析的运行结果 。,16,单因素方差分析的输出结果,输出结果,17,双因素方差分析,双因素方差分析的应用范围很广; 应用条件: 因变量是数值型变量,且来自或近似来自正态总体。 自变量是分类变量,变量可以是数值型或字符型的。 各水平下的总体假设服从正态分布,而且假设各水平下的方差是相等的。,18,双因素方差分析,双因素方差分析过程: 可以分析出每

8、一个因素的作用; 各因素之间的交互作用; 检验各总体间方差是否相等; 能够对因素的各水平间均值差异进行比较等。,19,双因素方差分析,下表是某商品S在不同地区和不同时期的销售量(千件)表。已知数据服从正态分布,则要检验地区因素及时间因素对销售量的影响是否显著。(SY-23),由于销售量受地区和时间两个因素的影响,这是一个双因素方差分析的问题。,20,1、单击分析(Analyze) 一般线性模型(General linear Model) 单变量(Univariate),打开主对话框。,步骤:,2、从左框中选择因变量“销售量 ”进入因变量框内,选择“地区”和“时期”进入固定因子框内。 点击确定。

9、,21,3、单击模型(Model)按纽选择分析模型,得到对话框如图。,全因子选项为系统默认项,建立全模型,全模型中包括因素之间的交互作用。 如果选择分析两个因素的交互作用,则必须在每种水平组合下,取得两个以上的实验数据,才能实现两个因素的交互作用的分析结果。 如果不考虑因素间的交互作用时,应当选择设定模型。,22,先从左边框中选择因素变量进入模型框中,然后选择类型。 一般不考虑交互作用时,选择主效应,考虑交互作用时,选择交互。本例中选择主效应。 平方和一般选取默认项类型。 单击继续,返回主对话框,点击确定就可以得到相应的双因素方差分析表.,23,从表中数据可以看出,F值对应概率P值都小于显著性

10、水平0.05,这说明地区和时期对销售量的影响都是显著的。,24,实验4:相关与回归分析,相关分析 回归分析,25,相关分析,相关分析是研究变量间密切程度的统计方法,线性相关分析研究的是两变量间线性关系的程度,用相关系数表示; 可以通过分析菜单进行相关分析; SPSS提供的相关分析功能有 双变量相关分析(Bivariate); 偏相关分析 (Partial); 距离相关分析(Distance)。,26,双变量相关分析(简单相关分析),两个变量之间的相关关系称简单相关关系。有两种方法可以反映简单相关关系:通过散点图直观地显示变量之间关系;通过相关系数准确地反映两变量的关系程度。,27,双变量相关分

11、析散点图,首先打开数据SY-31;然后单击图形Graphs 散点Scatter, 打开散点图Scatter plot对话框,选择需要的散点图,图中的5个选项如下:,28,3. 如果只考虑两个变量,可选择简单的散点图Simple,然后点击定义Define,打开简单散点图Simple Scatterplot对话框,如左图所示。,4. 选择变量分别进入X轴和Y轴,点击OK后就可以得到右边的散点图 。,29,双变量相关分析相关系数,具体操作如下:,1. 打开数据库SY-31后,单击分析Analyze 相关Correlate双变量 Bivariate;如图所示。,30,分析变量,2、从左边的变量框中选择

12、需要考察的两个变量进入 变量框内,选择相关系数的种类,选择检验方式,单击选项Options按纽。,31,3.选择输出项和缺失值的处理方式。本例中选择输出基本统计描述。,成对剔除带有缺失值的观测量,剔除所有带有缺失值的观测量,32,4.单击OK,可以得到相关分析的结果。见图所示。,从表中可以看到两个变量相关性分析的结果:相关系数是0.996,相关程度非常高,且假设检验的P值远远地小于0.05,可以认为人均国内生产总值与城镇居民消费额存在线性正相关关系。,33,偏相关分析,简单相关关系只反映两个变量之间的关系,但如果因变量受到多个因素的影响时,因变量与某一自变量之间的简单相关关系显然受到其它相关因

13、素的影响,不能真实地反映二者之间的关系,所以需要考察在其它因素的影响剔除后二者之间的相关程度,即偏相关分析。,34,35,求解火柴销售量与煤气户数的偏相关系数具体操作如下:,1、首先打开数据文件SY-32,单击分析Analyze 相关 Correlate偏相关 Partial,打开对话框,见图所示。,要考察的变量,其它客观存在的变量,2、从左边框内选择要考察的两个变量进入变量框内,其它变量进入控制框内,如本例中考察煤气户数与火柴销量的偏相关系数进入变量框内,其它(除年份外)进入控制框内。,36,Partial Correlations 对话框,37,Partial Correlations 对

14、话框,(即:Pearson相关系数),本例中选择简单相关系数。,38,从表中可以看出,火柴销量与煤气户数的简单相关系数为0.826,自由度为13,检验的P值为0.00;而偏相关系数为0.605,自由度为10,检验的P值为0.037,表示煤气户数对火柴销量的真实影响是显著的。,表中的上半部分是简单相关系数,下半部分是偏相关系数。,39,回归分析研究的是自变量与因变量之间的非确定性的因果关系; SPSS提供的回归分析过程有:线性回归(Linear)、曲线估计(Curve Estimation)、二分变量逻辑回归 (Binary Logistic)、多分变量逻辑回归(Multinomial Logi

15、stic)、序回归(Ordinal)、概率单位回归(Probit)、非线性回归(Nonlinear)、加权估计(Weight Estimation)、最优编码回归(optimal Scaling)和二阶段最小平方法(2-Stage Least Squares )。,回归分析,40,线性回归分析,线性回归是统计分析方法中最常用的方法之一。如果所研究的现象有若干个影响因素,且这些因素对现象的综合影响是线性的,则可以使用线性回归的方法建立现象 (因变量)与影响因素(自变量)之间的线性函数关系式。由于多元线性回归的计算量比较大,所以有必要应用统计分析软件实现。 介绍SPSS软件的线性回归分析的操作方法

16、,包括求回归系数,给出回归模型的各项检验统计量值及相应的概率,对输出结果的分析等相关内容。,41,1、线性回归的假设理论 (1)正态性假设:即所研究的变量均服从正态分布; (2)等方差假设:即各变量总体的方差是相等的; (3)独立性假设, 即各变量之间是相互独立的; (4)残差项无自相关性,即误差项之间互不相关; 2、线性回归模型的检验项目 (1)回归系数的检验(t检验)。 (2)回归方程的检验(F检验)。 (3)拟合程度判定(可决系数R2)。 (4)D.W检验(残差项是否自相关)。 (5)共线性检验(多元线性回归)。 (6)残差图示分析(判断异方差性和残差序列自相关)。,线性回归模型假设条件与模型的各种检验,42,1、打开数据文件,单击分析Analyze 回归Regression 线性Linear,打开对话框如图所示。,加权最小平方法,线性回归分析的具体步骤:,2、从左边框中选择因变量Y,选择一个或多个自变量。从方法 框内下拉式菜单中选择回归分析方法。,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号