SPSS实验项Logistic回归分析

上传人:豆浆 文档编号:37537858 上传时间:2018-04-18 格式:DOC 页数:23 大小:748KB
返回 下载 相关 举报
SPSS实验项Logistic回归分析_第1页
第1页 / 共23页
SPSS实验项Logistic回归分析_第2页
第2页 / 共23页
SPSS实验项Logistic回归分析_第3页
第3页 / 共23页
SPSS实验项Logistic回归分析_第4页
第4页 / 共23页
SPSS实验项Logistic回归分析_第5页
第5页 / 共23页
点击查看更多>>
资源描述

《SPSS实验项Logistic回归分析》由会员分享,可在线阅读,更多相关《SPSS实验项Logistic回归分析(23页珍藏版)》请在金锄头文库上搜索。

1、SPSS 作作业业 8:二:二项项 Logistic 回回归归分析分析为研究和预测某商品消费特点和趋势,收集到以往胡消费数据。数据项包括是否购买,性别,年龄和收入水平。这里采用 Logistic 回归的方法,是否 购买作为被解释变量(0/1 二值变量) ,其余各变量为解释变量,且其中性别和收入水平为品质变量,年龄为定距变量。变量选择采用 Enter 方法,性别 以男为参照类,收入以低收入为参照类。(一)基本操作:(一)基本操作: (1)选择菜单 AnalyzeRegressionBinary Logistic; (2)选择是否购买作为被解释变量到 Dependent 框中,选其余各变量为解释变

2、量到 Covariates 框中,采用 Enter 方法,结果如下:消费的二项消费的二项 LogisticLogistic 分析结果(一)分析结果(一) (强制进入策略)(强制进入策略)Categorical Variables CodingsParameter codingFrequency(1)(2)低收入132.000.000中收入1441.000.000收入高收入155.0001.000男191.000性别女2401.000分析:分析:上表显示了对品质变量产生虚拟变量的情况,产生的虚拟变量命名为原变量名(编码) 。可以看到,对收入生成了两个虚拟变量名为 Income(1) 和 Inco

3、me(2) ,分别表示是否中收入和是否高收入,两变量均为 0 时表示低收入;对性别生成了一个虚拟变量名为 Gedder(1) ,表示是否女,取值为 0时表示为男。消费的二项消费的二项 LogisticLogistic 分析结果(二)分析结果(二) (强制进入策略)(强制进入策略) BlockBlock 0:0: BeginningBeginning BlockBlockClassification Tablea,bPredicted是否购买Observed不购买购买Percentage Correct不购买2690100.0是否购买购买1620.0Step 0Overall Percentag

4、e62.4a. Constant is included in the model.b. The cut value is .500分析:分析:上表显示了 Logistic 分析初始阶段(第零步)方程中只有常数项时的错判矩阵。可以看到:269 人中实际没购买且模型预测正确,正确率为 100;162 人中实际购买了但模型均预测错误,正确率为 0%。模型总的预测正确率为 62.4。消费的二项消费的二项 LogisticLogistic 分析结果(三)分析结果(三) (强制进入策略)(强制进入策略)Variables in the EquationBS.E.WalddfSig.Exp(B)Step

5、0Constant-.507.09926.0021.000.602分析:分析:上表显示了方程中只有常数项时的回归系数方面的指标,各数据项的含义依次为回归系数,回归系数标准误差,Wald 检验统计量的观测值,自由 度,Wald 检验统计量的概率 p 值,发生比。由于此时模型中未包含任何解释变量,因此该表没有实际意义。消费的二项消费的二项 LogisticLogistic 分析结果(四)分析结果(四) (强制进入策略)(强制进入策略)Variables not in the EquationScoredfSig.age1.2681.260gender(1)4.6671.031income10.64

6、02.005income(1)2.9351.087Variablesincome(2)10.6401.001Step 0Overall Statistics18.2734.001分析:分析:上表显示了待进入方程的各个变量的情况,各数据项的含义依次为 Score 检验统计量的观测值,自由度和概率 p 值。可以看到,如果下一步 Age 进入方程,则 Score 检验统计量的观测值为 1.268,概率 p 值为 0.26。如果显著性水平 a 为 0.05,由于 Age 的概率 p 值大于显著性水平 a,所以是不能进 入方程的。但在这里,由于解释变量的筛选策略为 Enter,所以这些变量也被强行进入方

7、程。消费的二项消费的二项 LogisticLogistic 分析结果(五)分析结果(五) (强制进入策略)(强制进入策略) BlockBlock 1:1: MethodMethod = = EnterEnterOmnibus Tests of Model CoefficientsChi-squaredfSig.Step18.4414.001Block18.4414.001Step 1Model18.4414.001分析:分析:上表显示了 Logistic 分析第一步时回归方程显著性检验的总体情况,各数据项的含义依次为似然比卡方的观测值,自由度和概率 p 值。可以看 到,在本步所选变量均进入方程

8、(Method=Enter) 。与前一步相比,似然比卡方检验的观测值 18.441,概率 p 值为 0.001。如果显著性水平 a 为 0.05,由 于概率 p 值小于显著性水平 a,应拒绝零假设,认为所有回归系数不同时为 0,解释变量的全体与 Logit P 之间的线性关系显著,采用该模型是合理的。 在这里分别输出了三行似然比卡方值。其中,Step 行是本步与前一步相比的似然卡方比;Block 行是本块(Block)与前一块相比的似然卡方比; Model 行是本模型与前一模型相比的似然卡方比。在本例中,由于没有设置解释变量块,且解释变量是一次性强制进入模型,所以三行结果都相同。消费的二项消费

9、的二项 LogisticLogistic 分析结果(六)分析结果(六) (强制进入策略)(强制进入策略)Model SummaryStep-2 Log likelihoodCox (2)选择是否购买作为被解释变量到 Dependent 框中,选其余各变量为解释变量到 Covariates 框中,采用 Forward:LR 方法,在 Option 框中对模型做 近一步分析,结果如下:消费的二项消费的二项 LogisticLogistic 分析结果(一)分析结果(一) (逐步筛选策略)(逐步筛选策略) BlockBlock 1:1: MethodMethod = = ForwardForward

10、StepwiseStepwise (Likelihood(Likelihood Ratio)Ratio)Omnibus Tests of Model CoefficientsChi-squaredfSig.Step10.5432.005Step 1Block10.5432.005Model10.5432.005Step5.9171.015Block16.4593.001Step 2Model16.4593.001消费的二项消费的二项 LogisticLogistic 分析结果(二)分析结果(二) (逐步筛选策略)(逐步筛选策略)Model if Term RemovedVariableMode

11、l Log LikelihoodChange in -2 Log LikelihooddfSig. of the ChangeStep 1income-285.32510.5432.005gender-280.0535.9171.015Step 2income-282.97611.7612.003分析:分析:上面第一个表显示了变量逐步筛选过程中对数似然比卡方检验的结果,用于回归方程的显著性检验。这里略去了第零步分析的结果。结果上面的 两个表共同分析。在 Step1 中,模型中包含常数项和 INCOME。如果此时剔除 INCOME 将使-2LL 减少 10.543,即 10.543 是 INCO

12、ME 进入模型引起的, -285.325 即为零模型的对数似然比;在 Step2 中,模型中包含常数项,INCOME,GENDER。此时剔除 GENDER,即-2LL 将减少 5.917,即 5.917 是在 Step1 基础上 GENDER 所引起的,-280.053 即为 Step1 模型的对数似然比,此时-2*285.325+2*280.053=10.543,即 INCOME 引起的。其他同理。可以看 到,如果显著性水平 a 为 0.05,由于各步的概率 p 值均小于显著性水平 a,因此此时模型中的解释变量全体与 Logit P 的线性关系是显著,模型合理。消费的二项消费的二项 Logi

13、sticLogistic 分析结果(三)分析结果(三) (逐步筛选策略)(逐步筛选策略)Variables in the EquationBS.E.WalddfSig.Exp(B)95.0% C.I.for EXP(B)LowerUpperincome10.5122.005income(1).006.259.0011.9821.006.6061.670income(2).672.2477.4241.0061.9581.2083.174Step 1aConstant-.762.18716.6341.000.467gender(1).504.2095.8241.0161.6561.0992.493

14、income11.6692.003income(1).096.263.1341.7141.101.6581.843income(2).761.2519.1471.0022.1391.3073.502Step 2bConstant-1.113.24021.4321.000.329a. Variable(s) entered on step 1: income.b. Variable(s) entered on step 2: gender.分析:分析:上表显示了解释变量筛选的过程和各解释变量的回归系数检验结果。可以看到,最终的模型(第二步)中包含了性别和收入变量,各自回归系数 显著性检验的 Wa

15、ld 观测值对应的概率 p 值都小于显著性水平 a,因此均拒绝零假设,意味它们与 Logit P 的线性关系是显著,应保留在方程中。表中的 第七,第八列分别是发生比的 95%的置信区间。 最终年龄变量没有引入方程,因为如果引入则相应的 Score 检验的概率 p 值大于显著性水平 a,不应拒绝零假设,它与 Logit P 的线性关系不显著, 不应进入方程。具体结果如下:消费的二项消费的二项 LogisticLogistic 分析结果(四)分析结果(四) (逐步筛选策略)(逐步筛选策略)Variables not in the EquationScoredfSig.age1.8481.174Va

16、riablesgender(1)5.8651.015Step 1Overall Statistics7.8242.020Variablesage1.9841.159Step 2Overall Statistics1.9841.159消费的二项消费的二项 LogisticLogistic 分析结果(五)分析结果(五) (逐步筛选策略)(逐步筛选策略)Model SummaryStep-2 Log likelihoodCox & Snell R SquareNagelkerke R Square1560.107a.024.0332554.190b.037.051a. Estimation terminated at iteration number 3 because parameter estimates changed by less than .001.b. Estimation terminated at iteration number 4 because parameter estimates changed by less than .0

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号