统计软件及其应用_例题分析.docx

上传人:marr****208 文档编号:134622492 上传时间:2020-06-07 格式:DOCX 页数:12 大小:360.03KB
返回 下载 相关 举报
统计软件及其应用_例题分析.docx_第1页
第1页 / 共12页
统计软件及其应用_例题分析.docx_第2页
第2页 / 共12页
统计软件及其应用_例题分析.docx_第3页
第3页 / 共12页
统计软件及其应用_例题分析.docx_第4页
第4页 / 共12页
统计软件及其应用_例题分析.docx_第5页
第5页 / 共12页
点击查看更多>>
资源描述

《统计软件及其应用_例题分析.docx》由会员分享,可在线阅读,更多相关《统计软件及其应用_例题分析.docx(12页珍藏版)》请在金锄头文库上搜索。

1、北京交通大学 统计软件及其应用 大作业统计软件及其应用北京交通大学姓名:任彦嘉 学号:11273012 学校:北京交通大学 专业:材化1101目录第2题:基本统计分析222.1 基本思路22.2 操作步骤22.3 结果(附上图表)32.4 结果的解释和结论3第5题:方差分析255.1 基本思路5 5.2 操作步骤55.3 结果(附上图表)65.4 结果的解释和结论6第8题:线性回归278.1基本思路78.3 结果(附上图表)88.4 结果的解释和结论8第13题:聚类分析11113.1基本思路1113.3 结果(附上图表)1113.4 结果的解释和结论11。第2题:基本统计分析22.1 基本思路

2、小题(1)由于存(取)款金额数据为定距型变量,直接采用频数分析不利于对其分布形态的把握,因此考虑依据第三章中的数据分组功能对数据分组后再编制频数分布表。进行数据拆分,并分别计算城镇储户和农村储户的一次存(取)款金额的四分位数,并通过四分位数比较两者分布上的差异。小题(2)该问题列联表的行变量为户口,列变量为未来收入状况,在列联表中输出各种百分比、期望频数、剩余、标准化剩余,显示各交叉分组下频数分布柱形图,并利用卡方检验方法,对城镇和农村储户对该问题的态度是否一致进行分析。、该问题列联表的行变量为户口,列变量为什么合算,在列联表的基础上进行卡方检验。小题(3)提出原假设:城镇储户存储一次存款金额

3、5000元不可信,计算检验统计量和概率P值 。给定显著性水平与p值做比较:如果p值小于显著性水平,小概率事件在一次实验中发生,则我们应该拒绝原假设,反之就不能拒绝原假设。2.2 操作步骤小题(1)数据分组,将存(取)款金额重新分成五组,五组区间分布为,少于500元,5002000元,20003500元,35005000元,5000元以上。分组后进行频数分析并绘制带正态曲线的直方图。利用SPSS的频数分析计算所有样本的存(取)款金额的四分位数;然后,按照户口类型对数据进行拆分,并重新计算分位数,分别得到城镇户口和农村户口的存(取)款金额的四分位数。小题(2)菜单栏分析描述统计-交叉表行选入户口,

4、列选入什么合算统计量选择卡方确定输出结果小题(3)即筛选城镇储户存款数据:菜单栏数据选择个案如果个案,满足A13=1 菜单栏分析比较均值-单样本T检验检验变量选存款金额【a5】检验值输入5000确定输出结果2.3 结果(附上图表)2.4 结果的解释和结论目标1:分析储户一次存款金额的分布,基本描述统计量,并对城镇储户和农村储户进行比较;表2-11存款金额频数分布表(分组后金额)频率百分比有效百分比累积百分比有效1.009734.434.434.42.008730.930.965.23.00165.75.770.94.00269.29.280.15.005619.919.9100.0合计2821

5、00.0100.0表2-1说明:被调查者中,有34.3%的储户一次存款金额在500元以下,20003500元的最少,也有一部分19.9%储户的一次存款金额在5000元以上。表2-12 居民储蓄金额直方图表2-2表明储户存款的金额呈明显的右偏分布,即一次存款的金额偏低的占比较大的比例,也有少数金额偏高的储户。表2-13城镇和农村储户存款金额四分位数统计表2-3表明城镇储户有200人,一次存款金额的四分位数差分别是500元(1000-500),和4000元(5000-1000);农村储户有82人,一次存款金额的四分位差分别是500元(800-300)和450(2250-800).可见,城镇储户存款

6、金额的离散度要远大于农村储户,尤其在高金额区。同时也说明在整体上看,城镇储户的存款金额高于农村储户。目标2.分析不同年龄的储户对什么合算的认同是否一致。表2-21城镇农村储户对存款是否合算的列联表户口* 什么合算 交叉制表计数什么合算合计买东西存钱户口城镇户口11387200农村户口592382合计172110282p值小于0.05拒绝原假设,认为行列变量之间相关,户口对存款合算与否有影响表2-22城镇和农村储户对存款是否合算的卡方检验卡方检验值Df渐进 Sig. (双侧)精确 Sig.(双侧)精确 Sig.(单侧)Pearson 卡方5.836a1.016连续校正b5.2041.023似然比

7、6.0031.014Fisher 的精确检验.016.011线性和线性组合5.8151.016有效案例中的 N282a. 0 单元格(0.0%) 的期望计数少于 5。最小期望计数为 31.99。b. 仅对 2x2 表计算由表2-22可见,卡方检验概率p值为0.016,如果显著性设为0.05,由于卡方的概率小于0.05,因此拒绝原假设,认为行列变量之间相关,户口对存款合算与否有影响。目标3.检验城镇储户存储一次存款金额5000元是否可信。表2-31城镇储户一次存款金额基本描述统计结果单个样本统计量N均值标准差均值的标准误存(取)款金额2004956.949792.515692.435表2-32城

8、镇储户一次平均存款金额单样本t检验结果单个样本检验检验值 = 5000tDfSig.(双侧)均值差值差分的 95% 置信区间下限上限存(取)款金额-.062199.950-43.065-1408.521322.39由表2-32可知:卡方检验概率p值为0.950,如果显著性设为0.05,由于卡方的概率大于0.05,因此接受原假设,认为城镇储户存储一次存款金额与5000元没有显著差异,即城镇储户存储一次存款金额为5000元是可信的。第5题:方差分析25.1 基本思路小题(1)给出SPSS数据集的格式(列举前4个样本即可);小题(2)多重比较检验 总体上讲,不同浓度对产品收率有显著影响,那么究竟哪种

9、浓度的作用较明显哪种不明显,这些问题可通过多重比较检验实现。(采用LSD,Bonferroni,Tukey,Scheffe,S-N-K五种方法)小题(3)提出原假设:浓度、温度对收率有无显著影响差异,浓度、温度交互作用对观测变量无显著影响。计算检验统计量和概率P值。给定显著性水平与p值做比较:如果p值小于显著性水平,则应该拒绝原假设,反之就不能拒绝原假设。 5.2 操作步骤小题(1)按表格5-1输入新建的SPSS数据集中,列1234代表温度,行123代表浓度小题(2)菜单栏分析比较均值-单因素ANOVA因变量列行选收率,因子选浓度两两比较勾选五种不同的方法输入显著性水平=0.05确定输出结果小

10、题(3)菜单栏分析一般线性模型单变量因变量选收率固定,因子选浓度及温度模型选全因子确定输出结果5.3 结果(附上图表)5.4 结果的解释和结论目标1:给出SPSS数据集的格式(列举前4个样本即可)表格5-1 原始数据表格表格5-12 SPSS数据集格式前四行。(5行以后表格省略)目标2:浓度对收率有无显著影响,并进行多重比较检验;(表格数据太多,因此只摘选其中的的LSD方法)P值,P接受原假设,反之拒绝原假设表格5-21 浓度的多重比较检验(部分)*. 均值差的显著性水平为 0.05又表格5-21 中分别显示了两两浓度下收率的均值检验结果,以浓度A1与其他两种浓度两两检验结果为例,在显著性水平

11、=0.05情况下,在LSD方法中浓度A1与A2的效果有显著差异(概率p值为0.032),A1与A3的效果无显著差异(概率p值为0.909)。目标3: 浓度、温度以及它们间的交互作用对收率有无显著影响。表格5-31收率多因素方差分析的饱和模型主体间效应的检验以浓度跟温度为控制变量,收率为观测变量,建立固定效应的饱和模型。其中零假设为不同浓度没有对收率产生显著影响;不同温度没有对收率产生显著影响;不同浓度跟温度没有对收率产生显著的交互影响;结果分析:由于A,B,A*B所对应的P值分别为0.074,0.462,0.721均大于显著性水平0.05,应接受零假设,即认为不同浓度没有对收率产生显著影响;不

12、同温度没有对收率产生显著影响;不同浓度跟温度没有对收率产生显著的交互影响因变量: 收率源III 型平方和df均方FSig.校正模型69.458a116.3141.175.391截距2625.04212625.042488.380.000A35.083217.5423.264.074B14.79234.931.917.462A * B19.58363.264.607.721误差64.500125.375总计2759.00024校正的总计133.95823a. R 方 = .519(调整 R 方 = .077)以高校科研研究数据为例,建立回归方程研究 以课题总数X5为被解释变量,解释变量为投入人年

13、数X2、投入科研事业费X4、专著数X6、论文数X7、获奖数X8。解释变量采用逐步筛选策略,并做多重共线性、残差的正态性和方差齐性的检验。第8题:线性回归28.1基本思路通过逐步筛选( Stepwise )策略即在向前筛选策略的基础上结合向后筛选策略,在每个变量进入方程后再次判断是否存在应该剔除出方程的变量。因此,逐步筛选策略在引入变量的每一个阶段都提供了再剔除不显著变量的机会。然后在逐步筛选策略得到的数据的基础上分别得到立项课题数的线性诊断分析结果,残差累计概率图,以及残差图,用来分别分析多重共线性,残差的正态性,以及方差齐性的检验。8.2操作步骤菜单回归线性回归因变量选课题总数,自变量选投入人年数X2、投入科研事业费X4、专著数X6、论文数X7、获奖数X8方法选逐步估计量勾选估计,共线性诊断,模型拟合度 残差勾选Durbin-watson图勾选Y ZRESID ;X ZPRED保存预测值勾选标准化,残差勾选正态分布选包含协方差矩阵双变量相关选入标准化残差及标准化预测值相关系数选Spearman由此可以得到8.3 结果(附上图表)8.4 结果的解释和结论表8-1(a) 立项课题数多元线性回归分析结果(逐步筛选策略)输入移去的变量a模型输入的变量移去的变量方法1投入人年数.步进(准则: F-to-enter 的概率 = .050,F

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 其它相关文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号