文档详情

SPSS思路和答案

野鹰
实名认证
店铺
DOCX
84.01KB
约9页
文档ID:1134960
SPSS思路和答案_第1页
1/9

一、1) 对数据集居民储蓄调查数据(存款).sav 按照户口类型和年龄对存款金额进行分类汇总,计算其均值和标准差方法一:打开数据-分类汇总-“年龄和户口”移入分组变量、将“存款金额”两次移动到变量摘要里-分别点击下方函数——得到变量摘要里“a5 mean 和 a5sd”---再点击下方“创建只包含汇总变量 ”)(方法二:利用拆分-比较组点进“年龄和户口”-分析- 描述统计- 描述-点进“存款金额” )得到如下:描述统计量户口 年龄 N 均值 标准差存(取)款金额 7 1525.14 2376.64020岁以下有效的 N (列表状态) 7存(取)款金额 110 1955.44 4444.93520~35岁有效的 N (列表状态) 110存(取)款金额 74 3140.80 7346.75635~50岁有效的 N (列表状态) 74存(取)款金额 32 4407.91 5685.931城镇户口50岁以上有效的 N (列表状态) 32存(取)款金额 53 2312.19 11047.61320~35岁有效的 N (列表状态) 53存(取)款金额 26 1674.27 4648.64235~50岁有效的 N (列表状态) 26存(取)款金额 11 815.45 888.767农村户口50岁以上有效的 N (列表状态) 112) 分组、频数分析(对数据集居民储蓄调查数据(存款).sav 进行分析)(原理与上题方法二一样利用拆分--只是最后将“描述统计”中的“描述”换成“频率” )得到:(也可以加上直方图)统计量存(取)款金额 有效 720岁以下 N缺失 0有效 11020~35岁 N缺失 0有效 7435~50岁 N缺失 0有效 32城镇户口50岁以上 N缺失 0有效 5320~35岁 N缺失 0有效 2635~50岁 N缺失 0有效 11农村户口50岁以上 N缺失 03) 分析储户的户口和职业的基本情况(听老师说可以直接做饼状图:去掉拆分——图形-——旧对话框——饼图——个案组摘要、定义——职业移入“定义区分” ,户口移入“行” )得出:4) 分析储户一次存款金额的分布,并对城镇储户和农村储户进行比较。

存款金额分为 500 元以下(包括 500 元)、500~2000 元,2000~3500 元、3500-5000元,5000 以上将存款金额重新编码为不同变量,定义新值,做拆分—描述——频率:转换——重新编码不同变量——这个应该都熟悉具体不赘述,重新定义完后要返回到变量视图给“金额等级”赋值 1 代表 500 一下,2 代表 500-2000.然后做拆分(选入户口)——分析——频率——选入“金额等级” )得到:g户口 频率 百分比 有效百分比 累积百分比500一下 104 46.6 46.6 46.6500-2000 62 27.8 27.8 74.42000-3500 11 4.9 4.9 79.43500-5000 19 8.5 8.5 87.95000以上 27 12.1 12.1 100.0城镇户口 有效合计 223 100.0 100.0500一下 48 53.3 53.3 53.3500-2000 34 37.8 37.8 91.12000-3500 4 4.4 4.4 95.63500-5000 1 1.1 1.1 96.75000以上 3 3.3 3.3 100.0农村户口 有效合计 90 100.0 100.0然后可以利用 “复式条形图 ” 做出下面:(去掉拆分——图形——旧对话框——条形图——复式条形图、定义——“金额等级”到类别轴,户口到定义类聚。

两个颠倒无所谓)二. 打开数据 Employee data.sav,进行如下操作:1)计算薪水增加额(saladd = salary- salbegin) (简单不说了)2)将薪水增加额分为四组(1:30000 )并将分组结果保存在为变量 saladd_g,定义变量 saladd_g的 Label(变量名标签)为薪水增加等级 (与上第四题一样,重新定义变量)3)利用描述统计分析不同性别的薪水增加情况,并以图表显示 (方法一:利用交叉表:分析——描述统计——交叉表——行、列内分别选入“性别”或“薪水增加等级” ,两者顺序没要求方法二:利用拆分——把“性别”拆分——分析——描述统计——分析——选入“薪水增加等级” )得出:salary add* Gender 交叉制表计数 GenderFemale Male合计1.00 69 22 912.00 127 137 2643.00 15 53 68salary add4.00 5 46 51合计 216 258 474三1)a1、a2、a3、a4、a5 、a6 、a7、a8 是运动员对本次赛事的印象数据,试分析运动员对本次赛事的印象情况,列出比例最高的前三项。

(多选题的做法是要重新把所有选项定义为一个变量集:分析——多重响应——定义变量集——选入a1 到 a8 所有选项,定义名称为 “印象” ,然后对这个变量集做描述分析:分析——多重响应——频率——选入“印象”确定,完工)得出$印象 频率响应N 百分比个案百分比健康 537 26.1% 79.7%高水平 134 6.5% 19.9%国际化 387 18.8% 57.4%大众 388 18.9% 57.6%刺激 95 4.6% 14.1%时尚 122 5.9% 18.1%高雅 30 1.5% 4.5%Ga快乐 363 17.7% 53.9%总计 2056 100.0% 305.0%a. 值为 1 时制表的二分组2)2)分析不同年龄段运动员对本次赛事的印象情况,列出比例最高的前三项方法一:将“年龄段”进行拆分,然后做:分析——多重响应——频率——选入“印象”确定方法二:利用交叉表做:分析——多重响应——交叉表——将“年龄段”和“印象”分别选入“行”和“列” ,顺序无所谓——要看看变量视图里面, “年龄段”被赋了几个值——然后“定义范围”最小值为 0,最大值为 6)得出:年龄*$印象 交叉制表Ga健康 高水平 国际化 大众 刺激 时尚 高雅 快乐总计计数 118 27 87 97 26 25 6 87 1517-20岁年龄 内的 % 78.1% 17.9% 57.6% 64.2% 17.2% 16.6% 4.0% 57.6%计数 291 68 211 211 50 69 13 198 36021-30岁年龄 内的 % 80.8% 18.9% 58.6% 58.6% 13.9% 19.2% 3.6% 55.0%计数 92 29 67 65 14 23 6 64 12031-40岁年龄 内的 % 76.7% 24.2% 55.8% 54.2% 11.7% 19.2% 5.0% 53.3%计数 18 7 12 8 1 2 3 9 2141-50岁年龄 内的 % 85.7% 33.3% 57.1% 38.1% 4.8% 9.5% 14.3% 42.9%计数 18 3 10 7 4 3 2 5 22年龄51-60岁年龄 内的 % 81.8% 13.6% 45.5% 31.8% 18.2% 13.6% 9.1% 22.7%总计 计数 537 134 387 388 95 122 30 363 674百分比和总计以响应者为基础。

a. 值为 1 时制表的二分组4、某研究者调查了一减肥产品的使用效果,结果如下表所示:(建立新数据库——切换到变量视图——建立三个变量“体重控制情况”赋值“0无效,1有效”;“使用情况”0未使用,1使用;频数——切换到数据视图输入数据——加权个案,将“频数”选入“频率变量”——分析—描述统计——交叉表——“体重控制情况”和“使用情况”选入“行”和“列”,在“单元格”里的“行”上打钩 ,ok)得出:体重控制情况* 使用情况 交叉制表使用情况未使用 使用合计计数 19 33 52无效体重控制情况 中的 % 36.5% 63.5% 100.0%计数 27 20 47体重控制情况有效体重控制情况 中的 % 57.4% 42.6% 100.0%计数 46 53 99合计体重控制情况 中的 % 46.5% 53.5% 100.0%体重控制情况有效 无效 合计未使用 27 19 46使用 20 33 53是否使用该产品合计 47 52 991)请做出下表体重控制情况 Total有效 无效是否使用该产品 未使用 58.70% 41.30% 100%使用 37.74% 62.26% 100%Total 47.47% 52.53% 100%。

下载提示
相似文档
正为您匹配相似的精品文档