统计分析与SPSS的应用(第五版) (薛薇)课后练习答案第 4 章 SPSS 基本统计分析1、利用第 2 章第 7 题数据采用SPSS 频数分析,分析被调查者的常住地、职业和年龄分布特征,并绘制条形图分析描述统计频率,选择“常住地”, “职业”和“年龄”到变量中,然后,图表条形图图表值(频率)继续,勾选显示频率表格,点击确定Statistics户口所在地职业年龄NValid282282282Missing000户口所在地FrequencyPercentValid PercentCumulative PercentValid中心城市200边远郊区82Total282职业FrequencyPercentValid PercentCumulative PercentValid国家机关24商业服务业54文教卫生18公交建筑业15经营性公司18学校15一般农户35种 粮 棉 专 业户4种 果 菜 专 业户10工 商 运 专 业户34退役人员17金融机构35现役军人3Total282年龄FrequencyPercentValid PercentCumulative PercentValid20 岁以下42035 岁1463550 岁9150 岁以上41Total282分析:本次调查的有效样本为282 份。
常住地的分布状况是:在中心城市的人最多,有200 人,而在边远郊区只有82 人;职业的分布状况是:在商业服务业的人最多,其次是一般农户和金融机构;年龄方面:在35-50 岁的人最多由于变量中无缺失数据,因此频数分布表中的百分比相同2、利用第 2 章第 7 题数据,从数据的集中趋势、离散程度以及分布形状等角度,分析被调查者本次存款金额的基本特征,并与标准正态分布曲线进行对比进一步,对不同常住地储户存款金额的基本特征进行对比分析分析描述统计描述,选择存款金额到变量中点击选项,勾选均值、标准差、方差、最小值、最大值、范围、偏度、峰度、按变量列表,点击继续确定分析:由表中可以看出,有效样本为282 份,存(取)款金额的均值是,标准差为,峰度系数为,偏度系数为与标准正态分布曲线进行对比,由峰度系数可以看出,此表的存款金额的数据分布比标准正态分布更陡峭;由偏度系数可以看出,此表的存款金额的数据为右偏分布,表明此表的存款金额均值对平均水平的测度偏大分析:由表中可以看出,中心城市有200 人,边远郊区为82 人两部分样本存取款金额均呈右偏尖峰分布,且边远郊区更明显3、利用第 2 章第 7 题数据, 如果假设存款金额服从正态分布,能否利用本章所讲解的功能,找到存款金额 “ 与众不同 ” 的样本,并说明理由。
分析描述统计描述,选择存款金额到变量中对“将标准化得分另存为变量”打上勾,然后对数据编辑窗口中的最后一列变量标准化Z变量进行排序, 并观察, 找到它的绝对值大于 3 的都是“与众不同”的样本理由: 标准化值反映的是样本值与样本均值的差是几个标准差单位如果标准化值等于0,则表示该样本值等于样本均值;如果标准化值大于0,则表示该样本值大于样本均值;如果标准化值小于0,则表示该样本值小于样本均值如果标准化值的绝对值大于3,则可认为是异常值4、利用第 2 章第 7 题数据,结合被调查者的常住地或职业或年龄状况,分析储户的收入分布特征分析描述统计交叉表,选择常住地、职业、年龄到行中,选择收入水平到列中,勾选“显示复式条形图”点击单元格选择观测值、期望、行、列、合计点击统计量选择卡方点击继续确定利用列联分析实现首先编制列联表,然后进行卡方检验以户口和收入的列联分析为例:表中,卡方统计量的观测值等于,概率-P 值等于若显着性水平设为,由于,拒绝原假设,表明户口地与收入水平不独立5、说明第 2 章第 7 题资料中的多选项问题是按照哪种拆分方式拆分的利用多选项分析被调查者本次存款的最主要目的是什么答:第 2 章第 7 题资料的多选项问题是按照分类法拆分的。
目的是为了把多选项问题的分析转化为对多个问题的分析,即对多个SPSS 变量的分析多选项分类法;存款的最主要目的是正常生活零用6、三代同堂的家庭中,婆婆与儿媳妇关系紧张的现象并不少见,为了了解住房条件对婆媳关系的影响,对 600 户家庭进行了调查并进行了列联分析,如下表:1) 补充表中第一行和第四行空缺的计算结果差一般好Count577860195Expected Count48.7568.2578195% within 婆媳关系29.23%40.00%30.77%100.00% within 住房条件38.00%37.14%25.00%32.50%Count458763195Expected Count48.7568.2578195% within 婆媳关系23.08%44.62%32.31%100.00% within 住房条件30.00%41.43%26.25%32.50%Count4845117210Expected Count52.573.584210% within 婆媳关系22.86%21.43%55.71%100.00% within 住房条件32.00%21.43%48.75%35.00%Count150210240600Expected Count150210240600% within 婆媳关系25.00%35.00%40.00%100.00% within 住房条件100.00%100.00%100.00%100.00%婆媳关系 *住房条件 Crosstabulation婆媳关系Total紧张一般和睦住房条件Total2) 写出卡方检验的统计量并说明其构造基本原理。
eefffX202)(3) 婆媳关系与住房条件有无联系判断婆媳关系与住房条件有无关系:因为P 值为,小于显着性水平,属于高度显着,拒绝原假设,所以婆媳关系与住房条件有关系计算结果:卡方统计量:ricjeijeijoijfff1122)(, 用于测度各个单元格的观测频数与期望频数的差异,并依卡方理论分布判断差异是否统计显着由于期望频数代表的是行列变量独立下的分布,所以卡方值越大表明实际分布与期望分布差异越明显本例中,由于概率P值小于显着性水平,应拒绝原假设,婆媳关系与住房条件有关系7、利用第 2 章第 4 题资料,分析两种减肥产品所产生的效果分布是否一致分析描述统计交叉表,选择“产品类型”到行,选择“体重变化”到列点击统计量勾选卡方点击单元格选择观察值、期望值、行、列、总计点击继续,确定将计数数据还原为原始数据,采用交叉分组下的频数分析,并进行卡方检验表中,卡方统计量观测值为,对应的概率P-值为,小于显着性水平,应拒绝原假设,说明减肥效果并不一致8、根据第2 章第 8 题数据,回答以下问题:(1)该问卷中的多选项问题是按照哪种方式分解的(2)请给出调查问卷数排在前三位的城市编码这三个城市的有效问卷共有多少份(3)股民中有多大比例的人赚钱了有多大比例的人亏钱了(4)股民买卖股票主要依据的是哪种办法股民买卖股票最少依据的是哪种办法(5) 要研究专职投资者与业余投资者在股票投资结果上是否有差异,请给出你的分析思路、计算结果和分析绪论。
1)多选项二分法;(2)102(794 份) 、101(514 份) 、401(400 份)(3)赚钱比例: %,赔钱比例38%(4)主要依据:基本因素法;最少依据:更跟方法(5)采用列联分析卡方检验结果表明:专职和业余投资者在投资结果上存在显着差异9、为分析私家车主倾向接受的汽车销售价格是否与其居住地区有关,一家汽车企业的销售部门对东部地区、中部地区和西部地区的400 名消费者作了抽样调查,得到如下结果:汽车价格东部地区中部地区西部地区10 万元以下20404010 万20 万元50605020 万30 万元30202030 万元以上402010(1)指出表中所涉及的变量,并说明变量的类型2)可使用哪种分析方法分析上表请说明分析的基本思路并利用SPSS 进行分析1)变量:汽车价格、居住地区;类型:定序型变量、定类型变量(2)上述是计数数据的组织方式,应首先组织到SPSS 的数据编辑器窗口中,再利用交叉分组下的频数分析方法利用【交差表】 来分析上表, 步骤如下:先将上表中数据录入SPSS 中共有400 个个案分析】【描述统计】【交叉表】,将“地区”作为列变量,将“汽车价格”作为行变量,在【统计量】中选择“卡方”,在【单元格】中选择观察值、期望值、行、列和总计,得到分析结果。
提出原假设:认为地区和汽车价格无关系列联分析原假设:不同居住区的私家车主接受的汽车价格具有一致性的上表可知,如果显着性水平为,由于卡方检验的概率P-值小于显着性水平,因此应拒绝原假设由卡方检验表可知,渐进Sig(双侧)为,如果认为显着性水平为,因为 ,所以拒绝原假设,认为地区和汽车价格有关系,地区分布不同,汽车价格也不同。