第1题:基本统计分析1分析:本题要求随机选取 80%的样本,因而需要选用随机抽样的方法, 在此选择随机抽样中的近似抽样方法进行抽样 其基本操作步骤如下: 数据一选择个案一随机个案样本一大约(A) 80所有个案的%1、基本思路:(1)由于存款金额为定距型变量,直接采用频数分析不利于对其分布形态的把握,因而采用数据分组,先对数据进行分组再编制频数分布表此处分为少于 500元,500~2000元,2000~3500元,3500~5000元,5000元以上五组分组后进行频数分析并绘制带正态曲 线的直方图2)进行数据拆分,并分别计算不同年龄段储户的一次存取款金额的四分位数,并通 过四分位数比较其分布上的差异操作步骤:(1)数据分组:【转换一重新编码为不同变量】,然后选择存取款金额到【数字变量一输出变量(V)】框中在【名称(N)】中输入“存取款金额 1",单击[更改(H)】按钮; 单击【旧值和新值】按钮进行分组区间定义存取款金额1频率百分比有效百分比累积百分比1.008234.634.634.62.007632.132.166.73.00104.24.270.9有效4.00229.39.380.25.004719.819.8100.0合计237100.0100.0(2)【分析一描述统计一频率】;选择“存款金额分组”变量到【变量( V)】框中;单 击[图标(C)]按钮,选择【直方图】和【在直方图上显示正态曲线】 ;选中【显示频率表格】,确定。
(3)【数据一拆分文件】,选择“年龄”变量到【分组方式】框中,选中【比较组】和【按分组变量排序文件】,确定;【分析一描述统计一频率】,选择“存款金额”到【变量】框中,单击【统计量】按钮,选择【四分位数】 一继续一确定统计量存(取)款金额有效1N缺失020岁以下2550.00百分位数5050.007550.00有效131N缺失020~35岁25500.00百分位数501000.00755000.00有效73N缺失035~50岁25500.00百分位数501000.00754500.00有效32N缺失050岁以上25525.00百分位数501000.00752000.00结果及结果描述:频数分布表表明,有一半以上的人的一次存取款金额少于 2000元,且有34.6%的人的存取款金额少于 500元,19.8%的人的存取款金额多于 5000元,下图为相应的带正态曲线的 直方图统计量表格表明,年龄在20岁以下的人有1人,其存取款金额的四分位差是 0 (50-50) 元,年龄在20~35岁之间的人有131人,其存取款金额的四分位差是 4500 (5000-500)元, 年龄在35~50岁之间的人有73人,其存取款金额的四分位差是 4000 (4500-500)元,年龄 在50岁以上的人有 32人,其存取款金额的四分位差是 1475 (2000-525)元。
可见,20~35, 35~50两个年龄段的离散程度比较大,其余两个年龄段的离散程度较小2、基本思路:本问题涉及到两个变量户口和物价趋势, 考虑两者之间的联系, 因而需要用到交叉列联表该列联表的行变量为户口, 列变量为物价趋势,需要在列联表中输出各种百分比、 期望频数、剩余、标准剩余,显示各交叉分组下频数分布柱形图,并利用卡方检验方法,对城镇和农村储户对物价趋势的态度是否一致进行分析操作步骤:(1)【分析一描述统计一交叉表】,选择“户口”至ij【行】框中,选择“物价趋势”到【列】框中;并选中【显示复式条形图】(2)单击【单元格】按钮,选中【观测值】、【期望值】、【行】、【列】、【总计】各框一继续;(3)单击【统计量】,选中【卡方】框一继续;结果及其结果分析:户口 *物价趋势 交叉制表物价趋势合计上升稳定下降计数2113118170期望的计数20.1122.727.3170.0城镇户口 户口中的%12.4%77.1%10.6%100.0%物价趋势中的%75.0%76.6%47.4%71.7%总数的%8.9%55.3%7.6%71.7%户口计数7402067期望的计数7.948.310.767.0农村户口 户口中的%10.4%59.7%29.9%100.0%物价趋势中的%25.0%23.4%52.6%28.3%总数的%3.0%16.9%8.4%28.3%计数2817138237期望的计数28.0171.038.0237.0合计 户口中的%11.8%72.2%16.0%100.0%物价趋势中的%100.0%100.0%100.0%100.0%总数的%11.8% .72.2%16.0%100.0%.卡方检验值df渐进Sig.(双侧)13.27Pearson 卡方6a2.00112.15似然比92.002线性和线性组合7.7501.005有效案例中的N237a. 0单元格(0.0%)的期望计数少于 5。
最小期望计数为 7.92户口上面交叉列联表表明,I共有237名被访者,其中170名有城镇户口, 67名是农村户口,占样本总数的 71.7%, 28.3%;认为物价趋势为上升、稳定、下降的人数分别为 28、171、38,各占总数的11.8%,72.2%, 16.0%II对不同户口的人群进行分析: 城镇户口的人数总共有170人,对物价稳定趋势为上升、稳定、下降的比例分别为 12.4%、77.1%、10.6%,认为物价趋势稳定的人数多于总比例,认 为物价趋势下降的人数少于总比例; 农村户口的总人数为67人,对物价稳定趋势为上升、稳定、下降的比例分别为10.4%、59.7%、29.9%,认为物价趋势稳定的人数少于总比例,认为 物价趋势下降的人数多于总比例;III对物价趋势不同态度的人群分析:认为物价上升的人数总共有 28人,其中城镇户口和农村户口所占比例分别为 75%, 25%,有城镇户口的比例略高于总比例;认为物价稳定的 人数总共有171人,其中城镇户口和农村户口所占比例分别为 76.6%, 23.4%,有城镇户口的比例略高于总比例;认为物价下降的人数总共有 28人,其中城镇户口和农村户口所占比例分 别为47.4%, 52.6%,有城镇户口的比例明显低于总比例;总体来说,不同户口的人群对物价趋势的态度存在一定的一致性。
从所得卡方检验结果来看,概率 p值为0.001 ,小于显著性水平,因此拒绝原假设,认为行列变量具有较强的相关性3、对居民一次存款金额分别按照收入水平进行分类,得到均值、中位数、方差和偏 度3、基本思路本题中的分类变量为收入水平, 因而需按照收入水平对数据进行拆分, 然后分别计算一 次存款金额的均值、中位数、方差和偏度操作步骤:【数据一拆分文件],选择“收入水平”变量到【分组方式】框中,选中【比较组】和【按分组变量排序文件】,确定; 【分析一描述统计一频率】,选择“存款金额”到【变量】框中,单击【统计量】按钮,选中【均值】、【中位数】、【方差】、【偏度】一继续一确a£o结果及其分析:统计量存(取)款金额有效41N缺失0均值2043.17300元以下中值300.00方差30740437.195偏度4.066偏度的标准误.369有效N137缺失0均值4314.15300~800元中值1000.00方差134185788.508偏度6.490偏度的标准误.207有效N46缺失0均值5687.67800~1500元中值1750.00方差116385836.002偏度4.415偏度的标准误.350有效N13缺失01500元以均值11026.92上中值7000.00方差197942756.410偏度2.193偏度的标准误.616第2题:基本统计分析 2用随机抽样中的近似抽样方法选取 85%勺1¥本,数据一选择个案一随机样本一大约(A) 85所有个案的%第一问基本思路:①由于存款金额是定距型变量,考虑先进行数据分组再编制频数 分布表。
②进行数据拆分,分别计算“300以下”、“300-800”、“800-1500”、“1500 以上”收入的四分位数,并通过四分位数比较上述四者分布上的差异操作步骤:①【转换一重新编码为不同变量(R)];选择“存款金额”到【数 字变量一输出变量(V)】框中;在[名称(N)】中输入“存款金额分组”,单击【更改(m 按钮;单击【旧值和新值】按钮进行分组区间定义存款金额分组频率百分比有效百分比累积百分比1.008534.334.334.32.007731.031.065.33.00166.56.571.8有效4.002510.110.181.95.004518.118.1100.0合计248100.0100.0②【分析一描述统计一频率】;选择“存款金额分组”变量到【变量(V)]框中; 单击【图标(C)]按钮,选择【直方图】和【在直方图上显示正态曲线】;选中 【显小频率表格】,确定③【数据一拆分文件],选择“收入水平”变量到【分组方式】框中,选中 【比较组】和【按分组变量排序文件】,确定;【分析一描述统计一频率】,选 择“存款金额”到【变量】框中,单击【统计量】按钮,选择【四分位数】一继 续一确定。
统计量存(取)款金额有效43N缺失0300元以下25200.00百分位数50300.00751000.00有效148N缺失0300〜800元25500.00百分位数501000.00754475.00有效41N缺失0800〜1500元25710.00百分位数502000.00756000.00有效16N缺失01500元以上253000.。