200编号统计案例分析---大学生月平均生活费的估计和检验

上传人:玩*** 文档编号:145836315 上传时间:2020-09-24 格式:PDF 页数:24 大小:313.65KB
返回 下载 相关 举报
200编号统计案例分析---大学生月平均生活费的估计和检验_第1页
第1页 / 共24页
200编号统计案例分析---大学生月平均生活费的估计和检验_第2页
第2页 / 共24页
200编号统计案例分析---大学生月平均生活费的估计和检验_第3页
第3页 / 共24页
200编号统计案例分析---大学生月平均生活费的估计和检验_第4页
第4页 / 共24页
200编号统计案例分析---大学生月平均生活费的估计和检验_第5页
第5页 / 共24页
点击查看更多>>
资源描述

《200编号统计案例分析---大学生月平均生活费的估计和检验》由会员分享,可在线阅读,更多相关《200编号统计案例分析---大学生月平均生活费的估计和检验(24页珍藏版)》请在金锄头文库上搜索。

1、统计案例分析统计案例分析 案例 2.1 大学生月平均生活费的估计和检验案例 2.1 大学生月平均生活费的估计和检验 姓名: 覃玉冰 姓名: 覃玉冰 学号: 学号: 班级: 16 应用统计 班级: 16 应用统计 一、数据一、数据 为了了解大学生日常生活费支出及生活费来源状况, 对中国人民大学在校本 科生的月生活费支出问题进行了抽样调查。该问卷随机抽取中国人民大学大一、 大二、大三、大四在校本科生男女各 30 多人作为样本。调查采取分层抽样,对 在校本科生各个年级男生、女生各发放问卷 30 多份,共发放问卷 300 份,回收 问卷 291 份, 其中有效问卷共 272 份。 其中, 男生的有效问

2、卷为 127 份, 女生为 145 份。调查得到的部分数据见表一。 表一 大学生月平均生活费支出的调查数据(仅截取部分) 性别所在年级家庭所在 地区 平均月 生活费 (元) 性别所在年级家庭所在 地区 平均月 生活费 (元) 男1998 级大型城市1000女1998 级大型城市500 男1998 级大型城市800女1998 级大型城市800 男1998 级大型城市1000女1998 级大型城市500 男1998 级中小城市400女1998 级大型城市1000 二、生活费支出的区间估计和假设检验二、生活费支出的区间估计和假设检验 (一)平均月生活费的描述统计量(一)平均月生活费的描述统计量 为了

3、更好地研究全校本科学生平均月生活费支出, 我们先来看一下样本数据 中平均月生活费支出的一些描述统计量。 在 spss 中,点分析描述统计描述变量选择“平均月生活费”,选项 选择“均值、标准差、均值的标准误”,得到的样本数据中平均月生活费的描述 统计量见表二。 表二 平均月生活费的描述统计量 N均值标准差 统计量统计量标准误统计量 平均月生活费272 595.04 14.761243.444 有效的 N (列表状态)272 从表二可以看到,样本数据中平均月生活费支出的均值为 595.04,标准差 为 243.444,均值的标准误为 14.761. (二)平均月生活费的假设检验(二)平均月生活费的

4、假设检验 从表二中我们已经知道了样本数据中平均月生活费支出的均值为 595.04, 现在我们来检验一下全校本科学生即总体的月平均生活费支出是否等于 500。 1. 检验统计量的确定检验统计量的确定 样本数据的样本量 n 为 272,其大于 30,可以认为该数据是一个大样本。现 在我们并不知道总体的月平均生活费支出是否服从正态分布, 但是在样本量大的 条件下,如果总体为正态分布,样本统计量服从正态分布:如果总体为非正态分 布,样本统计量也是渐进服从正态分布的。所以在这种情况下,我们都可以把样 本统计量视为正态分布,这时可以使用 z 统计量(z 分布)。即在总体标准差 已知时,有 n x / z

5、0 而我们这里总体标准差是未知的,此时可以用样本标准差 s 代替,上式可 以写为: ns x / z 0 2. 提出假设提出假设 原假设为:全校本科学生月平均生活费支出 u=500 0 H 备择假设为:全校本科学生月平均生活费支出 u=500 1 H 3. spss 操作及结果分析操作及结果分析 在spss中点分析比较均值单样本T检验检验变量选 “平均月生活费” 检验值填“500”,得到的平均月生活费的假设检验的结果见表三。 表三 平均月生活费的假设检验的结果 检验值 = 500 差分的 95% 置信区间 tdfSig.(双侧)均值差值下限上限 平均月生活费6.438271 .000 95.0

6、3765.98124.10 从表三可以看到, 检验的 P 值接近于 0, 其小于 0.05, 根据小拒大接的原则, 拒绝原假设,表面全校学生的月平均生活费支出与 500 元有显著差异。 (三)平均月生活费的区间估计(三)平均月生活费的区间估计 1. 数学模型的建立数学模型的建立 样本数据的样本量 n 为 272,其大于 30,可以认为该数据是一个大样本。现 在我们并不知道总体的月平均生活费支出是否服从正态分布, 但是在样本量大的 条件下, 样本均值的抽样分布均为正态分布, 其数学期望为总体均值, 方差为x 。经过标准化以后的随机变量服从标准正态分布,即 n 2 x ) 1 , 0( / zN

7、n x 由上式和正态分布的性质, 可以得出总体均值在置信水平下的置信区-1 间为 n zx n zx 22 , 式中,称为置信下限,称为置信上限;是事先所确 n zx 2 n zx 2 定的一个概率值,也称为风险值,它是总体均值不包括在置信区间的概率 ;-1 称为置信水平;是标准正态分布右侧面积为时的值;是总体均值的 2 z 2 z n 标准误;是估计总体均值时的估计误差。 n z 2 这里,我们并不知道全校本科学生的平均月生活费支出的方差,但是由于样 本数据的样本量较大,所以上式中的总体方差可以用样本方差代替,这时 2 2 s 总体均值在置信水平下的置信区间可以写为:-1 n s zx n

8、s zx 22 , 2.模型的求解 2.模型的求解 由表二可知,样本均值为 595.04,样本均值的标准误为 14.761.当风险 n s 值取 0.05 时,即置信水平取 95%时,全校学生月平均生活费支出的 95%的-1 置信区间为595.04-1.96*14.761,595.04+1.96*14.761,即 566.11 到 623 元 之间。 三、男女学生的平均月生活费的假设检验三、男女学生的平均月生活费的假设检验 (一)男女学生的平均月生活费的描述统计量 (一)男女学生的平均月生活费的描述统计量 为了更好地研究全校本科男女学生的平均月生活费支出间是否有显著差异, 我们先来看一下样本数

9、据中男女学生的平均月生活费支出的一些描述统计量。 在 spss 中点数据拆分文件勾选“比较组”分组方式选“性别” 然后点分析描述统计描述变量选择“平均月生活费”,选项选择“均值、 标准差、均值的标准误”,得到的平均月生活费的描述统计量见表四。 表四 男女学生平均月生活费的描述统计量 N均值标准差 性别统计量统计量标准误统计量 平均月生活费127 569.69 20.387229.748男 有效的 N (列表状态)127 平均月生活费145 617.24 21.056253.543女 有效的 N (列表状态)145 从表四可以看到,样本数据中男生的平均月生活费支出的均值为 596.69, 标准差

10、为 229.748;女生的平均月生活费支出的均值为 617.24.标准差为 253.543。单从样本数据中男女学生的平均月生活费支出的均值来看,全校本科 男女学生的平均月生活费支出间是有差异的,但是这只是我们主观的看法,下面 我们用两个总体均值之差的假设检验来探究全校本科男女学生的平均月生活费 支出间是否有显著差异。 (二)男女学生的平均月生活费间的假设检验(二)男女学生的平均月生活费间的假设检验 1. 检验统计量的确定1. 检验统计量的确定 样本数据中男学生有 127 人,女学生有 145 人,均大于 30,说明两个总体 的样本量均较大,此时无论两个总体的分布是不是正态分布,可以证明的是,由

11、 两个独立样本算出来的的抽样分布都是服从正态分布的,此时,作为检验 21 xx 统计量的计算公式为:z 2 2 2 1 2 1 2111 )()( nn xx z 式中,分别为两个总体的均值,分别为两个总体的方差。 21 , 2 2 2 1 , 这里,我们并不知道全校本科男学生和女学生的平均月生活费支出的方差, 但是由于两个总体的样本量都较大,所以可以用样本方差来替代总体方 2 2 2 1 SS , 差.此时,上式可以写为: 2 2 2 1 , 2 2 2 1 2 1 2111 )()( n s n s xx z 2. 提出假设2. 提出假设 原假设为:全校本科男女学生月平均生活费支出之差,即

12、全校 0 H0- 21 本科男女学生的平均月生活费支出之间没有显著差别。 备择假设为:全校本科男女学生月平均生活费支出之差,即全 1 H0- 21 校本科男女学生的平均月生活费支出之间有显著差别。 3. spss 操作及结果分析3. spss 操作及结果分析 在 spss 中点数据拆分文件勾选“分析所有个案,不创建组”,然后点 分析比较均值独立样本 T 检验检验变量选“平均月生活费”分组变量选 “性别编号”,定义组选择“使用指定值 1 和 2”,得到的男女学生的平均月生 活费间的假设检验的结果见表四。 表四 男女学生的平均月生活费间的假设检验的结果 方差方程的 Levene 检验均值方程的 t

13、 检验 差分的 95% 置信区间 FSig.tdf Sig.(双 侧) 均值 差值 标准误 差值下限上限 假 设 方 差 相等 .484 .487 -1.612270 .108 - 47.556 29.500- 105.63 5 10.523平均月生 活费 假 设 方 差 不相等 -1.623269.67 9 .106- 47.556 29.308- 105.25 8 10.145 从表四可以看出,当原假设是男女学生的平均月生活费的方差相等时,检验 所对应的 P 值是 0.487,其大于 0.05,根据小拒大接的原则,不能拒绝原假设, 即没有证据表明方差是不相等的, 故我们看假设方差相等时的假

14、设检验的结果就 可以了。 从假设方差相等时的假设检验的结果上来看,检验的 P 值为 0.108,其大于 0.05,根据小拒大接的原则,不能拒绝原假设,即没有证据表明男女学生的月平 均生活费支出之间有显著差异。 四、估计乡镇地区学生的比例四、估计乡镇地区学生的比例 (一)对学生按性别和来源进行分类汇总(一)对学生按性别和来源进行分类汇总 为了估计乡镇地区学生的比例,我们先对学生按性别和来源进行分类汇总, 在spss中点分析描述统计交叉表行选择 “性别”, 列选择 “家庭所在地区” 单元格中的百分比勾选“行”,得到如表五所示的汇总表。 表五 按性别和家庭所在地区进行的分类汇总 家庭所在地区 大型城

15、市乡镇地区中小城市合计 计数264655127男 性别 中的 %20.5%36.2%43.3%100.0% 计数602263145 性别 女 性别 中的 %41.4%15.2%43.4%100.0% 计数8668118272合计 性别 中的 %31.6% 25.0% 43.4%100.0% 从表五可以看到,家庭所在地区为乡镇地区的学生占所有被抽中的学生的 25%。 (三)乡镇地区学生比例的区间估计(三)乡镇地区学生比例的区间估计 1. 数学模型的建立数学模型的建立 样本数据的样本量 n 为 272,其大于 30,可以认为该数据是一个大样本。由 样本比例的抽样分布可知,当样本量足够大时,比例的抽

16、样分布可用正态分pp 布近似。的数学期望为;的方差为。样本比例经标准p)(pEp n p )1 ( 2 化后的随机变量则服从标准正态分布,即 ) 1 , 0( / )1 ( N n p z 与总体均值的区间估计类似,在样本比例的基础上加减估计误差,p p z 2 即得总体比例在置信水平下的置信区间为:-1 n zp n zp )1 ( , )1 ( 22 用上式计算总体比例的置信区间时,值应该是已知的。但实际情况不 然,值恰好是要估计的,所以,需要用样本比例来替代。这时,总体比例p 的置信区间可表示为: n pp zp n pp zp )1 ( , )1 ( 22 式中,称为置信下限,称为置信上限; n pp zp )1 ( 2 n pp zp )1 ( 2 是显著性水平;是标准正态分布右侧面积为时

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 总结/报告

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号