统计案例分析-大学生月平均生活费的估计和检验

上传人:夏** 文档编号:553690539 上传时间:2023-10-08 格式:DOCX 页数:24 大小:231.77KB
返回 下载 相关 举报
统计案例分析-大学生月平均生活费的估计和检验_第1页
第1页 / 共24页
统计案例分析-大学生月平均生活费的估计和检验_第2页
第2页 / 共24页
统计案例分析-大学生月平均生活费的估计和检验_第3页
第3页 / 共24页
统计案例分析-大学生月平均生活费的估计和检验_第4页
第4页 / 共24页
统计案例分析-大学生月平均生活费的估计和检验_第5页
第5页 / 共24页
点击查看更多>>
资源描述

《统计案例分析-大学生月平均生活费的估计和检验》由会员分享,可在线阅读,更多相关《统计案例分析-大学生月平均生活费的估计和检验(24页珍藏版)》请在金锄头文库上搜索。

1、统计案例分析案例2.1 大学生月平均生活费的估计和检验姓名: 覃玉冰 学号: 班级: 16应用统计 一、 数据为了了解大学生日常生活费支出及生活费来源状况,对中国人民大学在校本科生的月生活费支出问题进行了抽样调查。该问卷随机抽取中国人民大学大一、大二、大三、大四在校本科生男女各30多人作为样本。调查采取分层抽样,对在校本科生各个年级男生、女生各发放问卷30多份,共发放问卷300份,回收问卷291份,其中有效问卷共272份。其中,男生的有效问卷为127份,女生为145份。调查得到的部分数据见表一。表一 大学生月平均生活费支出的调查数据(仅截取部分)性别所在年级家庭所在地区平均月生活费(元)性别所

2、在年级家庭所在地区平均月生活费(元)男1998级大型城市1000女1998级大型城市500男1998级大型城市800女1998级大型城市800男1998级大型城市1000女1998级大型城市500男1998级中小城市400女1998级大型城市1000二、生活费支出的区间估计和假设检验(一)平均月生活费的描述统计量为了更好地研究全校本科学生平均月生活费支出,我们先来看一下样本数据中平均月生活费支出的一些描述统计量。 在spss中,点分析描述统计描述变量选择“平均月生活费”,选项选择“均值、标准差、均值的标准误”,得到的样本数据中平均月生活费的描述统计量见表二。表二 平均月生活费的描述统计量N均值

3、标准差统计量统计量标准误统计量平均月生活费272595.0414.761243.444有效的 N (列表状态)272从表二可以看到,样本数据中平均月生活费支出的均值为595.04,标准差为243.444,均值的标准误为14.761.(二)平均月生活费的假设检验从表二中我们已经知道了样本数据中平均月生活费支出的均值为595.04,现在我们来检验一下全校本科学生即总体的月平均生活费支出是否等于500。1. 检验统计量的确定样本数据的样本量n为272,其大于30,可以认为该数据是一个大样本。现在我们并不知道总体的月平均生活费支出是否服从正态分布,但是在样本量大的条件下,如果总体为正态分布,样本统计量

4、服从正态分布:如果总体为非正态分布,样本统计量也是渐进服从正态分布的。所以在这种情况下,我们都可以把样本统计量视为正态分布,这时可以使用z统计量(z分布)。即在总体标准差已知时,有而我们这里总体标准差是未知的,此时可以用样本标准差s代替,上式可以写为:2. 提出假设原假设为:全校本科学生月平均生活费支出u=500备择假设为:全校本科学生月平均生活费支出u=5003. spss操作及结果分析在spss中点分析比较均值单样本T检验检验变量选“平均月生活费”检验值填“500”,得到的平均月生活费的假设检验的结果见表三。表三 平均月生活费的假设检验的结果检验值 = 500 tdfSig.(双侧)均值差

5、值差分的 95% 置信区间下限上限平均月生活费6.438271.00095.03765.98124.10从表三可以看到,检验的P值接近于0,其小于0.05,根据小拒大接的原则,拒绝原假设,表面全校学生的月平均生活费支出与500元有显著差异。(三) 平均月生活费的区间估计 1. 数学模型的建立样本数据的样本量n为272,其大于30,可以认为该数据是一个大样本。现在我们并不知道总体的月平均生活费支出是否服从正态分布,但是在样本量大的条件下,样本均值的抽样分布均为正态分布,其数学期望为总体均值,方差为。经过标准化以后的随机变量服从标准正态分布,即由上式和正态分布的性质,可以得出总体均值在置信水平下的

6、置信区间为式中,称为置信下限,称为置信上限;是事先所确定的一个概率值,也称为风险值,它是总体均值不包括在置信区间的概率;称为置信水平;是标准正态分布右侧面积为时的值;是总体均值的标准误;是估计总体均值时的估计误差。这里,我们并不知道全校本科学生的平均月生活费支出的方差,但是由于样本数据的样本量较大,所以上式中的总体方差可以用样本方差代替,这时总体均值在置信水平下的置信区间可以写为: 2.模型的求解由表二可知,样本均值为595.04,样本均值的标准误为14.761.当风险值取0.05时,即置信水平取95%时,全校学生月平均生活费支出的95%的置信区间为595.04-1.96*14.761,595

7、.04+1.96*14.761,即566.11到623元之间。三、男女学生的平均月生活费的假设检验(一) 男女学生的平均月生活费的描述统计量 为了更好地研究全校本科男女学生的平均月生活费支出间是否有显著差异,我们先来看一下样本数据中男女学生的平均月生活费支出的一些描述统计量。在spss中点数据拆分文件勾选“比较组”分组方式选“性别”然后点分析描述统计描述变量选择“平均月生活费”,选项选择“均值、标准差、均值的标准误”,得到的平均月生活费的描述统计量见表四。表四 男女学生平均月生活费的描述统计量性别N均值标准差统计量统计量标准误统计量男平均月生活费127569.6920.387229.748有效

8、的 N (列表状态)127女平均月生活费145617.2421.056253.543有效的 N (列表状态)145从表四可以看到,样本数据中男生的平均月生活费支出的均值为596.69,标准差为229.748;女生的平均月生活费支出的均值为617.24.标准差为253.543。单从样本数据中男女学生的平均月生活费支出的均值来看,全校本科男女学生的平均月生活费支出间是有差异的,但是这只是我们主观的看法,下面我们用两个总体均值之差的假设检验来探究全校本科男女学生的平均月生活费支出间是否有显著差异。(二) 男女学生的平均月生活费间的假设检验1. 检验统计量的确定样本数据中男学生有127人,女学生有14

9、5人,均大于30,说明两个总体的样本量均较大,此时无论两个总体的分布是不是正态分布,可以证明的是,由两个独立样本算出来的的抽样分布都是服从正态分布的,此时,作为检验统计量的计算公式为: 式中,分别为两个总体的均值,分别为两个总体的方差。这里,我们并不知道全校本科男学生和女学生的平均月生活费支出的方差,但是由于两个总体的样本量都较大,所以可以用样本方差来替代总体方差.此时,上式可以写为:2. 提出假设原假设为:全校本科男女学生月平均生活费支出之差,即全校本科男女学生的平均月生活费支出之间没有显著差别。备择假设为:全校本科男女学生月平均生活费支出之差,即全校本科男女学生的平均月生活费支出之间有显著

10、差别。3. spss操作及结果分析在spss中点数据拆分文件勾选“分析所有个案,不创建组”,然后点分析比较均值独立样本T检验检验变量选“平均月生活费”分组变量选“性别编号”,定义组选择“使用指定值1和2”,得到的男女学生的平均月生活费间的假设检验的结果见表四。表四 男女学生的平均月生活费间的假设检验的结果方差方程的 Levene 检验均值方程的 t 检验FSig.tdfSig.(双侧)均值差值标准误差值差分的 95% 置信区间下限上限平均月生活费假设方差相等.484.487-1.612270.108-47.55629.500-105.63510.523假设方差不相等-1.623269.679.

11、106-47.55629.308-105.25810.145从表四可以看出,当原假设是男女学生的平均月生活费的方差相等时,检验所对应的P值是0.487,其大于0.05,根据小拒大接的原则,不能拒绝原假设,即没有证据表明方差是不相等的,故我们看假设方差相等时的假设检验的结果就可以了。从假设方差相等时的假设检验的结果上来看,检验的P值为0.108,其大于0.05,根据小拒大接的原则,不能拒绝原假设,即没有证据表明男女学生的月平均生活费支出之间有显著差异。四、 估计乡镇地区学生的比例(一)对学生按性别和来源进行分类汇总为了估计乡镇地区学生的比例,我们先对学生按性别和来源进行分类汇总,在spss中点分

12、析描述统计交叉表行选择“性别”,列选择“家庭所在地区”单元格中的百分比勾选“行”,得到如表五所示的汇总表。表五 按性别和家庭所在地区进行的分类汇总家庭所在地区合计大型城市乡镇地区中小城市性别男计数264655127性别 中的 %20.5%36.2%43.3%100.0%女计数602263145性别 中的 %41.4%15.2%43.4%100.0%合计计数8668118272性别 中的 %31.6%25.0%43.4%100.0%从表五可以看到,家庭所在地区为乡镇地区的学生占所有被抽中的学生的25%。(三) 乡镇地区学生比例的区间估计1. 数学模型的建立样本数据的样本量n为272,其大于30,

13、可以认为该数据是一个大样本。由样本比例的抽样分布可知,当样本量足够大时,比例的抽样分布可用正态分布近似。的数学期望为;的方差为。样本比例经标准化后的随机变量则服从标准正态分布,即与总体均值的区间估计类似,在样本比例的基础上加减估计误差,即得总体比例在置信水平下的置信区间为:用上式计算总体比例的置信区间时,值应该是已知的。但实际情况不然,值恰好是要估计的,所以,需要用样本比例来替代。这时,总体比例的置信区间可表示为:式中,称为置信下限,称为置信上限;是显著性水平;是标准正态分布右侧面积为时的值;是估计总体比例时的估计误差。2. 模型的求解从表五可以得到,家庭所在地区为乡镇地区的学生占所有被抽中的

14、学生的25%。所以全校本科学生中,乡镇学生比例的95%的置信区间为,即19.85%到30.15%之间。五、单因素对月平均生活费支出的影响分析(一) 数学模型1. 单因素方差分析单因素方差分析是指对单因素试验结果进行分析,检验因素对试验结果有无显著性影响的方法。单因素方差分析是两个样本平均数比较的引伸,它是用来检验多个平均数之间的差异,从而确定因素对试验结果有无显著性影响的一种统计方法。在数据中,总误差反映全部观测数据的误差;处理误差(组间误差)是由于不同处理造成的误差,它反映了处理对观测数据的影响,因此称为处理效应;随机误差(组内误差)是由于随机因素造成的误差,也简称为误差。数据的误差用平方和表示,记为SS。其中总平方和记为SST,其计算公式为:它反映全部数据总误差大小的平方和。处理平方和记为SSA,其计算公式为:它反映处理误差大小的平方和,也称为组间平方和。误差平方和记为SSE,其计算公式为:

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 其它相关文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号