《西华大学统计学实验报告》由会员分享,可在线阅读,更多相关《西华大学统计学实验报告(18页珍藏版)》请在金锄头文库上搜索。
1、课 程 实 验 报 告 题 目: 社会经济统计学 学生姓名: 学 号: 专 业: 年 级: 学 院: 指导教师: 教务处制实验一:EXCEL的数据整理与显示一、实验目的及要求:(一)目的1了解EXCEL的基本命令与操作、熟悉EXCEL数据输入、输出与编辑方法;2熟悉EXCEL用于预处理的基本菜单操作及命令;3熟悉EXCEL用于整理与显示的基本菜单操作及命令。(二)内容及要求 1根据下面的数据。1.1用Excel制作一张组距式次数分布表,并绘制一张条形图(或柱状图),反映工人加工零件的人数分布情况。从某企业中按随即抽样的原则抽出50名工人,以了解该企业工人生产状况(日加工零件数):117 108
2、 110 112 137 122 131 118 134 114 124 125 123 127 120 129 117 126 123 128 139 122 133 119 124 107 133 134 113 115 117 126 127 120 139 130 122 123 123 128 122 118 118 127 124 125 108 112 135 1161.2整理成频数分布表,并绘制直方图。1.3 假设日加工零件数大于等于130为优秀。二、仪器用具硬件:计算机(安装Windows2003 、Windows2007 或Windows XP或以上)软件:EXCEL三、实
3、验原理 统计中数据整理与显示的相关理论。四、实验方法与步骤1点击“数据”“透视图” ,选定区域为日加工零件数一列,输出区域为空白地方,完成,修改一下形成。2点击“图表向导” “条形图”,数据区域为复制的数据,再修改系列、名称、X轴、Y轴,完成,再修改一下图表。3分组后,点击“工具” “数据分析” “直方图”,输入区域为体育一列,接受区域为分好的组,标志打钩,输出区域为空白地方,累计百分比和图表输出打钩,完成,在对表和图进行一系列的修改,形成所需要的表和图。五、实验结果与数据处理1.1工人加工零件的人数分布情况。1.2整理成频数分布表,并绘制直方图1.3 假设日加工零件数大于等于130为优秀六、
4、讨论与结论 统计学是一门收集,整理,显示和分析统计数据,研究统计方法论的学科。本实验中,已经随机抽样出企业50名工人的日加工零件数以了解企业工人生产状况,所以我们要做的便是分析统计数据。 首先,观察数据,对数据进行组距式分组。在分组过程中我了解到组距式分组需要满足保持组内总体单位的同质性和组间总体单位的差异性原则、穷举性原则、互斥性和上限不在内原则。确定组距后,统计每组数据出现的次数,这是一个需要耐心的工作,要保证每个数据都有归属的组。然后,把整理好的数据输入EXCEL中。最后利用EXCEL功能绘制条形图。不可否认,EXCEL对统计工作提供了有力的帮助。这也告诉我们统计学是一门与实践紧密结合的
5、科学,要学好统计学还必须把理论用于实践,掌握EXCEL的相关功能。 通过条形图,可以清晰的反映日加工零件数在某个范围内人数的多少。我们可以看到日加工零件在120125件的人数最多达到14个;其次是115120和125130,人数分别为9个和10个;居于105110和135140范围的人数较少。且50个工人的日加工零件数分布较为分散,说明每个工人的日加工零件数差异较大。直方图就是对数据进行统计分析,得到频数的分布表,最后画出统计图,以便更加直观的反应出数据之间的关系和规律。通过直方图,可以清晰反映日加工零件数在某个范围内的人数占总人数的比重,可以帮助我们了解工人的一般水平集中在什么范围内。假设日
6、加工零件数在大于等于130的为优秀,在图形中得到了很好的反映,达到优秀水平的工人为9个,占样本比例的18%。说明该企业工人生产水平达到优秀水平的比例较小,大部分工人生产水平位于一般水平。实验二:EXCEL的数据特征描述、抽样推断一、实验目的及要求:(一)目的熟悉EXCEL用于数据描述统计、列联分析、多元回归的基本菜单操作及命令。(二)内容及要求根据实验1的数据,(1)计算特征值;(2)判断该企业职工的平均日加工零件数及优秀率的区间;(3)假设检验(如果以往该企业的工人日加工零件数为115,优秀率为5%,显著性水平为5%)。二、仪器用具硬件:计算机(安装Windows2003 、Windows2
7、007 或Windows XP或以上)软件:EXCEL三、实验原理 统计中数据整理与显示的相关理论。四、实验方法与步骤1、 在相应方格中输入命令,得到各特征值。COUNT(B4:B53)并回车,得到50个数据中的单位总量。SUM(B4:B53)并回车,得到50个数据中的标志总量。MAX(B4:B53)并回车,得到50个数据中的最大值。MIN(B4:B53)并回车,得到50个数据中的最小值。AVERAGE(B4:B53)并回车,得到50个数据中的平均值。MEDIAN(B4:B53)并回车,得到50个数据中的中位数。GEOMEAN(B4:B53)并回车,得到50个数据中的几何平均数。HARMEAN
8、(B4:B53)并回车,得到50个数据中的调和平均数。AVEDEV(B4:B53)并回车,得到50个数据中的变异统计的平均差。STDEV(B4:B53)并回车,得到50个数据中的变异统计的标准差。VAR(B4:B53)并回车,得到50个数据中的变异统计中的方差。KURT(B4:B53)并回车,得到50个数据中的变异统计中的峰度。SKEW(B4:B53)并回车,得到50个数据中的变异统计中的偏度。2、 抽样推断在单元格中输入CONFIDENCE(所在单元格,标准差所在单元格,样本容量单元格),点得到极限误差,从而得到日价格零件数和优秀率的置信区间。单元格中键入“=(样本均值单元格-115)/(样
9、本标准差单元格/SQRT(样本容量单元格))”,得到t值;单元格中键入“=TINA(0.05,49)”得到=0.05,自由度为49的临界值。五、 实验结果与数据处理所以置信区间为120.64,125.12=6.894六、 讨论与结论 把实验一的数据依次输入EXCEL表格中,利用其函数计算功能分别计算样本数据的特征值。通过对特征值的计算,我学会了函数计算功能的使用和各个函数的具体功能,为统计数据的分析提供了便捷的渠道。从实验结果可以得到,该企业50名员工日加工零件数的总额为6149件,平均日加工零件数122.88与日加工零件数的最大值139和最小值107差距较大,说明该组数据波动幅度较大。变异统
10、计的平均差6.3696表示数据与其均值的绝对偏差的平均值,方差65.33和标准差8.082是测度数据变异程度最重要、最常用的指标,这三个数值表明数据相对离散。峰值-0.472反映与正态分布相比某一分别的尖锐度或平坦度。偏斜度0.025反映以平均值为中心的分布的不对称程度。峰值和偏斜度表明数据分布较为不对称。 了解完特征值后,我们对数据进行进一步的分析。运用点估计的思想可以用样本均值估计总体均值得到企业职工日平均加工零件数,然后算得极限误差,进而得到优秀率的置信区间。运用区间估计的思想进行假设检验。假设检验是抽样推断的继续和必要补充,在推断统计中起着重要作用。所谓假设检验,也称显著性检验,是事先
11、对总体参数做出一个假设,然后利用样本信息来判断该假设是否合理,即判断样本信息与原假设是否有显著差异。 通过此次实验,我学会了数据特征值和假设检验在EXCEL中的应用,大大简化了计算工作,同时巩固了关于特征值的含义和假设检验的相关知识。还让我增长了新的知识,比如峰度和偏斜度便是课本外的知识。 实验三:时间序列分析一、实验目的及要求:(一)目的掌握EXCEL用于移动平均、线性趋势分析的基本菜单操作及命令。(二)内容及要求 综合运用统计学时间序列中的移动平均、季节指数运算、时间序列因素分解、图形展示等知识,对某小区居民用电量(千度)季节数据的构成要素进行分解,并作出图形进行分析。月度第一年第二年第三
12、年第四年151657458554224474694554383345366352341435432734142753744123883586359353332355736538139237684374604294419353344361382102953112913771145445339539812457486491428二、仪器用具硬件:计算机(安装Windows2003 、Windows2007 或Windows XP或以上)软件:EXCEL三、实验原理 时间序列分析中的移动平均分析原理、季节指数原理等。四、实验方法与步骤1(1)输入“年/月度”、 “时间标号”,复制各月度销售额到“用电
13、量”。(2)点击“数据分析”“移动平均”,输入区域为“销售额”,间隔4,输出“移动平均值”;同样的办法对“移动平均值”进行2步平均,输出“中心化后的移动平均值”。(3)对称一下 “移动平均值”和“中心化后的移动平均值”,然后用“用电量”除以“中心化后的移动平均值”求出“比值”。(4)将“比值”中的数据复制到“季节指数计算表”中,计算完成表。(5)点击“图标向导”“折线图”,输入区域为季节指数中的数值,修改完成图表。 2(1)完善“用电量”和“季节指数”并计算“用电量”/“季节指数”,完成季节分离后的时间序列。(2)点击“数据分析”“回归”,Y值输入区域为季节分离后的时间序列,X值输入区域为时间
14、标号,输出。(3)利用计算出的趋势模型和季节比率,对该小区第五年用电量数据进行预测。3点击“图表向导”“折线图”,数据区域为“用电量”、“季节分离后的时间序列”和“回归后的趋势”,系列产生在“列”,完善标题、X轴、Y轴,完成,再修改完成图。4用与图3相同的方法绘制销售额预测图。五、实验结果与数据处理 年/月度用电量销售额中心化的移动平均比值第一年559447400.54166671.115989345402.08333330.858031354403.8750.876509374403.6250.926603359404.08333330.888431365405.41666670.900308437405.83333331.076797353407.45833330.866346295408.04166670.722965