统计工程综合实验报告

上传人:飞*** 文档编号:42345685 上传时间:2018-06-01 格式:DOC 页数:31 大小:1.48MB
返回 下载 相关 举报
统计工程综合实验报告_第1页
第1页 / 共31页
统计工程综合实验报告_第2页
第2页 / 共31页
统计工程综合实验报告_第3页
第3页 / 共31页
统计工程综合实验报告_第4页
第4页 / 共31页
统计工程综合实验报告_第5页
第5页 / 共31页
点击查看更多>>
资源描述

《统计工程综合实验报告》由会员分享,可在线阅读,更多相关《统计工程综合实验报告(31页珍藏版)》请在金锄头文库上搜索。

1、JI A N G S U U N I V E R S I T Y统计工程综合实验报告学院名称: 财经学院专业班级: 统计 1201学 号: 3120812028学生姓名: 白卓指导教师姓名: 王伏虎2015 年 6 月1.检验学生平均分是否服从正态分布,是否存在离群值等。检验学生平均分是否服从正态分布,是否存在离群值等。SPSS:在 SPSS 里执行“分析描述统计频数统计表”,然后弹出左边的对话框,变量选择 “平均分”,再点下面的“图表”按钮,弹出图中右边的对话框,选择“直方图”,并选中“包括正态曲线”,设置完后点“确定”,就后会出来一系列结果,包括 2 个表格和一个图,我们先来看看最下面的图

2、,见下图,图 1.1 直方图上图中横坐标为期初平均分,纵坐标为分数出现的频数。从图中可以看出根据直方图绘出的曲线是很像正态分布曲线。下面我们看单个样本K-S检验:在SPSS里执行“分析非参数检验单个样本K-S检验,弹出对话框,检验变量选择“期初平均分”,检验分布选择“正态分布”,然后点“确定”。检验结果为:表 1. 1 矩统计量表One-Sample Kolmogorov-Smirnov Test 平均分N10Mean108.9300Normal Parametersa,bStd. Deviation5.72326Absolute.205Positive.205Most Extreme Dif

3、ferencesNegative-.186Kolmogorov-Smirnov Z.650Asymp. Sig. (2-tailed).793a. Test distribution is Normal.b. Calculated from data.从结果可看出,K-S检验中,Z值为0.650,P值 (sig 2-tailed)=0.7930.05,因此数据呈近似正态分布SAS输入数据:输入数据:表 1. 2 数据表ID CHINESE MATH ENGLISH TOTAL AVERAGE1501111139110360120.000150212311997339113.0001506112

4、12396331110.3331508112118101331110.3331504109117105331110.333150911212395330110.000150511311986318106.0001503109103105317105.667150711011196317105.66715101041108029498.000表 1. 3 矩统计量表矩矩N24权重总和权重总和24均值均值783.75观测总和观测总和18810标准差标准差47.4398933方差方差2250.54348偏度偏度0.26717607峰度峰度-0.8453637未校平方和未校平方和14794100校正平

5、方和校正平方和51762.5变异系数变异系数6.05293695标准误差均值标准误差均值9.68362767表 1. 4 基本统计侧度表基本统计测度基本统计测度位置位置变异性变异性基本统计测度基本统计测度位置位置变异性变异性均值均值783.7500标准差标准差47.43989中位中位 数数785.0000方差方差2251众数众数800.0000极差极差170.00000四分位极四分位极 差差80.00000表 1. 5 位置检验表位置检验位置检验: Mu0=0检验检验统计量统计量P 值值学生学生 tt80.93558Pr |t|= |M|= |S| D0.150Cramer-von Mises

6、W-Sq0.04103987Pr W-Sq0.250Anderson-DarlingA-Sq0.27129424Pr A-Sq0.250图 1. 3 Q-Q 图2.双样本的均值检验,判断两个独立样本或配对样本均值是否存在差异。双样本的均值检验,判断两个独立样本或配对样本均值是否存在差异。在有小麦丛矮病的麦田里,调查了 13 株病株和 11 株健株的植株高度,分析健株高度是否高于病株。其调查数据如下:健株 26.0 32.4 37.3 37.3 43.2 47.3 51.8 55.8 57.8 64.0 65.3病株 16.7 19.8 19.8 23.3 23.4 25.0 36.0 37.3

7、 41.4 41.7 45.7 48.2 57.8(状态变量中:1 表示病株,2 表示健株。)SPSS:1)准备分析数据在数据编辑窗口输入分析的数据。2)启动分析过程在主菜单选中“Analyze”中的“Compare Means”,在下拉菜单中选中“Independent -Sample T Test”命令。3)设置分析变量Test Variable(s):从左边的变量列表中选中变量“小麦丛矮病株高”, Grouping Variable(s):从左边的变量列表中选中分组变量“状态”。4)设置其他参数 点击“Options”按钮,打开设置检验的置信度和缺失值对话框。置信度水平为系统默认即 95

8、%;“Missing Values”框里的“Exclude cases analysis by analysis” 栏,是只排除分析变量为缺失值的选择项,“Exclude cases listwise”是排除任何含有缺失值的选择项。5)提交执行输入完成后,在过程主窗口中单击“OK”按钮。6) 结果与分析结果结果表 2. 1 分组统计量列表typeN均值标准差均值的标准误病株1333.546213.043683.61767height健株1147.109113.029773.92862表 2. 2 独立样本的检验结果方差方程的 Levene 检验均值方程的 t 检验差分的 95% 置信区间FSi

9、g.tdfSig.(双侧)均值差值标准误差值下限上限假设方差相等.038.847-2.53922.019 -13.562945.34106 -24.63961 -2.48626height假设方差不相等-2.54021.354.019 -13.562945.34056 -24.65804 -2.46784分析分析表 2.2“Levenes Test for Equality of Variances”列方差齐次性检验结果:F 值为 0.038,显著性概率为 0.847,因此两组方差不显著。那么应该从表 2.1 的“Equal vari ances assumed”行读取数值。t 值是-2.53

10、9,Sig. (2-tailed)是双尾 t 检验的显著性概率 0.019,小于 0.05。可以得出结论:病株与健株的株高差异显著。两组的株高均值之差为 13.56,平均病株低于健株 13.56。差值的标准误为5.341。SAS:程序语言:proc ttest data=jianyan;var height;class type; run;输出结果:表 2. 3 分组统计量表typeNMeanStd DevStd ErrMinimumMaximum11147.109113.02983.928626.000065.300021333.546213.04373.617716.700057.8000

11、Diff (1-2) 13.562913.03745.3411 表 2. 4 独立样本检验表MethodVariancesDFt ValuePr |t|PooledEqual222.540.0187SatterthwaiteUnequal21.3542.540.01893.双因素方差分析,判断两个因素之间是否存在交互作用,以及两个因素对因双因素方差分析,判断两个因素之间是否存在交互作用,以及两个因素对因变量的影响是否显著。变量的影响是否显著。某公司试图确定鞋店每天的销售额是否与竞争者的数量以及商店的地理位置有影响,有如下数据:表 3. 1 部分数据 商店位 置竞争者数 量销量0041 0138

12、 0259 0347 0030 0131 0248 0340 0045 0139 0251 0339 1025 1129 1244 1343SPSS:表 3. 2 描述性统计量表因变量:销售额竞争者数量商店位置均值标准 偏差N位于近郊的商店38.677.7673位于购物中心的商店26.004.5833位于城内的商店26.677.7673没有竞争者总计30.448.5759位于近郊的商店36.004.3593位于购物中心的商店31.333.2153位于城内的商店21.334.04131个竞争者总计29.567.3169位于近郊的商店52.675.6863位于购物中心的商店47.333.0553位

13、于城内的商店27.671.52832个竞争者总计42.5611.8769位于近郊的商店42.004.3593位于购物中心的商店46.006.0833位于城内的商店27.674.04133个以上的竞争者总计38.569.3699位于近郊的商店42.338.21712位于购物中心的商店37.6710.32512位于城内的商店25.834.98812总计总计35.2810.59036对比不同地理位置的鞋店,可发现购物中心鞋店销售额均值呈现“增长减少”的变化趋势,和总变化趋势稍有不同,这表明竞争者个数和商店位置之间似乎存在交互作用。表 3. 3Levenes 误差齐次检验表因变量:销售额Fdf1df2

14、Sig.1.3861124.242检验零假设,即在所有组中因变量的误差方差均相等。a. 设计 : 截距 + 竞争者数量 + 商店位置 + 竞争者数量 * 商店位置Levenes误差齐次检验表显示根据因素水平分类的各单元因变量的方差是否相等,从表中看出F=1.386,对应的显著性水平sig.=0.2420.05,没理由拒绝原假设。因此,各组变量的标准虽然存在差别,但是这种差别可能是由于一些偶然或随机波动造成的。表 3. 4 组间效应检验表因变量:销售额源III 型平方和df均方FSig.校正模型3317.889a11301.62611.919.000截距44802.778144802.77817

15、70.472.000竞争者数量1078.3333359.44414.204.000商店位置1736.2222868.11134.305.000竞争者数量 * 商店位置503.333683.8893.315.016误差607.3332425.306总计48728.00036校正的总计3925.22235a. R 方 = .845(调整 R 方 = .774)“商店位置*竞争者数量”对应的F=3.315,其显著性水平sig.=0,016 FModel7912.604167130.3720243.990.0354Error8261.33333332.666667 SourceDFSum of Squ

16、aresMean SquareF ValuePr FCorrected Total151173.937500 表 3. 8 ANOVA 表R-SquareCoeff VarRoot MSEsize Mean0.77738714.090545.71547640.56250表 3. 9 双因素方差检验表SourceDFAnova SSMean SquareF ValuePr Flocation1150.5208333150.52083334.610.0641number3678.6875000226.22916676.930.0130location*number383.395833327.79861110.850.50414.多元线性回归模型,检验模型中多重共线性问题,如果存在比较严重的共多元线性回归模型,检验模型中多重共线性问题,如果存在比较严重的共 线性问题时如何选择一个理论上最优的模型。线性问题时如何选择一个理论上最优的模型。部分数据如下:表 4. 1 部分数据YX1X2X

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号