统计专业实验-实验3

上传人:F****n 文档编号:99611690 上传时间:2019-09-20 格式:DOC 页数:8 大小:149.50KB
返回 下载 相关 举报
统计专业实验-实验3_第1页
第1页 / 共8页
统计专业实验-实验3_第2页
第2页 / 共8页
统计专业实验-实验3_第3页
第3页 / 共8页
统计专业实验-实验3_第4页
第4页 / 共8页
统计专业实验-实验3_第5页
第5页 / 共8页
点击查看更多>>
资源描述

《统计专业实验-实验3》由会员分享,可在线阅读,更多相关《统计专业实验-实验3(8页珍藏版)》请在金锄头文库上搜索。

1、重庆工商大学数学与统计学院统计专业实验课程实验报告实验课程: _指导教师: _ 专业班级: _ _ _学生姓名: _ _学生学号: _ _实 验 报 告实验项目实验三 多元正态总体检验实验日期实验地点实验目的1.掌握单一多元正态总体均值的检验;2.掌握两个多元正态总体均值向量的检验(区分协差阵是否相等)。3.掌握多元方差分析的思想和操作。实验内容1.检验2008年西部9个省区城镇居民大类消费与全国平均水平有无显著差异。2.分析我国上市公司电力、煤气及水生产供应行业和房地产行业在经营绩效(净资产收益率、总资产报酬率、资产负债率和总资产周转率)方面是否存在明显差异,抽样数据见 上市公司效绩指标.x

2、ls。3.一套生产线同时产出三种产品,分析温度和时间对总体产出率的影响,以及温度和时间对不同产品产出率的影响,数据见 三种产品产出率.sav实验思考题解答:1对协差阵未知时,在相等和不等(n=m)两种情况下,两个正态总体均值向量检验有何差异之处?答:先假设协差相同但未知,n=m和n不等于m的两种情况下,F值会有变化,但是不影响检验结果,最终还是F大于F临界值,拒绝原假设。再假设协差不等,在n=m和n不等于m的两种情况下,F值无变化,F值大于F临界值,所以仍是拒绝原假设。2对协差阵不等(n=m)的两个正态总体均值向量检验其基本思想如何,与单总体均值向量检验有何联系?答:建立。由于协差不等,且n=

3、m,故检验统计量为 ,其中,Z=X-Y,S为Z的离差阵。给出检验水平,得到临界值,将计算得到的F值与F临界值比较,如果F大于F临界值,则拒绝原假设。这与单总体均值向量检验的步骤大致相同,只是计算公式,所得到的统计量不同,其基本思想是一致的。实验运行程序、基本步骤及运行结果:实验1、假设检验问题是:H0: 西部9个省区城镇居民大类消费与全国平均水平有显著差异 H1:西部9个省区城镇居民大类消费与全国平均水平无显著差异首先在所给的表格中选取食品、衣着等8个总体指标,将其他不是西部的城市删掉,计算出西部的地区各个指标的平均值和西部个指标与全国水平的差值,就得到一张关于西部地区在这8个指标上的具体数据

4、,然后用公式s=MMULT(TRANSPOSE(X-Z),X-Z),就可以求得离差阵s,用公式s-1=MINVERSE(S) 便得到离差阵的逆矩阵,接着计算出T平方统计量,公式:T2=n*(n-1)*MMULT(MMULT(Z_Z0,S_1),TRANSPOSE(Z_Z0) 用公式将T平方统计量转化为F统计量F= =(n-p)/(n-1)*p)*G15 最后通过查表得到F的临界值,F0.05(8,3)=8.8452F=5.3618 所以拒接原假设,即西部地区的消费与全国相比没有显著性差异。实验2n=13,m=15,n不等于m,设两组样本来自正态总体X和Y,且两组样本相互独立,协差阵相等但未知。

5、假设检验问题:由于有共同未知协差阵,故检验统计量为 其中:1 分析资料对应的n=11,m=15,p=42 利用函数AVERAGE计算X的各指标的平均值,即得到X的平均值向量转置矩阵=Mx,=;同理计算Y的平均值,既得Y的平均值向量转置矩阵=My;计算差值阵,得:3 计算X的离差阵,输入公式=MMULT(TRANSPOSE(X-Mx),X-Mx),计算Y的离差阵,输入公式=MMULT(TRANSPOSE(Y-My),Y-My)计算4 计算S的逆矩阵,输入公式=MINVERSE(S)5 计算统计量T2=(n+m-2)*(n*m)/(n+m)*MMULT(MMULT(d,S_1),TRANSPOSE

6、(d),计算统计量F=(n+m-2)-p+1)/(n+m-2)*p)*I6;6 计算临界值(取显著水平a=0.05)F0.05=FINV(0.05,p,n+m-p+1)。数据如下:7 分析:由上可知,F统计量大于F0.05临界值,所以拒绝原假设,即我国上市公司电力、煤气及水生产供应行业和房地产行业在经营绩效(净资产收益率、总资产报酬率、资产负债率和总资产周转率)方面存在明显差异。实验3:思路: 提出零假设选择检验统计量计算检验统计量的观测值及概率p值给出显著性水平做出假设,假设检验问题:H0:不同温度和时间对产品产出率没有显著影响;H1:不同度和时间对产品产出率有显著影响; (1)温度和时间对

7、总体产出率的影响。操作:选择菜单AnalyzeGeneral Linear ModelUnivariate;再分别选择“总产出率”到随机变量框中,选择“温度”“时间”到控制变量框中,得到结果如下:Tests of Between-Subjects EffectsDependent Variable:三种产品和SourceType III Sum of SquaresdfMean SquareFSig.Corrected Model1891.703a8236.4632.194E3.000Intercept53314.186153314.1864.948E5.000温度480.6862240.34

8、32.230E3.000时间328.8682164.4341.526E3.000温度 * 时间1082.1504270.5372.511E3.000Error.9709.108Total55206.85918Corrected Total1892.67317a. R Squared = .999 (Adjusted R Squared = .999)可以看出,观测变量的总变差为1892.673,它被分解为四个部分,分别由温度不同引起的变差480.686和时间引起的变差328.868,由不同温度和时间交互作用引起的变差1082.150,由随机因素引起的变差0.97。这些变差除以各自的自由度后,得

9、到各自的均方,F统计量以及对应的p值。显然,温度,时间,温度*时间的F值对应的概率p值都为0,都小于0.05,所以拒绝原假设,即不同温度和不同时间对产品总产率都有显著影响。(2)温度和时间对产品1的影响:基本操作:选择菜单AnalyzeGeneral Linear ModelUnivariate;再分别选择“产品1”到随机变量框中,选择“温度”“时间”到控制变量框中,其结果如下:Tests of Between-Subjects EffectsDependent Variable:丹参素(mg/g)SourceType III Sum of SquaresdfMean SquareFSig.C

10、orrected Model78.381a89.7984.120E3.000Intercept420.1131420.1131.767E5.000温度26.824213.4125.640E3.000时间28.478214.2395.988E3.000温度 * 时间23.07945.7702.427E3.000Error.0219.002Total498.51518Corrected Total78.40217a. R Squared = 1.000 (Adjusted R Squared = .999)可以看出,观测变量的总变差为78.402,它被分解为四个部分,分别由温度不同引起的变差26.

11、824和时间引起的变差28.478,由不同温度和时间交互作用引起的变差23.079,由随机因素引起的变差.021。这些变差除以各自的自由度后,得到各自的均方,F统计量以及对应的p值。显然,温度,时间,温度*时间的F值对应的概率p值都为0,都小于0.05,所以拒绝原假设,即不同温度和不同时间对产品总产率都有显著影响。(3)温度和时间对产品2的影响:基本操作:选择菜单AnalyzeGeneral Linear ModelUnivariate;再分别选择“产品2”到随机变量框中,选择“温度”“时间”到控制变量框中,结果如下:Tests of Between-Subjects EffectsDepen

12、dent Variable:原儿茶醛(mg/g)SourceType III Sum of SquaresdfMean SquareFSig.Corrected Model3.092a8.387828.262.000Intercept10.982110.9822.353E4.000温度1.4702.7351.575E3.000时间1.0592.5291.135E3.000温度 * 时间.5634.141301.619.000Error.0049.000Total14.07918Corrected Total3.09617a. R Squared = .999 (Adjusted R Squar

13、ed = .997)由上可以看出,观测变量的总变差为3.096,它被分解为四个部分,分别由温度不同引起的变差1.470和时间引起的变差1.059,由不同温度和时间交互作用引起的变差.563,由随机因素引起的变差0.004。这些变差除以各自的自由度后,得到各自的均方,F统计量以及对应的p值。显然,温度,时间,温度*时间的F值对应的概率p值都为0,都小于0.05,所以拒绝原假设,即不同温度和不同时间对产品总产率都有显著影响。(4)温度和时间对产品3的影响:基本操作:选择菜单AnalyzeGeneral Linear ModelUnivariate;再分别选择“产品3”到随机变量框中,选择“温度”“

14、时间”到控制变量框中,结果如下:Tests of Between-Subjects EffectsDependent Variable:没育得碱产出率%SourceType III Sum of SquaresdfMean SquareFSig.Corrected Model1219.538a8152.4421.294E3.000Intercept42885.442142885.4423.641E5.000温度251.8582125.9291.069E3.000时间138.791269.396589.208.000温度 * 时间828.8894207.2221.759E3.000Error1.0609.118Total44106.04018Corrected Total1220.59817a.

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 教学/培训

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号