数学实验 统计推断

上传人:灯火****19 文档编号:142981941 上传时间:2020-08-25 格式:PDF 页数:8 大小:490KB
返回 下载 相关 举报
数学实验 统计推断_第1页
第1页 / 共8页
数学实验 统计推断_第2页
第2页 / 共8页
数学实验 统计推断_第3页
第3页 / 共8页
数学实验 统计推断_第4页
第4页 / 共8页
数学实验 统计推断_第5页
第5页 / 共8页
点击查看更多>>
资源描述

《数学实验 统计推断》由会员分享,可在线阅读,更多相关《数学实验 统计推断(8页珍藏版)》请在金锄头文库上搜索。

1、实验实验 12:统计推断:统计推断 系别:化工 班级:化 22 学号:2012011903 姓名:华丰 实验目的:实验目的: 1. 掌握数据的参数估计、假设检验的基本原理、算法,和用 MATLAB 实现的方法 2. 练习用这些方法解决实际问题。 习题习题 12-6 学校随机抽取 100 名学生,测量他们的身高和体重,所得数据见表格 (1)对这些数据给出直观的图形描述,检验分布的正态性; (2)根据这些数据对全校同学的平均身高和体重做出估计,并给出估计的误差范围; (3)学校 10 年前做过普查,学生的平均身高为 167.5cm,平均体重为 60.2kg,根据这次 抽查的数据,对学生的平均身高和

2、体重有无明显变化做出结论。 样本数据:样本数据:100 名学生的身高(名学生的身高(cm)和体重()和体重(kg) 问题分析:问题分析: (1)要求用直观的图形描述指的是画出以上 100 个样本点的直方图,并用 MATLAB 函数检 验其正态性,若通过,则可以用 MATLAB 中的 normfit 函数,来估计总体的一些统计量。 (2)通过正态性检验后,分别计算均值点估计,均值区间估计,标准差点估计和标准差区 间估计。区间估计在取置信水平为 0.95 时,均值点落在估计区间的概率为 0.95. (3)这是一个关于总体均值的双侧检验。 模型建立:模型建立: (3)记 0010:,:HH 由于总体

3、方差未知 若原假设成立,因为, 取 t (n-1) 的分位数 1-,记 t=, 满足 t 检验规则为: 当时接受 H0,否则拒绝 取 alpha=0.05 程序:程序: (1)A=dlmread(height.m); x=A(1,:),A(2,:),A(3,:),A(4,:),A(5,:),A(6,:),A(7,:),A(8,:),A(9,:),A(1 0,:); B=dlmread(weight.m); y=B(1,:),B(2,:),B(3,:),B(4,:); subplot(1,2,1),hist(x,6),title(100名学生身高),xlabel(身高 /(cm),ylabel(

4、频数) subplot(1,2,2),hist(y,6),title(100名学生体重),xlabel(体重 /(kg),ylabel(频数) n1=hist(x,6) n2=hist(y,6) h1=jbtest(x) h2=jbtest(y) (2) mu1 s1 muci1 smaci1=normfit(x) mu2 s2 muci2 smaci2=normfit(y) (3) h1,sig1,ci1=ttest(x,167.5,0.05,0) h2,sig2,ci2=ttest(y,60.2,0.05,0) 运行结果:运行结果: (1) 0 (1) / X t n sn 频数表频数表

5、学生身高/ (cm) 155-160 161-165 166-170 171-175 176-180 181-186 频数 4 13 38 28 13 4 学生体重/ (kg) 47-52 52-57 57-62 62-67 67-72 72-77 频数 12 17 27 28 9 7 h1 = 0 h2 =0 (2) mu1 =170.2500 s1 = 5.4018 muci1 =169.1782 171.3218 smaci1 = 4.7428 6.2751 mu2 = 61.2700 s2 = 6.8929 muci2 = 59.9023 62.6377 smaci2 = 6.0520

6、 8.0073 (3) h1 = 1 sig1 = 1.7003e-006 ci1 = 169.1782 171.3218 h2 = 0 sig2 = 0.1238 ci2 = 59.9023 62.6377 = 0.05 假设 = 0 Sig ci 身高 接受 1.7003e-006 (169.1782 , 171.3218) 体重 拒绝 0.1238 (59.9023 , 62.6377) 结论:结论: (1)该样本中学生的身高体重直方图和频数表如上所示,且两者通过正态性检验均满足 正态分布 (2)学生身高均值和标准差的点估计和区间估计 身高/(cm) 体重/(kg) 均值点估计 170.

7、2500 61.2700 均值区间估计 (169.1782 , 171.3218) (59.9023 , 62.6377) 标准差点估计 5.4018 6.8929 标准差区间估计 (4.7428 , 6.2751) (6.0520 , 8.0073) (3)拒绝身高不变的假设,因为 sig=1.7003e-006 = 0.05,所以即使把改为 0.01,此 结论不变。同时接受体重不变的假设。 习题习题 12-8 20 名学生参加了某课程进行的、考查同样知识的两次测验,成绩如下表,根据这些数据 判断两次测验的难度是否相同。 20 名学生的两次测验成绩(每列是相同的学生)名学生的两次测验成绩(每

8、列是相同的学生) 第一次 93 85 79 90 78 76 81 85 88 68 92 73 88 84 90 70 69 83 83 85 第二次 88 89 86 85 87 88 75 93 88 78 86 86 80 89 85 79 78 88 88 90 问题分析:问题分析: 本题的两组数据不能视为独立,故不可直接使用两总体均值的假设检验。 因为是两组不独立的数据,首先分析影响考试成绩的因素:一者是考试的难度,另一者是 考试者答题水平的涨落。 前者是我们需要检验的内容, 后者是我们在处理时需要尽量避免其 作用的因素。 用两种方法解此题,一种方法以1 2作为样本点,另一者以1和

9、2作为样本点。因为 1和2都满足正态分布,所以新的样本应该满足均值为 0 的正态分布。后者因为完全忽略了 同一列两组数据的联系,认为其独立是不正确的,在此仅作为讨论原理的切入口。 模型建立:模型建立: 法一,与前一问一样,此题依然是总体均值的双侧检验: 当时接受 H0,否则拒绝 取 alpha=0.05 法二,此处是一个标准差未知的两总体均值假设检验,假定标准差相等, 若原假定成立 , t 检验的规则是, 当时接受 H0,否则拒绝 程序:程序: x1=93 85 79 90 78 76 81 85 88 68 92 . 73 88 84 90 70 69 83 83 85; x2=88 89

10、86 85 87 88 75 93 88 78 86 . 86 80 89 85 79 78 88 88 90; y1=jbtest(x1) y2=jbtest(x2) x=x1-x2; h1,sig1,ci1=ttest(x,0,0.05,0) h2,sig2,ci2=ttest2(x1,x2,0.05,0) 运行结果:运行结果: y1 =0 y2 =0 h1 =1 sig1 = 0.0428 ci1 = -6.4818 -0.1182 h2 =0 sig2 = 0.1090 ci2 = -7.3703 0.7703 结论结论 两个样本均满足正态分布, 用方法一 (以两样本对应的数据之差为新

11、样本点) 和方法二 (忽 略两样本间的联系)得出的结论不同。前者认为第二次测验更加简单,而后者则接受了两次 测验难度相等的假设。 探究其原因:追溯其 t 检验的判据,编程如下: (数据输入略) s=std(x); s=s*s alpha=0.05; T=tinv(1-alpha/2,19) t=T*sqrt(s/20) %计算法一的方差,分位数和均值差 s1=std(x1); s2=std(x2); ss=(19*s1*s1+19*s2*s2)/38 T1=tinv(1-alpha/2,38) t1=T1*sqrt(ss/20+ss/20) %计算法二的方差,分位数和均值差 运行结果整理如下表

12、: 法一 方差 分位数 均值差 46.2211 2.0930 3.1818 法二 方差 分位数 均值差 40.4263 2.0930 4.0703 也就是说面对同样的检验条件,两种方法被承认的条件是不同的,法一更加严苛一些。造 成这种结果的原因,并不是两者的分位数不同,而是两者的方差不同。而造成方差不同的原 因容易见得, 就是因为法二忽略了同一批人考试的因素, 所以法一算的的方差应该比法二小, 结果计算得比法二大,所以不被接受也是正常的。 习题习题 12.10 表 12.10 中给出的中国 718 岁青少年身高资料来源于 95 年全国学生体质健康调研, 分层 随机整体群抽样自除西藏、台湾外所有

13、省,年龄 7-22 岁,共约 20 万各年龄段的数据。日本 718 岁青少年身高资料以 95 年日本学校保健调查为依据。表 2.5 中是各个样本的均值和标 准差。设法用这些数据判断中国和日本男女生身高是否有差异。 (表略) 问题分析:问题分析: 这道题没有原始数据,不能直接用 MATLAB 命令 test2 计算,我们转而假设所有的数据均 满足正态分布,且未知方差相等,利用 t 检验进行计算 模型建立:模型建立: 此处是一个标准差未知的两总体均值假设检验,假定标准差相等, 若原假定成立 , t 检验的规则是, 当时接受 H0,否则拒绝 程序:程序: Function 函数: function

14、h,sig=pttest2(xbar,ybar,s1,s2,m,n,alpha) spower=(m-1)*s12+(n-1)*s22)/(m+n-2); t=(xbar-ybar)/sqrt(spower/m+spower/n); a=tinv(1-alpha/2,m+n-2); sig=2*(1-tcdf(abs(t),m+n-2); if abs(t)=a h=0; else h=1; end M 文件: m=5000;n=5000;alpha=0.05; xbar=124.5 129.4 134.6 139.3 145.1 151.2 160.0 165.1 168.3 170.1 1

15、71.0 170.8; ybar=122.5 128.1 133.4 138.9 144.9 152.0 159.6 165.1 168.5 170.0 170.8 171.1; s1=5.7 5.6 6.0 6.6 7.2 8.1 8.0 7.0 6.3 6.3 6.0 5.8; s2=5.4 5.5 5.4 5.9 6.7 7.8 7.6 6.8 6.2 5.9 6.0 5.9; xbar2=123.4 128.4 134.3 140.0 146.7 152.5 156.3 157.7 158.9 159.3 159.3 159.1; ybar2=121.8 127.6 133.5 140.2 146.7 151.9 155.1 156.7 157.4 157.9 158.1 158.2; s12=5.4 5.5 6.2 6.9 7.0 6.6 6.0 5.5 5.6 5.4 5.4 5.3; s22=5.4 5.7 6.3 6.6 6.7 6.2 5.4 5.2 5.0 5.3 5.0 5.1; for i=1:12 h,sig=pttest2(xbar(i),ybar(i),s1(i),s2(i),m,n,alpha); H(i)=h; Sig(i)=sig; end H Sig (对比女性数据时直接修改 for 循环中的变量名称即可) 运行结果整理:运行

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号