非参数统计(R软件)参考答案

上传人:re****.1 文档编号:497798888 上传时间:2023-11-06 格式:DOCX 页数:29 大小:265.04KB
返回 下载 相关 举报
非参数统计(R软件)参考答案_第1页
第1页 / 共29页
非参数统计(R软件)参考答案_第2页
第2页 / 共29页
非参数统计(R软件)参考答案_第3页
第3页 / 共29页
非参数统计(R软件)参考答案_第4页
第4页 / 共29页
非参数统计(R软件)参考答案_第5页
第5页 / 共29页
点击查看更多>>
资源描述

《非参数统计(R软件)参考答案》由会员分享,可在线阅读,更多相关《非参数统计(R软件)参考答案(29页珍藏版)》请在金锄头文库上搜索。

1、内容:geyer ,它上机实践:将MAS嗷据包用命令library(MASS)加载到R中,调用自带“老忠实”喷泉数据集有两个变量:等待时间waiting和喷涌时间duration,其中(1) 将等待时间70min以下的数据挑选出来;(2) 将等待时间70min以下,且等待时间不等于57min的数据挑选出来;(3) 将等待时间70min以下喷泉的喷涌时间挑选出来;(4) 将喷涌时间大于70min喷泉的等待时间挑选出来。解:读取数据的R命令:library(MASS);#加载MASS1data(geyser);#加载数据集geyserattach(geyser);#将数据集geyser的变量置为内

2、存变量(1)依题意编定R程序如下:sub1geyser=geyserwhich(waiting70),1;#提取满足条件(waiting70)的数据,which(),读取下标sub1geyser1:5;#显示子数据集sub1geyser的前5行15760565054(2)依题意编定R程序如下:Sub2geyser=geyserwhich(waiting70)&(waiting!=57),1;#提取满足条件(waiting70&(waiting!=57)的数据.Sub2geyser1:5;#显示子数据集sub1geyser的前5行16056505460原数据集的第1列为waiting喷涌时间,所

3、以用which(waiting70),2(3)Sub3geyser=geyserwhich(waiting70),2;#提取满足条件(waiting70)的数据,which(),读取下标Sub3geyser1:5;#显示子数据集sub1geyser的前5行1 原数据集的第2列为喷涌时间,所以用which(waiting70),1;#提取满足条件(waiting70)的数据,which(),读取下标Sub4geyser1:5;#显示子数据集sub1geyser的前5行(1) 8071807577如光盘文件中的数据,一个班有30名学生,每名学生有5门课程的成绩,编写函数实现下述要求:(2) 以的格

4、式保存上述数据;(3) 计算每个学生各科平均分,并将该数据加入(1)数据集的最后一列;(4) 找出各科平均分的最高分所对应的学生和他所修课程的成绩;(5) 找出至少两门课程不及格的学生,输出他们的全部成绩和平均成绩;(6) 比较具有(4)特点学生的各科平均分与其余学生平均分之间是否存在差异。先将数据集读入R系统student=(,header=T)class(student):#显示数据集student的类型,1#student是数据框names(student);#显示数据框student的变量1namemathphysicschemliteratenglishmean#输出显示,数据框st

5、udent有7个变量,第7个变量是平均值mean。(1)(student,F:gzmu非参数统计各章数据附录A,=T)打开namemathphysicschemliteratenglish1Katty6561728479,6=(2) 依题意,要为原始数据集添加一个变量,即添加一列在最后。me=rep(0,30);for(iin1:30)x=(studenti,2:6);mei=mean(x);student$mean=me;#上面程序的最后一行也可以如此:student,7=menames(student);1 namemathphysicschemliteratenglishmean#如上显

6、示,程序运行后数据框student添加了第7列mean.(3) 依题意,在(2)的程序运行后做,要用到which(mean=max(mean),如同。attach(student);maxme=studentwhich(mean=max(mean),;#找出最高平均分的记录,并赋予maxme;maxme;namemathphysicschemliteratenglishmean15Liggle7896818076(4) 依题意,要用到二重的for和if.由原数据框geyser给data1赋值时要用到数据转换:#x=(studenti,2:6);#读取student第i行2:6列的数据,#dat

7、a1k,=x;#将x赋给data4#的第k行。sum(x60)是不及格门数。Data1=student1,;#赋初值k=0;for(iin1:30)x=(studenti,2:6);if(sum(x1)k=k+1;data1k,=studenti,;data1namemathphysicschemliteratenglishmean1Ricky67634965579Jed8310079415010Jack869497515512Jetty678453585613Corner816269565214Osten716494525225Amon7479955959(5) 依题意,要创造两个子集dat

8、a4和data2,用两样本的比较方法比较他们的平均成绩是否有显著差异。类似创造data1的方法,创造data2。并设x=data1$mean,y=data2$mean,比较二样本x,y是否有显著差异,由于还没有学非参数检验,试用t检验检验之(R的t检验函数为(x,y),原假设H是两样本的均值相等,备择假设H1是两样本不等)。如果P值p-value,则拒绝原假设。data2=student1,;k=0;for(iin1:30)x=(studenti,2:6);if(sum(x60)2)k=k+1;data2k,=studenti,;下面做t检验x=data1$mean;y=data2$mean;

9、(x,y)WelchTwoSamplet-testdata:xandyt=,df=,p-value=alternativehypothesis:truedifferenceinmeansisnotequalto095percentconfidenceinterval:sampleestimates:meanofxmeanofy:结论:p-value=,则将会拒绝H0:,而且按照Neyman-Pearson弓I理,该检验是最优的。现在,如果我们观察到X=,该水平的最优检验告诉我们拒绝=0的零假设,接受=1000的备择假设,你觉得有问题吗问题在哪里如何解决答:有问题。假设检验在原假设条件成立下,得

10、到拒绝域接受只是其中的一种情况,故不能接受改进方法:可直接提出假设“均值为1000”进行检验。即检验(2)有两组学生的成绩,第一组为11名,成绩为x:100,99,99,100,100,100,100,99,100,99,99;第二组为2名,成绩为y:50,0.我们对这两组数据作同样水平=的t检验(假设总体的均值为),H0:100H1:100。对第二组数据的检验结果为:df=10,t=,mean(x)=,单边检验(100,less)的P值为p-value=o所以拒绝原假设,认为100o对第二组数据检验的结果为:df=1,t值为-3,单边(100,less)的P值为p-value=,不拒绝原假设二100。但是mean(y)=25.解:两个结论都不是合理的,t检验是针对正态数据做的,第一组数据事实上是两点分布,x的取值域为99,100,所以t检验的基本假设不满足,所以第一个检验是不合理的;第二组数据的t检验也是不合理的,样本量太少,不具有代表性。(3)写出上面所用的t检验统计量,及p值的定义,解释水平二的意义(注意,这里是一般情况,不要联系(2)中的具体数据例子),如果没有给定水平,如何用p值来做出结论解:设样本X1,X2,.,XniidN(,2),对于三种假设(双边假设,两个单边假设)都用同一X

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 商业/管理/HR > 营销创新

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号