R语言中的t-test和ANOVA13965

上传人:宝路 文档编号:47915735 上传时间:2018-07-06 格式:PPT 页数:44 大小:1.17MB
返回 下载 相关 举报
R语言中的t-test和ANOVA13965_第1页
第1页 / 共44页
R语言中的t-test和ANOVA13965_第2页
第2页 / 共44页
R语言中的t-test和ANOVA13965_第3页
第3页 / 共44页
R语言中的t-test和ANOVA13965_第4页
第4页 / 共44页
R语言中的t-test和ANOVA13965_第5页
第5页 / 共44页
点击查看更多>>
资源描述

《R语言中的t-test和ANOVA13965》由会员分享,可在线阅读,更多相关《R语言中的t-test和ANOVA13965(44页珍藏版)》请在金锄头文库上搜索。

1、R语言中的t-test和ANOVA组员:程琪张君颀周祎祎炜IndexT-test ANOVA单因子方差分析同时置信区间双因子方差分析有交互作用的方差分析多重t-test分析Vasishths Height ExampleSAMP =53.56797, 60.12001, 59.85700, 63.53580, 62.00390, 61.80454, 64.33530,61.38428, 60.05831, 65.93938, 57.21961Shrinking drug (non-effect value=64)大部分情况下我们并不知道 T分布 pt(-3.02, df = 10) + (1

2、- pt(3.02, df = 10)1 0.01289546Vasishths Height ExampleThe p-value of this two-sided t-test is 0.012. samp t.test(samp, mu = 64)One Sample t-testdata: sampt = -3.0237, df = 10, p-value = 0.01281alternative hypothesis: true mean is not equal to 6495 percent confidence interval:58.60396 63.18260sample

3、 estimates:mean of x60.89328 source(file = “shade.tails.R“) shade.tails(3.02, tail = “both“, df = 10)曲线下小于-3.02只有0.06% 通过Keith Johnsons shade.tails 这个功能绘图.t.test()的调用格式t.test(x, y = NULL, alternative = c(“two.sided“, “less“, “greater“),mu = 0, paired = FALSE, var.equal = FALSE,conf.level = 0.95, .)若

4、仅出现数据x, 则进行单样本t检验; 若出现数据x和y, 则进行二样本 的t检验alternative=c(“two.sided“, “less“, “greater“)用于指定所求置信区间的 类型; alternative=“two.sided“是缺省值, 表示求置信区间 alternative=“less“表示求置信上限; alternative=“greater“表示求置信 下限. mu表示均值, 它仅在假设检验中起作用, 默认值为零.单正态总体参数检验 x t.test(x)One Sample t-test data: x t = 283.8161, df = 9, p-value

5、t.test(x)$conf.int #置信区间1 173.3076 176.0924 attr(,“conf.level“) 1 0.95两正态总体参数检验 x y t.test(x, y, var.equal=TRUE)Two Sample t-test data: x and y t = -0.8548, df = 13, p-value = 0.4081 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval:-0.7684249 0.332710

6、6 sample estimates: mean of x mean of y 19.92500 20.14286 原假设的显著性检验 x y t.test(x, y, paired=TRUE)Paired t-test data: x and y t = 1.8002, df = 7, p-value = 0.1149 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval:-0.3213757 2.3713757 sample estimates: m

7、ean of the differences 1.025 Better-than-advertised gas mileage某地区上市SUV车,广告宣传一加仑跑17米,消费者协会认为实际上没有达 到广告宣传。为了测试,讲SUV灌满油记录里程数。重复十次获得十个数据 。 mpg xbar s n c(xbar, s, n)1 14.870000 1.572012 10.000000 SE (xbar - 17)/SE1 -4.284732 pt(-4.285, df = 9, lower.tail = T)1 0.001017478 t.test(mpg,mu=17,alternative=“

8、less“)ANOVA方差分析(analysis of variance, 简写为ANOVA) 是生产和科学研究中分析试验数据的一种有效的统计 方法。引起观测值不同(波动)的原因主要有两类:一类是试验过程中随机因素的干扰或观测误差 所引起不可控制的的波动; 另一类则是由于试验中处理方式不同或试验条 件不同引起的可以控制的波动。 方差分析的主要工作就是将观测数据的总变异( 波动)按照变异的原因的不同分解为因子效应与试验误 差,并对其作出数量分析,比较各种原因在总变异中 所占的重要程度,以此作为进一步统计推断的依据.aov()的调用格式aov(formula, data=NULL, project

9、ions=FALSE,qr=TRUE, contrasts=NULL, .)formula是方差分析的公式, 在单因素方差分析中它表示为x A, data 是数据框, 其它参见在线帮助单因子方差分析以淀粉为原料生产葡萄的过程中, 残留许多糖蜜, 可作为生产 酱色的原料. 在生产酱色的过程之前应尽可能彻彻底底除杂, 以保证酱色质量.为此对除杂方法进行选择. 在实验中选用5种 不同的除杂方法, 每种方法做4次试验, 即重复4次, 结果见表1表1 不同除杂方法的除杂量 除杂方法Ai 除杂量Xij 均量Xi A1 25.6 22.2 28.0 29.8 26.4 A2 24.4 30.0 29.0 2

10、7.5 27.7 A3 25.0 27.7 23.0 32.2 27.0 A4 28.8 28.0 31.5 25.9 28.6 A5 20.6 21.2 22.0 21.2 21.3 X A miscellany aov.mis summary(aov.mis)输出结果 Df Sum Sq Mean Sq F value Pr(F) A 4 131.957 32.989 4.3061 0.01618 * Residuals 15 114.915 7.661 - Signif. codes: 0 * 0.001 * 0.01 * 0.05 . 0.1 1 说明: 上述结果中, Df表示自由度;

11、 sum Sq表示 平方和; Mean Sq表示均方和; F value表示F检验统计量的值, 即F比; Pr(F)表 示检验的p值; A就是因素A; Residuals为残差.可以看出, F=4.3061 F0.05(5-1,20-5)=3.06, 或者 p=0.01618 plot(miscellany$Xmiscellany $A) 得到图8.1. 从图形上也可以 看出, 5种除杂方法产生的除 杂量有显著差异, 特别 第5种与前面的4种, 而方法1 与3, 方法2与4的差异不明显.同时置信区间: Tukey法若经前面的F检验, H0 : 1=r被拒绝了, 则因子A 的r个水平的效应不全相

12、等, 这时我们希望对效应之差i j pi jq作出置信区间, 由此了解哪一些效应不相等. 这里仅 介绍一种基于学生化极差分布的TUKEY 方法. 这是 J.W.Tukey(1952)提出的一种多重比较方法, 是以试验错 误率为标准的, 又称真正显著差(honesty significient difference, HSD)法.在R软件中, 函数qtukey( )用于计算q分位数, 函数 TukeyHSD( )用于计算同时置信区间, 其调用格式为说明: x为方差分析的对象, which是给出需要计算比较区间的因子向量, ordered是逻辑值, 如果为“true“, 则因子的水平先递增排序,

13、从而使得因子间差异均以正值出现. conf.level是置信水平.TukeyHSD(x, which, ordered=FALSE, conf.level=0.95.)使用方法 TukeyHSD(aov(XA, sales) 例:某商店以各自的销售方式卖出新型手表, 连续四天手表 的销售量如表8.3所示, 试考察销售方式之间是否有显著 差异. 销售方式与销售量数据表 销售方式销售量数据 A1 23 19 21 13 A2 24 25 28 27 A3 20 18 19 15 A4 22 25 26 23 A5 24 23 26 27 sales summary(aov(XA, sales) 得

14、 Df Sum Sq Mean Sq F value Pr(F) A 4 212.800 53.200 7.98 0.001178 * Residuals 15 100.000 6.667 - Signif. codes: 0 * 0.001 * 0.01 * 0.05 . 0. #可见不同的销售方式有差异.最后再求均值之差的同时置信 区间. R命令为 TukeyHSD(aov(XA, sales)运行结果为Tukey multiple comparisons of means 95% family-wise confidence level Fit: aov(formula = X A, d

15、ata = sales) $A diff lwr upr p adj 2-1 7 1.362247 12.637753 0.0120117 3-1 -1 -6.637753 4.637753 0.9805632 4-1 5 -0.637753 10.637753 0.0944731 5-1 6 0.362247 11.637753 0.0344328 3-2 -8 -13.637753 -2.362247 0.0041527 4-2 -2 -7.637753 3.637753 0.8062057 5-2 -1 -6.637753 4.637753 0.9805632 4-3 6 0.362247 11.637753 0.0344328 5-3 7 1.3

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 中学教育 > 教学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号