153分钟学会r资料

上传人:w****i 文档编号:99356164 上传时间:2019-09-18 格式:PDF 页数:41 大小:742.71KB
返回 下载 相关 举报
153分钟学会r资料_第1页
第1页 / 共41页
153分钟学会r资料_第2页
第2页 / 共41页
153分钟学会r资料_第3页
第3页 / 共41页
153分钟学会r资料_第4页
第4页 / 共41页
153分钟学会r资料_第5页
第5页 / 共41页
点击查看更多>>
资源描述

《153分钟学会r资料》由会员分享,可在线阅读,更多相关《153分钟学会r资料(41页珍藏版)》请在金锄头文库上搜索。

1、R常见问题解答 R frequently asked questions http:/www.r-project.org 153分钟学会R This document is generated from LATEXsources compiled with ctex v0.7d in a Windows platform . The used packages are CJK、listings、graphicx and so on. 序: 这篇文档内容的来源多样,既有来自于R官方文档 (包括R intro,R data,R admin) ,也有来 自于互联网的contributed docum

2、ents;还有若干来自于Capital Of Statistics论坛的讨论问题。 本文档的目的是为具有一定统计(数学) 背景的R软件初学者提供一个快速认识R软件的平 台,如果你无此背景,可能会对其中的若干表达存在疑问。这篇文档重点不在统计方法上,因此所 列问题不可能详尽到统计学的每个知识点。 R是一个很庞大的体系,在CRAN的Task Views上可以清楚地看到贝叶斯推断、聚类分析、 机器学习、 空间统计、 稳健统计等方法的介绍。 而这些方法又通过相应的R Packages扩展,可以说 学习R是一件没有尽头的事情。 如果你的英文阅读没问题,那么精读一本关于R的原版书籍也是一个不错的选择,但这

3、个开 头常常让人很头痛。希望这份37页的文档,对你认识、 学习R是个不错的帮助。 刘思喆1 June 25, 2008 致谢: abel,cran,rtist,Xie Yihui,zhangv . A前言 1. R是做什么的? R是一个有着统计分析功能及强大作图功能的软件系统, 是由奥克兰大学统计学系的Ross Ihaka和 Robert Gentleman共同创立。 由于R受Becker, Chambers Every object is S has a class. 31. data frame是什么? 6 data frame(数据框)可以理解是一个松散的数据集。它可以是由不同类型的列(

4、数字、 因子、 字符 等)组成的类矩阵(matrix-like) 。 32.如何得到函数的代码? 通常情况你只需要在R平台下写出你需要查看的函数名, 回车即可。比如: dist 但有时候这个函数可能是一个类函数(Generic Function) ,上面的方法就需要稍稍改进一下:先使 用methods()函数来查看这个类函数的列表, 找到具体需要的函数4, 写出来, 回车问题解决。 1summary#I ti sag e n e r i cf u n c i t o n methods(summary)#l i s to ft h eS3m e t h o d s 3summary.lm#ma

5、ybeyouwantt oknowt h el i n e a rm o d e l s ssummary 如果要究根问底, 可以去下载源代码压缩包(*.tar.gz, 比如R-2.5.1.tar.gz) 33.我想查看一个矩阵的前(后)几行, 怎么办? 可以使用head()或tail()函数。 1head(CO2) 这两个函数是类函数,它们可以应用于向量、矩阵、数据框、表格或函数。如果只想随机看看对象 中的一些内容, 还可以使用car包中的some函数。 34.在R中公式的符号都是什么意义? 拿常见的lm,glm模型来说,y model是一种特定的格式,表示以y为响应变量,模型为model。

6、 其中model中的变量由+来连接,或者由:来表示变量间的“交互作用”。除了+和:,我们使用 来表示 0a + b + a : b0。(a + b + c)2 表示(a + b + c) (a + b + c), 即主因素a、b、c和各个因素的 交互作用。表示去掉之意。(a + b + c)2 a : b表示 0a + b + c + b : c + a : c0。在公式表达中除了 变量和因子名外, 运算符号也是可以存在的。如 0log(y) a + log(x)0 是合法的。 符号.在update函数中有特殊的意义, 它表示“已经存在”之意。 1fm 1 sample(x, replace

7、= T)解靴带法 sample(x,n)非放回的从x中抽取n项 sample(x,n, replace = T)放回的从x中抽取n项 sample(x,n, replace = T ,prob = p)以概率p, 放回的从x中抽取n项 7当然同样概要统计的表现形式不一样 13 n quantile (c (1 ,4 ,6 ,17 ,50 ,51 ,70 ,100) 0%25%50%75%100% 51.005.5033.5055.75100.00 我们看下他们的的定义:分位数是指有百分之多少的数据小于的数值(summary()函数, 即使用分 位数概念) , 我们可以看到 1 4, 3 4 分

8、位数的定义: 1 + 1 4(length(x) 1), 1 4分位数 1 + 3 4(length(x) 1), 3 4分位数 而 fi venum()函数是完全利用中位数概念。 E数学运算 65.如何做出曲线积分? R语言使用integrate函数来得到积分结果, 如 14 1integrate (dnorm ,1.96,1.96) integrate (dnorm , Inf ,Inf ) 3#as l o w l y c o n v e r g e n ti n t e g r a l integrand =$ 为开头,$为结尾的段落里面。开头部分 有两个常用的参数:echo和fig,

9、使用逻辑值分别表示是否将 R 代码输入 作为 LaTeX 文本输出;是否在 LaTeX 文档中绘制图形。 这篇文档只需要在 R 中编译一遍,即可形成LaTeX需要的输出(文件)。 下面是一个配对 t 检验的一个例子: = choose(49,6) 美国威力球(类似于福彩双色球)的理论组合数等于Sexprchoose(49,6)。 通过这种方法处理有大量计算的文档,比 word 不知方便多少倍。 36 R 代码中可以随意写注释,但这些注释默认不会被输出。如果要求输出注释, 抱歉,现在还没有更好的解决办法。 使用 Sweave 还可以将 R 生成的图形加入到 LaTeX 文档中,而不必事先 做出

10、LaTeX 需要的图形文件footnoteSweave会自动生成 ps 和 pdf 图形。 下图是根据Titanic号海难中人员的经济状况、性别、年龄和是否存活四 个变量绘制的马赛克图: = require(graphics) mosaicplot(Titanic, main = “Survival on the Titanic“) enddocument Copyright c ?2008 R and all the Contributors to R FAQ. All rights reserved. R 以及 R FAQ 的作者拥有版权 c ?2008。保留所有权利。 Permissio

11、n is granted to copy, distribute and/or modify this document under the terms of the GNU Free Documentation License, Version 1.2 or any later version published by the Free Software Foundation; with the Invariant Sections being Contributors, no Front-Cover Texts, and no Back-Cover Texts. 你可以拷贝、 发布或者修改

12、这份文档, 但必须遵守 自由软件组织 颁布的 GNU 自由文档许可证 1.2 或者以后版本 的条款。Invariant Sections 包括 Contributors, 没有 Front-Cover Texts 和 Back-Cover Texts。 37 索引 Symbols 9 18 .packages . 6 / . 9 %*% 15 .16, 30 . 12 A abline . 20 aggregate13 any11 aov30 aperm . 12 append 10 apply.12, 16, 25 as.Date18 as.numeric.20 as.POSIXct18 a

13、xes . 21 axis21 B barplot 23 boxcox.33 bptest . 33 Breusch-Pagan.33 C cancor.33 capture.output8 car7, 33 casefold17 choose.16 citation.3 clipboard . 8 cluster.29 cm.colors 23 col.23 col2rgb 23 colMeans 16 colors23 combn.16 Commander . 34 complex . 15 confi nt.31 confi nt.glm 31 confi nt.nls . 31 con

14、tour25 crossprod15 cumsum12, 24 curve 24 cutree . 29 D D16 data 6 data frame 6, 12 demo . 3 detach5 dev.copy.24 dev.cur 22 dev.list 22 dev.off .22 dev.set 22 Devices22 diag . 15 diff time18 duplicated.12 durbin.watson . 32 dwtest.32 E edit.9 eigen 15 ESS . 35 eval10 F factanal29 factorial . 16 FALSE

15、 12 fi le.choose.9 fi lled.contour 25 fi vnum.14 fi x 9 format.18 G gc . 35 getAnywhere7 getwd.5 glm31 gray . 23 grep . 18 grey . 23 grid . 21 H hat,hatvalues 31 hclust . 29 head7 heat.colors.23 help 3 help.search3 I I.30 identical.11 if 12 image25 integer.15 38 integrate.14 iris 20 is.na.10 is.nume

16、ric . 13 J jarque.bera.test29 jpeg . 23 K kmeans28 ks.test.29 L latex9 latex.table 9 layout . 19 lda 33 legend . 20 letters . 23 Library . 5 library5 lines.24 list . 4 lm.31 lmtest . 33 loadings . 29 lower.tri . 16 ls.4 M mai19 mar . 19 matrix . 12, 16 memory.limit . 4 merge . 14 methods 7 N nchar18 ncv.test33 NULL . 12 O optimize.17 options . 4 outer 15 P Package.5 par . 19, 21, 25, 26 parplot 26 parse 10 paste4, 17 pch20 pdf 2

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号