R语言初学者指南学习摘要

上传人:壹****1 文档编号:548473312 上传时间:2023-01-22 格式:DOC 页数:14 大小:88KB
返回 下载 相关 举报
R语言初学者指南学习摘要_第1页
第1页 / 共14页
R语言初学者指南学习摘要_第2页
第2页 / 共14页
R语言初学者指南学习摘要_第3页
第3页 / 共14页
R语言初学者指南学习摘要_第4页
第4页 / 共14页
R语言初学者指南学习摘要_第5页
第5页 / 共14页
点击查看更多>>
资源描述

《R语言初学者指南学习摘要》由会员分享,可在线阅读,更多相关《R语言初学者指南学习摘要(14页珍藏版)》请在金锄头文库上搜索。

1、精选优质文档-倾情为你奉上R语言初学者指南第一章 引言函数功能示例?访问帮助文件?boxplot#添加注释#Add your comments hereboxplot生成盒形图boxplot(y)boxplot(yfactor(x)log自然对数log(2)log10以10为底的对数log10(2)library载入包library(MASS)setwd设置工作目录setwd(“C:/AnyDirectory”)q关闭Rq()citation提供对R的引用citation()第二章 R中的数据输入录入数据,并把数据系统地转化为标量(单值)、向量、矩阵、数据框或列表。如何从Excel、ascii

2、文件、数据库和其他统计程序中载入数据。2.1 R中的第1步2.1.1 小型数据库中的数据录入 #符号“-”相当于“=” #变量名中不能出现“%,&,*,!,?,+,-,(),,#,”因为这些符号中的大部分都是运算符。#如果定义好了: SQ.wing1SQ.wing1或者把需要执行的命令放在圆括号内: (SQ.wing1Wingcrd Wingcrd 1如果需要查看Wingcrd前五个值,则需要 Wingcrd 1:5如果需要查看Wingcrd除了第二个值以外的其他值,则需要 Wingcrd -2-负号表示删除了这个值R有很多的内置函数,最基本的有sum, mean, max, min, med

3、ian(中位数), var(方差)和sd(标准差)等。 sum(Wingcrd)或者存在一个新的变量中,S.win S.win输入其他三组数据:Tarsus = c(22.3,19.7,20.8,20.3,20.8,21.5,20.6,21.5)Head = c(31.2,30.4,30.6,30.3,30.3,30.8,32.5,NA)Wt = c(9.5,13.8,14.8,15.2,15.5,15.6,15.7)R中的变量名最好使用大写字母开头,这样可以避免将它和一些内部函数名混淆。注意,数据里有一只鸟的头的尺寸是没有测量的,我们用NA表示,这时我们调用内部函数计算就会出现错误。在向量中

4、有一个缺失值的话,默认选项“na.rm=FALSE”(rm表示移除remove),将会导致R函数返回NA,为了避免此种情况,我们用“na.rm=TRUE”, sum(Head, na.rm=TRUE)我们将接着学习如何连接这4个变量中的数据,(1)c,cbind和rbind函数;(2)matrix和vector函数;(3)数据框;(4)列表。2.1.3 使用c,cbind和rbind结合变量Wingcrd翼弦, Tarsus踝骨, Head头, Wt体重,四组数据,每组8个值c函数可以用来连接这些数据,同时连接这些数据中的8个值: BirdData Id Id Id a rep(a, each

5、=8)接着生成一个VarNames的新变量: Varnames = c(Wingcrd, Tarsus, Head, Wt)VarnamesId2= rep(Varnames, each=8)Id2 c函数是我们结合数据或者变量的一种选择,另一种选择是cbind函数,它的作用是将所结合的变量以列的形式输出。如: Z Z当我们有特殊需求时:1、 访问Z的第一列: Z ,1 或者 Z1:8, 12、访问Z的第二行: Z2, 或者 Z2,1:4 dim(Z) #表示Z的行数和列数2.1.4 使用vector函数结合数据vector函数的作用与c函数类似,它可以用来代替c函数。2.2 数据的载入2.2

6、.1 Excel中的数据载入两种方法:第一种(常用):1、 将EXCEL中的数据准备好;2、 将其提取到制表符分隔的ascii文件中;3、 关闭EXCEL;4、 使用read.table函数将数据载入到R中。第二种:是一个专门的R程序包,RODBC,它可以访问EXCEL中选定的行和列。2.2.1.1 EXCEL中的数据准备样本变量形式:列表示各种变量,如性别、年龄、成绩等,行表示各种样本、观察值、案例、对象或其他称之为样本单元的东西。2.2.1.2 数据提取到制表符分隔的ascii文件步骤:在EXCEL中,“文件”“另存为”“保存类型”选择“文本文件(制表符分隔)”,将EXCEL中的数据提取到

7、一个制表符分隔的ascii文件中,注意存储位置。(注意,此操作前,必须让EXCEL中的没有特殊的数据,也不可有空内容或者包含空格的名称,不然会出现NA)2.2.1.3 read.table函数的使用 Squid setwd(“C:UserswinnerDesktop学习札记”) #设置默认存储目录 Squid names(Squid)3.1.1 str函数 str命令告诉我们数据框中每个变量的属性 str (Squid )read.table和names和str函数结合在一起使用 3.1.2 函数中的数据参数 M1 Squid $ GSI还可以: Squid , 6 #第6列也就是变量GSI那

8、一列计算均值:两种方法都可以 但建议用第一种 mean ( Squid$GSI)3.1.4 attach函数用attach命令把Squid添加到R的搜索路径里,就可以直接输入变量而不加其他函数,就能看到该变量的值了。 attach (Squid) GSI boxplot(GSI) mean(GSI)attach虽然比较好,但是如果有两个具有相同变量名称的数据框,就会发生问题。1、 为了避免复制变量,不要输入attach(Squid)两次;2、 如果你使用attach命令,确保你使用唯一的变量名称,避免使用月份、位置等常见的名称;3、 如果你载入多个数据集,并且一次只处理一个数据集,考虑使用de

9、tach命令从R的搜索路径里移除一个数据框。如: detach (Squid)3.2 访问数据子集如果我只想处理某个位置的雌性数据,为了提取数据子集,我们需要知道性别是如何编码的,可以键入: Squid$Sex结果显示了变量Sex的所有值,可以用unique命令显示这个变量里有多少个唯一值: unique(Squid$Sex)出现1表示雌性,2表示雄性为了访问所有的雄性数据,使用: Se1 SquidM SquidM 上述命令也可以写为:Squid Squid若Location上的值有1、2、3、4这四个,我们想提取1、2、3的数据,我们可以使用符号|表示或,!=表示不等于。 Squid123 Squid123 Squid123 - SquidSquid$Location Squid123 =1 & Squid$Location Ord1 Squid Ord1, 3.3 使用相同的标识符组合两个数据集几个不同的数据集,但是每个数据集里都有1个或几个相同的变量,就可以将这几个数据集组合起来。merge函数 setwd( “C:/RBOOK/”)Sql Sql SquidMerged SquidMerged merge命令采用两个数据框Sq1和S

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 教学/培训

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号