R语言实验指导书

上传人:人*** 文档编号:470441852 上传时间:2022-10-06 格式:DOC 页数:10 大小:388KB
返回 下载 相关 举报
R语言实验指导书_第1页
第1页 / 共10页
R语言实验指导书_第2页
第2页 / 共10页
R语言实验指导书_第3页
第3页 / 共10页
R语言实验指导书_第4页
第4页 / 共10页
R语言实验指导书_第5页
第5页 / 共10页
点击查看更多>>
资源描述

《R语言实验指导书》由会员分享,可在线阅读,更多相关《R语言实验指导书(10页珍藏版)》请在金锄头文库上搜索。

1、.R 语言实验指导书(二)2016年10月27日1/10.实验三创建和使用R 语言数据集一、实验目的 :1. 了解 R 语言中的数据结构。2. 熟练掌握他们的创建方法,和函数中一些参数的使用。3. 对创建的数据结构进行,排序、查找、删除等简单的操作。二、实验内容 :1. 向量的创建及因子的创建和查看有一份来自澳大利亚所有州和行政区的 20 个税务会计师的信息样本 1 以 及他们各自所在地的州名。州名为: tas, sa, qld, nsw, nsw, nt, wa,wa, qld, vic, nsw, vic, qld, qld, sa, tas, sa, nt, wa, vic。1)将这些州

2、名以字符串的形式保存在state当中。2)创建一个为这个向量创建一个因子statef。3)使用 levels函数查看因子的水平。2. 矩阵与数组。2/10.i. 创建一个 4*5 的数组如图,创建一个索引矩阵如图,用这个索引矩阵访问数组,观察结果。3.将之前的 state ,数组,矩阵合在一起创建一个长度为3 的列表。3/10.4. 创建一个数据框如图。5. 将这个数据框按照 mpg列进行排序。6.访问数据框中 drat 列值为 3.90 的数据。4/10.三、实验要求要求学生熟练掌握向量、矩阵、数据框、列表、因子的创建和使用。5/10.实验四数据的导入导出一、实验目的1. 熟练掌握从一些包中

3、读取数据。2. 熟练掌握 csv 文件的导入。3. 创建一个数据框,并导出为 csv 格式。二、 实验内容1. 创建一个 csv 文件(内容自定),并用 readtable 函数导入该文件。2.查看 R 语言自带的数据集 airquality(纽约 1973 年 5-9 月每日空气质量)。3.列出 airquality的前十列,并将这前十列保存到air 中。4.查看 airquality中列的对象类型。5. 查看 airquality 数据集中各成分的名称6. 将 air 这个数据框导出为 csv 格式文件。(write.table (x, file =, sep=, row.names =T

4、RUE, col.names =TRUE, quote =TRUE))三、实验要求要求学生掌握从包中读取数据,导入csv 文件的数据,并学会将文件导出。6/10.实验五 R 语言数据的清洗一、实验目的1. 查看数据集的缺失值,并学会对缺失值进行处理。2. 对异常变量重新赋值。3. 将某一列的字符型转化为日期型。4. 利用 subset ()获取子集。二、实验内容1. 有一个数据框代码如下,使用 summary函数查看,那一列含有缺失值,有几个。并查看 wind 列的最大值。Ozone - c(41, 36, 12, 18, NA, 28)Solar.R - c(190, 118, 149, 3

5、13, NA, NA)wind - c(7.4, 8.0, 12.6, 11.5, 14.3, 14.9)Temp - c(67, 82, 74, 62, 86, 66)date - c(1997/05/01,1997/05/02,1997/05/03,1997/05/04, 1997/05/05,1997/05/06)air - data.frame(date,Ozone,Solar.R,wind,Temp, stringsAsFacto rs = FALSE)2. 使用 class ()函数查看 date 函数的类型,并将其转化为 data 型,格式为月 / 日/ 年。3. 使用 subs

6、et ()根据 Temp列获取 air 中 Temp大于 60 小于 70 的数据。4. 将 air 中含有缺失值的列去掉。5. 找出 Temp中大于 85 的值将其设置为缺失值。6. 创建一个 air1 包含两个列 q1,q2。用 cbind 函数添加到 air 中。7. 使用 names函数查看 air 的列名,并根据列自己创建一个数据框。 使用 rbind 函数添加到 air 中三、实验要求要求学生会用 subset 获取子集,学会对缺失值进行一些简单的处理和对一些异常值的查找和修改。7/10.实验六高级数据管理一、实验目的1. 学会简单的数值和字符处理函数。2. 学会自己编写一个函数。

7、二、实验内容1. 使用下面代码创建 roster 数据集。Student - c(John Davis, Angela Williams, Bullwinkle Moose, David Jones, Janice Markhammer, Cheryl Cushing, Reuven Ytzrhak, Greg Knox, Joel England, Mary Rayburn)Math - c(502, 600, 412, 358, 495, 512, 410, 625, 573, 522) Science - c(95, 99, 80, 82, 75, 85, 80, 95, 89, 86)

8、English - c(25, 22, 18, 15, 20, 28, 15, 30, 27, 18) roster - data.frame(Student, Math, Science, English,stringsAsFactors=FALSE)2. 使用 length 函数查看 Student 的长度。3. 计算该班级数学的平均成绩,最高成绩。4. 将成绩单按照姓和名进行排序,将学生的各科考试成绩组合为单一的成绩衡量指标、基于相对名次(前 20%,下 20%,等等)给出从 A 到 F 的评分。1) 使用 quantile 函数按 20%,40%, 60%,80%,求分位数。2) 使用

9、变量重命名的方法将 grade 列分为 A、B、 C、 D、 F 几个等级。3) 使用 strsplit函数将 Student 列的名字分割,存到 name中。4) 创建一个函数 x1,功能为实现返回值为传入参数的第一个值。5) 使用 sapply 函数将 name中的 firstname 提取出来。(“ sapply (data ,function )”)同理即可提取出 lastname 。6)将 lastname 和 firstname 与 roster合并,同时去掉 roster的第一列。7)将成绩单用姓和名进行排序。三、实验要求要求学生学会一些简单的数值和字符处理函数。学会如何自己创建

10、一个函数。和对一些简单问题的处理。8/10.实验七基本统计分析实验一、实验目的1. 学会使用 summary函数和 Hmisc 包中的 describe 函数来计算统计量。2. 使用 table 函数生成一维、二维、多维列联表。3. 学会用 R 实现卡方独立性检验。4. 学会用 R 进行相关性的度量。5. 学会用 R 进行 Pearson 、Spearman和 Kendall 相关。6. 学会用 R 进行相关性的显著性检验。7. 学会用 R 进行组间差异的非参数检验。二、实验内容1. 描述性统计分析1) 对 R自带的数据集 rock( 48 块石头的形态数据) 使用 summary函数、Himisc 包中的 describe 函数、 pastecs 包中的 stats.desc 函数计算描述性统计量。2) 使用 aggregate 、doby 中的 summaryBy对 sleep 数据集的 group 列

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 活动策划

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号