R语言实验指导书02

上传人:碎****木 文档编号:220861422 上传时间:2021-12-09 格式:DOCX 页数:9 大小:37.82KB
返回 下载 相关 举报
R语言实验指导书02_第1页
第1页 / 共9页
R语言实验指导书02_第2页
第2页 / 共9页
R语言实验指导书02_第3页
第3页 / 共9页
亲,该文档总共9页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《R语言实验指导书02》由会员分享,可在线阅读,更多相关《R语言实验指导书02(9页珍藏版)》请在金锄头文库上搜索。

1、R 语言试验指导书二试验三 创立和使用 R 语言数据集一、试验目的:1. 了解 R 语言中的数据构造。2. 娴熟把握他们的创立方法,和函数中一些参数的使用。3. 对创立的数据构造进展,排序、查找、删除等简洁的操作。二、试验内容:1. 向量的创立及因子的创立和查看有一份来自澳大利亚全部州和行政区的 20 个税务会计师的信息样本 1以 及他们各自所在地的州名。州名为:tas, sa, qld, nsw, nsw, nt, wa, wa, qld, vic, nsw, vic, qld, qld, sa, tas, sa, nt, wa, vic。1) 将这些州名以字符串的形式保存在 state 当

2、中。2) 创立一个为这个向量创立一个因子 statef。3) 使用 levels 函数查看因子的水平。2. 矩阵与数组。i.创立一个 4*5 的数组如图,创立一个索引矩阵如图,用这个索引矩阵访问数组,观看结果。3. 将之前的 state,数组,矩阵合在一起创立一个长度为 3 的列表。4. 创立一个数据框如图。5. 将这个数据框依据 mpg 列进展排序。6. 访问数据框中 drat 列值为 3.90 的数据。三、试验要求要求同学娴熟把握向量、矩阵、数据框、列表、因子的创立和使用。试验四 数据的导入导出一、试验目的1. 娴熟把握从一些包中读取数据。2. 娴熟把握 csv 文件的导入。3. 创立一个

3、数据框,并导出为 csv 格式。二、试验内容1. 创立一个 csv 文件内容自定,并用 readtable 函数导入该文件。2. 查看 R 语言自带的数据集 airquality纽约 1973 年 5-9 月每日空气质量。3. 列出 airquality 的前十列,并将这前十列保存到air 中。4. 任选三个列,查看 airquality 中列的对象类型。5. 使用 names 查看 airquality 数据集中各列的名称6. 将 air 这个数据框导出为csv 格式文件。write.table (x, file =“, sep=“, row.names =TRUE, col.names =

4、TRUE, quote =TRUE) 三、试验要求要求同学把握从包中读取数据,导入 csv 文件的数据,并学会将文件导出。试验五 R 语言数据的清洗一、试验目的1. 查看数据集的缺失值,并学会对缺失值进展处理。2. 对特别变量重新赋值。3. 将某一列的字符型转化为日期型。1. 有一个数据框代码如下,使用 summary 函数查看,那一列含有缺失值, 有几个。并查看 wind 列的最大值。Ozone - c(41, 36, 12, 18, NA, 28)Solar.R - c(190, 118, 149, 313, NA, NA)wind - c(7.4, 8.0, 12.6, 11.5, 14

5、.3, 14.9)Temp - c(67, 82, 74, 62, 86, 66)date - c(“1997/05/01“,“1997/05/02“,“1997/05/03“,“1997/05/04“, “1997/05/05“,“1997/05/06“)air - data.frame(date,Ozone,Solar.R,wind,Temp, stringsAsFacto rs = FALSE)2. 使用 class函数查看 date 的类型,并将其转化为date 型,格式为年/月/日。3. 使用 subset依据 Temp 列猎取 air 中 Temp 大于 60 小于 70 的数据。

6、4. 将 air 中含有缺失值的列去掉。5. 找出 Temp 中大于 85 的值将其设置为缺失值。6. 创立一个数据框 air1 包含两个列 q1,q2。用 cbind 函数添加到 air 中。7. 使用 names 函数查看 air 的列名,并依据列自己创立一个数据框。使用rbind 函数添加到 air 中4. 利用 subset猎取子集。二、试验内容三、试验要求要求同学会用 subset 猎取子集,学会对缺失值进展一些简洁的处理和对一些特别值的查找和修改。试验六 高级数据治理一、试验目的1. 学会简洁的数值和字符处理函数。2. 学会自己编写一个函数。二、试验内容1. 使用下面代码创立并查看

7、 roster 数据集。Student - c(“John Davis“, “Angela Williams“, “Bullwinkle Moose“, “David Jones“, “Janice Markhammer“, “Cheryl Cushing“,“Reuven Ytzrhak“, “Greg Knox“, “Joel England“, “Mary Rayburn“)Math -c(502, 600, 412,358, 495, 512, 410,625, 573, 522)Science- c(95, 99, 80,82, 75, 85, 80, 95,89, 86)Engli

8、sh- c(25, 22, 18,15, 20, 28, 15, 30,27, 18)roster - data.frame(Student, Math, Science, English, stringsAsFactors=FALSE)2. 使用 length 函数查看 Student 列的长度。3. 计算该班级数学的平均成果,最高成果。4. 将成果单依据姓和名进展排序,将同学的各科考试成果组合为单一的成果衡量指标、基于相对名次前 20%,下 20%,等等给出从 A 到 F 的评分。1) 使用 scale()将 Math,Science,English,中心化标准化。3)4)使用 quant

9、ile 函数按 20%,40%,60%,80%,求分位数。使用变量重命名的方法将 grade 列分为 A、B、C、D、F 几个等级。5) 使用 strsplit 函数将 Student 列的名字分割,存到 name 中。6) 创立一个函数 x1,功能为实现返回值为传入参数的第一个值。7) 使用 sapply 函数将 name 中的 firstname 提取出来。“sap plydata,function”同理即可提取出 lastname。8) 将 lastname 和 firstname 与 roster 合并,同时去掉 roster的第一列。9) 将成果单用姓和名进展排序,将 roster

10、显示。2) 通过函数 mean()来计算各行的均值以获得综合得分,并使用函数cbind()将其添加到 roster 中三、试验要求要求同学学会一些简洁的数值和字符处理函数。学会如何自己创立一个函数。和对一些简洁问题的处理。试验七 根本统计分析试验一、试验目的1. 学会使用 summary 函数来计算统计量。2. 使用 table 函数生成一维、二维、多维列联表。3. 学会用 R 实现卡方独立性检验。4. 学会用 R 进展相关性的度量。5. 学会用 R 进展 Pearson、Spearman 和 Kendall 相关。6. 学会用 R 进展相关性的显著性检验。7. 学会用 R 进展组间差异的非参

11、数检验。二、试验内容1. 描述性统计分析1) 对 R 自带的数据集 rock48 块石头的形态数据使用 summary 函数、pastecs 包中的 stats.desc 函数计算描述性统计量。2) 分别使用aggregate 和doby 中的summaryBy 对sleep 数据集的group列分组猎取 extra 列的平均值。2. 频数表和列联表1) 加载 vcd 包中的 Arthritis 数据集使用 table 生成 Sex 列的频数统计表。2) 分别使用 table、xtabs 对 Arthritis 的 Treatment行、Imporved列列生成二维列联表。并使用addmarg

12、ins 为这些表格添加边际和。3) 使用 xtabs 生成三维列联表依据 Treatment行、sex列、Improved 三个因子。4) 使用 chisq.testhan()函数对二维表的行和列进展卡方独立性检验, 并观看他们是否独立。5) 使用 vcd 包中的 assocstats()函数计算二维列联表的 phi 系数、列联系数和 Cramers V 系数。3. 相关1) Pearson、Spearman 和 Kendall 相关a) 猎取 state.x77 的前 10 行储存到 states 中。b) 对 states 数据集计算方差和协方差、Pearson 积差相关系数、Spearman 等级相关系数。c) 使用 psych 包中的 corr.test 对 states 数据集 Illiteracy、Murder 计算相关显著性检验4. T 检验1) 比较南方group 1和非南 方group 0各州的监禁概率使用MASS 包中的 t.test 独立样本的 t 检验,So 为是否为南方,Prob 表示监禁率,数据集为 UScrime。三、 试验要求通过本次试验让同学学会根本统计分析用到的频数表、列联表、相关、t 检验、组间差异的分参数检验。让同学可以把握一些根本的统计分析的概念和如何用 R 来进展统计分析。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 教育/培训

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号