R语言笔记常用函数统计分析数据类型数据操作帮助安装程序包R绘图

上传人:壹****1 文档编号:488174668 上传时间:2024-01-29 格式:DOC 页数:14 大小:28.07KB
返回 下载 相关 举报
R语言笔记常用函数统计分析数据类型数据操作帮助安装程序包R绘图_第1页
第1页 / 共14页
R语言笔记常用函数统计分析数据类型数据操作帮助安装程序包R绘图_第2页
第2页 / 共14页
R语言笔记常用函数统计分析数据类型数据操作帮助安装程序包R绘图_第3页
第3页 / 共14页
R语言笔记常用函数统计分析数据类型数据操作帮助安装程序包R绘图_第4页
第4页 / 共14页
R语言笔记常用函数统计分析数据类型数据操作帮助安装程序包R绘图_第5页
第5页 / 共14页
点击查看更多>>
资源描述

《R语言笔记常用函数统计分析数据类型数据操作帮助安装程序包R绘图》由会员分享,可在线阅读,更多相关《R语言笔记常用函数统计分析数据类型数据操作帮助安装程序包R绘图(14页珍藏版)》请在金锄头文库上搜索。

1、R语言学习笔记常用函数1、聚类 常用的包:fpc,cluster,pvclust,mclust 基于划分的方法: kmeans, pam, pamk, clara 基于层次的方法: hclust, pvclust, agnes, diana 基于模型的方法: mclust 基于密度的方法: dbscan 基于画图的方法: plotcluster, plot.hclust 基于验证的方法: cluster.stats2、分类 常用的包 rpart,party,randomForest,rpartOrdinal,tree,marginTree,maptree,survival 决策树: rpart

2、, ctree 随机森林: cforest, randomForest 回归, Logistic回归, Poisson回归: glm, predict, residuals 生存分析: survfit, survdiff, coxph3、关联规则与频繁项集 常用的包 arules:支持挖掘频繁项集,最大频繁项集,频繁闭项目集和关联规则 DRM:回归和分类数据的重复关联模型 APRIORI算法,广度RST算法:apriori, drm ECLAT算法:采用等价类,RST深度搜索和集合的交集:eclat4、序列模式 常用的包:arulesSequences SPADE算法:cSPADE5、时间序列

3、 常用的包:timsac 时间序列构建函数:ts 成分分解: decomp, decompose, stl, tsr6、统计 常用的包: Base R, nlme 方差分析: aov, anova 密度分析: density 假设检验: t.test, prop.test, anova, aov 线性混合模型:lme 主成分分析和因子分析:princomp7、图表 条形图: barplot 饼图: pie 散点图: dotchart 直方图: hist 密度图: densityplot 蜡烛图, 箱形图 boxplot QQ (quantile-quantile) 图: qqnorm, qqp

4、lot, qqline Bi-variate plot: coplot 树: rpart Parallel coordinates: parallel, paracoor, parcoord 热图, contour: contour, filled.contour 其他图: stripplot, sunflowerplot, interaction.plot, matplot, fourfoldplot,assocplot, mosaicplot 保存的图表格式: pdf, postscript, win.metafile, jpeg, bmp, png8、数据操作 缺失值:na.omit 变

5、量标准化:scale 变量转置:t 抽样:sample 堆栈:stack, unstack 其他:aggregate, merge, reshape9、与数据挖掘软件Weka做接口 RWeka: 通过这个接口,可以在R中使用Weka的所有算法。安装程序包1 用函数install.packages()2 安装本地zip包路径:Packagesinstall packages from local files查看安装的包installed.packages()检查更新old.packages()更新update.packages()帮助 查看帮助文档?install.package()help(i

6、nstall.package) 函数帮助?functionhelp(function) html帮助Help.start()帮助Html帮助 关键词搜索RSiteSearch(word)数据类型向量 创建向量c( ),创建向量length( ), 向量长度删除向量vector-n,即删除第n个向量mode( ), 向量类型rbind( ), 向量元素都作为一行rowcbind( ) ,向量元素都作为一列col*创建向量序列seq(from, to, by = (to - from)/(length.out - 1),length.),length是总长度(个数),因此by就是间隔rep(mod

7、e,time) 产生mode 重复time次的向量lettersn:m 产生字符向量rnorm(n,mean=.,sd=.) 随机序列 取子集 值范围限制如:V(xm|xk,c(col1,col2,.),用attach(data)可以简化这一步操作,即在attach之后可以直接访问列(所有),datadata$colk,用detach可以解除。另一种控制条件查询的方式即通过subset函数取子集Subset(data,colNamek),此时colName是数据框的一个列属性 筛选which()函数进行筛选,which中是筛选条件,如:is.na(). 编辑数据edit(data) 查看数据框

8、属性查看数据维度:dim(data) 返回:行,列单独查看行数列数:nrow(data)、ncol(data)查看列名:names(data),同时修改列名:names(data)=c(,.)查看数据结构:str(data)查看属性(列名$names、类$class、列$row.names),attributes(data) 添加一列data$addCol=c(,.),添加列的元素应与原来的行数相等merge(dataframeA,dataframeB,by=c(,.),横向合并(添加多列)数据操作数据处理 变量重命名,调用fix(data),出现一个交互式工具;或者rename(datafr

9、ame,c(oldname=newname,.) 类型转换:is.datatype()判断,as.datatype()转换 字符串处理:nchar(),计算字符数量substr(x,start,stop)grep(pattern,v),返回向量坐标sub(pattern,replacement,x),替换strsplit(x,split)分割paste(x,c(),sep=),在x后面(向量个数)连接c()向量,以sep分隔cat(str1,str2,.),连接字符串toupper()tolower()读取文件数据data=read.table(位置, header=T)读取文本文件data=read.csv(位置,header=T)读取csv文件在数据导入R语言后,会以数据框(dataframe)的形式储存。dataframe是一种R的数据格式,可以将它想象成类似统计表格,每一行都代表一个样本点,而每一列则代表了样本的不同属性或特征。初学者需要掌握的基本操作方法就是dataframe的编辑、抽取和运算。数据库操作1、配置数据元安装connector配置数据源(控制面板-管理工具-数据源)2、连接数据库odbcConnect(data_src,uid= ,pwd= )3、查询这个是一个通用类型的操作,即可以查询,又可以添加删除

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 幼儿/小学教育 > 小学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号