R语言笔记常用函数统计分析数据类型数据操作帮助安装程序包R绘图

资源描述

《R语言笔记常用函数统计分析数据类型数据操作帮助安装程序包R绘图》由会员分享，可在线阅读，更多相关《R语言笔记常用函数统计分析数据类型数据操作帮助安装程序包R绘图（14页珍藏版）》请在金锄头文库上搜索。

1、R语言学习笔记常用函数1、聚类常用的包：fpc，cluster，pvclust，mclust 基于划分的方法: kmeans, pam, pamk, clara 基于层次的方法: hclust, pvclust, agnes, diana 基于模型的方法: mclust 基于密度的方法: dbscan 基于画图的方法: plotcluster, plot.hclust 基于验证的方法: cluster.stats2、分类常用的包 rpart，party，randomForest，rpartOrdinal，tree，marginTree，maptree，survival 决策树: rpart

2、, ctree 随机森林: cforest, randomForest 回归, Logistic回归, Poisson回归: glm, predict, residuals 生存分析: survfit, survdiff, coxph3、关联规则与频繁项集常用的包 arules：支持挖掘频繁项集，最大频繁项集，频繁闭项目集和关联规则 DRM：回归和分类数据的重复关联模型 APRIORI算法，广度RST算法：apriori, drm ECLAT算法：采用等价类，RST深度搜索和集合的交集：eclat4、序列模式常用的包：arulesSequences SPADE算法：cSPADE5、时间序列

3、常用的包：timsac 时间序列构建函数：ts 成分分解: decomp, decompose, stl, tsr6、统计常用的包： Base R, nlme 方差分析: aov, anova 密度分析: density 假设检验: t.test, prop.test, anova, aov 线性混合模型：lme 主成分分析和因子分析：princomp7、图表条形图: barplot 饼图: pie 散点图: dotchart 直方图: hist 密度图: densityplot 蜡烛图, 箱形图 boxplot QQ (quantile-quantile) 图: qqnorm, qqp

4、lot, qqline Bi-variate plot: coplot 树: rpart Parallel coordinates: parallel, paracoor, parcoord 热图, contour: contour, filled.contour 其他图: stripplot, sunflowerplot, interaction.plot, matplot, fourfoldplot,assocplot, mosaicplot 保存的图表格式: pdf, postscript, win.metafile, jpeg, bmp, png8、数据操作缺失值：na.omit 变

5、量标准化：scale 变量转置：t 抽样：sample 堆栈：stack, unstack 其他：aggregate, merge, reshape9、与数据挖掘软件Weka做接口 RWeka: 通过这个接口，可以在R中使用Weka的所有算法。安装程序包1 用函数install.packages()2 安装本地zip包路径：Packagesinstall packages from local files查看安装的包installed.packages()检查更新old.packages()更新update.packages()帮助查看帮助文档?install.package()help(i

6、nstall.package) 函数帮助?functionhelp(function) html帮助Help.start()帮助Html帮助关键词搜索RSiteSearch(word)数据类型向量创建向量c( ),创建向量length( ), 向量长度删除向量vector-n，即删除第n个向量mode( ), 向量类型rbind( ), 向量元素都作为一行rowcbind( ) ，向量元素都作为一列col*创建向量序列seq(from, to, by = (to - from)/(length.out - 1),length.),length是总长度（个数），因此by就是间隔rep(mod

7、e,time) 产生mode 重复time次的向量lettersn:m 产生字符向量rnorm(n,mean=.,sd=.) 随机序列取子集值范围限制如：V(xm|xk,c(col1,col2,.)，用attach(data)可以简化这一步操作，即在attach之后可以直接访问列（所有），datadata$colk，用detach可以解除。另一种控制条件查询的方式即通过subset函数取子集Subset(data,colNamek)，此时colName是数据框的一个列属性筛选which()函数进行筛选，which中是筛选条件，如：is.na(). 编辑数据edit(data) 查看数据框

8、属性查看数据维度：dim(data) 返回：行，列单独查看行数列数：nrow(data)、ncol(data)查看列名：names(data)，同时修改列名：names(data)=c(,.)查看数据结构：str(data)查看属性（列名$names、类$class、列$row.names），attributes(data) 添加一列data$addCol=c(,.)，添加列的元素应与原来的行数相等merge(dataframeA,dataframeB,by=c(,.)，横向合并（添加多列）数据操作数据处理变量重命名，调用fix(data)，出现一个交互式工具；或者rename(datafr

9、ame,c(oldname=newname,.) 类型转换：is.datatype()判断，as.datatype()转换字符串处理：nchar()，计算字符数量substr(x,start,stop)grep(pattern,v)，返回向量坐标sub(pattern,replacement,x)，替换strsplit(x,split)分割paste(x,c(),sep=)，在x后面（向量个数）连接c()向量，以sep分隔cat(str1,str2,.)，连接字符串toupper()tolower()读取文件数据data=read.table(位置, header=T)读取文本文件data=read.csv(位置,header=T)读取csv文件在数据导入R语言后，会以数据框(dataframe)的形式储存。dataframe是一种R的数据格式，可以将它想象成类似统计表格，每一行都代表一个样本点，而每一列则代表了样本的不同属性或特征。初学者需要掌握的基本操作方法就是dataframe的编辑、抽取和运算。数据库操作1、配置数据元安装connector配置数据源（控制面板-管理工具-数据源）2、连接数据库odbcConnect(data_src,uid= ,pwd= )3、查询这个是一个通用类型的操作，即可以查询，又可以添加删除

展开阅读全文

R语言笔记常用函数统计分析数据类型数据操作帮助安装程序包R绘图

最新文档