45分钟搞定R语言之数据库交互及统计绘图

上传人:d****y 文档编号:98095058 上传时间:2019-09-08 格式:PPTX 页数:47 大小:373.74KB
返回 下载 相关 举报
45分钟搞定R语言之数据库交互及统计绘图_第1页
第1页 / 共47页
45分钟搞定R语言之数据库交互及统计绘图_第2页
第2页 / 共47页
45分钟搞定R语言之数据库交互及统计绘图_第3页
第3页 / 共47页
45分钟搞定R语言之数据库交互及统计绘图_第4页
第4页 / 共47页
45分钟搞定R语言之数据库交互及统计绘图_第5页
第5页 / 共47页
点击查看更多>>
资源描述

《45分钟搞定R语言之数据库交互及统计绘图》由会员分享,可在线阅读,更多相关《45分钟搞定R语言之数据库交互及统计绘图(47页珍藏版)》请在金锄头文库上搜索。

1、45分钟搞定R语言之 数据库交互及统计绘图,目录 数据库交互 语言与数据库 通过RODBC进行数据存取 统计绘图 语言与统计绘图 的高水平绘图函数 的常用绘图参数 的低水平绘图函数 组合多个图形 高级格函数(Lattice Function) 小结,R与数据库:各有所长、取长补短,统计分析,统计图形,数据的组织,数据的存储,数据的管理,RODM、teradataR、Rhive,R与数据库:两种连接方式,),ODBC(Open DataBase Connectivity),开放式数据库连接 大部分计算机都有(Windows/Linux/Mac OS X) 支持多种数据源(Oracle、MySQL

2、、DB2、SQL Sever 需要建立一个DSN(Data Source Name)或数据源的名称(控制面板-系统和安全- 管理工具-数据源(ODBC)) DBI(DataBase Interface)方式: ROracle、RMysql 需要针对特定的数据库下载专门的软件包 比ODBC方式表现更好 目前对Windows平台支持不好,目录 数据库交互 语言与数据库 通过RODBC进行数据存取 统计绘图 语言与统计绘图 的高水平绘图函数 的常用绘图参数 的低水平绘图函数 组合多个图形 高级格函数(Lattice Function) 小结,通过RODBC进行数据存取:主要函数,操作步骤:建立DSN

3、打开连接数据操作关闭连接,R通过RODBC方式进行数据存取的主要函数如下:,通过RODBC进行数据存取:读取数据,示例:通过RODBC从Oracle读取数据 # 加载RODBC包 library(RODBC) # 创建连接 channel - odbcConnect(“BITEST“,uid=“dw“,pwd=“dw“) # 执行查询 org1 - sqlFetch(channel,DIM.DIM_ORGANIZATION) org2 - sqlQuery(channel,SELECT * FROM DIM.DIM_ORGANIZATION) # 关闭连接 odbcClose(channel)

4、 # 使用数据 head(org1) head(org2),通过RODBC进行数据存取:写入数据库,示例:通过RODBC将数据写入Oracle library(RODBC) channel - odbcConnect(“BITEST“,uid=“dw“,pwd=“dw“) # 创建数据框(待写入对象) mydata - sqlQuery(channel,SELECT * FROM DIM.DIM_ORGANIZATION) # 写入数据库表,并读取结果表 sqlSave(channel,mydata,NEW_TABLE_NAME,append = FALSE) mydata2 - sqlQue

5、ry(channel,SELECT * FROM NEW_TABLE_NAME) # 更新数据库表,并读取数据 sqlSave(channel,mydata,NEW_TABLE_NAME,append = TRUE) mydata3 - sqlQuery(channel,SELECT * FROM NEW_TABLE_NAME) # 删除刚刚建立的表NEW_TABLE_NAME sqlDrop(channel, NEW_TABLE_NAME) odbcClose(channel) # 查看执行结果 head(mydata,n = 30); head(mydata2,n = 30); head(

6、mydata3,n = 30),目录 数据库交互 语言与数据库 通过RODBC进行数据存取 统计绘图 语言与统计绘图 的高水平绘图函数 的常用绘图参数 的低水平绘图函数 组合多个图形 高级格函数(Lattice Function) 小结,图形的首要作用是“直观”的展示信息,但是“直观”不等于“简单”,统计量才是统计图 形的最关键构成元素。 Microsoft Excel 价格高! 展示的几乎都是原始数据! 不能灵活的控制图形的组成元素! 其他商业统计软件 价格昂贵! 不能灵活的控制图形的组成元素! R: is a free software environment for statistica

7、l computing and graphics 完全免费! 任何理论上可以计算出来的统计量都能在R中很方便地以图形的方式表达出来! 可以灵活的控制图形的组成元素!,R与统计绘图:工具选择,任何一幅统计图形都是由以下这些最基础的图形元素构成 点(points) 线(lines, abline, segments, arrows) 多边形(rect, polygon, box) 颜色(colors) 文本(text) 图例(legend),与统计绘图:图形的最基础构成元素,高水平(high-level)绘图函数 在图形设备上产生一个新的绘图区域,并生成一个新的图形 通过其参数可以设置坐标轴,标签

8、,标题等等 低水平(low-level)绘图函数 在已存在的图形上加上更多的图形元素,是绘制图形的基础函数 如额外的点、线、多边形和标签 交互式绘图函数 允许交互式地用定点设备(如鼠标)在已经存在的图上添加/提取图形信息,R与统计绘图:绘图函数的分类,目录 数据库交互 语言与数据库 通过RODBC进行数据存取 统计绘图 语言与统计绘图 的高水平绘图函数 的常用绘图参数 的低水平绘图函数 组合多个图形 高级格函数(Lattice Function) 小结,plot()是最常用R绘图函数,是一个泛型函数,它产生的图形依赖于第一个参数的类型或者类 # 测试数据 set.seed(1); x - sa

9、mple(c(1:50),10) set.seed(2); y - sample(c(1:50),10) xt - ts(x) xy - cbind(x, y) f - as.factor(c(rep(a,3),rep(b,5),rep(c,2),R的高水平绘图函数:plot(),更多参见:methods(plot) 高水平绘图函数的更多示例参加: example(plot) example(barplot)等等,点图(Cleveland dot plot)/克里夫兰点图: # 基本实现,可用于检测离群点 dotchart(mtcars$mpg,labels=row.names(mtcars)

10、,cex=.7, main=“Gas Milage for Car Models“, xlab=“Miles Per Gallon“) # 按mpg进行排序,按cylinder进行分组并设定不同的颜色,可用于确定聪明变量 x - mtcarsorder(mtcars$mpg), # sort by mpg x$cyl - factor(x$cyl) # it must be a factor x$colorx$cyl=4 - “red“ x$colorx$cyl=6 - “blue“ x$colorx$cyl=8 - “darkgreen“ dotchart(x$mpg,labels=row.

11、names(x),cex=.7,groups= x$cyl,main=“Gas Milage for Car Modelsngrouped by cylinder“,xlab=“Miles Per Gallon“, gcolor=“black“, color=x$color),R的高水平绘图函数:点图dochart(),线图(Line Chart): # 基本实现,仅仅使用plot() plot(mtcars$mpg, type=“l“) # plot()和lines()共同完成,plot()负责绘制一个没有点的图,lines()完成线条绘制,观察选项 type=的不同选择值的差异 x - c

12、(1:5); y - x; par(pch=22, col=“red“); par(mfrow=c(2,4) opts - c(“p“,“l“,“o“,“b“,“c“,“s“,“S“,“h“) for(i in 1:length(opts) plot(x, y, type=“n“, main=paste(“type=“,optsi) lines(x, y, type=optsi) # 添加多条线 sal_num - c(45,21,50,43,90,32); click_num1 - sal_num+5; click_num2 - sal_num+10; plot(sal_num, col=“

13、black“, type=“o“, ylim=c(0,105), axes=TRUE) lines(click_num1, col=“red“, type=“o“, pch=22, lty=2) lines(click_num2, col=“blue“, type=“o“, pch=22, lty=2),R的高水平绘图函数:线图plot()+lines(),直方图(Histogram): # 基本实现,使用hist观察变量的分布 hist(mtcars$mpg) # 设置桶的数量和填充颜色 hist(mtcars$mpg, breaks=5, col=“red“) hist(mtcars$mp

14、g, breaks=c(10,25,30,40), col=“red“) #精确设置断点 核密度图(Kernel Density Plots): # 基本实现,使用density观察变量分布 d - density(mtcars$mpg) plot(d, main=“Kernel Density of Miles Per Gallon“) polygon(d, col=“gray71“, border=“blue“) #设置图形格式,R的高水平绘图函数:直方图hist()、核密度图density(),盒图(Boxplot): # 基本实现 boxplot(x=c(cars$speed,35)

15、boxplot(x=c(cars$speed,35),range=3) # range参数的值改变胡须的延伸位置 # 按cyl进行分组,绘制盒图 boxplot(mpgcyl,data=mtcars, main=“Car Milage Data“, xlab=“Number of Cylinders“, ylab=“Miles Per Gallon“),更多盒图参见:sfsmisc包boxplot.matrix()、gplots包boxplot.n()、Rlab包bplot(),R的高水平绘图函数:盒图boxplot(),条图(Barplot): # 基本实现 counts - table(m

16、tcars$gear) barplot(counts, main=“Car Distribution“, xlab=“Number of Gears“) barplot(counts, main=“Car Distribution“, horiz=T, names.arg=c(“3 Gears“, “4 Gears“, “5 Gears“) # 水平放置,设置标签 # 堆积条形图,设置填充颜色和图例 counts - table(mtcars$vs, mtcars$gear) barplot(counts, main=“Car Distribution by Gears and VS“,xlab=“Number of Gears“, col=c(“darkblue“,“red“),legend=rownames(counts) #

展开阅读全文
相关资源
相关搜索

当前位置:首页 > IT计算机/网络 > 数据库

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号