R实习指导模板

上传人:博****1 文档编号:478202220 上传时间:2022-09-03 格式:DOCX 页数:24 大小:558.68KB
返回 下载 相关 举报
R实习指导模板_第1页
第1页 / 共24页
R实习指导模板_第2页
第2页 / 共24页
R实习指导模板_第3页
第3页 / 共24页
R实习指导模板_第4页
第4页 / 共24页
R实习指导模板_第5页
第5页 / 共24页
点击查看更多>>
资源描述

《R实习指导模板》由会员分享,可在线阅读,更多相关《R实习指导模板(24页珍藏版)》请在金锄头文库上搜索。

1、第四章R统计图形一图胜千言,优秀的图形可以将枯燥的数字以友好的形式展示在 大家前面,从而让数据自己说话。统计图是统计描述的重要工具,它 可以直观的反映出事物间的数量关系.在可视化技术如火如荼的发展 之背景下,加上R软件在作图上的优越性,学习使用R统计作图已经 成为必然趋势.本章主要向大家介绍R底层作图函数以及高水平作图函数,以及 现今一些经典的R作图包.4.1引入图 4.1 mapped 2011想必大家看到这幅图,也许都想知道要怎么样才能画出来呢?是 的,R就能完成,并且还能完成得非常漂亮.冰冻三尺非一日之寒, 要想完成这么复杂但是美观的图案,还是得学习很多的东西,下面我 们也就从R最基础的

2、作图函数开始,达到你所见则能所画.或者想方法,让一般能实现的东西变得更加漂亮.4.2 R统计描述作图4.2.1直方图、经验分布图与QQ图直方图的作图函数为hist(x),x为向量.其他参数详见帮助函 数? hist.与百方图相配套的核密度估计函数density(x),其目的是用已知 样本估计其密度.其他参数详见? density.经验分布函数的作图命令为ecdf(x).不论是直方图还是经验分布图,要从比较上鉴别样本是否近似于 某种类型的分布较困难,而QQ图可以帮助我们鉴别样本的分布是否 近似于正态分布.qqnorm()和qqline()提供了画正态QQ图和相应直 线的方法,其他的参数详见帮助文

3、件.例4.2.1下面是15个学生的体重(单位:Kg)如下75.0 64.0 47.4 66.9 62.2 62.2 58.7 63.566.6 64.0 57.0 69.0 56.9 50.0 72.0对此数据作出直方图、核密度估计图以及QQ图.命令为:whist(w,freq=F) #绘出密度直方图 lines(density(w),col=blue) #绘出蓝色的学生体重密度线 lines(44:76,dnorm(44:76,mean(w),sd(w),col=red)qqnorm(w);qqline(w)#绘出学生体重的QQ图我们得到下面的图:Histogram of wHonrial

4、Q-Q Plotw.TlwcfsUcal Quarrtilei图4.2学生体重的直方图、核密度估计图和QQ图 由图4.2可以看出15个学生的体重是近似服从正态分布的.4.2.2箱线图箱线图的作图函数为boxplot(),参数详见? boxplot.在箱线图中,上(Q3)下(Q1)四分位数分别确定出中间箱体的 顶部和底部,箱体中间的粗线是中位数所在的位置.由箱体向上下伸 出的垂直部分成为“触须”,表示数据的散步范围,最远点为1.5倍 四分位数间距,超出此范围的点称为异常指点,通常用“o”表示.在R软件中,InsectSprays是内部的数据框,它由两列数据构 成,一列叫count,由数据构成,另

5、一列叫spray,由因子构成,共有 A-F六个水平,现在画出数据count在这六个水平下的箱线图,其命 令为:boxplot(countspray,data=InsectSprays,notch二T,col=2:7)得到下面的图形:A图4.3 InsectSpray的箱线图由上面可以看出在C、D两个水平上,存在极端异常值点(处于 外限之外),都含有“o”标记.col=2:7代表箱线图的颜色向量从2 (红色)开始到7 (淡黄色),图中的C、E、F水平上四分位数离中 位数的距离远比下四分位数距中位数的距离大,说明这些水平上,数 据呈右偏分布,即数值较小的占多数;同理,B、D水平下,数据呈 左偏分布

6、,数值较大的占多数.当然boxplot()函数也还有其他很多的统计应用,希望您可以自 己去学习.4.3高水平作图函数4.3.1高水平的函数作图简介高水平作图函数有:plot()、pairs()、coplot()、dotchart()、contour()、image()、persp()等等(1) plot ()函数的使用方法: plot(x,y):x,y为向量,生成y关于x的散点图. plot(x):x是一时间序列,生成时序图;x是向量,生成x关于下 标的散点图;x是复向量,生成复数的实部与虚部的散点图. plot(f,y):f是因子,y是数值向量,生成y关于f水平的箱线图. plot(df):

7、df为数据框,生成df中所有变量的相对散点图.(2) pairs(x):x为矩阵,生成矩阵各列的散布图;x为数据框时, 同plot(x)的功能.(3) coplot()函数的使用方法: coplot(ab|c):在给定c值下,a关于b的散点图. coplot(ab|c+d):即按c,d划分下,a关于b的散点图.(4) dotchart(x):构造数据x的点图,点图中,y轴是数据x标记, x轴是数据x的数值.(5) image(x,y,z,),contour(x,y,z,),persp(x,y,z,)其 中 x,y为数值型向量,z是与x和y对应的矩阵(z的行数是x的 维数,z的列数是y的维数).

8、image()绘出三维图形的映像, contour()绘出三维图形的等值线,persp()绘出三维图形的表 面曲线.4.3.2高水平作图例证例证1 R软件中,数据VADeaths给出了 virginia(弗尼吉亚)州在 1940年的人口死亡率.Rural Male Rural Female Urban Male Urban Female50-5411.78.715.48.455-5918.111.724.313.660-6426.920.337.019.365-6941.030.954.635.170-7466.054.371.150.0画出该数据框的点图.R命令如下:dotchart(VAD

9、eaths,main=Death Rates in Virginia -1940)dotchart(t(VADeaths),main=Death Rates in Virginia -1940)Rural Female 70-74Urban Male 7074irban Female irbanMale :urai Female :ural MaleFemaleJvlale -emale 4aleDeath Rates In Virginia -1940图4.4 Virginia州1940年的人口死亡率的点图例证2对日中内部数据集iris中的前四列进行点图分析R命令如下: pairs(iris

10、1:4, main = Andersons Iris Data - 3 species,+pch = 21, bg = c(red, green3,blue)unclass(iris$Species)得到下面的点图:Andersons Iris Data - 3 species2.03.04.00.51.52.54.5 s图64.时Anderson s 1 iris的散点矩阵图例证3-2n , 2n X -2n , 2n 的正方形区域内绘函数z sin x sin y的等值线图和三维曲面图.R程序如下: x-y f z contour(x,y,z,col=red,main=z=sinxsiny

11、 的等值线图) persp(x,y,z,theta=30,phi=30,expand=.7,col=red) #增加了观察图形的角度theta和图形的颜色.z=sinxsiny的等值线图6-4-20246图4.6乙sin工sin j的等值线图画三维曲面图的时候,直接底层函数persp ()画出的也许没那么 美观,若选择rgl R包,名为:3D可视化装置,它便能画出优美的 三维图,当然还有其他很多强大的功能:画3D图、电影动画、函数动 画等等,这些都是基于OPENGL图形处理系统下的.那么我们用rgl画 出上面这个函数的三维图时,命令为: library(rgl) zorder=rank(z)

12、#z为函数f关系下的外积运算 persp3d(x,y,z,col二rainbow(as.integer(max(zorder)zorder) #加上了彩虹渐变颜色参数.得到下面的3D图:z图 4.7 Z由3D图也可以很直观的看到,在上图达到尖刺的地方达到函数的最大或者最小值(上面的为最大值,下面的为最小值).4.4. R画图包在cran官网上,在taskview 一栏,分类列出了 R的各种包,有 一类别为Graphics即为图形包,现今共有32个,主要有:rgl、 ggplot2、lattice、plotrix、vcd、RcolorBrewer、animation,gallery 等等包,当然

13、还有一些统计包中也会自带一些特殊的图形绘画函数: 如corrplot绘制相关矩阵数据的可视化图.我们主要通过一些例子,介绍下ggplot2和corrplot包的一些应 用,其他详细的用法可以参见cran官网上的资料,也可以从google 搜索到 ggplot.pdf 和 corrplot.pdf.例 4.4.1 R 内部数据 quakes ( Locations of Earthquakes offFiji),包含了地震发生的经纬度,以及死亡人数、震级等等.我们可以简单的画出地震发生代的级数与其经纬度的关系,画出散 点图.命令为:require(ggplot2)#导入 R 包 ggplot2

14、head(quakes) #查看数据集quakes的前六行 qpolt(lat,long,data二quakes,col二mag,size二exp(mag) 得到下面的图形:185-180-4.04.55.05.56.0_o175-170-例4.4.2给出我国外汇储备在1985-2011年的数据:IM (进口额)、内生产总值)、FR (外汇储备量)、EM (出口额)、expfmag) 100 200 300 400 500包含Gdp (国FDI (外商直接投资)、M2(广义货币供应量)、SD (短期债务)、 latLD (长期债务)等等.绘出外汇与其众多影响因素的相关矩阵可视化图形.R命令:rtlibrary(corrplot)corrcorrplot(corr,method=pie,order=hclust,hclust.method=ward”, addrect = 3,col=rev(rainbow(100)#采用饼图的方式,按照ward聚类(3类)排列.得

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文 > 其它学术论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号