数据分析展现与R语言

上传人:我*** 文档编号:133270367 上传时间:2020-05-25 格式:PDF 页数:54 大小:1.52MB
返回 下载 相关 举报
数据分析展现与R语言_第1页
第1页 / 共54页
数据分析展现与R语言_第2页
第2页 / 共54页
数据分析展现与R语言_第3页
第3页 / 共54页
数据分析展现与R语言_第4页
第4页 / 共54页
数据分析展现与R语言_第5页
第5页 / 共54页
点击查看更多>>
资源描述

《数据分析展现与R语言》由会员分享,可在线阅读,更多相关《数据分析展现与R语言(54页珍藏版)》请在金锄头文库上搜索。

1、DATAGURU专业数据分析网站 2013 04 20 数据分析 展现与R语言 第2课 DATAGURU专业数据分析网站 2013 04 20 数据可视化的重要性 2 DATAGURU专业数据分析网站 2013 04 20 综合性例子 模拟产生统计专业同学的名单 学号区分 记录数学分析 线性代数 概率统计三 科成绩 然后进行一些统计分析 3 DATAGURU专业数据分析网站 2013 04 20 模拟成绩 用runif和rnorm 4 DATAGURU专业数据分析网站 2013 04 20 模拟成绩 5 DATAGURU专业数据分析网站 2013 04 20 合成数据框并保存到硬盘 data

2、frame write table 6 DATAGURU专业数据分析网站 2013 04 20 计算各科平均分 函数mean colMeans apply 7 DATAGURU专业数据分析网站 2013 04 20 求各科最高最低分 函数max min apply 8 DATAGURU专业数据分析网站 2013 04 20 求出每人总分 9 DATAGURU专业数据分析网站 2013 04 20 总分最高的同学 10 DATAGURU专业数据分析网站 2013 04 20 对x1进行直方图分析 绘制直方图函数hist 11 DATAGURU专业数据分析网站 2013 04 20 探索各科成绩的

3、关联关系 散点图绘制函数plot 12 DATAGURU专业数据分析网站 2013 04 20 列联表分析 列联函数table 柱状图绘制函数barplot 13 DATAGURU专业数据分析网站 2013 04 20 饼图 饼图绘制函数pie 14 DATAGURU专业数据分析网站 2013 04 20 箱尾图 箱子的上下横线为样本的25 和 75 分位数 箱子中间的横线为样本的中位数 上下延伸的直线称为尾线 尾线的 尽头为最高值和最低值 异常值 15 DATAGURU专业数据分析网站 2013 04 20 箱线图 boxplot x 2 4 col c red gre en blue no

4、tch T 16 DATAGURU专业数据分析网站 2013 04 20 箱尾图 水平放置的箱尾图 17 DATAGURU专业数据分析网站 2013 04 20 星相图 每个观测单位的数值表示 为一个图形 每个图的每个角表示一个 变量 字符串类型会标注 在图的下方 角线的长度表达值的大小 18 DATAGURU专业数据分析网站 2013 04 20 星相图 19 DATAGURU专业数据分析网站 2013 04 20 脸谱图 安装aplpack包 20 DATAGURU专业数据分析网站 2013 04 20 脸谱图 用五官的宽度和高度来描绘数值 人对脸谱高度敏感和强记忆 适合较少样本的情况 2

5、1 DATAGURU专业数据分析网站 2013 04 20 其它脸谱图 安装TeachingDemos包 22 DATAGURU专业数据分析网站 2013 04 20 茎叶图 23 DATAGURU专业数据分析网站 2013 04 20 QQ图 可用于判断是否正态分布 直线的斜率是标准差 截距是均值 点的散布越接近直线 则越接近正态分布 24 DATAGURU专业数据分析网站 2013 04 20 散点图 散点图的进一步设置 plot x x1 x x2 main 数学分析与线性代数成绩的关系 xlab 数学分析 ylab 线性代数 xlim c 0 100 ylim c 0 100 xaxs

6、 i Set x axis style as internal yaxs i Set y axis style as internal col red Set the color of plotting symbol to red pch 19 Set the plotting symbol to filled dots 25 DATAGURU专业数据分析网站 2013 04 20 散点图 连线图 a c 2 3 4 5 6 b c 4 7 8 9 12 plot a b type l 26 DATAGURU专业数据分析网站 2013 04 20 散点图 多条曲线的效果 plot rain T

7、okyo type l col red ylim c 0 300 main Monthly Rainfall in major cities xlab Month of Year ylab Rainfall mm lwd 2 lines rain NewYork type l col blue lwd 2 lines rain London type l col green lwd 2 lines rain Berlin type l col orange lwd 2 27 DATAGURU专业数据分析网站 2013 04 20 密度图 函数density plot density rnorm

8、 1000 28 DATAGURU专业数据分析网站 2013 04 20 R内置数据集 函数data 列出内置数据 29 DATAGURU专业数据分析网站 2013 04 20 热力图 利用内置的mtcars数据集绘制 heatmap as matrix mtcars Rowv NA Colv NA col heat colors 256 scale column margins c 2 8 main Car characteristics by Model 30 DATAGURU专业数据分析网站 2013 04 20 Iris 鸢尾花 数据集 Sepal 花萼 Petal 花瓣 Specie

9、s 种属 31 DATAGURU专业数据分析网站 2013 04 20 向日葵散点图 用来克服散点图中数据点重叠问 题 在有重叠的地方用一朵 向日葵 花 的花瓣数目来表示重叠数据 的个数 sunflowerplot iris 3 4 col gold seg col gold 32 DATAGURU专业数据分析网站 2013 04 20 散点图集 遍历样本中全部的变量配对 画出二元图 直观地了解所有变量之间的 关系 pairs iris 1 4 33 DATAGURU专业数据分析网站 2013 04 20 散点图集 用plot也可以实现同样的效果 plot iris 1 4 main Rela

10、tionships between characteristics of iris flowers pch 19 col blue cex 0 9 34 DATAGURU专业数据分析网站 2013 04 20 散点图集 利用par 在同一个device输出多个 散点图 Par命令博大精深 用于设置绘图参 数 help par par mfrow c 3 1 plot x1 x2 plot x2 x3 plot x3 x1 35 DATAGURU专业数据分析网站 2013 04 20 关于绘图参数 help par 有哪些颜色 colors 36 DATAGURU专业数据分析网站 2013 04

11、 20 关于绘图参数 绘图设备 37 DATAGURU专业数据分析网站 2013 04 20 关于绘图参数 位置控制参数 mai参数 A numerical vector of the form c bottom left top right which gives the margin size specified in inches oma参数 A vector of the form c bottom left top right giving the size of the outer margins in lines of text 38 DATAGURU专业数据分析网站 2013

12、04 20 三维散点图 安装scatterplot3d 包 scatterplot3d x 2 4 39 DATAGURU专业数据分析网站 2013 04 20 三维作图 x y seq 2 pi 2 pi pi 15 f function x y sin x sin y z outer x y f contour x y z col blue persp x y z theta 30 phi 30 expand 0 7 col lightblue 40 DATAGURU专业数据分析网站 2013 04 20 调和曲线图 41 DATAGURU专业数据分析网站 2013 04 20 调和曲线图

13、 unison r的代码 自定义函数 调和曲线用于聚类判断非常方便 42 DATAGURU专业数据分析网站 2013 04 20 地图 安装maps包 map state interior FALSE map state boundary FALSE col red add TRUE map world fill TRUE col heat colors 10 43 DATAGURU专业数据分析网站 2013 04 20 R实验 社交数据可视化 先下载安装maps 包和geosphere 包并加载 library maps library geosphere 画出美国地图 map state

14、44 DATAGURU专业数据分析网站 2013 04 20 R实验 社交数据可视化 画世界地图 map world 45 DATAGURU专业数据分析网站 2013 04 20 R实验 社交数据可视化 通过设置坐标范围使焦点 集中在美国周边 并且设 置一些有关颜色 xlim c 171 738281 56 601563 ylim c 12 039321 71 856229 map world col f2f2f2 fill TRUE bg white lwd 0 05 xlim xlim ylim ylim 46 DATAGURU专业数据分析网站 2013 04 20 R实验 社交数据可视化

15、 画一条弧线连线 表示社 交关系 lat ca 39 164141 lon ca 121 64062 5lat me 45 21300 4lon me 68 906250 inter gcIntermediate c lon c a lat ca c lon me lat me n 50 addStartEnd TRUE lines inter 47 DATAGURU专业数据分析网站 2013 04 20 R实验 社交数据可视化 继续画弧线 lat tx 29 954935 lon tx 98 701172 inter2 gcIntermediate c lon ca lat ca c lon

16、 tx lat tx n 50 addStartEnd TRUE lines inter2 col red 48 DATAGURU专业数据分析网站 2013 04 20 R实验 社交数据可视化 装载数据 airports read csv header TRUE flights read csv header TRUE as is TRUE 49 DATAGURU专业数据分析网站 2013 04 20 R实验 社交数据可视化 画出多重联系 map world col f2f2f2 fill TRUE bg white lwd 0 05 xlim xlim ylim ylim fsub flights flights airline AA for j in 1 length fsub airline air1 airports airports iata fsub j airport1 air2 airports airports iata fsub j airport2 inter gcIntermediate c air1 1 long air1 1 lat c air2 1 lon

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 教学/培训

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号