R的简单介绍和线性回归

上传人:宝路 文档编号:47219977 上传时间:2018-06-30 格式:PPT 页数:36 大小:1.87MB
返回 下载 相关 举报
R的简单介绍和线性回归_第1页
第1页 / 共36页
R的简单介绍和线性回归_第2页
第2页 / 共36页
R的简单介绍和线性回归_第3页
第3页 / 共36页
R的简单介绍和线性回归_第4页
第4页 / 共36页
R的简单介绍和线性回归_第5页
第5页 / 共36页
点击查看更多>>
资源描述

《R的简单介绍和线性回归》由会员分享,可在线阅读,更多相关《R的简单介绍和线性回归(36页珍藏版)》请在金锄头文库上搜索。

1、R 学 习 的 分 享目录一、R的介绍1.R的特点2.R的界面3.R的使用注意事项 二、R中数据创建1.数据的输入1.1. 向量1.1.1向量的赋值1.1.2有序向量的赋值1.2.矩阵的创建1.3.数据框的创建1.3.1表格输入1.3.2数据框的直接输入2.数据读入目录三、统计分析方法简介 3.1方差分析和多重比较3.1.1方差分析和多重比较的命令调用 3.2假设检验3.2.1假设检验的命令调用 3.3主成分和因子分析3.3.1主成分和因子分析的命令调用 3.4判别分析及命令 3.5聚类分析3.5.1聚类分析函数的命令调用 3.6回归分析3.6.1回归分析的详细解释R的介绍R是什么:R是一个有

2、着统计分析功能及强大作图功 能的软件系统,是由奥克兰大学统计学系 的Ross Ihaka和Robert Gentleman共同创 立,并受到贝尔实验室s语言的影响。R的特点1.免费性:R是一个免费的统计分析软件;2.运算能力强大:同Matlab一样不需要编译就可执 行代码; 3.帮助功能完善:可通过help命令可随时了解R所提 供的各类函数的使用方法或例子;4.R有顶尖水准的制图:在可视化方面,R的效果特 别好,并能保存为各种形式的文件;5.统计分析能力尤为突出:R内嵌了许多统计分析函 数,一些中间结果既可保存到专门的文件,也可 直接用于进一步的分析。6.R的界面中文版的R界面从后开始输入数据

3、,代码等R的使用注意事项1.R的命令对大小写敏感,这在使用命令方式安装和载入程序包时应特 别注意。2.输入R的命令中尽量使用英文字符,避免使用中文字符。3.同一行中可输入多个命令,需用 ; 隔开,# 认为是注释内容,不予 执行。4.R中所有的函数后都带圆括号5.赋值一般用 a a 1 1 2 3 4 5 b b 1 “one“ “two“ “three“ “four“ “five“ d d 1 TRUE FALSE1.1.2有序向量的赋值生成有序的向量可以使用seq命令, s1 s11 -5.0 -4.5 -4.0 -3.5 -3.0 -2.5 -2.0 -1.5 -1.0 -0.5 0.0

4、0.5 1.0 1.5 15 2.0 2.5 3.0 3.5 4.0 4.5 5.0 还有其他的赋值向量的命令不再详细举例。1.2.矩阵创建创建一个矩阵: Mymatix cells rnames cnamesmymatrix mymatrixC1 C2 R1 1 26 R2 24 681.3.1表格输入如果要输入以下表格的数据可以使用矩阵,也可用数据框的形式 bloodtype jnbq cs xjt xjgs patientdata patientdatabloodtype jnbq cs xjt xjgs 1 zc 8.90 12.00 34.71 44.00 2 lj 10.63 18

5、.05 46.18 67.24 3 yc 19.84 30.55 73.06 116.82血压状态 冠状动脉 机能不全猝死心绞痛心肌梗塞正常8.91234.7144临界10.6318.0546.1867.24异常19.8430.5573.06116.821.3.2数据框的直接输入同样的,可以在R中新建数据框,直接输入数据。命令格式如下: 比如创建一个名为mydata的数据框,它含有三个变量,age(数值 型)、gender(字符型)、weight(数值型)。 命令为: mydata mydatamydataframe library(RODBC) channel mydataframe odb

6、cClose(channel) txt读取: mydata choose.dir()或者 file.choose()直接从弹出的对话框中了来查找文件。三、统计分析方法简介统计分析方法: 常用的主要方法有:线性回归,方差分析与 多重比较,假设检验,主成分和因子分析 ,判别分析,聚类分析。3.1方差分析方差分析:用于分析分类型自变量与数值型自变量之间的关 系,即分析多各总体均值是否相等的方法。具体根据影响因素 的不同,可以分为单因素方差分析,双因素方差分析 例:某城市从4个排污口取水,进行某种处理后检测大肠杆菌数量 ,单位面积内菌落数如下表所示,请分析各个排污口的大肠杆菌数量 是否有差别。排污口属

7、于分类型自变量,大肠杆菌数量属于数值型因变量。分析的问题是:不同排污口大肠杆菌的数量是否相等。排污口1234 大肠杆菌数量9,12,7,520,14,18,1212,7,6,1023,13,16,21方差分析代码X weight fhl womendataplot(fhlweight, type=“b“,col=“red“,xlab=“体重“,ylab=“肺活量 “,xlim=c(40,50),ylim=c(0,3.5)通过图形发现,体重与肺活量之间有较强的线性关系。 进一步做线性回归分析: fit summary(fit)Call: lm(formula = fhl weight, data

8、 = womendata)Residuals:Min 1Q Median 3Q Max -0.30590 -0.16699 0.03269 0.12481 0.33128 Coefficients:Estimate Std. Error t value Pr(|t|) (Intercept) -1.58154 1.27732 -1.238 0.2619 weight 0.09321 0.02741 3.401 0.0145 * - Signif. codes: 0 * 0.001 * 0.01 * 0.05 . 0.1 1Residual standard error: 0.2421 on 6 degrees of freedom Multiple R-squared: 0.6584, Adjusted R-squared: 0.6015 F-statistic: 11.56 on 1 and 6 DF, p-value: 0.01448以上分析,我们看到肺活量与体重之间存在着线性关系残差最值及分位数回归系数检验, y=-1.58154+0.09321*weight残差标准 误拟合优度R方估计方程的显著性检 验,P值小于0.05, 认为方程显著

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 中学教育 > 教学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号