R语言常用上机命令分功能整理

上传人:博****1 文档编号:492409895 上传时间:2023-09-14 格式:DOCX 页数:18 大小:49.84KB
返回 下载 相关 举报
R语言常用上机命令分功能整理_第1页
第1页 / 共18页
R语言常用上机命令分功能整理_第2页
第2页 / 共18页
R语言常用上机命令分功能整理_第3页
第3页 / 共18页
R语言常用上机命令分功能整理_第4页
第4页 / 共18页
R语言常用上机命令分功能整理_第5页
第5页 / 共18页
点击查看更多>>
资源描述

《R语言常用上机命令分功能整理》由会员分享,可在线阅读,更多相关《R语言常用上机命令分功能整理(18页珍藏版)》请在金锄头文库上搜索。

1、第一讲应用实例R的基本界面是一个交互式命令窗口,命令提示符是一个大于号,命令的结果马上 显示在命令下面。S命令主要有两种形式:表达式或赋值运算(用一或者=表示)在命令提 示符后键入一个表达式表示计算此表达式并显示结果。赋值运算把赋值号右边的值 计算出来赋给左边的变量。 可以用向上光标键来找回以前运行的命令再次运行或修改后再运行。S是区分大小写的,所以X和X是不同的名字。我们用一些例子来看R软件的特点。假设我们已经进入了 R的交互式窗口。如果没有打开的 图形窗口,在R中,用:xll()可以打开一个作图窗口。然后,输入以下语句:x1 = 0:100x2 = x1*2*pi/100y = sin(x

2、2)plot(x2, y,type=l)这些语句可以绘制正弦曲线图。其中,“=”是赋值运算符。0:100表示一个从0到100的 等差数列向量。第二个语句可以看出,我们可以对向量直接进行四则运算,计算得到的x2是 向量x1的所有元素乘以常数2*pi/100的结果。从第三个语句可看到函数可以以向量为输入, 并可以输出一个向量,结果向量y的每一个分量是自变量x2的每一个分量的正弦函数值。xlab=x 轴,ylab=y 轴)有关作图命令plot的详细介绍可以在R中输入help(plot)数学函数abs, sqrt:绝对值,平方根 log, loglO, log2 , exp:对数与指数函数 sin,

3、cos, tan, asin, acos, at an, at an2 :三角函数 sinh, cosh, t anh, asinh, acosh, at anh:双曲函 数简单统计量sum, mean, var, sd, min, max, range, median, IQR(四分位间距)等为统计量,sort, order, rank 与排序有关,其它还有 ave, fivenum, mad, quantile, stem 等。下面我们看一看S的统计功能: marks c(10, 6, 4, 7, 8) mean(marks) sd(marks) min(marks) max(marks)

4、第一个语句输入若干数据到一个向量,函c()用来把数据组合为一个向量。后面用了几个函 数来计算数据的均值、标准差、最小值、最大值。可以把若干行命令保存在一个文本文件中,然后用source函数来运行整个文件: source(C:/l.R)注意字符串中的反斜杠。例:计算6, 4, 7, 8, 10的均值和标准差,把若干行命令保存在一个文本文件(比如C:1.R) 中,然后用source函数来运行整个文件。a c(10, 6, 4, 7, 8)bmean(a)c-sd(a)source(C:/1.R)时间序列数据的输入使用函数tsts(1:10, frequency = 4, start 二 c(195

5、9, 2)print( ts(1:10, frequency = 7, start 二 c(12, 2), calendar = TRUE)a-ts(1:10, frequency = 4, start 二 c(1959, 2)plot(a)将外部数据读入Rread.csv默认header = TRUE,也就是第一行是标签,不是数据。read .table默认 header = FALSE 将R中的数据输出wri tewrite.t ablewrit e.csv第二讲1. 绘制时序图、自相关图例题2.1d=scan(sha.csv)sha 二t s(d,s tart二 1964,freq=1)

6、plo t.t s(sha)#绘制时序图acf(sha,22)#绘制自相关图,滞后期数22pacf(sha,22) #绘制偏自相关图,滞后期数22 corr=acf(sha,22)#保存相关系数cov=acf(sha,22 ,type = covariance)#保存协方差图的保存,单击选中图,在菜单栏选中“文件”再选“另存为” 同时显示多个图:用x11()命令生成一个空白图,再输入作图命令。2. 同时绘制两组数据的时序图d=read.csv(double.csv,header=F) double 二t s(d,s tart二 1964,freq=1) plo t(double, plo t.

7、t ype = mul tiple)#两组数据两个图plo t(double, plo t.t ype = single)#两组数据一个图plot(double, plot.type = single,col=c(red,green),lty=c(1,2)设置每组数据 图的颜色、曲线类型)3. 产生服从正态分布的随机观察值例题2.4随机产生1000白噪声序列观察值 d=rnorm(1000,0,1)#个数 1000 均值 0 方差 1plot.t s(d)4. 纯随机性检验例题2.3续d=scan (t emp.csv)t emp 二t s(d,freq=1,s tart二 c(1949)Bo

8、x .test(temp, type=Ljung-Box,lag=6)5. 差分计算x=1:10y=diff(x)k步差分VkXt Xt Xt-k加入参数lag=k如计算x的3步差分为 y=diff(x, lag = 3)p阶差分V匕巴 巴-i加入参数differences = p 如2阶差分y二diff(x,differences = 2)第三讲 例题3.1plot.t s(arima.sim(n = 100, lis t(ar = 0.8)#模拟AR(1)模型,并作时序图。 plot.t s(arima.sim(n = 100, lis t(ar = -1.1)#非平稳,无法得到时序图。p

9、lot.t s(arima.sim(n = 100, lis t(ar = c(1,-0.5) plot.t s(arima.sim(n = 100, lis t(ar = c(1,0.5)例题3.5acf(arima.sim(n = 100, lis t(ar = 0.8) acf(arima.sim(n=100,lis t(ar=-1.1)acf(arima.sim(n=100,lis t(ar=c(1,-0.5)acf(arima.sim(n=100,lis t(ar=c(1,0.5)例题3.7arima.sim(n = 1000, lis t(ar = 0.5, ma = -0.8)

10、acf(arima.sim(n = 1000, lis t(ar = 0.5, ma = -0.8),20) pacf(arima.sim(n = 1000, lis t(ar = 0.5, ma = -0.8),20)例题2.5d=scan(a1.5. txt)#导入数据prop二 ts(d,s tart=1950,freq=1)#转化为时间序列数据plo t(prop)#作时序图acf(prop,12)#作自相关图,拖尾pacf(prop,12)#作偏自相关图,1阶截尾Box .test( prop, type=Ljung-Box,lag=6)#纯随机性检验,p值小于5%,序列为非白噪声B

11、ox .test( prop, type=Ljung-Box,lag=12) arima(prop, order = c(1,0,0),me thod二ML)#用AR( 1)模型拟合,如参数met hod二CSS,估计方法为条件最小二乘法,用条件最小二乘 法时,不显示AIC。arima(prop, order = c(1,0,0),method=ML, include.mean = F) #用 AR( 1)模型拟合, 不含截距项。t sdiag(arima(prop, order = c(1,0,0),me thod二ML)#对估计进行诊断,判断残差是否为白噪声 summary(arima(p

12、rop, order = c(1,0,0),me thod二ML) a=arima(prop, order = c(1,0,0),me thod二ML) r=a$residuals#用r来保存残差Box. test(r, type二Ljung-Box,lag=6)#对残差进行纯随机性检验 predict(arima(prop, order = c(1,0,0), n.ahead =5) #预测未来 5 期 prop.fore = predic t( arima(prop, order = c(1,0,0), n.ahead =5) #将未来5期预测值保存在prop.fore变量中U = pro

13、p.fore$pred + 1.96* prop.fore$seL = prop.fore$pred - 1.96* prop.fore$se#算出 95%置信区间 ts.plo t(prop, prop.fore$pred,col=1:2)#作时序图,含预测。 lines(U, col二blue, lty二dashed)lines(L, col二blue, lty=dashed)#在时序图中作出 95%置信区间例题3.9d=scan(a1.22 .txt)x=diff(d)arima(x, order = c(1,0,1),me thod二CSS)t sdiag(arima(x, order

14、 = c(1,0,1),me thod二CSS)第一点:对于第三讲中的例2.5,运行命令arima(prop, order = c(1,0,0),method=ML)之后,显 示:Call:arima(x = prop, order = c(1, 0, 0), met hod = ML)Coefficients:ar1intercept0.691481.5509s.e. 0.09891.7453sigma2 estimated as 15.51: log likelihood = -137.02, aic = 280.05注意:intercept下面的81.5509是均值,而不是截距!虽然in

15、tercept是截距的意思,这 里如果用 mean 会更好。(the mean and the intercept are the same only when there is no AR term,均值和截距是相同的,只有在没有AR项的时候)如果想得到截距,利用公式计算。int =(1-0.6914)*81.5509= 25.16661。课本P81的例2.5 续中的截距25.17是正确的。第二点:如需计算参数的t统计量值和p值,利用下面的公式。ar 的 t 统计量值=0.6914/0.0989= 6.9909(注:数值与课本略有不同,因为课本用sas算的se= 0.1029,R计算的se=0.0989)p 值=pt(6.9909,df=48,lower. tail = F)*2pt()为求t分布求p值的函数,6.99为

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 机械/制造/汽车 > 电气技术

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号