中国人民大学--非参数统计(ppt-41)第2章s-plus基础课件

上传人:F****n 文档编号:88133443 上传时间:2019-04-19 格式:PPT 页数:41 大小:1,000.50KB
返回 下载 相关 举报
中国人民大学--非参数统计(ppt-41)第2章s-plus基础课件_第1页
第1页 / 共41页
中国人民大学--非参数统计(ppt-41)第2章s-plus基础课件_第2页
第2页 / 共41页
中国人民大学--非参数统计(ppt-41)第2章s-plus基础课件_第3页
第3页 / 共41页
中国人民大学--非参数统计(ppt-41)第2章s-plus基础课件_第4页
第4页 / 共41页
中国人民大学--非参数统计(ppt-41)第2章s-plus基础课件_第5页
第5页 / 共41页
点击查看更多>>
资源描述

《中国人民大学--非参数统计(ppt-41)第2章s-plus基础课件》由会员分享,可在线阅读,更多相关《中国人民大学--非参数统计(ppt-41)第2章s-plus基础课件(41页珍藏版)》请在金锄头文库上搜索。

1、第二章 S-Plus基础,本章要求,熟悉在S-Plus命令行中S-Plus基本数据处理 熟悉在S-Plus命令行中进行基本数据基本运算 编写简单的计算函数 绘制基本图形,第一节 S-Plus环境,S-Plus用户界面 算术运算,S-Plus,S语言和S的扩展S-Plus,是由AT&T Bell实验室于20世纪70年代末80年代初研制开发的,其中Rick Becker和John Chambers是主要创始人之一。,S-Plus的主要应用特点:,S-Plus拥有强大的面向对象的开发环境。 作为标准的统计语言,S拥有几乎所有,在S-Plus中,用户可以随处自定义的各种函数,延伸基本的分析方法。 作为

2、面向对象的语言,S集数据的定义、插入、修改和函数计算等功能于一体,语言风格统一,可以独立完成数据分析生命周期的全部活动。 S-Plus提供了非常丰富的2D和3D图形库。 与S-Plus类似的有新近开发的R,R最早由Auckland 大学统计系的Robert Gentleman和Ross Ihaka于1995年开始研制开发,从1997年开始免费公开发布。R在计算功能上比S-Plus有更高的效率,但由于推出时间较短,因而不如S-Plus普及。S-Plus和R二者在语法和功能实现上区别不大,因而学习S-Plus的用户可以轻松转到R,反之亦然。,S-Plus界面六项内容:,Object Explore

3、r(对象浏览器); Commands Window(命令窗口) ; Graph Sheets(图形操作表) ; Script Window(草稿窗口); Menus(菜单); Toolbars(工具栏)。,第二节 向量的基本操作,一、向量的定义和表示 二、向量的基本操作 二、向量的算术运算 三、向量的逻辑运算,一、向量的定义,一、算术运算:S-Plus默认的命令提示符是“” 1) 计算7 X 3,可如下执行命令: 7*3 21 2) 计算 (7+2) X 3,可如下执行命令: (7+2)*3 42 3) 计算 log2 (12 /3),可如下执行命令: log(12/3,2) 2 4) 计算幂

4、2 X 32,可如下执行命令: 2*(32) 18,一、 向量的定义,二、赋值: x y_1+x 屏幕打印变量如下,x: x 3 print(x*y) 12,二、向量的基本操作,1、连接命令; 2、序列命令seq; 3、循环命令rep;,1、连接命令,例1: A.brand A.brand*0.8 1 12.0 21.6 71.2 title.text A.brand1 1 15 A.brandlength(A.brand) 1 89 如果输入的位置超出向量的长度,则S-Plus输出NA,NA表示数据缺失,如下所示: A.brand6 1 NA,1、连接命令(续),2.在向量中插入新的数据:,

5、在A.brand向量末尾添加两个新产品价格的书写方法是: 例1续: add.A.brand add.A.brand 115 27 89 189 240 在向量的开头插入新数据的书写方法如下: addbegin.A.brand-c(12,13,A.brand) 1 12 13 15 27 89,思考题1 : 如何在向量的第i个位置后插入数据?,1、连接命令(续),3.向量与向量的合并: B.brand-c(35,40,58) AB.brand-c(A.brand,B.brand) 1 15 27 89 35 46 58 向量中元素的个数,称为向量的长度,查看向量中元素的个数,可以使用length

6、命令,如下所示: length(add.A.brand) 1 5,1、连接命令(续),4.在向量中删除数据: 将A.brand向量中起始位置的产品价格删除的方法用减法表示,如下表示: 例1续: delete.A.brand delete.A.brand 1 27 89 189 240 将A.brand向量末尾的产品价格删除的方法是: delete.A.brand delete.A.brand 1 15 27 89 189,2、序列命令seq,seq命令的语法如下所示: seq(lower,upper,increment,length,.) 例2: seq(1,10) 1 1 2 3 4 5 6

7、 7 8 9 10 seq(1900,2000,6) 1 1900 1906 1912 1918 1924 1930 1936 1942 1948 1954 11 1960 1966 1972 1978 1984 1990 1996 seq(1,0,-0.1) 1 1.0 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0.0 1:10 #seq(1,10) seq(0,1,0.05,length=10),3、循环命令rep,rep命令的语法结构如下所示: rep(pattern,number of times,length) 例3 rep(2,6) 2 2 2 2 2

8、 2 rep(c(0,5),2) 0 5 0 5 rep(1:3,3) 1 2 3 1 2 3 1 2 3 rep(c(1,4,6),length=5) 1 4 6 1 4,思考题3: 猜测如下程序的输出结果: rep(c(1,2,3), c(1,2,3),三、向量的算术运算,向量算术运算是对标量运算的扩展: 例4: a 2*a 0 6 12 18 24 30 36 a b-1:3,四、向量的逻辑运算,S-Plus中有两个逻辑值:TRUE和FALSE: 3=4 F 常用的逻辑运算符如表1.3:,向量的逻辑运算例:,例6: 假设price表示某一公司推出的所有产品价目表,将price中大于10的

9、所有数据找出来: price large1010 1 11 15,第三节 复杂的数据结构,矩阵 数组 数据框架 列表,一、矩阵,1.定义矩阵: 例7:假定有国民经济数据data,其中显示了2003年中国、日本、韩国三个国家的国家生产总值GDP(单位:1012 US$),年末人口(单位:亿)及通货膨胀率(单位:100%): macroecno asia.data asia.data ,1 ,2 ,3 1, 1.4 12.92 1.2 2, 4.5 0.56 -0.8 3, 0.4 0.5 1.7,例题,例7续:给数据指定列名和行名: dimnames(asia.data) NULL dim(as

10、ia.data) 3,3 row.name col.name dimnames(asia.data) asia.data ,1 ,2 ,3 P.R.China 1.4 12.92 1.2 Japan 4.5 0.56 -0.8 KOREA 0.4 0.5 1.7 dimnames(asia.data)-list(NULL,col.name),例题(续), asia.data GDP POP INFLAT 1 1.4 12.92 1.2 2 4.5 0.56 -0.8 3 0.4 0.5 1.7 dimnames(asia.data) asia.data GDP POP INFLAT P.R.C

11、hina 1.4 12.92 1.2 Japan 4.5 0.56 -0.8 KOREA 0.4 0.5 1.7 dimnames(asia.data) 1: 1 “P.R.China“ “Japan“ “KOREA“ 2: 1 “GDP“ “POP“ “INFLAT“,1、矩阵,2.矩阵元素的表示: 矩阵a中第i,j位置的元素表示为:ai,j,比如: asia.data2,1:2 GDP POP 4.5 0.56 例7续: asia.data2, GDP POP INFLAT 4.5 0.56 -0.8 asia.data“Japan“,“POP“ asia.data“Japan“,“POP

12、“ 59,1、矩阵,3.矩阵的运算: (1)元素对元素的加、减、乘、除法运算是向量的运算的确延拓。 (2)一个数与矩阵的运算相当于数与矩阵的每一个元素的运算。 (3)矩阵用%*%表示: a ,1 ,2 1, 1 3 2, 2 4 (4) x a%*%x ,1 1, 5 2, 8, solve(a) ,1 ,2 1, -2 1.5 2, 1 -0.5,思考题4. 计算asia.data中的人均GDP.,1、矩阵,4.矩阵的合并: 增加若干列用cbind函数,增加若干行用rbind函数;求矩阵列数用cnol表示,求解矩阵行数用rnol表示: a ,1 ,2 1, 1 3 2, 2 4 addc a

13、 a addc 1, 1 3 5 2, 2 4 6,思考题5. 在asia.data中插入Australia 数据:GDP:0.53;POP:0.10;INFL:2.3.,二、数组,数组则是多维矩阵,生成数组与生成矩阵类似: a a , , 1 ,1 ,2 ,3 ,4 1, 1 4 7 10 2, 2 5 8 11 3, 3 6 9 12 , , 2 ,1 ,2 ,3 ,4 1, 13 16 19 22 2, 14 17 20 23 3, 15 18 21 24,2.数组的行列计算函数: apply(data,dim,function,.) 例1.7续:计算asia.data中GDP,POP,

14、INFLAT的最小值: apply(asia.data,2,min) GDP POP INFLAT 0.4 0.5 -0.8 例1.7续:求数组asia.data中的最小值所在的行和列: col(a)asia.data=min(asia.data) 3 row(a)asia.data=min(asia.data) 2,思考题6. 请输出asia.data中GDP最小值所在的行和列.,三、数据框架,数据框架可以理解为二维数据表,其中不同列具有不同的数据类型。 asia.frame asia.frame GDP POP INFLAT IS.AS P.R.China 1.4 12.92 1.2 AS

15、 Japan 4.5 0.56 -0.8 AS KOREA 0.4 0.5 1.7 AS apply(asia.data,2,max) GDP POP INFLAT 4.5 12.92 1.7,四、列表,列表是比数据框架更为松散的数据结构,列表可以将不同类型,不同长度的数据打包,而数据框架中要求被插入的数据长度和原来的长度是一致的。 IS.AS list(asia.frame,country) 1: GDP POP INFLAT IS.AS P.R.China 1.4 12.92 1.2 AS Japan 4.5 0.56 -0.8 AS KOREA 1.4 4.5 0.4 AS 2: 1 “P.R.China“ “Japan“ “KOREA“,第四节 数据处理,1.从键盘输入数据: 例8: x_scan( ) 1: 23 45 68 8 5: 34 7 7: x 1 23 45 68 8 34 7 2.读入矩阵: 例9: matrix(scan(“c:datawh.txt“),3) V1 V2 V3 1 0.64 0.32 0 2 0.28 0.14 1 3 0.0

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > PPT模板库 > PPT素材/模板

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号