Chapter01 R语言介绍

上传人:101****457 文档编号:53938561 上传时间:2018-09-06 格式:PPT 页数:42 大小:1.27MB
返回 下载 相关 举报
Chapter01 R语言介绍_第1页
第1页 / 共42页
Chapter01 R语言介绍_第2页
第2页 / 共42页
Chapter01 R语言介绍_第3页
第3页 / 共42页
Chapter01 R语言介绍_第4页
第4页 / 共42页
Chapter01 R语言介绍_第5页
第5页 / 共42页
点击查看更多>>
资源描述

《Chapter01 R语言介绍》由会员分享,可在线阅读,更多相关《Chapter01 R语言介绍(42页珍藏版)》请在金锄头文库上搜索。

1、南京信息工程大学数学与统计学院,统计分析软件应用,课时安排:理论课:48 学时 实习课:16学时 教材:理论课:无指定教材 参考书目: R语言实战(R in Action, 2nd edition) 薛益、陈立萍.统计建模与R软件,清华大学出版社.,课程安排,上机:4-16周 双周周四5-6节 地点:尚贤楼 812 双周 4、6、8、10、12、14、16要求: 掌握统计软件基本编程与使用 应用:分析数据阅读文献、上机练习 测试:上机测试、理论考试相结合,成绩评定,1、上机报告,递交上机报告电子版 2、上机测验 3、综合测验 4、开卷考试(笔试),2008美国最佳职业排行榜,精算师(Actua

2、ry) 统计师(statistician) 生物学家(Biologist) 软件工程师(Software engineer) 金融策划师(Financial planner) 计算机系统分析员(Computer-systems analyst) 会计师(Accountant) 其它,统计的应用领域,经济学,管理学,医学,工程学,社会学,统计学,actuarial work (精算) agriculture (农业) animal science (动物学) anthropology (人类学) archaeology (考古学) auditing (审计学) crystallography (

3、晶体学) demography (人口统计学) dentistry (牙医学) ecology (生态学) econometrics (经济计量学) education (教育学) election forecasting and projection (选举预测和策划) engineering (工程) epidemiology (流行病学) finance (金融) fisheries research (水产渔业研究) gambling (赌博) genetics (遗传学) geography (地理学) geology (地质学) historical research (历史研究)

4、 human genetics (人类遗传学),统计的应用领域,统计的应用领域,hydrology (水文学) industry (工业) linguistics (语言学) literature (文学) manpower planning (劳动力计划) management science (管理科学) marketing (市场营销学) medical diagnosis (医学诊断) meteorology (气象学) military science (军事科学) nuclear material safeguards (核材料安全管理) ophthalmology (眼科学) p

5、harmaceutics (制药学) physics (物理学) political science (政治学) psychology (心理学) psychophysics (心理物理学) quality control (质量控制) religious studies (宗教研究) sociology (社会学) survey sampling (调查抽样) taxonomy (分类学) weather modification (气象改善),统计数据类型,统计数据分类,如何成功地处理、分析和理解数据:,获取数据(从各种数据源将数据导入程序); 整理数据(编码缺失值、修复或删除错误数据、将

6、变量转换成更方便的格式); 注释数据(以记住每段数据的含义); 总结数据(通过描述性统计量了解数据的概况); 数据可视化(一图胜千言); 数据建模(解释数据间的关系,检验假设); 整理结果(创建具有出版水平的表格和图形)。,统计软件,统计软件的发展,使得统计从统计学家的圈内游戏变成了大众游戏。统计是使用计算机进行数字计算最多的用户。 统计软件的问题: 统计软件则不那么负责。只要数据格式无误、方法不矛盾而且不用零作为除数就一定给你结果,而且没有任何警告。 可能统计学家缺乏商业头脑。 统计软件输出的结果太多。即使是同样的方法,不同软件输出的内容还不一样;有时同样的内容名称也不一样。 这就使得使用者

7、大伤脑筋。即使统计学家也不一定能解释所有的输出。 在使用傻瓜式软件的同时更要理解统计原理及其意义!,统计软件介绍,统计软件的种类很多 有些功能齐全 有些价格便宜 有些容易操作, 有些需要更多的实践才能掌握 还有些是专门的软件,只处理某一类统计问题 最常见有几种,SAS,这是功能非常齐全的软件 美国政府政策倾斜(“权威性”) 许多美国公司使用 价格不菲 尽管现在已经尽量“傻瓜化”,仍然需要一定的训练才可以进入,SPSS,一个很受欢迎的统计软件 它容易操作 输出漂亮 功能齐全 价格合理 对于非统计工作者是很好的选择,Excel,严格说来不是统计软件,但作为数据表格软件,必然有一定统计计算功能。 注

8、意,多数装Office时没有装数据分析的功能,画图功能都具备(虽然不好看)。 对于简单分析,Excel还算方便,但随着问题的深入,就不那么“傻瓜”,需要很麻烦地使用函数,甚至根本没有相应的方法了。,S-plus,统计学家喜爱的软件之一 功能齐全,图形漂亮 有不断加入的各个方向统计学家编写的统计软件包。也可以自己加入算法 强大而又方便的编程功能,使得研究人员可以编制自己的程序来实现自己的理论和方法 它也在进行“傻瓜化”以争取顾客。但主要以其方便的编程为顾客所青睐 在R软件之前是统计学家的首选软件,但是对于不会编程者,不那么“傻瓜”,Python,其他有关软件,Minitab:这个软件是很方便的功

9、能强大而又齐全的软件,也已经“傻瓜化”,在我国用的不如SPSS与SAS那么普遍 Statistica:也是功能强大而齐全的“傻瓜化”的软件,在我国用的也不如SAS与SPSS那么普遍 Eviews:这是一个主要处理回归和时间序列的软件 Systat: 已经被SPSS购买而消失 GAUSS:这是一个很好用的统计软件,许多搞经济的喜欢它。主要也是编程功能强大。目前在我国使用的人不多,其他有关软件,MATLAB:这也是应用于各个领域的以编程为主的软件,在工程上应用广泛。编程类似于S和R。但是统计方法不多。 FORTRAN:这是应用于各个领域的历史很长的非常优秀的编程软件,功能强大,有大量数学软件包及一

10、定的统计软件包。计算速度比前面介绍的都快得多。但需要编程和编译。操作不那么容易。 C/C+: 是许多软件,诸如SAS的基础;但没有软件包,编程不方便.,R软件,免费的,志愿者管理的软件 R是一个全面的统计研究平台,提供了各式各样的数据分析技术 其编程语言与S-plus所基于的S语言一样; R拥有顶尖水准的制图功能,编程方便,语言灵活; R是一个可进行交互式数据分析和探索的强大平台; R可以轻松地从各种类型的数据源导入、导出数据; R囊括了在其他软件中尚不可用的、先进的统计计算例程,有不断加入的各个方向统计学家编写的统计软件包。也可以自己加入自己算法的软件包 从网上可以不断更新和增加有关的软件包

11、、数据和程序。可以使用其他软件编制的程序 可以通过网上服务把程序变成机器语言 这是发展最快的软件,受到世界上统计师生的欢迎。是用户量增加最快的统计软件 R可运行于多种平台之上,包括Windows、UNIX和Mac OS X。,R 起源于1990s ,由 Ross Ihaka and Robert Gentleman at the University of Auckland, New Zealand 提供 statistical environment,Robert Gentleman,Ross Ihaka,http:/www.r-project.org,R 界面,Command box,Gr

12、aphics box,Menu,Icons,1.2 R 的获取和安装,R可以在CRAN(Comprehensive R Archive Network)http:/cran.r-project.org上免费下载。RStudio:https:/ R 的使用,R是一种区分大小写的解释型语言 R语句由函数和赋值构成。R使用 -,而不是传统的 = 作为赋值符号 注释由符号 # 开头。 10名婴儿的月龄和体重: age - c(1,3,5,2,11,9,3,9,12,3)weight - 4.4,5.3,7.2,5.2,8.5,7.3,6.0,10.4,10.2,6.1)mean(weight)sd(w

13、eight)cor(age,weight)plot(age,weight),demo(),若想大致了解R能够作出何种图形,在命令行中运行demo(graphics)即可。 其他的演示还有demo(Hershey) 、demo(persp) 和demo(image)。 要看到完整的演示列表,不加参数直接运行demo()即可,1.3.2 获取帮助,1.3.3 工作空间(workspace),工作空间(workspace)就是当前R的工作环境,它储存着所有用户定义的对象(向量、矩阵、函数、数据框、列表)。 在一个R会话结束时,你可以将当前工作空间保存到一个镜像中,并在下次启动R时自动载入它。 各种命

14、令可在R命令行中交互式地输入。使用上下方向键查看已输入命令的历史记录。这样我们就可以选择一个之前输入过的命令并适当修改,最后按回车重新执行它。,dir.create()来创建新目录, setwd()将工作目录指向这个新目录 在独立的目录中保存项目是一个好主意。通常会在启动一个R会话时使用setwd()命令指定到某一个项目的路径,后接不加选项的load()命令。这样做可以从上一次会话结束的地方重新开始,并保证各个项目之间的数据和设置互不干扰。 在Windows和Mac OS X平台上,跳转到项目所在目录并双击保存的镜像文件即可。这样做可以启动R,载入保存的工作空间,并设置当前工作目录到这个文件夹

15、中。,1.3.4 输入和输出,source(“script1.R“) sink(“myoutput“,append=TRUE,split=TRUE) pdf(“mygraphs.pdf“) source(“script2.R“) sink() dev.off() source(“script3.R“),包(package)可从 http:/cran.r-project.org/web/packages下载 包是R函数、数据、预编译代码以一种定义完善的格式组成的集合。 计算机上存储包的目录称为库(library)。函数.libPaths()能够显示库所在的位置, 函数library()则可以显示库中有哪些包 R自带了一系列默认包(包括base、datasets、utils、grDevices、graphics、stats以及methods),它们提供了种类繁多的默认函数和数据集。其他包可通过下载来进行安装。安装好以后,它们必须被载入到会话中才能使用。命令search()可以告诉你哪些包已加载并可使用,

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 资格认证/考试 > 医师/药师资格考试

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号