R语言:数据集的创建

上传人:飞****9 文档编号:127388228 上传时间:2020-04-01 格式:PPT 页数:26 大小:209.50KB
返回 下载 相关 举报
R语言:数据集的创建_第1页
第1页 / 共26页
R语言:数据集的创建_第2页
第2页 / 共26页
R语言:数据集的创建_第3页
第3页 / 共26页
R语言:数据集的创建_第4页
第4页 / 共26页
R语言:数据集的创建_第5页
第5页 / 共26页
点击查看更多>>
资源描述

《R语言:数据集的创建》由会员分享,可在线阅读,更多相关《R语言:数据集的创建(26页珍藏版)》请在金锄头文库上搜索。

1、 R语言 数据集的创建 1 范式的起源 范式 的概念和理论是美国著名科学哲学家托马斯 库恩 Thomas Kuhn 提出并在 科学革命的结构 TheStructureofScientificRevolutions 1962 中进行系统阐述并发展而来的 在库恩看来 范式也指一种对本体论 认识论和方法论的基本承诺 是科学家集团所共同接受的一组假说 理论 准则和方法的总和 这些东西在心理上形成科学家的共同信念 库恩说 范式也指那些公认的科学成就 它们在一段时间里为实践共同体提供典型的问题和解答 这些成就一般具备两个基本特征 一是它们空前地吸引一批坚定的拥护者 使他们脱离科学活动的其他竞争模式 同时

2、这些成就又足以无限制地为重新组成的一批实践者留下有待解决的问题 1 从存储角度划分对象R的数据对象可以划分为数值型 字符串型和逻辑型等主要存储类型 1 数值型数值型 numeric 是计算机存储诸如年龄 身高和体重等数字形式数据的类型 具体表现形式 如25 1 76以及1 67E2等 2 字符串型字符串型 character 是计算机存储诸如姓名 地名等字符形式数据的类型 具体表现形式 如 LiMing Hubei 等 3 逻辑型逻辑型 logistic 是计算机存储诸如是否同意 是否真假等是非判断形式的数据类型 逻辑型数据只有真 是 假 非 两个取值 具体形式为大写的英语单词TRUE和FAL

3、SE 他们之间的关系是TRUE等于 FALSE FALSE等于 TRUE 其中 符号 表示反向操作 一 R的数据对象 二 从数据结构角度划分1 向量向量 vector 是用于存储数值型 字符型或逻辑型数据的一维数组 它是R数据组织的基本单位 用于组织多个数据 由于统计分析的基本单位是变量 变量具有多个变量值 因此 一个向量也可以视为一个变量 是多个具有相同存储类型的数据的集合 若无特殊说明 向量均为列向量 2 向量的赋值 1 标向量只含有一个元素的向量成为标量 创建标量的赋值语句的基本书写格式为 对象名 R常量 2 操作实例 V1V1V2V2 V3V3 3 向量类型的判断 is 类型名 函数可

4、用于判断数据对象是否为向量 基本书写格式为 is vector 数据对象名称 is numeric 数据对象名称 is character 数据对象名称 和is logistic 数据对象名称 函数可用于判断对应的向量是否依次为数值型向量 字符串型向量或逻辑型向量 结果以TRUE或FALSE的形式出现 操作实例 is vector V1 is character V2 3 多元素向量对象的赋值 赋值语句的基本书写格式为 对象名 R函数赋值操作符的左侧为R函数 其具体形式视具体情况而定 其中 常用的R函数是c函数 基本书写格式为 c 常量或向量名列表 其中 各常量或向量名之间需用逗号隔开 实例操

5、作 V1V1 c 4 6 用于查找V1变量中的第4个和第6个元素 V3 c 2 4 2 矩阵矩阵 matrix 用于组织多个具有相同存储类型 数值型 字符型或逻辑型 的变量 是二维表格形式 通常情况下 矩阵的列为变量 行为观测 1 矩阵的创建可以通过is matrix函数判断数据对象是否为矩阵 基本书写格式为 is matrix 数据对象名称 若指定对象为矩阵 则结果为逻辑型常量TRUE或者FALSE 1 矩阵可视为多个向量合并的结果R向量默认为列向量 可通过合并函数将多个已有向量合并成矩阵 基本书写格式为 cbind 向量名列表 向量名之间用英文逗号隔开 各向量的存储格式应一致 行数取决于向

6、量所包含元素个数 列数取决于向量的个数 可通过以下函数显示行列数 dim 矩阵名 因矩阵是通过列向量合并而成的 矩阵各列的名称默认为列向量名 各行尚未命名 可通过以下函数显示矩阵列的名称 或为列重新命名 colnames 矩阵名 或colnames 矩阵名 列常量位置1 列常量位置2 位置常量用于指定仅显示名称的列 以下函数用于显示矩阵各行的名称或为行命名 rownames 矩阵名 或rownames 矩阵名 行常量位置1 行常量位置2 实例操作 V1dim V1 显示矩阵的行列数 str V1 显示对象结构 colnames V1 显示矩阵各列名称 colnames V1 3 5 显示矩阵制

7、定列名称 rownames V1 rownames V2 is matrix V1 判断V1是否为矩阵 说明 该矩阵为一个3行8列的矩阵 行数取决于列向量所包含的元素个数 列数取决于列向量的个数 矩阵显示中 第1行为各列标题 各行为行标题 列合并时各向量包含的元素个数相等 或者整数倍数 行合并函数rbind 向量名列表 也是创建矩阵的一种方式 2 矩阵可由单个向量派生而来如果矩阵中的数据元素已经存在于一个向量中 则可以利用marix函数将改向量按制定方式派生为矩阵 基本书写格式为 marix 向量名 nrow 行数 ncol 列数 byrow TRUE FALSE dimnames list

8、行名称向量 列名称向量 实例操作 adim1dim2V2V2说明 dim项可以省略 表示所生成的矩阵没有行列名称 访问矩阵中的元素 1 访问制定位置的元素 有三种基本书写格式 分别为 矩阵名 行位置常量 列位置常量 矩阵名 行位置常量1 行位置常量2 列位置常量1 列位置常量2 矩阵名 c 行位置常量列表 列位置常量列表 实例操作 V1 2 3 访问第2行 第3列的位置上的元素 V1 1 2 1 3 访问第1 2行 第1 3列位置上的元素 V1 1 2 c 1 3 访问第1 2行 第1 3列位置上的元素 访问指定行上的所有元素 有四种基本书写格式 分别为 矩阵名 行位置常量 矩阵名 行位置常量

9、1 行位置常量2 矩阵名 c 行位置常量列表 矩阵名 行位置向量名 访问指定列上的所有元素 有四种基本书写格式 分别为 矩阵名 列位置常量 矩阵名 行位置常量1 行位置常量2 矩阵名 c 行位置常量列表 矩阵名 行位置向量名 说明 省略英文逗号前面的行位置参数 表示访问指定列上的所有行 实例操作 V1 2 表示第2行上的所有元素 V2 c 1 3 访问第1 3行上的所有元素 aV1 a 利用逻辑型位置向量访问第1 3行上的所有元素 V1 1 3 访问第1 3列上的所有元素 a marix nrow 5 ncol 2 创建一个5行2列的矩阵 初始值默认为NA 3 数组的创建数组以三维方式组织数据

10、 是矩阵的扩展形式 数组可以通过array函数创建 基本书写格式为 array 向量名 维度说明 dimnames 维名称列表 数组中的数据已事先存储在指定的向量名称中 维度说明用于描述3个维度的最大值 dimnames用于指定各维的名称 可以省略 可以通过is array函数来判断数据对象是否为数组 基本书写格式为 is array 数据对象名 如果指定对象为数组 结果为逻辑型常量TRUE 否则为FALSE 数组元素的访问方式与矩阵类似 但需指定3个维度 实例操作 创建一个为a的数组 adim1dim2dim3aa 逐张显示各张二维表的名称说明 数组显示以表格为单位 依次列出各表格的数据内容

11、数组元素的访问方式与矩阵元素的访问方式类似 只是需要分别指定行号 列号3个位置参数 四 数据框的创建可以通过is data frame函数可判断数据对象是否为数据框 基本书写格式为 is data frame 数据对象名 如果指定对象为数据框 结果为逻辑型常量TRUE 否则为逻辑型常量FALSE 1 创建数据框数据框可以被视为多个存储类型不同的向量集合 创建数据框就是要指定数据框由哪些向量组成 这些向量对应数据框的哪些域 数据框是一张二维表格 行和列统计上分别成为观测和变量 计算机分别称为记录和域 其中 变量名称对应的称谓是域名 变量值对应域值 基本书写格式为 data frame 域名1 向

12、量名1 域名2 向量名2 数据框中的数据事先已经存储在各向量中 它们与各域一一对应 可以通过以下函数显示各个域名 具体书写格式为 names 数据框名 实例操作 V5V5 names V5 显示数据框的域名 str V5 显示数据框的结构信息 is data frame V5 判断V5是否为数据框数据框的访问有3中基本方式 数据框名 域名 表示访问指定数据框中的指定域数据框 域名 数据框 域编号 其中指定将访问的域是数据框的第几个域 域编号取决于数据框创建的顺序 此外 还可以通过attach和detach函数简化访问时的域名书写 基本书写格式为 attach 数据框名 访问域名1访问域名2等d

13、etach 数据框名 attach为数据框绑定函数 detach为数据框解除绑定函数 attach和detach函数必须配对出现 实例操作 V5 V5 Fwind 访问Fwind域 V5 Ftemp 访问Ftemp域with函数的使用函数 基本书写格式为 with 数据框名 域访问函数1域访问函数2等等 说明 with函数中的大括号必须成对出现 with函数允许读取域中的数据 但不允许修改 可改用within函数 5 列表的创建与访问列表创建函数的基本书写格式为 list 成分名1 对象名2 成分名2 对象名2 对象是空间已有的 与各成分一一对应 可以通过以下函数显示各个成分名 具体书写格式为

14、 names 列表名 可通过is list函数判断数据对象是否为列表 基本书写格式为 is list 数据对象名 反馈结果为逻辑型常量TRUE和FALSE 实例操作 创建访问一个名称为V6的列表 成分名称分别为L1 L2 L3 依次对应a b c三个对象 abb 1 seq from 1 to 10 by 2 b 2 seq from 10 to 1 by 2 cV6name V6 显示列表V6的各成分名 str V6 显示对象V6的存储类型和结构信息 is list V6 判断V6是否为列表 2 列表的访问列表的访问有3中基本方式 列表名 成分 表示访问指定数据框中的指定成分列表名 成分 列

15、表名 成分 二 数据的录入 一 键盘的录入两种录入方式 用R内置的文本编辑器和在代码中嵌入数据 R中的函数edit 会自动调用一个允许手动输入数据的文本编辑器 具体步骤如下 1 创建一个空数据框 或矩阵 其中变量名和变量的模式需与理想中的最终数据集一致 2 针对这个数据对象调用文本编辑器 输入你的数据 并将结果保存回此数据对象中 实例操作 创建一个名为mydata的数据框 它含有三个变量 age 数值型 gender 字符型 和weight 数值型 然后你将调用文本编辑器 键入数据 最后保存结果 mydatamydata edit mydata 2 在代码中嵌入数据mydatatxt ageg

16、enderweight25m16630f11518f120 mydata read table header TRUE text mydatatxt 一 从文本文件中读数据利用read table函数将文本数据读入到向量中 基本书写格式 read table file 文件名 header TRUE FALSE sep 数据分割符 header取TURE表示文本文件第一个标题行 否则为具体数据 sep用于指定文本文件中的各数据列间的分隔符 省略时默认的分割符为空格 制表符 换行符或回车 Forest read table file ForestData txt header TRUE str Forest 二 从SPSS中导入数据read spss file SPSS数据文件名 use value labels TRUE FALSE todata frame TRUE FALSE 三 从Excel中导入数据read spss file Excel数据文件名 工作表编号 headers TRUE FALSE as data frame TRUE FALSE THANKS

展开阅读全文
相关资源
相关搜索

当前位置:首页 > IT计算机/网络 > 其它相关文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号