第4章 文件级别的数据管理教学提纲

上传人:yuzo****123 文档编号:142635643 上传时间:2020-08-21 格式:PPT 页数:17 大小:187.50KB
返回 下载 相关 举报
第4章 文件级别的数据管理教学提纲_第1页
第1页 / 共17页
第4章 文件级别的数据管理教学提纲_第2页
第2页 / 共17页
第4章 文件级别的数据管理教学提纲_第3页
第3页 / 共17页
第4章 文件级别的数据管理教学提纲_第4页
第4页 / 共17页
第4章 文件级别的数据管理教学提纲_第5页
第5页 / 共17页
点击查看更多>>
资源描述

《第4章 文件级别的数据管理教学提纲》由会员分享,可在线阅读,更多相关《第4章 文件级别的数据管理教学提纲(17页珍藏版)》请在金锄头文库上搜索。

1、第4章 文件级别的数据管理,2013.10,“数据”菜单中的项目: 简单命令:插入变量、插入个案、到达某条个案、复制数据集等。 常用的简单过程:排序个案、分割文件、选择个案、个案加权和分类汇总。 数据重组向导:长型和宽型格式数据互换 文件合并向导:添加个案与添加变量 与数据字典有关的功能:定义变量属性与复制数据属性 与数据准备有关的功能:重复个案与异常个案查找向导 与统计模型密切相关的过程 其他过程:定义多重响应集,4.1 几个常用过程,4.1.1 排序个案 “排序个案”( Sort Cases) 排序个案是将数据按照指定的某一个或多个变量值的升序或降序重新排列; 排序变量:用户指定的变量;

2、对所有记录进行排序; 对记录进行分组排序,如分性别排序; 单变量排序和多变量排序; 多变量优先排序;同时设置升序、降序;原数据排列次序变化问题。,4.1.3 选择个案 “选择个案”( Select Cases) 选择个案是对部分数据进行分析; 选择后状态栏显示“筛选范围”(Filter On) 取消选择。,4.1.4 加权个案 “加权个案”( Weight Cases ) 枚举格式和频数格式; 权重变量 选择后状态栏显示“加权范围”( Weight On) 取消加权。,4.1.5 分类汇总 “分类汇总”( Aggregate) 分类汇总是按照指定的分类变量对观测值进行分组,求出指定的描述统计量

3、,结果可存入新数据文件,也可替换当前数据文件; 分类汇总三步骤:指定分类变量和汇总变量;分类并计算;结果保存; 分类汇总产生的记录数和多重分类汇总。 例4.1 按time月份和s0城市对index1进行分类汇总,并将结果保存到新数据文件Sum_index1中。 又例 根据数据transform.sav 中学生的性别和城市变量对英语的平均成绩进行汇总。,4.2 数据文件的重组与转置,4.2.1 数据的长型与宽型格式 长型格式与宽型格式是重复测量数据的两种不同的排列方式,重复测量数据可以使用不同的统计模型(重复测量模型)分析,数据的转换就是必要的。 “重组”(Restructure); 以SPSS

4、的自带文件Anxiety.sav和Anxiety2.sav为例。,4.2.2 长型格式转换为宽型格式 使用“数据重构向导”; 个案重组为变量; 例4.2 将Anxiety.sav转换为Anxiety2.sav的格式。 4.2.3 宽型格式转换为长型格式 使用“数据重构向导”; 变量重组为个案; 例 将Anxiety2.sav 转换为Anxiety.sav的格式。,4.2.4 数据转置 数据转置功能实现的两个途径:“转置”(Transpose);“数据重构向导”的第三 个功能; 对数据进行行列互换,即将记录转为变量,将变量转为记录,数据重新显示。 以数据xuelin.sav为例。,4.3 多个数

5、据文件的合并,“合并文件” (Merge File)添加个案和添加变量 4.3.1 基本概念:纵向拼接和横向合并;案例文件解释 4.3.2 数据文件的纵向拼接 数据文件的纵向拼接是“添加个案”; 例4.3 将数据b.sav中的记录添加到a.sav中,注意变量h-height 又例 将数据transform2.sav中的记录添加到transform.sav中。 4.3.3 数据文件的横向合并 数据文件的横向合并是“添加变量”; 例4.4 将数据c.sav中的变量添加到a.sav中,并尽量保留数据。 例3.9 将数据transform3.sav中的记录添加到transform.sav中。,数据文件

6、横向合并的三个条件: 在两个数据文件中选择公共变量作为关键变量,关键变量可以多个; 两个数据文件按关键变量升序排序; 在不同数据文件中,数据含义不同的列,变量名应不同。,4.4 与数据字典有关的功能,4.4.1 数据字典的基本概念 数据字典是预先定义好的数据格式,包括变量格式、变量名标签、变量值标签、缺失值的定义; 两个数据管理向导:专门用于定义数据字典,或将预定义的数据字典直接引入当前数据文件。,4.4.2 定义变量属性 “定义变量属性”(Define Variable Properties); 用于对数据集中已存在的变量进一步定义其属性:列出所选变量的所有取值;分辨没有值标签的值;自动给出

7、值标签;所选变量与其他变量的属性相互拷贝; 与变量视图的区别。 例:将CCSS数据中的变量S4进行属性设定。 又例:将数据transform.sav中的变量gender进行属性设定。,4.4.3 复制数据属性 “复制数据文件属性”(Cope Data Properties); 用于将定义好的数据字典直接应用于当前文件中,可将一个外部的数据文件相关属性拷贝到当前数据文件中,还可以进行自定义,只选择某些变量,或者某些属性进行拷贝; 例:将CCSS数据中的变量A3的属性定义复制到A4-A16变量。 又例:将数据transform.sav中相关的变量属性作为数据字典应用到另一数据集transform2

8、.sav中。,4.5 与数据准备有关的功能,4.5.1 标识重复个案 “标识重复个案”(Identifying Duplicate Cases); 查找个别变量值重复,或者所有数值完全重复的记录; 例4.5 将CCSS案例数据第2、4条个案的ID变量值更改为1,然后按照time、id均相同的保准查找重复记录。 又例:以数据company_rongyu.sav为例 。,4.5.4 标识异常个案 “标识异常个案” 可能是录入错误所致,或确实存在异常值; 1.算法原理 计算过程:建模、评分、列出原因 例4.6 根据indexl、indexla、indexlb三个变量的取值在CCSS数据中标识异常个案。,

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 中学教育 > 教学课件 > 高中课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号