第3章 SPSS数据文件的 基本加工和处理,3.1 数据文件的整理 3.2数据加工 3.3数据分组 3.4数据文件的其他功能,3.1 数据文件的整理,一、个案排序 二、个案选取 三、数据文件的合并 四、数据文件的转置,一、个案排序,1.排序方法: 将数据编辑窗口的数据,按照用户指定的某个变量或多个变量的变量值的升序或降序重新排列 (1)单值排序 (2)多重排序:主排序变量、第二排序变量、第三排序变量,2.操作步骤,(1). 在主菜单中单击Data - Sort Cases菜单选项,打开对话框;,2.操作步骤,(2). 指定主排序变量到Sort by框中 (3). 点Sort Order框中的排序选项 (4).若是多重排序,指定其他排序变量及排序规则,二、个案选取,1. 选取方式: (1).选择符合一定条件的个案; (2).随机选取个案; (3).选取某一区域内的个案; (4).使用过滤变量选取个案2.操作步骤,(1)菜单选项:Data-Select cases,2.操作步骤,(2)指定按上述哪种选取方式进行个案选取; 按指定条件选取; 随机选取; 选取某一区域 ; 利用过滤变量选取 (3).指定对未选中个案的处理方式。
Filtered: 显示“/”标记 Delete,三、 数据文件的合并,文件合并指的是将一个外部数据文件的数据增加到当前工作文件中去,将它们合并成一个文件它包括两种合并方式 1.纵向合并:从外部数据文件增加观测量到当前数据文件中或追加观测量) 2.横向合并:从外部数据文件增加变量到当前数据文件中纵向合并(增加个案 ),遵循条件: (1).内容合并有意义; (2).不同文件中,数据含义相同的列,变量名和变量类型应相同纵向合并(增加个案 ),(1)首先在数据窗中打开一个待合并的数据文件 (2)按Data→Merge Files→Add Cases顺序,打开Add Cases:Read File对话框纵向合并(增加个案 ),(3) 两个待合并的数据文件中共有的变量名会被自动对应匹配纵向合并(增加个案 ),(4) Unpaired Variables(不成对变量)列表框,列出分属两个文件的不成对变量名,后面有*或+号 若不接受默认配对 a.手工选择两变量,按Pair指定配对; b.先按Rename改名后配对; c.按强行进入选择框纵向合并(增加个案 ),(5) Variables in New Working Data File(在新工作文件中的变量)列表框,列出两个数据文件中变量名和变量类型都匹配的相同变量 。
0-第一个数据文件 1-第二个数据文件,横向合并(增加变量 ),遵循条件: (1)至少有一个变量名相同的公共变量-关键变量; (2)必须均按关键变量排序; (3)数据含义不同的列,变量名不取相同的变量名.,横向合并(增加变量),(3)根据情况处理数据 如只合并两个数据文件中变量名和类型都相同的变量的观测量时,单击OK即可 如两文件的变量类型相同,变量名不同,如height和h,同时选中,单击Pair按钮将选入Variables in New Working Data File中 对于只在一个数据文件中含有的变量并将其移入新数据文件变量表中即可横向合并(增加变量),(1)打开一待合并的数据文件; (2)按Data→Merge Files→Add Variables,打开Add Variables: Read File对话框选择外部数据文件,单击“打开”按钮,打开如图所示的Add Variables from…(从…增加变量)主对话框横向合并(增加变量),横向合并(增加变量),(3) 两个待合并数据文件中的所有变量名出现在New Working Data File框中 (4) 若两文件的个案数据是横向顺序意义对应,按ok完成。
否则进入第(5)步 (5) Excluded Variables(被排除在新文件之外的变量) 列出的是外部文件与工作文件中重复的同名变量横向合并(增加变量),选择Match cases on key variables in sorted files复选项,激活下面三个选择项: Both files provide cases ,默认 External file is keyed table Working Data File is keyed table 横向合并(增加变量),(7) 点击Indicate case source as variable选项,可在合并后的数据文件中的那些个案来自那个数据文件 0-第一个数据文件 1-第二个数据文件,四、数据文件的转置,1. 在主菜单中单击Data- Transpose菜单选项,打开该菜单条;,2.把指定转置的数据文件保留的变量,选入Variables框;,3.选择一个取值唯一的标记变量到Name Variable框中;,4. 单击“OK”按钮,确认后,生成新的数据文件数据的转置—对话框,3.2 数据加工,一、变量转换 二、产生计数变量 三、数据文件的分类汇总,一、变量转换,1.SPSS算术表达式 2.SPSS函数 3.SPSS的条件表达式 4.变量转换的操作步骤,1.SPSS算术表达式,由常量、SPSS变量名、SPSS的算术运算符、圆括号等组成的式子。
注意事项: (1)常量和变量的类型应一致 (2)每个个案都有自己的计算结果 (3)存放结果的变量类型与计算结果的数据类型一致2.SPSS函数,注意事项与前面一致 书写形式:函数名(参数) 如NORMAL(1) 类别:算术函数、统计函数、分布函数、逻辑函数、字符串函数、日期时间函数、缺失值函数和其他函数,3.SPSS的条件表达式,对条件进行判断的式子结果取值:结果为真,若判断条件成立;反之为假 (1)简单条件表达式 如:数学80 (2)复杂条件表达式 如:(数学=80)and not (英语90),4.变量转换的操作步骤,用compute命令计算新变量步骤如下: 1、打开数据文件,执行 Transform(转换)→Compute 打开ComputeVariable(计算变 量)对话框,如图所示 2、Numeric Expression(数值表达式)输计算表达式,,4.变量转换的操作步骤,用compute命令计算新变量步骤如下: 3、在Target(目标)框中定义目标变量名 Label:在框中给目标加注标签 Use expression as label:使用计算目标变量的表达式作为标签,,,4.变量转换的操作步骤,用compute命令计算新变量步骤如下: 4、条件表达式(If……) Include all cases:对所有观测量计算新变量值, Include if cases satisfies condition:对满足条件的观测量计算新变量值。
二、产生计数变量,计数变量:计算变量值中落在指定区间的变量值的个数 1、区间的指定 一个数据点、闭区间、半开半闭区间,二、产生计数变量,2.操作步骤 (1)执行Transform → Count命令打开Count Occurrences of Values within Cases对话框 (2)从源变量列表中选择准备计数的变量移至Numeric栏中二、产生计数变量,(3)在Target框中输入计数变量名 (4) 选中Variables框中的变量,单击Define Values按钮;打开 Count Values within Cases:Value to Count对话框定义区间三、数据文件的分类汇总,1. 基本过程: (1) 指定分类变量和汇总变量; (2) 根据分类变量对个案数据分类,并计算汇总变量的描述统计量; (3) 保存分类汇总结果三、数据文件的分类汇总,2. 操作步骤 (1)打开Data-Aggregate菜单,出现对话框; (2)指定分类变量到Break框; (3)指定汇总变量到Aggregate Variable(s)框; (4)按Function指定计算哪些描述统计量;,三、数据文件的分类汇总,三、数据文件的分类汇总,(5) 指定分类结果的存放目录; (6) 按Name&Label重新指定结果文件中的变量名或加变量名标签; (7)选择Save number of case in break group as variable保存分类组的个案数。
3.3 数据分组,一、数据自动分组 二、数据手工分组,一、数据自动分组,1.本质:依照分组变量值的大小,将个案分成若干组标志变量存放组号 2.操作: (1) 打开菜单:Transform-automatic Recode; (2) 在Variable-New Name 框中指定分组变量;,一、数据自动分组,(3)在New Name 框后输入标志变量名,并按New Name 按钮; (4)指定组号编制方法: Lowest value表示组号按升序排名编制 Highest value表示组号按降序排名编制,二、数据手工分组,1.本质:对所有个案或部分满足条件的个案进行分组同样需要分组变量和标志变量,关键是定义分组区间 2.操作: a.分组结果存入原变量 (1) 打开菜单:Transform - Recode -Into Same Variables; (2) 指定分组变量到Variable;,二、数据手工分组,(3) 按Old and New Values纽进行分组区间定义; (4)定义一个分组区间; (5)单击If…按钮,确定赋值条件二、数据手工分组,b.分组结果存入新变量 (1) 打开菜单:Transform - Recode -Into Different Variables; (2) 指定分组变量到Input Variable -Output 框中; (3)在Variable Output 框后输入标志变量名,并按Change纽确认;,二、数据手工分组,(4) 按Old and New Values纽进行分组区间定义; (5)定义一个分组区间; (6)单击If…按钮,确定赋值条件。
3.4 数据文件的其他处理功能,一、指定加权变量 1.用于计算加权平均数 2.操作: (1)单击菜单:Data-Weight Case (2)点击Weight cases by选项,并指定某变量为加权变量 若取消,点击Do not weight case选项3.4 数据文件的其他处理功能,二、变量集的定义和使用 1.SPSS变量集的定义 (1)系统变量集: ALLVARIABLES变量集 存放所有变量名; NEWVARIABLES变量集 存放了尚未存盘的新定义的变量名 (2)用户自定义变量集 根据需要自己定义3.4 数据文件的其他处理功能,2.定义用户变量集 (1)单击菜单:Utilities-Define Variable Sets,弹出Define Variable Sets窗口; (2)在Set Name框中输入定义的用户变量集的名称 (3)选择若干个变量送入Variables in框中; (4)按Add sets纽将上述定义的变量集加到SPSS变量集中3.4 数据文件的其他处理功能,3.4 数据文件的其他处理功能,3.变量集的使用 (1)单击菜单:Utilities-Use Sets,弹出 Use Sets窗口; (2) 按 纽将需用的变量集选到Sets in Use框中。
按 纽将不需用的变量集选从Sets in Use框中剔出3.4 数据文件的其他处理功能,。