第2章 变量计算及转换2.1 SPSS内部函数 1、SPSS基本运算第2章 变量计算及转换2. SPSS表达式(1) 算术表达式 A+B(2) 关系表达式 A>B(3) 逻辑表达式 A>b&C=6逻辑运算中优先级的顺序为:最高级为not,其次为and,最后为or 3. SPSS内部函数(180个)(1) 算术函数(2) 统计函数(3) 概率函数2.2 变量计算及其运用Compute 命令 (1)打开数据文件,执行Transform—Compute命令2.2 变量计算及其运用(2)输入计算表达式 (3)定义新变量以及类型在Target(目标)框中定义目标变量名,type & label 按钮定义变量类型与标签 2.2 变量计算及其运用(4)条件表达式(if)在 Compute Variable对话框中单击if按钮,打开if Cases 条件对话框实习:n打开数据文件“第二章数据文件/变量计算.sav”n选择飞行员时要选择那身高与体重的比值在一 定范围内的人员,因此需要计算身高与体重的 比例前提条件是选择身高在175——185cm 之间的男生即可n选择所有男生中身高与体重的比值大于2.5的 观测量,并计算每个学生8门成绩总和。
n对总成绩进行降序排列2.3 设定随机数种子Transform---Random Number seed(随机数种子)命令, 打开Random Number seed对话框•Set seed to: 每次产生随机数种子之前,选择此选项 •Random Seed: 系统默认的选项2.4 特定变量值计数(1)执行Transform---Count命令打开Count Occurrences of Values within Cases 在对话框的Target Variable中输入目标变量名,用于保存 计数结果Target label框中输入变量名标签2.4 特定变量值计数(2)从源变量中选择准备计数的变量移至Numeric栏中 (3)选中Numeric Variable 框中的变量,单击 Define Values 按钮:打开Count Values within Cases: Value to Count对话框2.4 特定变量值计数Define Value(1) Value: 输入要计数的特定的变量值(2)System-missing:系统缺损值出现的次数(3)System-or use-missing:系统缺损值或用户自定义缺损值出现的次数(4)Range:[ ]through[ ] : 针对数值连续可变的数值型变量的计数(5)Range: Lowest through : 变量值上限(6)Range:[ ] through highest: 变量值下限2.4 特定变量值计数(4)如果按指定的条件计数,单击If按钮,在设置条件单击Continue返回主对话框,单击OK执行计数。
实习:n打开数据文件“变量计算.sav”n计数观测量中政治课成绩与英语成绩均 大于80分的同学有哪些同学2.5 变量重新赋值2.5.1 重新赋值给同一个变量 1.主菜单Transform 选择Recode Into Same Variable - old and new value用这货Recode-Into Different Variable2.5 变量重新赋值2.选择要进行编码的变量名,送入Numeric Variable矩形 3.通过条件表达式建立参与编码的观测量子集(1)单击If 对话框中有两个单选项 n Include all cases: 不执行按条件选择观测量n Include If case satisfies condition: 条件式真或假,选择或排除 观测量(2)选择与逻辑表达式有关的变量名(3)单击数字或逻辑符,进入逻辑表达式框中(4)选择使用的函数(5)单击Continue 返回主对话框2.5 变量重新赋值 4.单击Old and New value 弹出对话框(1)建立变量值与编码的对应关系nValue: 输入原始的变量值nSystem-missing: 系统缺损值与自定义编码的对应关系nSystem-or user-missing: 系统缺损值或用户自定义的缺损值与编码的对应关系2.5 变量重新赋值nRange:[ ]through [ ]: 连续取值的变量与编码的对应关系nRange:Lowest through[ ]: 变量值 的上限nRange:[ ]through highest: 变量值的下限nAll other value: 剩下的尚未指定的变量可以指定为同一个编码 (2)输入原始变量值对应的编码nValue: 原始变量值对应一个具体的编码nSystem-missing: 原始变量值对应的编码是系统缺损值 (3)单击Continue返回主对话框 5.主对话框中单击“OK”,执行编码操作2.5.2 变量重新赋值给新的变量1.主菜单Transform选择Recode-Into Different Variable2.选择进行编码的变量名,送入input Variables ——output 矩形框 3.在Output Variable 输入存放编码的新变量名和 标签,点击change按钮, 4.点击old and new values按钮4.建立变量值与编码的对应关系5.单击弹出对话框(1)Old Value: 原始变量值(2)New Value :始变量值的编码,可以是数值型 和字符型变量(3)如果要将数值型编码成字符型,选Output variable are string (4)如果原始变量值无定义,则编码后产生的新变量中自 动指定为系统缺损值(5)如果剩余的原始变量不需要再进行编码,则在Old Value选择All other value (6)若选Convert numeric string to numbers 中选项, 则可将字符型转换为数值型(7)可以同时对多个变量值进行编码5.通过条件表达式建立参与编码的观测量子集6.单击OK执行编码实习:n打开数据文件“变量重新赋值与求秩.sav”n1.将统计学成绩“stat”重新赋值:小于59 赋值为1,60~69赋值为2,70~79赋值 为3,80~89赋值为4,大于90分的赋值 为5。
n2.大于59分小于80分的取原值,其余值 定义为缺失值2.6 连续变量离散化(1)执行Transform---Categorize 命令,打开Categorize对话框 (2)从源变量列表中选择一个或几个连续的变量移入Create Categorize,在Number of Categorize输入整数2.6 连续变量离散化实习:连续变量离散化n打开数据文件“变量计算.sav”n将所有观测量按照身高分成等比例的四 组n统计四组不同身高同学的平均身高,请 在同一张表格中输出平均身高的值以便 于比较2.7 观测量求秩1.执行Transform ----Rank cases观测量求秩主对话框2.选择要排秩的变量名,送入Variables变量框(1)参与排秩的变量必须为数值型变量(2)可以同时对多个变量排秩3.分组独立进行排秩,单击分组变 量名,送入By框中选择排秩的方向:Assign Rank 1 to5.在Display summary table 选项,则在日 志文件中添加一个有关原始变量名排秩 产生的新变量及变量标签的列表6.排秩的类型,单击Rank Type2.7 观测量求秩(1)Rank: 普通秩 (2)Savage score: 基于指数分布规律计算出的一种秩 (3)Fractional rank: 分数形式的秩 (4)Fractional rank as %: 百分比形式的秩 (5)Sum of weights: 加权观测量的总和 (6)Ntiles: 按百分比进行分组结的处理方式选择: Ties(1)Mean: 出现同秩变量时,新变量的值取平均 值(2)Low: 出现同秩变量时,新变量的值取最小值(3)High: 出现同秩变量时,新变量的值取最大 值(4)Sequential ranks to value: 出现同秩变量时,新变量连续取值ties 8.单击OK,执行给变量排秩的操作MeanLowHighSequential ranks to unique values901111180232428033242804324270555532.7 观测量求秩一、打开数据文件“变量重新赋值与求秩 .sav”n1.对统计成绩求秩,结的处理方式分别 选择四种mean,low,high,sequential ranks to unique values ,比较其差异。
二、打开数据文件“变量计算.sav”n1.对所有学生的总成绩进行按降序求秩 n2.对学生的总成绩分班级排列名次n1.打开数据文件“机械厂数据文件.sav” 公司财务规定,工资按照下列原则发放 (1)出勤满22天或以上者,按照“日基本工资*出勤天数 +工龄*1.8-应扣水电费”计算,其中应扣水电费:工龄小于10年的工人为50元,工龄 在11-15年的为45元,工龄在16年以上的为40元 (2)出勤15-21天的按照“日基本工资*出勤天数+工龄 *1.2-应扣水电费”计算 (3)出勤14天及以下的按照“日基本工资*出勤天数+工 龄-应扣水电费”计算 (4)计算不同车间工人的月实发工资的平均值与总量 并将平均工资与总工资分别按照在一张表格与分车间的形式分别 输出综合实习下面是一份关于垃圾分类现状的调查,请 根据调查问卷建立一个数据文件,然后 做后面的练习n1.您对将垃圾分类回收的收益与作用了解吗?n A非常了解 B比较了解 C一般 D比较不了解 E非常不了解 2.您认为垃圾分类回收有必要吗? A非常有必要 B有必要 C一般 D没必要 E非常没有必要n 3.您对可回收,不可回收物品了解吗? A非常了解 B比较了解 C一般 D比较不了解 E非常不了解n 4.您是否会将垃圾分类投放? A每次都会 B经常会 C偶尔会 D从不n 5.是否接受过垃圾分类知识的宣传或教育? A经常 B有时 C 偶尔 D从来没有 6.是否会自己尝试搜集并学习有关垃圾分类的知识? A会 B看情况 C不会 D无n 7.您认为影响你将垃圾分类投放的因素是? n A 我认为没有必要将垃圾分类 B不方便,垃圾分类标准不明确 C找不到分类垃圾箱 D对分类垃圾箱的标记不理解 E没有这方面的规定 F 其他n8.您认为影响垃圾分类深入人心的最重要的因素是什么?A 环保意识差 B 生活习惯 C 国家相关法律法规不健全 D 别人也是乱投垃圾 E 其它________n9.您认为能促使您将垃圾分类投放的因素是? A环保意识 B生活习惯 C 国家相关法律法规 D 别人是否乱投垃圾 E其它________n10.您在平时生活中经常见到分类垃圾筒吗?(若选D则直接跳到第12题)A 经常见,到处都是 B一般 C 很少见到 D 从来没见过n11.您认为分类垃圾筒上的分类标记容易理解吗?A非常容易理解 B比较容易理解 C一般 D比较不容易理解 E非常不理解n12.您对现在投入使用的分类垃圾箱满意吗? A非常满意 B比较满意 C一般 D比较不满意 E 非常不满意一。