文档详情

spss数据库建立与编辑(二)

第***
实名认证
店铺
PPT
498.01KB
约40页
文档ID:58423709
spss数据库建立与编辑(二)_第1页
1/40

数据文件的建立与编辑,,一、一般概念,数据库是统计分析的基础,一个完善而简洁的数据库,可以提高研究和分析的效率 数据库多为二维(行列)表结构,一般列为变量(variable),行为个体(case)数据表中的一个格(cell)放一个数据 建立一个数据库分为三个基本步骤: 定义变量 输入数据 保存文件,二、进入SPSS前的准备工作,编码的概念: 根据一定的规则将研究资料转换为可进行统计分析的数码资料的过程编码的步骤,确定变量 变量:用来反映文意概念的量化形式在统计中往往指最小的分析单位编码就是对变量进行编码变量由两个部分构成:变量名和变量值要注意区分何为变量,何为变量值在调查问卷中还要注意区分问题和变量思考,例:如下问题艾滋病传播途径有几个? 你关于艾滋病传播途径知识的来源是: 专题讲座 网络 学校 朋友 父母等,编码的步骤,制作编码表 变量 未回答、缺失值 不适用 不知道 编码:根据编码表对问卷进行编码,而后将编码结果记录在问卷上或编码纸上变量类型,数值型变量字符型变量,变量名定义原则,唯一性 首字符不能是数字 变量名不能使用键盘上的#、¥、%等 变量名不能使用系统内部保留字,all 、and 、by 、with 、not 、eq等 变量名不能以“.”结尾,四、数据录入、编辑,在完成变量定义后,单击左下方的data view标签,激活数据表。

即可录入 编辑 修改 复制和粘贴 数据删除,操作技巧,连续多个相同值的输入 可利用复制、粘贴的方法 将EXCEL数据直接引入SPSS 先在EXCEL中选中所有的数据(不包括变量名),拷贝,然后再切换到SPSS,执行粘贴命令再定义相应的变量即可 将WORD中的数据直接引入SPSS 与在EXCEL相类似 如果表中全部是数据,则全选 如果表中有文本,则与EXCEL相同,五、数据整理(data),一般概念 数据整理是对原始数据中的变量或个体进行 增加 删除 排序 倒置(较少使用,不在介绍 合并 加权,1、插入或删除(变量或个体),如果发现这是一种错误操作,可通过选择edit---undo 进行恢复2、个体排序(data --- sort case),排序变量栏 可以是多个变量 以第一个变量为先 排序类型 升序 降序,3、合并文件(data---merge files),合并文件的功能是某外部文件与当前数据合并一个新工作数据,新工作数据包括个体或变量的增加 个体的增加是纵向合并;变量的增加是横向合并 增加变量时,外部文件与当前文件均必须是升序排列文件1)、数据纵向合并(merge file---add case),kw:,(2)、数据横向合并(add variable),对话框:,Excluded variables :(拒绝变量栏) New working data:(新工作数据变量栏) Match case on key variable in sorted:(排序文件中按关键变量匹配个体选项) Both files provide cases:由外部和当前文件两者提供个体。

External file is keyed table:外部文件为关键表以当前数据为基准,外部文件匹配当前数据的关键变量值,如果成功,外部文件的新变量值加入当前数据的新变量中,匹配不成功则不加入对话框:,Working file is keyed table:当前数据为关键表以外部文件为基准,当前数据匹配外部数据的关键变量值,如果成功,外部文件的新变量值加入当前数据的新变量中,匹配不成功则舍去当前数据的该个体 Key variables:关键变量栏 在拒绝变量栏中选择某变量作为关键变量 Indicate case source as variable:指示个体来源的变量选项 数值‘0’表示源工作数据的个体,数值“1”表示外部文件的个体:增加变量(不选择关键变量),:增加变量(选择关键变量),4、拆分数据文件 教材P93,在进行数据的处理时,经常对数据中的个体进行分组分析 “拆分”并非将一个数据文件拆分为两个或多个独立的数据文件,而在同一个数据文件按某个条件分组 拆分后,拆分处理一直有效,直到取消拆分处理或更改拆分变量才会有新的变化  : Data split file对话框,,取消“拆分” 结果放在一起分析 单独显示指明当前状态,5、选择个体,选择某些符合条件的个体,All case: 所有个体,系统默认值。

If condition is satisfied:按给定条件选择个体 If :是条件按钮,激活对话框 Random sample of cases:随机选择个体 Sample:随机样本按钮,激活对话框 Based on time or case range:在某范围内选择人全部个体 Range :范围按钮,激活对话框 Use filter variable: 过滤变量为0值或缺失值为非选择个体,其余为选择个体Unselected case are: 非选择个体单选项 Filtered : 过滤棵选择个体,产生过滤变量filter_$ filter_$值为0时表示个体是非选择个体,不进行统计分析,但仍在工作文件中变量filter_$为1表示该个体是选择个体,可以对它进行统计分析 Deleted : 删除个体删除不符合条件的个体,产生新文件 注意:删除的个体不可恢复6、加权个体 见教材P83,加权个体的功能是变量为频数变量Do not weight cases: 非加权个体变量选项 Weight cases by: 加权个体变量选项 Frequency variable 频数变量栏。

放入频数变量 Current status: 当前工作状态是否加权频数变量六、数据变换,一般概念 在整理数据时,常常需把某些变量的数据进行变换,这些数据变换是通过一个有效的数值表达式或SPSS的内部函数(如对数、平方根、倒数、比值等)来实现 另外,连续变量也可以变换为分类变量 :这儿我们只介绍: 如何建立新变量建立新变量,新变量的数据是对每个个体求数据值表达式的结果新变量可以是数值型或字符型的  transform  compute弹出一对话框Target variable 新变量栏 Type & label 类型与标签 Numeric expression 数值表达式 Functions 函数 If…:条件表达式按钮应用实例1:,例题2,测克山病人6例与6名健康人的血磷值如下: 病人:2.60 3.24 3.73 4.32 4.73 5.18 健康人:1.67 1.98 1.98 2.33 2.34 2.50 试建立数据文件,小结,建立一个数据文件,有哪些步骤? 变量名的定义原则?,。

下载提示
相似文档
正为您匹配相似的精品文档
相关文档