统计分析数据文件的建立和整理

上传人:宝路 文档编号:49806319 上传时间:2018-08-03 格式:PPT 页数:56 大小:478.50KB
返回 下载 相关 举报
统计分析数据文件的建立和整理_第1页
第1页 / 共56页
统计分析数据文件的建立和整理_第2页
第2页 / 共56页
统计分析数据文件的建立和整理_第3页
第3页 / 共56页
统计分析数据文件的建立和整理_第4页
第4页 / 共56页
统计分析数据文件的建立和整理_第5页
第5页 / 共56页
点击查看更多>>
资源描述

《统计分析数据文件的建立和整理》由会员分享,可在线阅读,更多相关《统计分析数据文件的建立和整理(56页珍藏版)》请在金锄头文库上搜索。

1、创建新数据文件定义变量名指定各变量属性输入数据保存SPSS数据文件的建立步骤Date一、变量类型与测量尺度变量类型:数值型 和 字符型 数值型:如分数、收入、销售额等 字符型:如血型、性别等 Tips:SPSS默认的是数值型Date变量类型 vs 测量尺度例:“性别”变量: 1男, 2女“成绩等级”变量:1最高,2中等,3 最低Question:“1” 在不同变量中意义有何不 同?Date测量尺度:数据的测量尺度表现为: 定类尺度定序尺度定距尺度定比尺度 计量水平由低级到高级 定类尺度 Nominal 定序尺度 Ordinal定距尺度 Interval定比尺度 Scale 表示类别或属 性表示

2、类别和顺 序表示类别、顺 序、距离表示类别、顺 序、距离 、比值 性别/宗教信 仰产品等级/学 历分数/温度收入/身高等于或不等于 比较大小加减运算加减乘除Date一般来说,数据的等级越高,应用范围越广泛,等级越低 ,应用范围越受限。 不同测度级别的数据,应用范围不同。 等级高的数据,可以兼有等级低的数据的功能,而等级低 的数据,不能兼有等级高的数据的功能。Date二、定义新变量(进入变量编辑窗口)名称:名称长度控制在8位以 内,并尽量使用英文名称。 类型: 宽度: 小数: 标签:对变量进行解释 值:可简化数据录入例:性别 1男 2女 缺失:缺失值的处理方法,多 用于严格的大型调查 列: 对齐

3、: 测量:变量的测量尺度Date二、定义新变量练习题: ID 城市 北京 广州 上海 深圳 武汉 性别 男 女 文化程度 大专及以下 大专 本科 硕士研究生 硕士研究生以上 职位等级 一般员工 基层管理者 中层管理者 高层管理者 企业规模 小型(50人以下) 中型(50-200人) 大型(200人以上) 企业性质 国企 机关 事业单位 外资 合资 年总收入 月基本工资 1月-12月份加班工资 1月-12月奖金 虚拟100人随机数据的产生(RAND)DateProblems: 名称:尽可能用英文 变量类型:字符 or 数值型,宽度,小数 点 模拟数据的合理性数据检查 无数据 vs 缺失值 变量命

4、名必须唯一,不能有两个相同的 变量名DateSPSS数据文件的建立1、数据的输入 2、数据的检查 3、数据整理*SPSS数据文件的建立 1、数据的输入 (进入数据编辑的数据窗口data view) 在SPSS中直接输入从外部文件导入 (1)Excel(.xls):菜单:file open data选择.xls文件类型直接从excel中copy,paste到spss Tips:简单但不智能,如变量名空缺,字符型变量缺失 (2)文本文档(.txt)菜单:fileRead text data*Exercise1、导入SPSS自带的demo.xls文件,导入时只 要包含demo中的前三个变量2、导入S

5、PSS自带的demo.txt文件Tips:C:Program Files SPSS tutorial sample_filesdemo(.xls/.txt)DateProblems: 名称:尽可能用英文 变量类型:字符 or 数值型,宽度, 小数点 模拟数据的合理性数据检查 无数据 vs 缺失值Date三、数据的录入和修改(进入数据编辑的数据窗口data view) 1. 在SPSS中直接录入Tips:使用键盘而非鼠标进行操作Date三、数据的录入和修改2. 从外部文件导入 (1)Excel(.xls): 菜单:file open data选择.xls文件类型 直接从excel中copy,pa

6、ste到spss Tips:简单但不智能,如变量名空缺,字符型变量缺失(2)文本文档(.txt) 菜单:fileRead text dataDate 第一步:“你的文本文件和预定义 格式是否相一致”Date 第二步:“变量如何排列”?“变量名包括在文件最前面么?”Date 第三步: “第一条记录从第几行开始” “你的记录是怎样存储在文件中的?” “你想导入多少条记录?” Date 第四步:“变量间用的是哪种分隔 符?” Date 第五步:“定义在数据预览窗口中所选 择的变量。” Date 第六步: “你愿意保存这次的文件(读入)格式设置 以备下次使用吗?” “你是否愿意将以上操作粘贴为SPSS

7、语句? ” DateExercise1、导入SPSS自带的demo.xls文件,导入时只 要包含demo中的前三个变量2、导入SPSS自带的demo.txt文件Tips:C:Program Files SPSS tutorial sample_filesdemo(.xls/.txt)Date三、数据的录入和修改数据必须输入正确才能保证正确的 分析结果。 但很难一次输入正确,所以就需要 进行修改,一般包括数据的插入、 删除、修改等。Date三、数据的录入和修改 找到单元格 重新输入数据查找办法: 1、移动指针到指定序号的观测值 Data Go to Case 2、查找指定变量中的指定数据(定位

8、到单元格)Edit+Find(或工具栏上的Find图标按钮) Date三、数据的录入和修改 插入一个变量 在现存变量的右边:直接在Variable View中定义 在现存变量的中间: Data View或Variable View 点击右键“insert variables” 菜单:Data Insert Variable Tips:所添加的变量都在现存变量前一个位置 删除一个变量 Data View选中一列数据,右键clear Variable View选中一变量名,右键clear Date三、数据的录入和修改 插入一个观测值 在最后:直接输入 在中间 :Data Insert Cases

9、Tips:结果是直接插入一空白行 删除一个观测值 选中观测量序号,后按Del,或右键clear批量数据调整 选中一列数据,鼠标右键cut,copy,pasteExercise:数据的录入和修改Date数据文件的管理 SPSS的一个重要功能File, Data, Transform 三大菜单Date数据文件的管理之File菜单详解 一、新建数据文件(略) 二、导入外部数据(重点) 三、保存数据文件Save 保存为同一数据文件Save as 保存为不同数据文件, 或者只保存文件中的部分变量 Example in SPSSDate 四、File 菜单中的其他 条目 Display Data Info

10、 系统会在结果窗口中显示所 选数据文件的详细情况,包 括建立时间、标签设置、变 量设置等信息 Give Example Cache Data 缓冲区 加快处理速度,用于处理远 程数据 Print 和 Print view 打印和打印预览 Date数据文件的管理之Utilities菜单详解 一、 Utilities Variables 菜单项: 该菜单项用于显示各个变量的基本信息 注:与FILE菜单中的Display Data Info 有所不同,前者单独显示各个变量的信息,后 者显示整个文件的信息 Give example二、 Utilities File info菜单项:Thinking:比

11、较File菜单中的display data info 与Utilities菜单中的variables以及Display data info 三者功能有何不同?Date数据文件的管理之Utilities菜单详解三、 UtilitiesDefine Sets :定义变 量集 用途:当数据文件中涉及到大量的变量 ,而我们所做的统计分析仅用到文件中 的某几个变量时常常需要定义变量集, 即将所要用到的变量定义成一个集合。 Exercise:定义工资表中的变量集Date数据文件的管理之Data菜单详解 【Sort Cases对话框】用途:将数据按照某一变量或某几个变量 进行排序Give ExampleDa

12、te数据文件的管理之Data菜单详解【Transpose对话框】 对数据进行行列转置原文件中的一行数据 变为新文件中的一列数据,反之亦然 可以在原数据文件中指定一个变量记录转置后 的变量名Give Example:性别为新变量名,将第一季度奖金 进行转置Date数据文件的管理之Data菜单详解【Merge Files对话框】 Add cases从外部数据文件中增加记录(仅观测值 )到当前数据文件中,称为纵向合并两文 件需具有相同的变量 Give Example Add variables从外部数据文件增加变量到当前数据文 件,称为横向合并 Give Example DateExercise D

13、ata1:以文化程度(升)和职业等级(降)将 工资表排序 Tips:注意当两个变量的排序相反时,SPSS如何处 理?2:以城市类型为新变量名,将工人全年加 班费(12个变量)进行行列转置 Tips:注意转换后文件的变量名DateExercise Data3:新建一个数据文件,其中含有“城市”和“ 地区”两个变量,每个变量有10个观测值( 数值为随机数),然后将新文件的“城市” 变量中所有观测值合并到“工资表”中4:新建一个数据文件,其中含有“id”和 “area”两个变量。其中id变量的数值为100 110,area变量的数值为随机数。然后以id 为key variable将新数据文件中的“a

14、rea” 变量合并到“工资表”中 Tips:注意有无key variable的结果差异Date数据文件的管理之Data菜单详解【Aggregate对话框】 用于对数据进行分类汇总即按指定 的分类变量对观测值进行分组,对每组 记录的各变量值求指定的描述统计量, 结果可以存入新数据文件,也可以替换 当前数据文件。 Date Break Variables:用于选择分组变量; Aggregate Variables框:用于选择被汇总的变量; Name&Label钮:用于定义新产生的汇总变量的名称和标签 Function钮:用于定义汇总函数 Save Number of cases in break

15、group as variable复选 框:用于定义一个新变量以存储同组的记录数; Create new data file单选钮:定义一个新文件以存储汇总 结果 Replace working data file单选钮:用汇总的结果替换原来 的数据DateAggregate对话框提供的函数形式:Give Example:不同城市工人的平均年总收入求数值概况 求特殊值 求观测值数 求百分比 求百分数Date数据文件的管理之Data菜单详解【Split File对话框】 用于将数据文件分组为进一步处理做准备 Analyze all cases单选框:选中本框不拆分文件; Compare groups单选框:结果紧挨在一起便于相互比较; Organize output by groups单选框:各组分析结果单独放 置; Groups based on框:用于选择拆分数据文件的变量; Sort the file by grouping variables单选框:将数据按所 用的拆分变量排序; File i

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号