数据文件的建立和管理

上传人:aa****6 文档编号:51415113 上传时间:2018-08-14 格式:PPT 页数:62 大小:545KB
返回 下载 相关 举报
数据文件的建立和管理_第1页
第1页 / 共62页
数据文件的建立和管理_第2页
第2页 / 共62页
数据文件的建立和管理_第3页
第3页 / 共62页
数据文件的建立和管理_第4页
第4页 / 共62页
数据文件的建立和管理_第5页
第5页 / 共62页
点击查看更多>>
资源描述

《数据文件的建立和管理》由会员分享,可在线阅读,更多相关《数据文件的建立和管理(62页珍藏版)》请在金锄头文库上搜索。

1、 数据分析基础与实践w导论 SPSS统计分析软件简介 w第1章 数据文件的建立和管理 w第2章 数据预处理 w第3章 描述性统计分析 w第4章 SPSS中图形的绘制 w第5章 SPSS中表格的绘制 w第6章 SPSS中输出的使用 w第7章 问卷分析 w第8章 参数检验 w第9章 相关分析 w第10章 回归分析导言 SPSS统计分析软件简介w一、 SPSS统计分析软件的发展 wSPSS最初是statistical package for the social sciences 的缩写,即社会统计学软件包。 w2000年SPSS 公司正式将英文全称更改为statistical products a

2、nd service solutions,意为“统计产品与服务解 决方案”,标志着SPSS的战略方向作出了重大调整。 w2009年, SPSS 公司将四大产品(statistics family, modeling family, data collection family, deployment family)整合到一个综合平台,把四类产品统一加上PASW 前缀(Predivtive Analysis Software),喻意SPSS的发 展方向为预测分析领域。wPASW18.0是目前较新的中文版本 wSPSS是世界上最早的统计分析软件,由美国 斯坦福大学的三位研究生( Norman Ni

3、e 、 Bent、Hull)于20世纪60年代末开发出来的 ,并由其中的两位创始人Norman Nie和 Hull于1975年在芝加哥成立SPSS公司。 w目前,SPSS已有40多年的历史,全球约有 25万家用户,分布于通信、医疗、银行、证 券、保险、制造、商业、市场研究、科研教 育等多个领域,是世界上最广泛的专业统计 分析软件之一。二、SPSS版本与授权SPSS 18.0 于2009年8月发布(尽管官方已经更名为IBM SPSS Statistics,但软件发行早于新名称,因此,仍然沿 用PASW Statistics名称) wSPSS 17.0.2 于2009年3月发布 wSPSS 17.

4、0.1 于2008年12月发布 wSPSS 16.0.2 于2008年4月发布 wSPSS 15.0.1 于2006年11月发布 wSPSS 14.0 于2005年发布 wSPSS 13.0 于2004年发布 wSPSS 12.0 于2003年发布 wSPSS 11.0 于2001年11月发布 w虽然产品的名称历经变迁,但是软件自身的统计分析功能变 化不大。三、SPSS统计分析软件的特点wSPSS是世界上最早采用图形菜单驱动界面的 统计软件,其最突出的特点是操作界面友好 ,输出结果美观。使用windows窗口展示出 各种管理和分析数据的功能,以对话框方式 展示出各种功能选择项。用户只要掌握一定

5、 的windows操作技能,粗通统计分析原理, 就可以使用该软件为特定的科研工作服务, 或者进行企业级的数据分析。 wSPSS的主要特点如下:w(1)操作简单(菜单、按钮、对话框) w(2)无需编程 w(3)功能强大 w(4)方便的数据接口 w能够读取及输出多种格式的文件,如.dbf文件、.xsl文件、 .txt文件、PDF文件、word文件、Power Point 文件等。 w(5)灵活的功能模块组合 wSPSS for windows 软件分为若干功能模块。用户可以根据 自己的分析需要和计算机的配置灵活选择。 w(6)与其他程序的无缝结合 wSPSS统计分析可以调用开源统计分析软件R或者开

6、源高级 程序语言python的功能模块,实现关联分析等功能。第1章 数据文件的建立和管理w开始SPSS w默认情况下,首先弹出SPSS开始界面对话窗 口。 w左边有【打开现有数据源】【打开其他文件 类型】两栏 w右边有【运行教程】【输入数据】【运行现 有查询】【使用数据库向导创建新查询】四 个选项 w可以选择【取消】直接进入数据编辑窗口wSPSS数据编辑窗口标题栏菜单栏工具栏编辑栏变量名称栏内容区窗口切换标签栏状态栏w菜单栏中的选项及功能: w文件-有关文件的建立、打开、存储、显示和替换 等。 w编辑-有关文本内容的选择、剪切、复制、粘贴、 查找和替换等。 w视图-有关状态栏、工具条、网络线是

7、否显示,以 及数据显示的字体类型、大小等设置。 w数据-有关数据变量定义、观察对象的选择、排序 、加权、数据文件的转换、连接和汇总等。 w转换-有关数值的计算、变量组段的划分、重新赋 值和缺失值替代等。 w分析-有关统计分析方法的应用。 w图形-有关统计图表的制作。 w实用程序-有关用户对软件的应用和设置等。 w窗口-有关窗口的排列、选择和显示等。 w帮助-有关帮助文件的调用、查找和显示等 SPSS的结果输出窗口w结果输出窗口是显示和管理SPSS统计分析结 果、报表及图形的窗口,由标题栏、菜单栏 、工具栏、内容区和状态栏组成 1、数据文件的建立和数据录入w首先从一个简单的例题入手 w例题1-1

8、 下表是某保险机构收集的车险投保人 数据,请根据数据特点建立SPSS数据文件, 命名为例题1-1性别别年龄龄交通事故性别别年龄龄交通事故 数男232女251 男351女243 男261女311 男250女260 男282女260 男311女290 男231女222 男313女255 w市场调查收集到的数据资料,在正式录入到 SPSS软件之前,需完成统计变量的定义。变 量定义在SPSS的变量视图中完成,内容包括 :w变量名称、变量类型、变量宽度、小数位数 、变量标签、值标签、缺失值、列宽度、对 齐方式和测量精度 w第一步,进入SPSS,越过导航框(点击【取 消】,或者点击【输入数据】),进入软件

9、 数据编辑器窗口。w第二步,点击左下角的【变量视图】标签, 定义文件的数据结构w第三步,录入数据w注意:在建立数据文件时,好的习惯是先定 义数据结构,再输入数据 wSPSS数据格式每行是一个记录,每列是一个 变量。w1.1 数据文件结构 w单击变量视图,在此界面中定义变量,每一 行代表一个变量。 w名称必须以英文字母开头,其他部分可 以是英文字母、数字和下划线,但不推荐使 用中文作为变量名,尽量避免和SPSS已有的 关键字重复,如sum等,最长64个英文字母 或32个汉字,变量名不区分大小写。 w类型一共8种,一般使用数值型(注意: 字符串变量不能用SPSS进行分析,且区分大 小写)w1.数值

10、型常用的有尺度、序号、名义三 种类型,要定义数据总宽度和小数的位数, 默认宽度8,小数为2。w逗号即整数部分用逗号分割的数值,在 整数部分,从个位算起,每三位数用一个逗 号。小数点仍然为“.”。w点即整数部分用点分隔的数值。在整数 部分,从个位算起,每三位数用一个点分隔 ,小数点为“,”。w日期日期型数据。w美元数据前有美元符号。可以选择具体 数据的呈现形式。 w设定货币选用客户设定的货币格式。在 应用该选项前,需要预先在选项中设置(选 择【编辑】-【选项】,然后选择货币标签) ,否则该格式不起作用。 w字符串如果变量或者属性属于字符型数 据,则需将变量定义为字符型。w列宽度即数据窗口显示的变

11、量宽度,该 数值决定了你能输入的字符串长度。用户定 义的窗口显示列宽度应大于或等于设定的变 量宽度,若变量宽度大于列宽度,则输入的 数值显示时可能被截去尾数或无法正常显示 ;若变量名称长度大于列宽度,则变量名称 在数据窗口中显示不完全。w标签作用巨大,实质是变量的含义,要养成给 变量加标签的习惯。 w值对于分类变量,通常用数字代表类别,如例 子中的性别变量用1代表男,2代表女 w度量标准有三种 w度量(scale,尺度数据)数据有大小之分,并 且数值的差代表差异程度,如“年龄”、“交通事故次 数”等 w序号(ordinal,顺序数据)取值有大小之分, 但变量值仅表示顺序,差值不代表差异程度,如

12、职 称高低,学历高低等 w名义(nominal,名义数据)变量取值没有大小 之分,如用1和2代表男和女w缺失值在实际的调查和研究中,往往会 因为某些原因导致记录的数据失真或者没有 调查到实际数据,这些称为缺失值。对数值 型变量,默认的缺失值为零;对字符型变量 ,默认的缺失值为空格。用户可以自定义缺 失值的标记。定义为缺失值的数字,虽然仍 会显示在对应的变量中,但不参与统计分析 。 w变量角色SPSS18.0开始引入的一个数据 属性,用来指定该变量在在建模中的角色( 输入、目标或不进入建模等)。w1.2 数据录入 w在数据视图窗口录入数据,每一行代表一个 个案,每一列代表一个变量。 w按单元格输

13、入数据要输入某个观测量的 某个变量值,可以将鼠标指针移动到相应单 元格,单击鼠标,被定位的单元格边框加黑 显示,也可用键盘的方向键将加黑的单元格 移到相应的位置,输入数据。 w按变量输入数据定义了一个变量,可以 马上输入该变量的数值。一般是从第一个变 量值开始输入。将输入单元格定位于该变量 与第一个观测量的交叉点单元格,输入变量 的第一个值,然后按回车键或者向下箭头。w按观测量输入数据首先将观测量最左 边的单元格启动,输入该观测量的第一个 变量值,然后按Tab键或者向右箭头,启 动右边第一个单元格。 w网格线显示设置用户可以根据自己的 习惯显示或隐藏数据编辑窗口中的单元格 网格线。选择“视图”

14、下拉菜单中的“网格 线”,当前面带有“时,显示网格线, 否则隐藏网格线。w数据录入的一些技巧:w复制和粘贴 w在excel或其他数据库文件,可以直接在 excel中使用复制,在SPSS第一个单元格, 使用粘贴,注意要补充定义变量结构 wWord文件格式中,也可以使用复制和粘贴, 不过必须全部是数值,否则SPSS会编织成系 统缺失值。第1次作业w本章练习:13w将作业发送到spss_,并自 行保存该文件,留待以后作业用。 w邮件名称为“姓名(第一次作业)”,例如“孙 伟(第一次作业)”w邮件有发送时间,以本次课的时间为准1.3数据的编辑 w1.3.1 数据的定位 w选择“编辑”“转至个案”,在对

15、话框中输入要查找的观 测量序号,或选择要转向的变量名称,即可定位于相应 的单元格或列 w1.3.2 数据的增加 w1)插入一列 w用鼠标左键单击某一列的变量名,即可选中这一列,然 后选择“编辑”“插入变量”(或单击鼠标右键,选择插 入变量),系统将自动在这一列前插入一个新的变量列 。 w2)插入一行 w用鼠标左键单击某一行的序号,即可选中这一行,然后 选择“编辑”“插入个案”(或单击鼠标右键,选择插入 个案),系统将自动在这一行前插入一个新的记录行。w1.3.3 数据的删除 w1)删除一列 w用鼠标左键单击需要删除列的变量名,即可选中这 一列,然后选择“编辑”“清除”(或单击鼠标右键 选择清除

16、,或按Delete键),该列即被删除。 w2)删除一行 w用鼠标左键单击需要删除行的序号,即可选中这一 行,然后选择“编辑”“清除”(或单击鼠标右键选 择清除,或按Delete键),该行即被删除。 w1.3.4 数据的排序 w选择“数据”“排序个案”,在对话框中选择要排序 的变量,然后选择升序或降序;或者选中一列后, 单击右键选择升序排序或降序排序,即可实现各观 测量按选定变量值重新排序。 w例题:数据文件1-1.sav中,记录了车险投保 人的数据,要求了解如下情况: w(1)车险投保人交通事故的大体情况;w(2)不同性别、不同年龄的车险投保人交通 事故大体情况。 w操作:打开数据1-1,选择【数据】-【排序 个案】,将accids(交通事故数)选入右边 排序变量框,选择升序,单击【确定】w当排序变量只有一个时,可以直接选中要排 序的变量,右键选择【升序排序】实现w第2个问题涉及多个变量排序,操作和第一个 问

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > PPT模板库 > PPT素材/模板

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号