《一、SPSS简介和入门...ppt》由会员分享,可在线阅读,更多相关《一、SPSS简介和入门...ppt(69页珍藏版)》请在金锄头文库上搜索。
1、SPSS简介和入门简介和入门 SPSS简介简介 相关概念相关概念 数据录入和数据获取数据录入和数据获取 菜单补充说明菜单补充说明 1968年:斯坦福大学三位学生创建了年:斯坦福大学三位学生创建了SPSS 1968年:诞生第一个用于大型机的统计软件年:诞生第一个用于大型机的统计软件 1975年:在芝加哥成立年:在芝加哥成立SPSS总部总部 1984年:推出用于个人电脑的年:推出用于个人电脑的SPSS/PC+ 1992年:推出年:推出Windows版本,同时开始全球化发展版本,同时开始全球化发展 自自SPSS 11.0起,起,SPSS全称为全称为“Statistical Product and S
2、ervice Solutions”,即,即“统计产品和服务解决方案统计产品和服务解决方案” 目前最高版本是目前最高版本是SPSS15.0版,较普遍使用的是版,较普遍使用的是13.0版版产品概述产品概述安装安装SPSS从开始菜单运行从开始菜单运行使用桌面快捷方式来运行使用桌面快捷方式来运行运行运行SPSSv 启动启动SPSS,首先看到的是数据编辑窗口,首先看到的是数据编辑窗口菜单栏菜单栏工具栏工具栏SPSS启动界面启动界面 File: 对对SPSS文件的管理,包括新建、打开、保存文件等文件的管理,包括新建、打开、保存文件等 Edit: 与与windows类似的编辑功能,如复制、剪切、粘贴、类似的
3、编辑功能,如复制、剪切、粘贴、 撤消等,以及系统参数设置撤消等,以及系统参数设置 View:选择显示状态条、工具栏、网格线、变量标签、变量:选择显示状态条、工具栏、网格线、变量标签、变量 视图及字体设置等视图及字体设置等 Data: : 实现文件级别的数据管理,如记录排序、记录拆分、实现文件级别的数据管理,如记录排序、记录拆分、 记录筛选、合并文件等记录筛选、合并文件等 Transform:实现变量级别的数据管理,如计算新变量、变:实现变量级别的数据管理,如计算新变量、变 量值的分组合并、连续变量的可视化分段等量值的分组合并、连续变量的可视化分段等SPSS菜单栏菜单栏 Analyze:SPSS
4、SPSS的重点菜单项,涵盖各种主要统计分析功能的重点菜单项,涵盖各种主要统计分析功能 Graphs: :绘制各种普通统计图及交互式统计图,如直方图、绘制各种普通统计图及交互式统计图,如直方图、 茎叶图、箱图、残差图等茎叶图、箱图、残差图等 Utilities:提供各种实用性管理设置,如变量信息管理,输出:提供各种实用性管理设置,如变量信息管理,输出 结果文件设置、菜单管理等结果文件设置、菜单管理等 Windows:窗口拆分、最小化、当前窗口显示等:窗口拆分、最小化、当前窗口显示等 Help:帮助系统:帮助系统SPSS菜单栏菜单栏打打开开文文件件保保存存文文件件打打印印召召回回前前次次菜菜单单操
5、操作作撤撤消消查查找找记记录录查查看看变变量量信信息息查查找找变变量量值值插插入入记记录录插插入入变变量量拆拆分分文文件件设设置置权权重重选选择择记记录录显显示示变变量量标标签签使使用用数数据据集集SPSS工具栏工具栏 SPSS的常用窗口:的常用窗口: Data、Syntax、Output、Draft Output、Script 几个术语几个术语:Case、Variable、Expression SPSS的的运算符运算符: 基本运算:数学运算、关系运算、逻辑运算基本运算:数学运算、关系运算、逻辑运算 算术运算的优先顺序:括号、函数、乘方(冥)、乘算术运算的优先顺序:括号、函数、乘方(冥)、乘
6、或除、加或减。同一优先级的按从左到右的顺序。或除、加或减。同一优先级的按从左到右的顺序。 SPSS的表达式:算术表达式、比较表达式、逻辑表达式的表达式:算术表达式、比较表达式、逻辑表达式相关概念(相关概念(1) SPSS的的函函数数:十十大大类类一一百百多多个个函函数数,包包括括算算术术函函数数、累累计计概概率率函函数数、概概率率密密度度函函数数、时时间间函函数数、逆逆分分布布函函数数、缺缺失失值函数、随机函数、统计函数、字符串函数和其他函数。值函数、随机函数、统计函数、字符串函数和其他函数。 SPSS的的文文件件类类型型:数数据据文文件件*.sav *.sys *.dat(.dbf .xls
7、 等等)、工工作作日日志志文文件件(.jnl)、结结果果文文件件(.spo)、命命令令文文件件或或语语法法文文件件(.sps)、脚脚本本文文件件(.sbs)、图图形形模模板板文文件件(.sct)。相关概念(相关概念(2) SPSS的数据格式:一般以行乘列的排列方式构造,行代表的数据格式:一般以行乘列的排列方式构造,行代表 case(或记录),列表示(或记录),列表示variable(或变量)。(或变量)。 “一个观测占一行,一个变量占一列一个观测占一行,一个变量占一列” 例例1:观察了:观察了10名学生的体重名学生的体重,其中男性其中男性5人人,女性女性5人应具有人应具有 2 10的数据结构的
8、数据结构(2个变量个变量,10个观察对象个观察对象) 例例2:一个:一个2 2的四格表的四格表,应具有应具有n 2的数据结构(的数据结构(2个变量个变量,n 个观察对象)个观察对象) 例例3:一个:一个2 2析因设计析因设计,应具有应具有n 3的数据结构(的数据结构(3变量变量,n次次 实验)实验)相关概念(相关概念(3)数据录入和数据获取数据录入和数据获取v 数数据据可可以以直直接接输输入入SPSS, 或或者者从从其其他他形形式式:SPSS数数据据文文件件、电电子子表表应应用用软软件件(例例如如Microsoft Excel)、数数据据库库软软件件(例例如如Microsoft Access)
9、以及文本文件等导入以及文本文件等导入(1)直接输入)直接输入 数据录入三部曲:数据录入三部曲:定义变量名定义变量名指定变量的属性指定变量的属性录入数据录入数据(2)外部数据的获取(集中在)外部数据的获取(集中在File菜单下):菜单下): 对于对于SPSS格式和其他大多数常用格式的数据文件,均可通过的格式和其他大多数常用格式的数据文件,均可通过的 FileOpenData或单击工具栏上的或单击工具栏上的 打开,以打开,以excel格式格式数据的数据的 读入为例作介绍。读入为例作介绍。 也可利用利用也可利用利用数据库数据库ODBC接口接口读入数据及读入数据及文本向导文本向导读入读入文本数据。文本
10、数据。数据编辑窗口数据编辑窗口语法编辑窗口语法编辑窗口结果管理窗口结果管理窗口目录区目录区内容区内容区草稿结果窗口草稿结果窗口v 结果的一种简化文本格式,即被结果的一种简化文本格式,即被word兼容的兼容的rtf 超文本格式,可在未安装超文本格式,可在未安装SPSS的机子上使用的机子上使用 word等字处理软件将该结果打开等字处理软件将该结果打开脚本窗口脚本窗口v 用用Sax Basic语言写的程序,用于使语言写的程序,用于使SPSS内部内部 操作自动化,也适用于高级分析人员操作自动化,也适用于高级分析人员 Case:组成数据文件的基本单位,组成数据文件的基本单位,即观测即观测记录记录 Var
11、iable:SPSS对变量有如下的约定对变量有如下的约定 (1)变量名最多有)变量名最多有8个字符,第一个字符必须是字母个字符,第一个字符必须是字母 或或,数字、,数字、$和下划线均可用在变量名中和下划线均可用在变量名中 (2)以)以$开头的变量名为系统变量(不可命名)开头的变量名为系统变量(不可命名) (3)变量类型:数值型、字符型()变量类型:数值型、字符型(A)、日期型等)、日期型等 数字数字 Expression:(表达式):(表达式) 逻辑逻辑SPSS的几个术语的几个术语 SPSSSPSS的运算符的运算符数学运算符关系运算符逻辑运算符+ (GT)| (OR)*= (GE)*= (EQ
12、)( )= (NT)v 以以cases (行行) 和和variables (列列)的格式进行组织的格式进行组织v 一行是指调查中一个观测对象所有问题的回答一行是指调查中一个观测对象所有问题的回答 v 一列指调查中对于一个问题所有观测对象的回答一列指调查中对于一个问题所有观测对象的回答表表1 10名学生的体重名学生的体重性别体重(kg)男56男60男62男64男65女46女48女50女52女53表表 2 穿新旧两种防护服工人的皮肤炎症患病率比较穿新旧两种防护服工人的皮肤炎症患病率比较防护服种类皮肤炎症阳性阴性新814旧1018表表3 两种药物治疗缺铁性贫血后红细胞增加数两种药物治疗缺铁性贫血后红
13、细胞增加数(百万百万/mm3)乙药(B)甲药(A)用(1)不用(2)用(1)2.10.92.21.12.01.0不用(2)1.30.81.20.91.10.7v 定义变量名前,首先新建一个数据文件定义变量名前,首先新建一个数据文件v 使用该菜单还可新建语法文件、结果文件、草稿结果使用该菜单还可新建语法文件、结果文件、草稿结果 文件和脚本文件文件和脚本文件单击切换至单击切换至变量视图变量视图变量名变量名v数据录入:数据录入:例例1Type:变量类型:变量类型 Width:字符宽度:字符宽度 Decimals:小数位数:小数位数 Label:变量标签:变量标签 Values:变量值:变量值 Mis
14、sing:缺失值:缺失值 Columns:单:单元格宽度元格宽度 Align:变量值对齐方式:变量值对齐方式Measure:变量:变量的测量尺度的测量尺度v 注:不同变量间各属性可直接进行复制粘贴注:不同变量间各属性可直接进行复制粘贴v 点击单元格,即出现如右图所示小方格,点击单元格,即出现如右图所示小方格, 点击小方格进行变量类型设定点击小方格进行变量类型设定标准数值型标准数值型字符型字符型日期型日期型逗号数值型逗号数值型圆点数值型圆点数值型科学计数法型科学计数法型美元数值型美元数值型用户自定义型用户自定义型v 如:如:美元数值型美元数值型设定三个特定的缺失值设定三个特定的缺失值也可设定缺失
15、值区间也可设定缺失值区间 定定类类尺尺度度(Nominal Measurement):无无序序分分类类变变量量,如如性性别别可可取取“男男”、“女女”。只能计算频数和频率。只能计算频数和频率 定定序序尺尺度度(Ordinal Measurement):有有序序分分类类变变量量,如如对对游游泳泳的的喜喜欢欢程程度度1非非常常喜喜欢欢,2喜喜欢欢,3无无所所谓谓,4不不喜喜欢欢,5非非常常不不喜喜欢欢,可计算频数、频率、累计频数、累计频率可计算频数、频率、累计频数、累计频率 定定距距尺尺度度(Interval Measurement):对对事事物物类类别别或或次次序序之之间间间间距距的的测测度度,
16、如如温温度度。无无绝绝对对“零零点点”,如如0并并不不表表示示“没没有有”,仅仅仅仅是是个个测测量值量值 定定比比尺尺度度(Scale Measurement):能能够够计计算算两两个个测测度度值值之之间间比比值值的的一种计量尺度,如职工月收入。有绝对一种计量尺度,如职工月收入。有绝对“零点零点”,0就表示就表示“没有没有”v SPSS中将定比尺度和定距尺度合并为一类,统称中将定比尺度和定距尺度合并为一类,统称 “Scale”, 且作为默认值且作为默认值表表1 10名学生的体重名学生的体重性别体重(kg)男56男60男62男64男65女46女48女50女52女53数据录入三种形式数据录入三种形
17、式:1.开放题的录入开放题的录入 例:年龄(例:年龄(age):):_岁岁2.单选题的录入单选题的录入 例:性别(例:性别(gender):):1 男男 2 女女3.多选题的录入多选题的录入 例:你在选择健康体检的医院时关注哪些因素:例:你在选择健康体检的医院时关注哪些因素: a.交通方便交通方便 b.检查项目检查项目 c.检查价格检查价格 d.服务质量服务质量 e.其他其他v 完成变量定义后,点击完成变量定义后,点击Data View即可切换即可切换 回数据视图,进行数据录入回数据视图,进行数据录入v 直接输入,每输入一个值后,按键盘上的向下方向键直接输入,每输入一个值后,按键盘上的向下方向
18、键 或或 按回车键,输入下一个值按回车键,输入下一个值v与开放题不同的是单选题中可以定义变量值标签,可与开放题不同的是单选题中可以定义变量值标签,可 以减少数据录入的工作量,且方便数据分析。以减少数据录入的工作量,且方便数据分析。 字符直接录入字符直接录入 字符代码字符代码+值标签值标签 数值代码数值代码+值标签(值标签(推荐推荐,便于录入及分析),便于录入及分析)v单选题录入的三种方式单选题录入的三种方式 多重二分法:每个选项定义一个变量多重二分法:每个选项定义一个变量 适用于适用于:选项不太多:选项不太多 多重分类法:每个答案定义一个变量,该用几个变量由多重分类法:每个答案定义一个变量,该
19、用几个变量由 实际可能给出的最多答案数而定实际可能给出的最多答案数而定 适用于适用于:选项较多:选项较多例:你对健康知识的了解主要来自哪些渠道(限选例:你对健康知识的了解主要来自哪些渠道(限选3项):项): a.刊物刊物 c.电视电视 d.收音机收音机 e.网络网络 f.朋友介绍朋友介绍 g.其他其他SPSS中的文件类型中的文件类型v 可以从电子表格式文件读入数据,第一行默认作为可以从电子表格式文件读入数据,第一行默认作为 变量名读入变量名读入SPSSv 打开数据文件打开数据文件v 使用该菜单还可打开语法文件、结果文件、草稿结果使用该菜单还可打开语法文件、结果文件、草稿结果 文件和脚本文件文件
20、和脚本文件确认是否要读入变量名确认是否要读入变量名确认导入的单元格区域确认导入的单元格区域也可进行自定义也可进行自定义v Excel数数据据导导入入后后数数据据显显示示如如图图,其其中中变变量量名名行行就就是是原来原来Excel文件中的第一行文件中的第一行v 关关于于ODBS(Open Database)不不进进行行详详述述,感感兴兴趣趣的可参考有关书籍。的可参考有关书籍。文本文件是另一种常见的数据文件,许多电子表和数据库文本文件是另一种常见的数据文件,许多电子表和数据库 可以将内容存成文本格式可以将内容存成文本格式逗号和制表位用以区分每个变量,上图中以制表位来区分逗号和制表位用以区分每个变量
21、,上图中以制表位来区分v 用以指导对文本进行定义,确定不同变量的区分用以指导对文本进行定义,确定不同变量的区分 选择定义好的格式或创建新格式。选择选择定义好的格式或创建新格式。选择No创建新格式创建新格式从文本导入数据从文本导入数据Step 1 如前所述,文件使用制表位格式,变量名位于文件顶行如前所述,文件使用制表位格式,变量名位于文件顶行选择选择Yes表明变量名从文件顶行读入表明变量名从文件顶行读入变量以特定界限区分,如逗号、制表位变量以特定界限区分,如逗号、制表位从文本导入数据从文本导入数据Step 2键入键入2表明从文本文件的第表明从文本文件的第2行开始读入数据行开始读入数据从文本导入数
22、据从文本导入数据Step 3v 用直观的界面快速确定是否从用直观的界面快速确定是否从SPSS正确读入你所正确读入你所 要求读入的数据要求读入的数据选中选中Tab从文本导入数据从文本导入数据Step 4v 为为适适合合SPSS的的格格式式,某某些些变变量量名名可可能能被被缩缩减减,该该对对话话框框用用以以编编辑辑不不适适当当的的变变量量,使使之之达达到到你你的的要要求求。同同样样可可以以更更改改变量类型,如将变量类型,如将INCOME设为设为Dollar格式。格式。选中选中Dollar选中选中INCOME从文本导入数据从文本导入数据Step 5从文本导入数据从文本导入数据Step 6v 从文本文
23、件导入数据完成,其中从文本文件导入数据完成,其中step5设置的设置的 INCOME为为Dollar形式形式v 前面就前面就File菜单下的菜单下的New、Open、Open Database、 Read Text Date已作了介绍,下面就已作了介绍,下面就File、Edit和和View菜菜 单下的其他子菜单作补充介绍单下的其他子菜单作补充介绍 Save:保存,覆盖当前文件:保存,覆盖当前文件 Mark File Read Only:使使数数据据文文件件标标记记为为只只读读,原原文文件件不不能能被被覆覆盖盖。点点击击该该菜菜单单项项后后,若若对对原原数数据据文文件件进进行行改改变变后后,对对
24、其其进进行行保保存存时时跳跳出出下下图图,提提示示保保存存为为另另一一个个文文件件名名或或至至另另一一个个目录,表明原文件不会被改动目录,表明原文件不会被改动 Save As:另另存存文文件件,可可以以另另存为存为SPSS格式或其他数据格式格式或其他数据格式 v 点点击击Mark File Read Only后后,菜菜单单变变为为Mark File Read Write,点击之可以恢复到可改写的状态,点击之可以恢复到可改写的状态 Display Date File Information:在在结结果果窗窗口口中中显显示示变变量量信信息息、变变量量值值等等Working File(显显示示当当前
25、前文文件件信信息息)External File(显显示示外外部部文文件件信息),信息),查看详情查看详情 Cache Data:查看详情查看详情 Stop Processor:停止程序处理:停止程序处理 Switch Server:用用以以转转化化、增增加加、编辑所登录的服务器,编辑所登录的服务器,查看详情查看详情 Print Preview:打印预览:打印预览 Recently Used Date:最近使用数据最近使用数据 Print:打印:打印 Recently Used File:最近使用文件最近使用文件 Exit:退出:退出 Undo:撤消:撤消 Cut:剪切剪切 Redo:重复:重复
26、 Copy:复制复制 Paste:粘贴:粘贴 Paste Variables:粘贴变量:粘贴变量 Clear:清除:清除 Options:设置系统参数设置系统参数 Find:查找:查找 状态条状态条 Status Bar:选选中中,则则在在右右下下角角显示状态条显示状态条 Fonts:字体设置:字体设置 Toolbars:用以对工具栏进行设置:用以对工具栏进行设置 Grid Lines:选中显示网格线:选中显示网格线 Value Labels:默默认认情情况况下下,数数据据视视图图中中显显示示数数值值,选选中中该该项项,则则数数据据视图中视图中显示数值标签显示数值标签 Varibles:选中切
27、换至变量视图选中切换至变量视图v Ok:在在下下次次读读取取该该文文件件时时(如如下下次次运运行行一一个个统统计计程程序序时时)产产生生缓缓存存文文件,多数情况下直接点件,多数情况下直接点ok即可即可 cache data(数数据据缓缓存存):是是指指将将当当前前数数据据文文件件的的一一份份拷拷贝贝放放入入缓缓存存,使使多多次次处处理理程程序序时时当当前前文文件件不不必必被被重重复复读读取取,从从而而有有效效减减少少程程序序处处理理的的时时间间。默默认认情情况况下下,数数据据库库自自动动产产生生一一份份数数据据缓缓存存,但但当当使使用用 GET DATA语语法法命命令令读读取取数数据据库库时时
28、,数数据据缓缓存存不不能能自自动动产产生生,应应该该使使用用FileCache Data菜单使之产生。菜单使之产生。v Cache Now:立立刻刻产产生生一一个个缓缓存存文文件件,若若当当前前文文件件被被锁锁住住“locked”而而无无法法修修改改时时使使用用之之,或或者者数数据据文文件件很很大大,它它能能加加快快处处理理时时数数据据视视图图内内容的滚动速度。容的滚动速度。v 默默认认情情况况下下,单单元元格格内内显显示示的的是是具具体体变变量量值值,鼠鼠标标放放在在该该变变量量名名上上(列列的的开开头头),出出现现关关于于该该变变量量详详细细描述的标签定义描述的标签定义. v 当前,变量当前,变量marital的单元格中显示的是变量标签:的单元格中显示的是变量标签:Married和和Unmarried