spss软件的应用课件－金锄头文库

资源描述

《spss软件的应用课件》由会员分享，可在线阅读，更多相关《spss软件的应用课件（65页珍藏版）》请在金锄头文库上搜索。

1、SPSS软件的应用,SPSS:,Statistical Package for Social ScienceStatistical Product and Service Solutions,SPSS主要窗口：数据编辑窗口,窗口标题：data editor 功能：定义数据结构、录入编缉、管理待分析的数据。组成：窗口主菜单、工具栏、数据编辑区、状态显示区特点： SPSS中各统计分析功能都是针对该窗口中的数据进行窗口中的数据文件以.sav存于磁盘上两个视图：数据视图和变量视图,SPSS主要窗口：数据输出窗口,窗口标题：viewer 功能：SPSS统计分析报表及图形的输出的窗口。特点：在

2、进行第一次分析时自动打开，也可手工打开输出窗口可以关闭，窗口内容以.SPV存于磁盘两个视图：目录视图和内容视图,SPSS数据文件的建立和管理,SPSS数据文件是一种有结构的数据文件。建立SPSS数据文件应完成两项任务：第一，描述SPSS数据的结构第二，录入编缉SPSS的数据内容,一行称为一个“个案”（case）一列称为一个“变量”（var）,变量视图,数据视图,在调查问卷中,有多少份问卷，意味着有多少个“个案”问卷中的每个问题对应于每一个“变量”,（一）变量名（Name）,变量名的字符个数一般不多于8个；变量名可以用英文，也可以用汉字，汉字一般不超过4个。变量名不区分大小写字变量名不能与SP

3、SS内部特有的具有特定含义的保留字相同，如ALL，BY，AND，NOT，OR等。,（二） Type、Width、Decimals,数值型（1）标准型（Numeric）默认8 . 2如： 12345678、12345.67、-1234.56 （2）科学记数法型（Scientific Notation）表示很大或很小的数据如：1.2E+05（3）逗号型（Comma）整数部分从个位开始每三位一个逗号如：1,234.56,（4）圆点型（Dot）整数部分从个位开始每三位一个圆点如：1.234,56（5）美元符号型（Dollar）主要表示货币数据如：$12.30字符型（String）默认列宽8个字

4、符，不能进行算术运算，区分大小写字母日期型（Date）dd-mmm-yyyymm/dd/yyyy,（三）变量名标签 (label) :对变量名的一些解释说明，增强分析结果的可视性。可以省略。（四）变量值标签 (Value)对变量所取值的一些解释说明，增强分析结果的可视性。可以省略。一般用于品质数据如：1-男 2-女、1-高 2-中 3-低,（五）变量列格式(Column Format),列宽度(Column Width)默认值为变量的总长度。对齐方式(Text Alignment)左对齐(Left):字符型默认。右对齐(Right):数值型默认。居中对齐(Center)计量尺度Scale（度

5、量） Ordinal（有序） Nominal（名义）,（六）缺失值(Missing Values)1、什么是缺失值？漏填数据明显错误的数据2、对缺失值的一般处理（1）指定某个特定值为缺失值（用户缺失值）如999999 （2）系统缺失值：点 (),SPSS数据的录入与编缉,录入时应注意：黑框确定当前数据单元。可以逐行录入，按Tab键；可以逐列录入，按Enter数据定位按值定位光标定位到某列变量上 - Edit - Find.,SPSS数据的编辑,插入和删除一个个案插入：编缉-插入个案删除：选定待删行，鼠标右键找到Cut插入和删除一个变量插入：光标定位到某列变量上 - 编缉-插入变量 (插到

6、某列前)删除：选定列，鼠标右键Cut项,多项选择题的处理方法,将一个问题定义成几个变量，用这几个变量来描述该问题的几个可能被选择的答案。编码方式：多选项二分法(multiple dichotomize method)将每个答案作为一个变量，每个变量只有两个取值(0或1)多选项分类法(multiple category method)首先估计多选项问题可能被选择的最多答案数，然后为每个答案建立一个变量，变量取值为多选项问题的可选答案,多选项二分法举例,多选项分类法举例,文件合并,【Data】【Merge File】【Add Cases】【数据】【合并文件】【添加个案】,SPSS数据文件的

7、基本加工和处理,SPSS数据文件的基本加工和处理,数据文件的整理个案排序数据加工变量计算数据分组自动分组、手工分组数据文件的其他处理功能指定加权变量,目的：将所有个案按照用户指定的某一个或多个变量的变量值的升序或降序重新排列。菜单选项:data - sort cases 注意:(1)Ascending:升序、Descending:降序。(2)多重排序,选择变量名的次序很关键。,个案排序,变量计算,(1)含义：变量计算是在原有数据的基础上，根据用户给出的SPSS算术表达式以及函数，对所有个案或满足条件的部分个案，计算产生一系列新变量。,(2)SPSS算术表达式(Numeric Expre

8、ssion):由常量、变量、算术运算符、圆括号、函数等组成的式子。注意：字符型常量应用引号引起来；算术运算符主要包括：+、-、*、/、* 在同一算术表达式中的常量及变量，数据类型应该一致,(3)SPSS条件表达式: 由SPSS关系运算符、逻辑运算符、SPSS函数以及SPSS变量名组成的式子。关系运算符: (大于)、 =(大于等于)、 32、sr AND OR,算术函数统计函数分布函数逻辑函数字符串函数缺失值函数日期时间函数其他函数,Abs() sqrt() rnd() trunc() mod() mean() sd() sum() cfvar() max() min() no

9、rmal() uniform() RV.分布名() Probit.() range() any() index() length() lower() lpad() ltrim() substr() missing() sysmis(),(4) SPSS函数,函数是事先编好并存储在SPSS软件中，能够实现某些特定计算任务的一段计算机程序。,(5)菜单选项：transformcompute（转换）（计算变量）1、利用“职工数据”计算实发工资，实发工资等于基本工资减去失业保险，再依据职称1-4级分别上浮5%，3%，2%，1%，之后再加上津贴。2、计算某零件使用寿命的标准分数,计数,(1)含义:对所有

10、或部分个案，计算若干个变量中有几个变量的值落在指定的区域内，并将结果存入新变量中。 (2)菜单选项:transform - count,数据文件的分类汇总,(1)含义：按指定的分类变量的变量值对个案分组；计算每组个案的汇总变量的基本统计量；将计算结果生成到一新文件中，即：在新文件中对应分类变量的每一个分类值产生一个个案。(2)菜单选项: data - aggregate,(3)注意:按照哪个变量进行分类对哪个变量进行汇总指定对汇总变量计算哪些统计量,利用住房状况调查数据，分析本市户口家庭和外地户口家庭目前人均住房面积的平均值是否有较大差距，未来打算购买住房的平均面积是否有较大差距。,应用

11、举例,频数分析,频数分析的第一个基本任务是编制频数分布表SPSS中的频数分布表包括有频数、百分比、有效百分比、累计百分比。有效百分比（Valid Percent）：各频数占总有效样本数的百分比。有效样本数总样本缺失样本数累计百分比：各百分比逐级累加起来的结果。,频数分析的第二个基本任务是绘制统计图。常用统计图：柱形图或条形图饼图直方图,频数分析,基本操作步骤(1)菜单选项:analyze-descriptive statistics-frequencies (2)选择几个待分析的变量到variables（变量）框. (3)chart（图表）选项，选择所需要的图形,例：利用住房状况问卷调查数据，

12、分析被调查家庭中户主的从业状况、目前所住房屋的产权情况。,数据分组,目的：了解数据的总体分布状况思路：指定按哪个变量分组，即：指定分组变量定义分组变量的分组区间（不重、不漏）指定一个存放分组结果的标志变量分组方法：自动分组手工分组,数据分组,(一)自动分组（单变量值分组）(1)含义: 分组变量值相同的个案分在同一组，同组中的标志变量相同。标志变量依照分组变量值的大小次序给定。（单变量分组，通常只适合于离散变量且变量值较少的情况）(2)菜单选项: transform - automatic recode,数据分组,(二)手工分组（组距分组）(1)含义：人工定义分组区域，对所有个案或

13、符合一定条件的个案进行等距或非等距分组。菜单选项:transform - recode - into different variables,频数分析,频数分析中的其他分析计算分位数:适用于定距数据数据按升序排序后，找到若干个分位点上的变量值 quartiles:计算四分位数25%(QL)、50%(中位数)、75%(QU)cut points for n equal groups:n等份 percentile:自定义百分位点分位数的应用在排除极端值影响的条件下，通过计算分位数差，比较两组样本数据的离散程度例: ( QL=50,QU=80) 和 (QL=70,QU=75) 的比较,计算描

14、述统计量,目的精确把握变量的总体分布状况，了解数据的集中趋势、离散趋势、对称程度、陡峭程度。基本方法计算基本描述统计量,计算描述统计量,描述集中趋势的统计量均值(mean):表示某变量所有变量值集中趋势或平均水平的统计量。适用于定距数据。特点：利用了全部数据，易受极端值的影响。描述离散程度的统计量标准差(standard deviation-Std Dev):表示某变量的所有变量值离散程度的统计量。 SPSS中计算的是样本标准差。方差(variance):标准差的平方。 SPSS中计算的是样本方差。极差 (range):最大值(maximum)最小值(minimum),计算描

15、述统计量,描述对称程度的统计量偏度(skewness):描述某变量分布形态的偏斜程度和方向的统计量. 偏度为0表示对称; 大于0表示正偏差大(右偏),频数最大的值比均值小,极值大于均值; 小于0表示负偏差大(左偏)。,计算描述统计量,描述陡峭程度的统计量峰度(kurtosis):描述某变量所有变量值分布形态陡缓程度的统计量。峭度为0表示与标准正态分布峭度相同。大于0表示比标准正态分布陡，尖峰。小于0表示比标准正态分布缓；平峰。,计算描述统计量,其他统计量标准误差(standard error S.E):抽样分布中的标准差，反映样本误差。均值标准误差(means of S.E) 中心极限定

16、理认为：样本均值N(u,2/n) 反映样本均值与总体真值间的平均离散程度样本数越大，样本均值的离散程度越小，对真值的估计越准确,相关分析,概述,(一)相关关系 (1)函数关系:(如:销售额与销售量;圆面积和圆半径.)是事物间的一种一一对应的确定性关系.即:当一个变量x取一定值时,另一变量y可以依确定的关系取一个确定的值 (2)统计关系:(如:收入和消费;身高的遗传.)事物间的关系不是确定性的.即:当一个变量x取一定值时,另一变量y的取值可能有几个.一个变量的值不能由另一个变量唯一确定,概述,统计关系的常见类型：线性相关：正线性相关、负线性相关非线性相关统计关系不象函数关系那样直接,但却普遍存在,且有强有弱.如何测度?,相关分析,(一)目的通过样本数据,研究两变量间线性相关程度的强弱. (二)基本方法绘制散点图、计算相关系数,

展开阅读全文