1.SPSS数据建立编辑和文件保存

上传人:人*** 文档编号:569463225 上传时间:2024-07-29 格式:PPT 页数:64 大小:1.02MB
返回 下载 相关 举报
1.SPSS数据建立编辑和文件保存_第1页
第1页 / 共64页
1.SPSS数据建立编辑和文件保存_第2页
第2页 / 共64页
1.SPSS数据建立编辑和文件保存_第3页
第3页 / 共64页
1.SPSS数据建立编辑和文件保存_第4页
第4页 / 共64页
1.SPSS数据建立编辑和文件保存_第5页
第5页 / 共64页
点击查看更多>>
资源描述

《1.SPSS数据建立编辑和文件保存》由会员分享,可在线阅读,更多相关《1.SPSS数据建立编辑和文件保存(64页珍藏版)》请在金锄头文库上搜索。

1、SPSS SPSS 入门讲义入门讲义关于关于SPSS软件软件n nSPSS是“社会科学统计软件包”(Statistical Package for the Social Science)的简称,是一种集成化的计算机数据处理应用软件。1968年,美国斯坦福大学H.Nie等三位大学生开发了最早的SPSS统计软件,并于1975年在芝加哥成立了SPSS公司,已有30余年的成长历史,全球约有25万家产品用户,广泛分布于通讯、医疗、银行、证券、保险、制造、商业、市场研究、科研、教育等多个领域和行业。SPSS是世界上公认的三大数据分析软件之一(SAS、SPSS和SYSTAT)n n目前,世界上最著名的数据分

2、析软件是SAS和SPSS。SAS由于是为专业统计分析人员设计的,具有功能强大,灵活多样的特点,为专业人士所喜爱。而SPSS是为广大的非专业人士设计,它操作简便,好学易懂,简单实用,因而很受非专业人士的青睐。此外,比起SAS软件来,SPSS主要针对着社会科学研究领域开发,因而更适合应用于教育科学研究,是国外教育科研人员必备的科研工具。1988年,中国高教学会首次推广了这种软件,从此成为国内教育科研人员最常用的工具。SPSS软件的特点软件的特点n n集数据录入、资料编辑、数据管理、统计分析、报表制作、图形绘制为一体。从理论上说,只要计算机硬盘和内存足够大,SPSS可以处理任意大小的数据文件,无论文

3、件中包含多少个变量,也不论数据中包含多少个案例n n统计功能包括常规的集中量数和差异量数、 相关分析、回归分析、方差分析、卡方检验、t检验和非参数检验;也包括近期发展的多元统计技术,如多元回归分析、聚类分析、判别分析、主成分分析和因子分析等方法,并能在屏幕(或打印机)上显示(打印)如正态分布图、直方图、散点图等各种统计图表。从某种意义上讲,SPSS软件还可以帮助数学功底不够的使用者学习运用现代统计技术。使用者仅需要关心某个问题应该采用何种统计方法,并初步掌握对计算结果的解释,而不需要了解其具体运算过程,可能在使用手册的帮助下定量分析数据。n n自从1995年SPSS公司与微软公司合作开发SPS

4、S界面后,SPSS界面变得越来越友好,操作也越来越简单。熟悉微软公司产品的用户学起SPSS操作很容易上手。SPSS for Windows界面完全是菜单式,一般稍有统计基础的人经过三天培训即可用SPSS做简单的数据分析,包括绘制图表、简单回归、相关分析等等,关键在于如何进行结果分析及解释,这一方面需要学习一些数理统计的基本知识,另一方面也要多进行实践,在实践中了解各种统计结果的实际意义一、一、SPSS统计数据的创建与编辑统计数据的创建与编辑n nSPSS数据的属性及其定义方法n nSPSS数据文件的构成n n应用案例:定义SPSS数据结构n nSPSS数据的录入n nSPSS数据的编辑n n数

5、据文件的操作1.SPSS数据的属性及其定义方法数据的属性及其定义方法n n一个完整的SPSS数据结构包括: 变量名、变量类型、变量名标签、变量值标签、缺失值的定义、度量的尺度、及数据的显示属性(显示宽度、列宽度、对齐方式)1.1变量名变量名n n首字符必须是字母或汉字,后面可以是除首字符必须是字母或汉字,后面可以是除(! (!、?、?*)*)之外的之外的任意字符。任意字符。n n变量名的结尾不能是圆点、句点、下划线变量名的结尾不能是圆点、句点、下划线n n变量名的长度不能超过变量名的长度不能超过6464个字符个字符n n变量名必须唯一,并且不区分大小写变量名必须唯一,并且不区分大小写n nSP

6、SSSPSS的保留字不能作为变量名(的保留字不能作为变量名(ALLALL、NENE、EQEQ、GTGTn nANDAND、NOTNOT、WITHWITH)n n如不指定变量名,则系统默认变量名以如不指定变量名,则系统默认变量名以VARVAR开头后面跟开头后面跟5 5个数字个数字 为了便于记忆和理解变量名与其所代表的具体含义一致。为了便于记忆和理解变量名与其所代表的具体含义一致。1.2变量的类型变量的类型(Type)n n数值型:根据其功能和形式又可细分为(标准型、逗号型、句点型、科学计数型、美元型和自定义货币型)n n字符型n n日期型系统默认为标准数值型数值型变量数值型变量n n标准型标准型

7、: :是是SPSSSPSS默认的类型,宽度默认的类型,宽度8 8、小数点、小数点2 2、小、小数点用圆点。数点用圆点。n n科学计数类型:适合数值很大或很小的变量科学计数类型:适合数值很大或很小的变量, ,变量变量显示为指数形式。如:显示为指数形式。如:-1.28E+002-1.28E+002表示表示-1.2810-1.28102 2n n逗号型逗号型(comma )(comma )n n圆点型圆点型(Dot)(Dot)n n美元型美元型(Dollar)(Dollar)n n自定义货币型自定义货币型日期型变量日期型变量(Date)n n用于表示日期和时间的变量类型SPSS提供了多达29种日期型

8、变量的格式.字符型变量字符型变量(String)n n是非数值型变量类型,其值是由字符串组成的.对其定义的对话框只有一个输入项修改数据变量的默认值修改数据变量的默认值n n对于SPSS变量的参数,系统都会自动给出默认值.也可通过Edit菜单中的Date对话框重新设置点击1.3变量标签(变量标签(Label)n n变量名标签(变量名标签(variable labelvariable label) 对变量名含义的进一步补充说明。对变量名含义的进一步补充说明。n n变量值标签(alue Label) 是对数值型变量各个取值的含义给予进一步的解释和说明.4变量缺失数据变量缺失数据(missing va

9、lue)n n系统默认无缺失值:如当前变量测试值、记录完全正确、系统默认无缺失值:如当前变量测试值、记录完全正确、无遗漏,则可用无缺失值。无遗漏,则可用无缺失值。离散缺失值:如性别0、3、4都是非法的,可分 别填入点击n n定义缺失值范围:这种缺失值针对连续的变量值。当指定定义缺失值范围:这种缺失值针对连续的变量值。当指定某一范围的值出现在当前定义的变量中,则被当作缺失值某一范围的值出现在当前定义的变量中,则被当作缺失值处理。如在性别变量值中输入了处理。如在性别变量值中输入了3 3、4 4、5 5、6 6。可以在。可以在LOWLOW后面输入后面输入3 3,HIGHTHIGHT后面输入后面输入6

10、 6。注意这个定义范围。注意这个定义范围内不能有合法值内不能有合法值。”0“就是包括不了的离散值1.5度量尺度度量尺度n n定距型变量定距型变量(scale)(scale)可以表示如温度、重量等含义的可以表示如温度、重量等含义的连续性连续性数值变量数值变量, ,也可以表示年龄、次数等离散型变量也可以表示年龄、次数等离散型变量. .还可以表还可以表示时间的日期变量或者货币的货币型变量示时间的日期变量或者货币的货币型变量, ,但不能是字符型但不能是字符型变量变量. .n n定序型变量定序型变量(ordinal)(ordinal)其值表示一种顺序的前后其值表示一种顺序的前后, ,如职称变量如职称变量

11、可分为高中低三个档次可分为高中低三个档次, ,可用可用A(1)A(1)、B(2)B(2)、C(3)C(3)表示,定序表示,定序型变量可以是数值型也可以字符型型变量可以是数值型也可以字符型n n定类型变量定类型变量(nominal)(nominal):该变量不存在变量值之间的大小、:该变量不存在变量值之间的大小、顺序的前后等。只表示属于的类别。如性别中顺序的前后等。只表示属于的类别。如性别中“1”“1”表示男,表示男,“2”“2”表示女等表示女等, ,可以是数值型也可以字符型可以是数值型也可以字符型2.SPSS数据文件的构成数据文件的构成n n由数据结构和数据内容构成 结构规定了数据文件的基本构

12、成属性 (变量名、变量类型、变量名标签、变量值标签、缺失值定义、度量尺度及数据显示属性如宽度列宽度和对齐方式等) 如一个班考试成绩表包含姓名、考号、各科科目成绩(英语、数学、如一个班考试成绩表包含姓名、考号、各科科目成绩(英语、数学、政治、专业)等六个变量。对每一个变量定义其属性,如政治、专业)等六个变量。对每一个变量定义其属性,如“ “姓名姓名” ”变量变量定义为字符型、宽度定义为定义为字符型、宽度定义为8 8个字符,度量尺度为定类型,由于变量个字符,度量尺度为定类型,由于变量含义清楚,无须定义变量标签和变量值标签,缺失值默认为含义清楚,无须定义变量标签和变量值标签,缺失值默认为0 02.1

13、创建创建SPSS数据文件数据文件1.在Variables View 视区定义变量及其变量的属性2.在Date View视区录入数据文件的内容 浏览数据文件变量名的三种方法浏览数据文件变量名的三种方法n n在在Variable ViewVariable View视区中浏览视区中浏览n n在在SPSSSPSS菜单中选择菜单中选择Utilities Utilities VariblesVariblesn n在在SPSSSPSS主界面选择主界面选择File File Display Date File information Display Date File informationSPSS数据的录入

14、数据的录入n n当变量的属性定义完成后就可以开始进行数据的输入n n切换窗口从Variables View Date View出现了二维的空白表格如Excel(见03 03 Date1 1) EnterEnter输入一列相同参数输入一列相同参数 Tab Tab 输入一行同一案例的数据输入一行同一案例的数据Shift+TabShift+Tab光标左移光标左移SPSS数据的编辑数据的编辑n n保证录入的数据准确无误,需要对SPSS数据进行修改、删除、插入、复制、定位等操作。创建和读取创建和读取SPSS数据文件数据文件1. 1.直接通过SPSS数据编辑窗口定义变量输入数据(如前所述)2. 2.通过打

15、开不同格式的数据文件,间接创建SPSS数据文件。 支持*.doc,*.xls,*.txt等保存保存SPSS数据数据n n经读取、修改后把SPSS窗口的数据以数据文件的形式保存到外部的储介质中。二、均值的比较与检验二、均值的比较与检验n nT T 检验是检验差异显著性的十分重要的统计工具检验是检验差异显著性的十分重要的统计工具, ,这这种差异显著性的检验是种差异显著性的检验是样本均值间样本均值间的比较。因此的比较。因此T T 检验也可以称为一种均值比较分析。它包括单样本检验也可以称为一种均值比较分析。它包括单样本T T检验、独立样本检验、独立样本T T 检验、配对样本检验、配对样本T T 检验。

16、检验。n n来自来自正态总体正态总体的两个样本进行均值比较常使用的两个样本进行均值比较常使用T T 检检验的方法。验的方法。T T 检验要求两个被比较的样体来自正态检验要求两个被比较的样体来自正态总体。总体。n n两个样本两个样本方差相等与不等方差相等与不等时使用的计算时使用的计算t t 值的公式值的公式不同。不同。1.单样本单样本T检验检验 检验单个变量的均值是否与给定的常数之间存在差异。样本均数与总体均数之间的差异显著性检验属于单一样本T 检验。示例1n n圆盘制动闸直径:标准为322mmn n四台机器生产,每台抽出16个。 检验是否与322有差异?先拆分文件先拆分文件按机器编号分四组按机

17、器编号分四组然后采用单然后采用单样本样本T检验检验点击2.点击1.填入检验参照指标n n某轮胎厂的质量分析报告中说明,该厂某轮胎的平均寿命在一定的载重负荷与正常行驶条件下会大于25000 公里。平均轮胎寿命的公里数近似服从正态分布。现对该厂该种轮胎抽取一容量为15 个的样本,试验结果得样本均值为27000 公里能否作出结论:该厂产品与申报的质量标准相符数据?见示例轮胎.示例2点击1.输入比较参照值2.点击点击2.两独立样本两独立样本T检验检验n n进行独立样本T 检验,要求被比较的两个样本彼此独立,即没有配对关系。要求样本均来自正态总体,而且均值对于检验是有意义的描述统计量。n n独立样本T

18、检验和配对样本的T 检验均使用T test 过程,但是使用的菜单不同对于数据文件结构的要求和所使用的命令语句也有区别。示例示例1n n某物质在处理前与处理后分别抽样分析其含脂率如下n n处理前(Xi) 0.19 0.18 0.21 0.30 0.41 0.12 0.27n n处理后(Yi) 0.15 0.13 0.07 0.24 0.19 0.06 0.08 0.12n n假定处理前后的含脂率都服从正态分布,且方差相同。问处理前后的含脂率的平均值是否有显著变化?( =0.05)。点击group进入分组变量点击处理前后进入检验变量1.点击点击group,定义分组定义分组组组1处理前处理前组组2处

19、理后处理后2.点击继续点击继续点击点击确定确定示例示例2n n几何均数的比较 选甲型流感病毒血凝抑制抗体滴度选甲型流感病毒血凝抑制抗体滴度( (对数对数) ) 共共24 24 人,随机分为两组,每组人,随机分为两组,每组1212人,用甲型流感病毒人,用甲型流感病毒活疫苗进行免疫,一组用气雾法,另一组用鼻腔活疫苗进行免疫,一组用气雾法,另一组用鼻腔雾法。免疫后一月采血,分别测定血凝抑制抗体雾法。免疫后一月采血,分别测定血凝抑制抗体滴度结果如下。问两法的效果有无差异?滴度结果如下。问两法的效果有无差异? 气气 雾雾 组(组(1 1) 40 20 30 25 10 15 25 30 40 10 15

20、 30 40 20 30 25 10 15 25 30 40 10 15 30 鼻腔雾组(鼻腔雾组(2 2) 50 40 30 35 60 70 30 20 25 70 35 25 50 40 30 35 60 70 30 20 25 70 35 25n n选择TransformCompute ,激活Compute Variable 新变量赋值主对话框令,lgx=lg10(x),点击OK 按钮,执行数据文件新增变量lgx,示例示例3n n作作T T 检验时,应首先检验方差是否相等。以上例子检验时,应首先检验方差是否相等。以上例子都是经检验后两样本方差相等的。下面举出一个经都是经检验后两样本方差

21、相等的。下面举出一个经检验后方差不相等的例子。检验后方差不相等的例子。n n甲乙两矿坑平均产煤中含矸率甲乙两矿坑平均产煤中含矸率( %)( %)指标是服从正态分指标是服从正态分布的,今分别从两坑所产煤中各抽取布的,今分别从两坑所产煤中各抽取7 7 个样品测得含个样品测得含矸率指标如下矸率指标如下 甲坑甲坑(x) 5.9 3.8 6.5 18.3 18.2 16.1 7.6(x) 5.9 3.8 6.5 18.3 18.2 16.1 7.6 乙坑乙坑(y) 7.6 0.4 1.1 3.2 6.5 4.1 4.7(y) 7.6 0.4 1.1 3.2 6.5 4.1 4.7 能否判断出它们的含矸率

22、有显著差异能否判断出它们的含矸率有显著差异( =0.05)( =0.05)3.配对样本配对样本T 检验检验配对的三种情况:(1)同一窝实验用小白鼠按性别、体重相同配对。再随机分到实验组和对照级分别,喂加入海藻的饮料和普通饮料,三个月后,分别将每对白鼠置于水中,测量其到溺死前的游泳时间比较两组白鼠游泳时间均值,从而比较两种饮料对抗疲劳的作用。(2)同一组高血压病人,在进行体育疗法前后,测量其血压。每个病人在体育疗法前后的血压测量值构成观测量对。可以是这组病人体育疗法前后血压的平均值。进行配对T检验。分析体育疗法对降血压的疗效。(3)在研究人体各部位体温是否有差别时,一个人的两个部位的温度构成一对

23、数据,测量若干人的同样部位的温度数据,可以比较这两个部位平均温度是否有显著性差异,使用配对t 检验示例示例n n某单位研究饮食中缺乏维生素E 与肝中维生素A 含量的关系,将同种属的大白鼠按性别相同,年龄、体重相近者配成对子。共8对,并将每对中的两头动物随机分到正常饲料组和维生素E缺乏组。过一定时期后将大白鼠杀死,测得其肝中维生素A的含量。 不同饲料组大白鼠维生素A 含量数据表大白鼠对号大白鼠对号 1 2 3 4 5 6 7 8 1 2 3 4 5 6 7 8正常饲料组正常饲料组 3550 2000 3000 3950 3800 3750 3450 3050 3550 2000 3000 395

24、0 3800 3750 3450 3050维生素维生素A A缺乏组缺乏组2450 2400 1800 3200 3250 2700 2500 17502450 2400 1800 3200 3250 2700 2500 1750示例示例2n n为了检验甲、乙、丙三种分离机在析出某种有用物质效能上的高低,今抽取8批溶液,每批均分成三份分别由甲、乙、丙机分解处理。其析出效果数据如表8-20所示。试问甲、乙、丙三种机在析出效能上有无差异( =0.05)?n n样号 1 2 3 4 5 6 7 8n n甲(X) 4.0 3.5 4.1 5.5 4.6 6.0 5.1 4.3n n乙(Y) 3.0 3.0 3.8 2.1 4.9 5.3 3.1 2.7n n丙(Z) 3.2 3.8 4.3 3.6 4.0 4.9 4.7 2.4谢谢谢谢!

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 建筑/环境 > 施工组织

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号