SPSS数据文件的建立、编缉-课件PPT

资源描述

《SPSS数据文件的建立、编缉-课件PPT》由会员分享，可在线阅读，更多相关《SPSS数据文件的建立、编缉-课件PPT（87页珍藏版）》请在金锄头文库上搜索。

1、SPSS软件软件数据文件的建立、编辑数据文件的建立、编辑2021/8/261 SPSS的基本数据管理功能的基本数据管理功能SPSS Basic Data Management2021/8/262一、数据获取一、数据获取二、变量属性二、变量属性三、记录排序三、记录排序四、文件拆分四、文件拆分五、筛选记录五、筛选记录六、数据文件的合并六、数据文件的合并纵向合并纵向合并七、数据文件的合并七、数据文件的合并横向合并横向合并八、通过计算产生新变量八、通过计算产生新变量九、重新赋值九、重新赋值十、排秩十、排秩十一、重排格式十一、重排格式十二、日期计算十二、日期计算十三、随机抽样十三、随机抽样2021/8

2、/263一、数据获取一、数据获取Getting Data into SPSS读取读取SPSS数据文件：数据文件：*.sav , 常用的其常用的其他外部数据文件：他外部数据文件： *.xls , *.dbf , *.txt , *.dat, *.w*, *.sas7bdat, *.mdb 注意注意：医学领域常用数据库：医学领域常用数据库EpiData软软件，先将数据文件件，先将数据文件*.rec转换为转换为*.sps文文件，然后在件，然后在SPSS的语法窗口运行，生的语法窗口运行，生成成*.sav 文件。文件。2021/8/264数据获取途径数据获取途径2021/8/265二、变量属性二、变量属

3、性Variable Properties1.Name：变量名。允许用中文，但习惯上采变量名。允许用中文，但习惯上采用英文变量名。用英文变量名。2.Type：变量类型，常用数值型变量类型，常用数值型（Numeric）、字符型（）、字符型（String）、日期型）、日期型（Date）。）。3.Width：变量宽度，默认为变量宽度，默认为8。4.Decimals：小数位数，默认为小数位数，默认为2。5.Label：变量编码，又称为变量标签，用于变量编码，又称为变量标签，用于注释变量名的含义。注释变量名的含义。2021/8/2666.Values：变量值编码，又称为变量值标签，用于注释变量值编码，又称

4、为变量值标签，用于注释变量值的含义。变量值的含义。例如：例如：变量变量sex，变量标签为，变量标签为“性别性别”；变量值为变量值为1与与2，变量值编码：，变量值编码：1为为“男性男性”，2为为“女性女性”。7.Missing：缺失值。默认为系统缺失值，用缺失值。默认为系统缺失值，用“.”表示。表示。8.Columns：列宽，默认为列宽，默认为8。9.Align：对齐方式。数值型变量默认右对齐（对齐方式。数值型变量默认右对齐（Right），），字符型变量默认左对齐（字符型变量默认左对齐（Left）。10.Measure：测度，包括三类：数值变量（测度，包括三类：数值变量（Scale），），名义

5、变量或无序分类变量（名义变量或无序分类变量（Nominal），有序分类变量），有序分类变量或等级变量（或等级变量（Ordinal）。）。2021/8/267数据清单数据清单变量清单变量清单数据文件数据文件ex.sav（数据窗口（数据窗口数据清单数据清单界面）界面）2021/8/268数据文件数据文件ex.sav（数据窗口（数据窗口变量清单变量清单界面）界面）注意：注意：一行对应一个一行对应一个“记录（记录（Case）”；一列对应一个；一列对应一个“变量变量（Variable）”。此数据窗口不是一个很好的数据录入界面。此数据窗口不是一个很好的数据录入界面。2021/8/269删除删除ex .sa

6、v文件中文件中id为为57的的case，将文件另，将文件另存为存为ex_1.sav为以后使用方便，将为以后使用方便，将ex .sav另存为如下数据库另存为如下数据库（Save As.）2021/8/2610删除删除ex .sav文件中文件中id为为14的的case，将文件另，将文件另存为存为ex_2.sav2021/8/2611删除删除ex .sav文件中变量文件中变量sbp1dbp2，删除，删除id6的记录，将文件另存为的记录，将文件另存为ex3.sav2021/8/2612只保留只保留ex .sav文件中变量文件中变量id、sbp1dbp2，删，删除除id7的记录，将文件另存为的记录，将文

7、件另存为ex4.sav2021/8/2613三、记录排序三、记录排序Sort Cases 2021/8/2614ex .sav文件中文件中, 按照按照“height（身高）（身高）”的大小排序。的大小排序。升序升序降序降序2021/8/2615四、文件拆分四、文件拆分 Split File 2021/8/2616比较组比较组分组变量分组变量根据分组根据分组变量排序变量排序ex .sav文件中文件中, 按照按照“sex（性别）（性别）”拆分文件拆分文件2021/8/26172021/8/2618分性别对分性别对“height（身高）（身高）”进行统计描述进行统计描述描述性统计描述性统计2021/

8、8/26192021/8/2620不同性别的不同性别的“height（身高）（身高）”统计描述统计描述所有记录的所有记录的“height（身高）（身高）”统计描述统计描述注意注意：SPSS的输出结果文件为的输出结果文件为*.spo2021/8/2621 五、五、筛选记录筛选记录 Select Cases2021/8/2622如果条件满足如果条件满足过滤过滤删除删除selectunselect2021/8/2623筛选条件：有高血压家族史（筛选条件：有高血压家族史（genic 0）2021/8/2624如果选用如果选用Deleted，则，则一定一定要将筛要将筛选后的文件另存选后的文件另存一个文件

9、名一个文件名2021/8/2625filter_$变量，变量，0表示未选中该记录，表示未选中该记录，1表示选中该记录表示选中该记录不符合条件的记录，不符合条件的记录，被用斜线筛除被用斜线筛除2021/8/2626有高血压家族史的患者身高的统计描述有高血压家族史的患者身高的统计描述所有患者身高的统计描述所有患者身高的统计描述2021/8/2627六、数据文件的合并六、数据文件的合并纵向合并：增加纵向合并：增加记录记录Merge Files.Add Cases打开数据文件打开数据文件ex_1.sav作为作为“工作数据文件工作数据文件”2021/8/2628打开打开ex_2.sav作为作为“外部数据

10、文件外部数据文件”2021/8/2629*代表工作数据文件，代表工作数据文件，代表外部数据文件。代表外部数据文件。2021/8/2630将连接后的文件另存一个文件名：将连接后的文件另存一个文件名：ex_12.sav2021/8/2631七、数据文件的合并七、数据文件的合并横向合并：增加变量横向合并：增加变量Merge Files.Add Variables打开打开ex3.sav作为作为“工作数据文件工作数据文件”2021/8/2632打开打开ex4.sav作为作为“外部数据文件外部数据文件”2021/8/2633（1）两个文件均提供记录（）两个文件均提供记录（Both files provid

11、e cases）关键变量关键变量对于排序的文件，按照关键变量对于排序的文件，按照关键变量进行匹配进行匹配*代表工作数据文代表工作数据文件，件，代表外部代表外部数据文件。数据文件。2021/8/2634警告：警告：如果数据未按照关键变量如果数据未按照关键变量的的升序升序进行排序，那么不能按照进行排序，那么不能按照关键变量匹配关键变量匹配2021/8/2635连接后的数据文件，另存为连接后的数据文件，另存为ex_34a.sav2021/8/2636（2）按照关键变量，将外部数据文件匹配到工作）按照关键变量，将外部数据文件匹配到工作数据文件中（数据文件中（External file is keyed

12、 table）。）。2021/8/2637连接后的数据文件，另存为连接后的数据文件，另存为ex_34b.sav2021/8/2638（3）按照关键变量，将工作数据文件匹配到外部）按照关键变量，将工作数据文件匹配到外部数据文件中（数据文件中（Working file is keyed table）。）。2021/8/2639连接后的数据文件，另存为连接后的数据文件，另存为ex_34c.sav2021/8/2640八、通过计算产生新变量八、通过计算产生新变量 compute2021/8/2641产生一个新变量：产生一个新变量：bmi体重体重/（身高）（身高）*2）2021/8/26422021/8

13、/2643九、重新赋值九、重新赋值Recode. Into different variables2021/8/2644旧及新的变量值旧及新的变量值2021/8/2645根据根据bmi对对7个记录进行分组，个记录进行分组，bmi: 正常：正常：18.023.9；超重：；超重：24.027.9；肥胖：；肥胖：28.0。2021/8/2646定义新的变量名：定义新的变量名：bmi _ gr2021/8/26472021/8/2648问题：当问题：当bmi23.91时，时，bmi_gr的取何值？的取何值？根据上述根据上述recode方法，方法， bmi_gr为缺失值！为缺失值！解决办法：解决办法：R

14、ECODE bmi (18.0 thru 24.0=1) (24.0 thru 28.0=2) (28.0 thru Highest=3) INTO bmi_gr .EXECUTE .2021/8/2649十、排秩十、排秩 rank cases2021/8/2650对对sbp1（治疗前（治疗前SBP）进行排秩）进行排秩2021/8/2651排秩后产生新变量排秩后产生新变量rsbp1，其中，其中对于相等的变量对于相等的变量值（称为结点值（称为结点ties）取平均秩次）取平均秩次。本例中第。本例中第2、3位的平均秩次为位的平均秩次为2.5。2021/8/2652十一、重排格式十一、重排格式Rest

15、ructure2021/8/26531.将变量转换为记录将变量转换为记录 Restructure selected variables into cases 2021/8/2654将变量转换为同一组将变量转换为同一组2021/8/2655记录记录标识标识转置后的新变量转置后的新变量需要转置的变量需要转置的变量需要固定的变量需要固定的变量2021/8/2656创建一个索引变量创建一个索引变量2021/8/2657索引变量索引变量的变量名的变量名按照自然数列对索引变量取值按照自然数列对索引变量取值2021/8/2658未选取的变量从未选取的变量从新数据库中删除新数据库中删除2021/8/2659开

16、始重排开始重排2021/8/2660重排后的数据文件重排后的数据文件data1.sav。 2021/8/26612.将记录转换为变量将记录转换为变量 Restructure selected cases into variables2021/8/26622021/8/2663记录标识记录标识索引变量索引变量2021/8/2664按照按照“记录标识记录标识”变量排序变量排序2021/8/2665按照原变量值按照原变量值顺序，排列新顺序，排列新变量组变量组2021/8/2666开始重排开始重排2021/8/2667重排后的数据文件重排后的数据文件data2.sav。 2021/8/2668十二、日

17、期计算十二、日期计算 Date/Time 2021/8/2669用日期与时间进行计算用日期与时间进行计算2021/8/2670两个日期之间的计算两个日期之间的计算2021/8/2671Date1与与Date2之差之差以以“天天”为单位为单位2021/8/2672结果变量：结果变量：day，单位，单位为为“天天”变量标签变量标签2021/8/26732021/8/2674十三、随机抽样十三、随机抽样 Random Sampling 步骤步骤1 随机数种子（随机数种子（Random Number Seed）的设定）的设定以数据文件以数据文件data.sav为为例例2021/8/2675指定种子（此

18、处以随机抽样的指定种子（此处以随机抽样的日期为种子）日期为种子）2021/8/2676步骤步骤2 随机筛选记录（随机筛选记录（Select Cases Randomly）2021/8/2677随机抽取样本随机抽取样本单击单击Sample按钮按钮2021/8/2678从前从前10个记录中随机抽取个记录中随机抽取2个记录个记录2021/8/2679从前从前10个记录中随个记录中随机抽取机抽取2个记录个记录2021/8/2680随机抽样的结果：随机抽样的结果：抽取了抽取了no为为3、4的两个记录。的两个记录。2021/8/2681注意：注意：1.随机抽样主要用于现场调查中，从总体中用简随机抽样主要

19、用于现场调查中，从总体中用简单随机的方法随机抽取一个样本。单随机的方法随机抽取一个样本。2.随机抽样的过程中，需要设定种子，以保证随随机抽样的过程中，需要设定种子，以保证随机抽样结果是机抽样结果是可重现可重现的。（一般来说，如果不设的。（一般来说，如果不设定种子，那么第二次抽样很可能与第一次抽样的定种子，那么第二次抽样很可能与第一次抽样的结果不同。）结果不同。）2021/8/2682小贴士：小贴士：SPSS通过菜单，可以实现大部分的数据管理及通过菜单，可以实现大部分的数据管理及统计分析功能，软件操作简单、易学。在学习统计分析功能，软件操作简单、易学。在学习SPSS时，要养成一个好习惯时，要养成

20、一个好习惯:用语法文件用语法文件（*.sps）保存每一步操作）保存每一步操作（只需要在每个对话（只需要在每个对话框中点击框中点击Paste，就可以将操作粘贴到语法窗口，就可以将操作粘贴到语法窗口，即即Syntax窗口）窗口）。这样做，至少有两个益处：。这样做，至少有两个益处：1.避免重复地操作；避免重复地操作；2.很清楚地记录了统计分析的很清楚地记录了统计分析的过程。过程。2021/8/2683如果您偷懒，从不保存语法文件如果您偷懒，从不保存语法文件1.您花了一整天的时间进行了复杂的数据整您花了一整天的时间进行了复杂的数据整理及统计分析理及统计分析几天后，老板告诉您：几天后，老板告诉您：数据库

21、需要删除一个记录，您要重新做统数据库需要删除一个记录，您要重新做统计！计！天啊！天啊！为了这一个记录，难道还要为了这一个记录，难道还要再花费一整天重头开始么？！再花费一整天重头开始么？！2021/8/2684如果您偷懒，从不保存语法文件如果您偷懒，从不保存语法文件2.您花了一整天的时间进行了复杂的数据整您花了一整天的时间进行了复杂的数据整理及统计分析。很幸运，数据很准确，方理及统计分析。很幸运，数据很准确，方法很合适，似乎没有什么遗憾了。法很合适，似乎没有什么遗憾了。N年年后，有人拿着您的统计结果，很崇拜地请后，有人拿着您的统计结果，很崇拜地请教：当初您是怎么算出这个结果的？教：当初您是怎么算出这个结果的？天啊！天啊！我怎么可能记得我怎么可能记得N年前的事年前的事情？！情？！2021/8/2685如果您养成了这个好习惯如果您养成了这个好习惯:用语法文件（用语法文件（*.sps）保存每一步操作保存每一步操作哈哈！哈哈！只需要几秒钟我就能将统计只需要几秒钟我就能将统计结果重现！结果重现！a piece of cake ！2021/8/2686部分资料从网络收集整理而来，供大家参考，感谢您的关注！

展开阅读全文

SPSS数据文件的建立、编缉-课件PPT

最新文档