统计软件应用:第二章 清理数据(自学)

上传人:M****1 文档编号:568765646 上传时间:2024-07-26 格式:PPT 页数:24 大小:747KB
返回 下载 相关 举报
统计软件应用:第二章 清理数据(自学)_第1页
第1页 / 共24页
统计软件应用:第二章 清理数据(自学)_第2页
第2页 / 共24页
统计软件应用:第二章 清理数据(自学)_第3页
第3页 / 共24页
统计软件应用:第二章 清理数据(自学)_第4页
第4页 / 共24页
统计软件应用:第二章 清理数据(自学)_第5页
第5页 / 共24页
点击查看更多>>
资源描述

《统计软件应用:第二章 清理数据(自学)》由会员分享,可在线阅读,更多相关《统计软件应用:第二章 清理数据(自学)(24页珍藏版)》请在金锄头文库上搜索。

1、12014.6.16目录目录第二章第二章 清理清理数据数据(自学)(自学)一、异常数据的检查和清理一、异常数据的检查和清理 利用利用Frequencies命令命令 利用利用Explore命令命令二、二、相关变量之间的逻辑检查相关变量之间的逻辑检查和清理和清理 原始资料原始资料 频数表资料频数表资料第二第二+ +章章 基本描述统计基本描述统计一、正态性检验一、正态性检验22014.6.16目录目录二、二、基本描述统计基本描述统计 使用使用Frequencies命令命令 使用使用Descriptives命令命令32014.6.16 第二章第二章 清理数据清理数据(自学)(自学) 一、异常数据的检查

2、和清理一、异常数据的检查和清理 利用利用Frequencies命令命令 此命令主要针对分类变量或离散变量,通过选择此命令主要针对分类变量或离散变量,通过选择 Display frequency tables(列频数表)来发现异常数据的(列频数表)来发现异常数据的有有无无。 通过通过EditFind命令或命令或DataSelect Cases命令命令查找查找异常数据所在的记录异常数据所在的记录,修改或删除。,修改或删除。42014.6.16 利用利用Explore命令命令 此命令主要针对定量变量或连续变量,通过选择此命令主要针对定量变量或连续变量,通过选择 Outliers(异常点)来发现异常数

3、据的(异常点)来发现异常数据的有无有无,也可通过其输也可通过其输出的出的Stem-and-Leaf Plot(茎(茎-叶图)或叶图)或Boxplot(箱图)来(箱图)来直观发现异常数据的直观发现异常数据的有无有无。 通过通过EditFind命令或命令或DataSelect Cases命令命令查找查找异常数据所在的记录异常数据所在的记录,修改或删除。,修改或删除。 二、二、相关变量之间的逻辑检查相关变量之间的逻辑检查和清理和清理 具体方法参见教材第具体方法参见教材第25页第二节相关内容。页第二节相关内容。52014.6.16 第二第二+ +章章 基本描述统计基本描述统计 一、正态性检验一、正态性

4、检验 原始资料原始资料 SPSS主要通过主要通过Analyze Nonparametric Tests 1-Sample K-S检验(即检验(即One-Sample Kolmogorov-Smirnov Test)完成对某变量所有数据的正态性检验完成对某变量所有数据的正态性检验。 下面通过对(第三版)教材第下面通过对(第三版)教材第58页例页例5.1的数据做正态的数据做正态性检验来讲述操作步骤及结果的判读。性检验来讲述操作步骤及结果的判读。 1. 1. 建立数据文件建立数据文件(见(见exp5.1.sav)62014.6.16 2. 2. 正态性检验正态性检验 Analyze Nonparam

5、etric Tests 1-Sample K-S打开打开One-Sample Kolmogorov-Smirnov Test对话框对话框。选择。选择检验变量并选择检验变量并选择 Normal(正态分布)选项,(正态分布)选项, OK完成。完成。 3. 3. 结果判读结果判读 输出结果见输出结果见表表5.2,若,若Asymp. Sig. (2-tailed)的值大于的值大于检验水准检验水准(0.05),则该变量服从正态分布;反之不服从。,则该变量服从正态分布;反之不服从。 注意:注意:注意:注意:在在One-Sample Kolmogorov-Smirnov Test对话对话框中的框中的Exac

6、t按钮,一般当被检验变量的例数小于按钮,一般当被检验变量的例数小于30时,时,点击可选择精确检验方法来得到精确检验概率。点击可选择精确检验方法来得到精确检验概率。72014.6.16 SPSS还可以通过还可以通过Analyze Descriptive Statistics Explore分析方法(即探索性分析分析方法(即探索性分析)完成对某变量所有完成对某变量所有数据的正态性检验数据的正态性检验。 下面通过对(第三版)教材第下面通过对(第三版)教材第59页例页例5.2的数据做正态的数据做正态性检验来讲述操作步骤及结果的判读。性检验来讲述操作步骤及结果的判读。 1. 1. 建立数据文件建立数据文

7、件(见(见exp5.2.sav) 2. 2. 正态性检验正态性检验 Analyze Descriptive Statistics Explore打打开开Explore对话框对话框,选择检验变量并点击,选择检验变量并点击 Plots按钮打按钮打开开Explore: Plots对话框对话框, 选择选择 Normality plots with tests选项选项, 点击点击Continue按钮,再点击按钮,再点击OK按钮按钮完成。完成。82014.6.16 3. 3. 结果判读结果判读 输出结果见输出结果见表表5.4a。本例数据经本例数据经Lilliefors检验水准下检验水准下的的Kolmogo

8、rov-Smirnov检验和检验和Shapiro-Wilk检验,检验概检验,检验概率率P均小于均小于0.001,则不服从正态分布。,则不服从正态分布。 注意:注意:注意:注意:当样本含量当样本含量50时,选择时,选择Shapiro-Wilk检验结果检验结果为准为准。 频数表资料频数表资料 方法同上。只需把频数表的方法同上。只需把频数表的组中值组中值当成变量值当成变量值x,把把频频数数 f 用用SPSS的加权命令的加权命令Weight cases选上选上, 其余操作步骤同其余操作步骤同上。上。92014.6.16 二、基本描述统计二、基本描述统计 使用使用Frequencies命令命令 SPSS

9、可以使用可以使用Frequencies命令完成对连续变量数据的命令完成对连续变量数据的频数分布分析,可以绘制频数分布分析,可以绘制直方图直方图(histogram);对离散变);对离散变量进行频数列表并绘制量进行频数列表并绘制直条图直条图(Bar chart)或)或饼图饼图( Pie chart );对数据可以求均数、标准差、最大值、最小值、;对数据可以求均数、标准差、最大值、最小值、标准误、中位数和百分位数等标准误、中位数和百分位数等。 方法:方法:方法:方法: Analyze Descriptive Statistics Frequencies 102014.6.16打开打开Frequen

10、cies对话框对话框, 首先选择分析变量首先选择分析变量, 选择选择 Display frequency tables选项则输出变量的频数表选项则输出变量的频数表。点击。点击Statistics按钮打开按钮打开Frequencies: Statistics对话框对话框,里面有百分位数值、里面有百分位数值、集中趋势、离散趋势以及分布四类的指标,每个指标的具集中趋势、离散趋势以及分布四类的指标,每个指标的具体含义参见教材体含义参见教材第第63页页“一、一、使用使用Frequencies作基本统计作基本统计分析分析”内相关内容;点击内相关内容;点击Charts按钮打开按钮打开Frequencies:

11、 Charts对话框对话框,可选择绘制条图、饼图或直方图。可选择绘制条图、饼图或直方图。 例例例例5.45.4 对例对例5.1的数据作基本统计分析。的数据作基本统计分析。 1. 1. 打开数据文件打开数据文件(见(见exp5.1.sav) 2. 2. 选择分析变量和基本统计分析项选择分析变量和基本统计分析项112014.6.16 Analyze Descriptive Statistics Frequencies 打开打开Frequencies对话框对话框,选择检验变量男性红细胞量,选择检验变量男性红细胞量blood并点击并点击 Statistics 按钮打开按钮打开Frequencies:

12、Statistics对对话框话框,选择,选择Mean、Sum、Std.deviation、Minimum、Maximum和和S.E.mean,点击点击Continue按钮,点击按钮,点击Charts按钮打开按钮打开Frequencies: Charts对话框对话框,选择,选择Histograms并选并选择择 With normal curve选项选项, 点击点击Continue按钮,再点击按钮,再点击OK按钮按钮完成。完成。 3. 3. 结果判读结果判读 输出结果见输出结果见表表5.7和和图图5.9,从图,从图5.9 可见该变量基本服可见该变量基本服从正态分布。从正态分布。122014.6.1

13、6 例例例例5.55.5 对例对例2.1的数据文件中的数据文件中time变量作基本统计描述。变量作基本统计描述。 操作步骤见教材第操作步骤见教材第29页内容。页内容。(自学)(自学) 使用使用Descriptives命令命令 SPSS可以使用可以使用Descriptives命令完成对连续变量数据的命令完成对连续变量数据的基本描述统计量的计算,与基本描述统计量的计算,与Frequencies命令相比,除不提命令相比,除不提供中位数、众数(供中位数、众数(Mode)、百分位数的计算和统计图的输)、百分位数的计算和统计图的输出外,其余功能相同出外,其余功能相同。 方法:方法:方法:方法: Analy

14、ze Descriptive Statistics Descriptives 132014.6.16打开打开Descriptives对话框对话框, 首先选择分析变量首先选择分析变量, 点击点击Options按钮打开按钮打开Descriptives : Options对话框对话框,里面有各种里面有各种基本描基本描述统计量供选择,述统计量供选择,每个每个统计量统计量的具体含义参见教材的具体含义参见教材第第64 65页内相关内容。页内相关内容。 即使不点击即使不点击Options按钮,按钮,SPSS默认默认选择选择Mean、Std.deviation、Minimum、Maximum四个统四个统计量进

15、行计算。计量进行计算。 例例例例5.65.6 对例对例2.1的数据中的月龄变量(的数据中的月龄变量(age)和红细胞压和红细胞压积变量(积变量(hct)作基本描述统计分析。作基本描述统计分析。 1. 1. 打开数据文件打开数据文件(见(见exp2.1.sav) 2. 2. 选择分析变量和基本描述统计分析项(略)选择分析变量和基本描述统计分析项(略)142014.6.16 3. 3. 结果判读结果判读 输出结果见输出结果见表表5.9。思考题思考题 1. 1. Frequencies命令命令和和Descriptives命令的区别。命令的区别。 2. 2. SPSS对数据进行正态性检验的方法有几种?

16、对数据进行正态性检验的方法有几种? 3. 3. 在用在用Frequencies命令对命令对连续型连续型变量进行分析时,变量进行分析时, 为什么常常应不选为什么常常应不选Display frequency tables项?项?C152014.6.16被检验变量被检验变量当被检验变量的例数小于当被检验变量的例数小于30时,时,选择此项可得到精确检验概率。选择此项可得到精确检验概率。Uniform 均匀分布均匀分布Poisson 泊松分布泊松分布Exponential 指数分布指数分布162014.6.16即检验概率即检验概率P,若若P0.05,则服从正则服从正态分布。态分布。检验统计量检验统计量Z

17、Sig.Significance,即检验概率即检验概率PAsymp.Asymptotic, 近似的近似的只有选择只有选择Exact选项时才有。选项时才有。表表 5.2输出结果输出结果172014.6.16被检验变量被检验变量 带正态检验带正态检验的正态概率图的正态概率图182014.6.16表表 5.2a部分输出结果部分输出结果表示表示P非常小,可表达为非常小,可表达为P0.001。调整输出值小数位数后的输出结果调整输出值小数位数后的输出结果192014.6.16列列频频数数表表值是组中值值是组中值任任意意百百分分位位数数的的选选择择Bar chart 条图条图Pie chart 饼图饼图Hi

18、stogram 直方图直方图202014.6.16对于连续变量对于连续变量 不选此项不选此项212014.6.16S表表 5.7输出结果输出结果222014.6.16图图 5.9输出结果输出结果232014.6.16Z-scores (standardized value) -Also known as a standardized value. To obtain z-scores for a variable, for each case subtract the variables mean value and divide by the standard deviation. Z-scores are useful for finding outliers and comparing values of variables that are measured on different scales. SPSS默认选项默认选项242014.6.16表表 5.9月龄:月龄: = 25.06, S=30.815, Max=144, Min=1, n=86红细胞压积:红细胞压积: =50.062, S=13.7709, Max=98.3, Min=31.6, n=86输出结果输出结果

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 研究生课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号