4第四章基本统计分析

资源描述

《4第四章基本统计分析》由会员分享，可在线阅读，更多相关《4第四章基本统计分析（73页珍藏版）》请在金锄头文库上搜索。

1、第四章基本统计分析,一、SPSS统计分析功能概述,1、SPSS数值分析过程（部分自学） 2、SPSS图形分析过程,1、SPSS数值分析过程,Descriptive Statistics Compare means General linear model CorrelateRegression,LoglinearClassifyData reduction ScaleNonparametric tests SurvivalMultiple response,2、SPSS图形分析过程,专门作为一章讲授,基本统计分析功能包括：1、报告分析（Report）2、描述性统计分析（Descriptive

2、 Statistics）,二、基本统计分析功能,（一）报告分析（Report）,1、OLAP 在线分析处理过程2 、Case Summaries 观测值摘要分析过程3、摘要报告分析过程(1)Report Summaries in Rows 行形式摘要报告(2) Report Summaries in Column 列形式摘要报告,按AnalyzeReportsOLAP Cubes顺序单击打开如下对话框：,摘要变量框：进入此框变量为数值型变量,分层变量框：进入此框变量为数值型或字符型变量,1、OLAP（在线分析处理过程）,可选择的统计量:Sum 总和Number of Cases 观测量数目Me

3、an 均值 Standard Deviation 标准差Percent of Total Sum 占总和的百分比Percent of Total N 占观察量总数的百分比Medina 中位数Grouping Median 分组中位数Std.Error of Mean 均值标准误Minimum 最小值Maximum 最大值Range 范围First 首值Last 尾值Variance 方差 Skewness 偏度Std.Error of Skewness 偏度的标准误Kurtosis 峰度Std.Error of Kurtosis 峰度的标准误Harmonic Mean 调和均数Geometri

4、c Mean 几何均数,标题对话框,输入统计量的标题,输入注解,这些注解将显示在统计量输出栏的下面,请看演示分析,30名少儿身高数据,1、操作步骤：1）按AnalyzeReportsOLAP Cubes顺序单击打开OLAP Cubes对话框2）打开数据文件“少儿身高.sav”，将height变量选入Summary Variable框中，将sex变量作为分组变量选入Grouping Variable 框中；3）单击Statistics按钮，在 Statistics框中选择Sum、Mean、Median项作为要输出的统计量；4）单击Title按钮，在Title框中输入“少儿身高分层报告”，单击C

5、ontinue返回；单击OK2、输出结果及分析,表4-3,观测量摘要,表4-2说明观测量的一些基本情况，包括总个数、有效值个数和缺省值个数。,表4-3是分层报告，输出了总和、均值和中位数。,其他数据基本分析方法,自学、练习,(二）描述性统计分析（Descriptive Statistics）,1、 Frequencies 频数分析表2、 Descriptive 描述性统计分析过程3、 Explore 探索分析过程4、 Crosstabs 列联表分析过程,1、频数分析表,一、主要功能可对数据按组进行归类整理，形成变量不同水平的频数分布表和图形，对数据的分布趋势进行初步分析。二、频数分析1）按A

6、nalyzeDescriptive StatisticFrequencies顺序，打开Frequencies对话框如图。,选择一个或多个变量右移入Variable（s）框。,按Statistics按钮，打开Statistics对话框,显示频数分布表,按Chart按钮，打开Chart 对话框,按Format按钮，打开Format 对话框,Frequences主对话框,输出百分位数：输出四分位数，显示25%、50%、75%的百分位数；将数据平均分为所设定的相等等份，可输入2100 的整数，如键入4则输出第25、50、75百分位数自定义百分位数，可输入0100 的整数。输入值后：按Add：输入值后

7、按此键，可反复操作键入多个百分位数；按Remove：删除已键入的数值按Change：重新输入新数,离差栏,分布参数栏,在计算百分位数值和中位数时，假设数据已分组，且用各组的组中值代替各组数据,中心趋势栏,输出统计量对话框,Chart 对话框,不输出任何图形，为默认输出条形图，各条高度代表变量各分类的频数输出圆图，圆图中各块的数值表示各分类变量的频数输出直方图，此图仅适用于区间型数值变量。选择此项后，还可选择With normal curve，画出的直方图带有正态曲线,只有选择了条形图和圆图项才有效，决定纵轴表示的统计量纵轴表示频数图纵轴表示百分比,Format 对话框,控制频数表输出的分

8、类数量。默认为10,多变量框中可设定多变量表格输出的格式,设置频数表输出的格式,选择频数表中排列顺序按变量升序排列，此为默认按变量降序排列按变量各种取值发生的频数的升序排列按变量各种取值发生的频数的降序排列,表49 100名大学生血清蛋白含量（%）,三、例题分析,对某高校100名大学生血清蛋白含量（g%）做频数分析，数据如表49,1、具体步骤按AnalyzeDescriptive StatisticFrequencies 顺序，打开Frequencies对话框。打开数据文件“大学生血清.sav”，挑xdh变量进入Variable框，grade变量进入Break框。选中Display frequ

9、ency tables复选框，要求输出频数分布表。单击Statistics按钮，选择要输出的统计量。单击Chart 按钮，选择Histogram项，输出直方图，并选择With normal curve复选框，输出正态曲线。单击Format 按钮，选Ascending项。单击“OK”完成。2、输出结果及分析结果如下表、图,血清蛋白含量的直方图,血清蛋白含量的统计表,血清蛋白含量的频数分布表,一、主要功能：调用此过程对变量进行描述性统计分析，计算均值、标准差、全距和均值标准误差等，并可将原始数据转换成Z分数。二、描述统计量分析按Analyze Descriptive Statistics Des

10、criptives顺序单击，打开 Descriptives主对话框。如图,选一个或多个变量移入,如选中此框，将对Variables框中选择的变量进行标准化产生相应的Z分值，并作为新变量保存到数据窗口，其变量名在原变量名前加z。,Descriptive 对话框,2、描述性统计分析过程,Options 对话框,基本统计量,当Variables框中有多个变量时，此框确定其输出顺序：按Variables框中的排列顺序输出按各变量的字母顺序输出按均值的升序排列按均值的降序排列,分布,三、例题分析已知20个初生婴儿的体重数据如下表，对其进行描述统计。,20个初生婴儿的体重（g）,1、操作步骤：打开数据文

11、件“婴儿体重.sav”。打开 Descriptives主对话框，选定变量t进入Variable栏中。选中Save standardized values as variables 复选框，要求计算变量的z值，并保存结果到当前数据集中。单击Options 按钮，选中Mean、Std.Deviation、Minimum、Maximum 、Variance 项。2、输出结果及分析,婴儿体重的描述统计量,这时打开原数据集，可看到多了一列zt，这是t 的z 分数，如下图所示：,保存了z 分数的数据集,一、主要功能：调用此过程可检查数据是否有错误、考察样本分布特征及对样本分布规律作初步考察。剔除奇异值和

12、错误数据。探索分析过程将提供在分组和不分组的情况下常用的统计量与图形。二、探索分析按Analyze-Descriptive Statistics-Explore 顺序单击，打开 Explore 主对话框。如图,3、探索分析过程,选择一个或多个变量进入Dependent框作为因变量，单击OK可获得因变量的一系列基本统计量和图形。,此作为分组变量，可以是字符变量，对因变量的分析将按该变量的观测值进行分组分析。可有多个分组变量，这时会按多个变量的交叉组合进行分组。,该框中的变量作为标识符，在输出诸如异常值时，用该变量进行标识，只允许有一个标识符。,可同时输出基本统计量和图形只输出基本统计量只输出

13、图形,Explore 主对话框,输出基本统计量均值的置信区间，可键入199%的任意值，根据该值算出置信区间的上下限。,给出中心趋势的最大拟然比的稳健估计量，当数据分布均匀，且两尾较长，或当数据中存在极端值时，可给出比均值或中位数更合理的估计。,输出最大和最小的5个数，且在输出窗口中加以标明。,输出5%、10%、25%、50%、75%、90%和95%的百分位数。,Statistics对话框,只有指定分组变量才有效，可输出分布水平图，同时输出回归直线斜率以及对方差的Levenes检验不输出分布水平图对每组数据产生一个中位数与四分位范围的自然对数散点图，同时在满足每组中数据方差相等的条件下对数据进

14、行幂变换的估计。根据在Power参数框中指定的变换对原始数据进行变换。不对数据进行转换,Explore 栏中Plots对话框,在此对话框中可选择要输出的统计图形及其参数。,只有在主对话框中指定了一个以上变量时，Boxplot栏才有效。在该栏选择盒形图的输出方式：每一个因变量生成一个盒形图所有因变量生成一个盒形图不显示任何盒形图,生成茎叶图，为默认生成直方图,输出正态概率和离散正态概率图，同时输出K-S统计量中的Liliefors显著水平检验，如果观测数不超过20，将用W-S统计量代替K-S。,确定缺失值的处置：因变量或分组变量中带有缺失值的观测量都将在分析过程中被剔除。在分析过程中根据分组变量

15、产生的组中带缺失值的观测量都将被剔除。分组变量的缺失值被单独分为一组，输出频数时将标出缺失组。,Explore 栏中Options对话框,三、例：下表为30名10岁少儿的身高（cm）数据，对其进行探索分析,1、操作步骤：打开 Explore主对话框，打开数据文件“Explore分析.sav”选变量height进入Dependent List栏中，选sex变量进入Factor List栏中；在Display栏中选择 Both项；打开Statistics对话框，选中Descriptives 、M-estimation、 Outliers复选项，单击Continue返回；要求计算变量的z值，并保存结果到当前数据集中。打开Plot对话框，选择Boxplots栏中的Factor levels together项，选择Descriptives栏内的 Stem-and-leaf复选项，选择Spread vs level with levene Test栏中的 Power estimation项，单击 Continue 返回。单击OK2、输出结果及分析输出结果如下表,观测量摘要表,

展开阅读全文