基本统计分析－金锄头文库

资源描述

《基本统计分析》由会员分享，可在线阅读，更多相关《基本统计分析（32页珍藏版）》请在金锄头文库上搜索。

1、基本统计分析一基本统计描述SPSS基本统计分析是进行其他统计分析的基础和前提。基本统计描述包括了平均数、中位数、众数、方差、百分位、频数、峰度、偏度、探索分析、交叉联列表分析、基本统计报表制作等操作。均值：表示的是某变量所有取值的集中趋势或平均水平。例如，学生某门学科的平均成绩、公司员工的平均收入、某班学生的平均身高等。均值（均值（MeanMean）和均值标准误差（和均值标准误差（ S.E.meanS.E.mean）平均值：若一组数据X1， X2，，XN，代表一个大小为N的总体或样本，则其平均数为：中位数（中位数（MediaMedia）定义：把一组数据按递增或递减的顺序排列，处于中间

2、位置上的变量值就是中位数。计算公式：N为奇数：N为偶数：众数（众数（ModeMode）和全距和全距(Range)(Range)众数：指一组数据中，出现次数最多的那个变量值。众数在描述数据集中趋势方面有一定的意义。计算公式需要统计数据的次数分布。全距：也称为极差，是数据的最大值与最小值之间的绝对差。在相同样本容量情况下的两组数据，全距大的一组数据要比全距小的一组数据更为分散。公式：最大值-最小值方差（方差（VarianceVariance）、）、标准差（标准差（Standard Standard DeviationDeviation）和频数和频数(Frequency)(Frequency

3、)方差：所有变量值与平均数偏差平方的平均值，表示了一组数据分布的离散程度的平均值。方差和标准差越大，说明变量值之间的差距越大，距离平均数这个“中心”的离散趋势越大。标准差：方差的平方根，它表示了一组数据关于平均数的平均离散程度。频数：是一个变量在各个变量值上取值的个案数。它可以使人们非常清楚地了解变量取值的分布情况。v Mean、Median、Mode是描述变量取值集中趋势的统计量，称之为集中量数。 v Std.Deviation、Std.Error of Mean、 Variance、和Range都是描述变量取值的离散程度的统计量，称之为差异量数。小小结结样本数据采集到以后，常

4、用一些统计量描述原始数据的集中程度和离散状况：标准化标准化Z Z分数与分数与T T分数分数Z分数定义：Z分数表示的是此变量大于或小于平均数几个标准差。 Z分数没有单位，可以用来比较两个从不同单位总体中抽出的变量值。T分数：基本统计分析功能基本统计分析功能频率分析频率分析描述统计分析描述统计分析列联表分析和卡方检验列联表分析和卡方检验比率分析比率分析1、频数分析表（Frequencies)一、主要功能可对数据按组进行归类整理，形成变量不同水平的频数分布表和图形，对数据的分布趋势进行初步分析。二、频数分析1）按AnalyzeDescriptive Statistic Frequenci

5、es顺序，打开Frequencies对话框如图。选择一个或多个变量右移入Variable （s）框。按Statistics按钮，打开Statistics对话框显示频数分布表按Chart按钮，打开Chart 对话框按Format按钮，打开Format 对话框Frequences主对话框离差栏中心趋势栏输出统计量对话框Chart 对话框不输出任何图形，为默认输出条形图，各条高度代表变量各分类的频数输出圆图，圆图中各块的数值表示各分类变量的频数输出直方图，此图仅适用于区间型数值变量。选择此项后，还可选择With normal curve，画出的直方图带有正态曲线Format

6、对话框多变量框中可设定多变量表格输出的格式设置频数表输出的格式选择频数表中排列顺序按变量升序排列，此为默认按变量降序排列按变量各种取值发生的频数的升序排列按变量各种取值发生的频数的降序排列例题分析：对某校英语专业两个班级英语成绩做频率分析。步骤：按“analyze-descriptive statistics-frequencies” 顺序，打开“frequencies”频率分析对话框。选择测试变量进入“variable”框中。选中“display frequency tables” 复选框，要求输出频率分配表。按“statistic”按扭，打开“sta

7、tistics”对话框，选择要输出的统计量。单击Chart 按钮，选择Histogram项，输出直方图，并选择With normal curve复选框，输出正态曲线。按“format”按扭，打开“format”对话框，选择数值排列顺序。在主对话框中选“ok”钮。一、主要功能：调用此过程对变量进行描述性统计分析，计算均值、标准差、全距和均值标准误差等，并可将原始数据转换成Z分数。2、描述性统计分析（Descriptives) 二、描述统计量分析按Analyze Descriptive Statistics Descriptives顺序单击，打开 Descriptives 主对

8、话框。如图如选中此框，将对 Variables框中选择的变量进行标准化产生相应的Z分值，并作为新变量保存到数据窗口，其变量名在原变量名前加z。选一个或多个变量移入Descriptive 对话框 Options 对话框基本统计量当Variables框中有多个变量时，此框确定其输出顺序：按Variables框中的排列顺序输出按各变量的字母顺序输出按均值的升序排列按均值的降序排列分布例题分析已知某高中高一学生对教师九种教学方法偏爱程度得分（五分制量表记分），试对其结果进行描述统计分析。步骤：按“analyze-descriptive statistics-des

9、criptives” 顺序，打开“descriptives”对话框。将所测变量移入“variable”栏中。勾选“save standardized values as variables”复选框，要求计算变量的Z分值，并保持结果在当前数据集中。打开“options”对话框，选择要输出的统计量。在主对话框中选“ok”钮。3 3、列联表分析、列联表分析( (CrosstabsCrosstabs) )和卡方和卡方检验检验功能：统计研究中，变量可分为定量变量和分类变量，列联表分析则用于对分类材料提供各种格式的频数分布描述，并进行简单的统计推断。列联表分析过程列联表分析程序按A

10、nalyze-Descriptive Statistics-Crosstabs 顺序打开 Crosstabs 主对话框。如图该框中的变量作为分布表中的行变量，必须是数值型或字符型等分类变量。该框中的变量作为控制变量，决定频数分布表中的层，可有多个控制变量，如要增加新的控制变量，按Next 键，要修改以前的变量按Previous 键显示每一组中各变量的分类条形图。只输出统计量，不输出多维列联表。Crosstabs 对话框进行行和列变量相互独立的假设检验，有多种检验法。（注）进行相关系数的检验，有两项结果显示： Pearson相关系数和

11、Spearman 相关系数适用于定类变量的统计量：基于卡方检验基础上对相关性的检验用来描述相关性当用自变量预测因变量时，此系数反映这种预测降低错误的比率。显示不确定系数，表示用一个变量来预测其他变量时降低错误的比率适用于定序变量： Gamma系数反映两个有序变量间的对称相关性。是Gamma检验的非对称推广。对有序变量和秩变量相关性的非参数检验。与Kendalls tau-c相似适用于定序变量：用于检验相关性用于检验两个评估人对同一对象的评估是否具有一致系。检验某事件发生和某因子之间的关系进行两个相关的二值变量的非参数检验进行一个二值因素变量和一个二值响应变量的独立性检验

12、。Crosstabs的Statistics 对话框Crosstabs的Cell Display 对话框选择在列联表中输出的统计量，包括观测量数、百分比、残差输出观测量的实际数量如果行和列变量在统计上是独立的或不相关的，那么会在单元格中输出期望的观测值的数量。输出单元格中观测量的数目占整行全部观测量数目的百分比输出单元格中观测值的数目占整列全部观测量数目的百分比输出单元格中观测量的数目占全部观测量数目的百分比计算非标准化残差计算标准化残差计算调整后残差Table Format 对话框决定各行的排列顺序：各行的排列按升序各行的排列按降序例题：在一项地区方言调查中，研究人员发

13、现男性与女性在某些发音方面有一定差别。男性多使用后鼻音，而女性较少使用后鼻音。搜集到的数据如下表所示，试检验性别与后鼻音的使用与否有无联系。特征男性女性合计后鼻音455162617无后鼻音183476659合计6386381276步骤：选择“data-weight case”，通过“weight case”对个案加权。依次选中“analyze-descriptive statistics-crosstabs”，打开“crosstabs”主对话框。将“发音特征”选入“row”作为行变量，将“性别”选入 “column”作为列变量。打开“statistics”对话框，选择“c

14、hi-square”要求进行卡方检验，按“continue”按钮返回主对话框。打开“cells”，在“count”记数栏中选“observed”（观测值）和“expected”（期望值），选中percentage（百分比）三项选项。单击“ok”完成。注：使用卡方检验时要求单元格中期望频数不少于5，条件不满足时，可以用Fisher精确检验。比率分析（Ratio) 主要功能：对比分析两个连续性变量，可以计算并显示多个高度专业化的对比描述统计值，全方位报告比值之间的状况及变动趋势。主要指标：成组数据的离散度 Dispersion例题：心理学家在某大学学生中进行了一项词汇效应实验。

15、他们想要了解大学生在辨认词汇时，拒绝非词时间是否比接受真词时间长。他们找了十个使用频率较高的汉语真词，同时用颠倒部首的方法创造了十个笔画与那十个真词相同的非词。让六个专业（文理各三）的四年级学生进行辨认，计算出每位同学接受真词和拒绝非词的平均时间。每个专业随机抽取十个学生并统计出其数据。请使用比率分析计算真词- 非词判别所需时间的各项对比指标。步骤：依次选中“descriptive statistics-ratio statistics” 进入“ratio-statistics”对话框。将“真词”选入“numerator”（分子）栏内作为相对比分子变量；将“非词”选入“denominator”（分母）栏内作为相对比分母变量；将“学生组” 选入“group variable”栏内作为分组变量。进入“statistics”对话框，在“central tendency”（集中趋势）中选择“median”。在“dispersion”中选中AAD（平均绝对差值），COD（离散系数值）和Median centered COV（中位数为核心的变差系数值。点击“continue”返回。点击“ok”完成。

展开阅读全文

基本统计分析

最新文档