基本统计分析

上传人:飞*** 文档编号:50380818 上传时间:2018-08-07 格式:PPT 页数:32 大小:760.50KB
返回 下载 相关 举报
基本统计分析_第1页
第1页 / 共32页
基本统计分析_第2页
第2页 / 共32页
基本统计分析_第3页
第3页 / 共32页
基本统计分析_第4页
第4页 / 共32页
基本统计分析_第5页
第5页 / 共32页
点击查看更多>>
资源描述

《基本统计分析》由会员分享,可在线阅读,更多相关《基本统计分析(32页珍藏版)》请在金锄头文库上搜索。

1、基本统计分析一 基本统计描述SPSS基本统计分析是进行其他统计分析的基础和前提。基本统计描述包括了平均数、中位数、众数、方差、百分位、频数、峰度、偏度、探索分析、交叉联列表分析、基本统计报表制作等操作。均值:表示的是某变量所有取值的集中趋势或平均 水平。例如,学生某门学科的平均成绩、公司员工 的平均收入、某班学生的平均身高等。均值(均值(MeanMean)和均值标准误差(和均值标准误差( S.E.meanS.E.mean)平均值:若一组数据X1, X2, ,XN,代表一个大小 为N的总体或样本,则其平均数为:中位数(中位数(MediaMedia)定义:把一组数据按递增或递减的顺序排列,处于中间

2、位置上的变量值就是中位数。计算公式:N为奇数:N为偶数:众数(众数(ModeMode)和全距和全距(Range)(Range)众数:指一组数据中,出现次数最多的那个变量值。众数在描述数据集中趋势方面有一定的意义。计算 公式需要统计数据的次数分布。全距:也称为极差,是数据的最大值与最小值之间的 绝对差。在相同样本容量情况下的两组数据,全距大 的一组数据要比全距小的一组数据更为分散。 公式:最大值-最小值方差(方差(VarianceVariance)、)、标准差(标准差(Standard Standard DeviationDeviation)和频数和频数(Frequency)(Frequency

3、)方差:所有变量值与平均数偏差平方的平均值,表 示了一组数据分布的离散程度的平均值。方差和标准差越大,说明变量值之间的差距越大 ,距离平均数这个“中心”的离散趋势越大。标准差:方差的平方根,它表示了一组数据关于平 均数的平均离散程度。频数:是一个变量在各个变量值上取值的个案数。它可以使人们非常清楚地了解变量取值的分布情况。v Mean、Median、Mode是描述变量取 值集中趋势的统计量,称之为集中量数 。 v Std.Deviation、Std.Error of Mean、 Variance、和Range都是描述变量取值的 离散程度的统计量,称之为差异量数。小小 结结样本数据采集到以后,常

4、用一些统计量描述原始数据的集中程度和离散状况:标准化标准化Z Z分数与分数与T T分数分数Z分数定义:Z分数表示的是此变量大于或小于平均数几个标准差。 Z分数没有单位,可以用来比较两个从不同单位总体中抽出的变量值。T分数:基本统计分析功能基本统计分析功能 频率分析频率分析 描述统计分析描述统计分析 列联表分析和卡方检验列联表分析和卡方检验 比率分析比率分析1、频数分析表(Frequencies)一、主要功能可对数据按组进行归类整理,形成变量不 同水平的频数分布表和图形,对数据的分布 趋势进行初步分析。二、频数分析1)按AnalyzeDescriptive Statistic Frequenci

5、es顺序,打开Frequencies对话框 如图。选择一个或 多个变量右 移入Variable (s)框。按Statistics按钮,打 开Statistics对话框显示频数 分布表按Chart按钮, 打开Chart 对 话框按Format按钮 ,打开Format 对话框Frequences主对话框离差栏中心趋势栏输出统计量对话框Chart 对话框不输出任何图形,为默认 输出条形图,各条高度代表变量各分类的频数 输出圆图,圆图中各块的数值表示各分类变量的频数 输出直方图,此图仅适用于区间型数值变量。选择此 项后,还可选择With normal curve,画出的直方图带有 正态曲线Format

6、 对话框多变量框中可设定多 变量表格输出的格式设置频数表输出的格式选择频数表中排 列顺序 按变量升序排 列,此为默认 按变量降序排 列 按变量各种取 值发生的频数的 升序排列 按变量各种取 值发生的频数的 降序排列 例题分析:对某校英语专业两个班级英语成绩做 频率分析。步骤: 按“analyze-descriptive statistics-frequencies” 顺序,打开“frequencies”频率分析对话框。 选择测试变量进入“variable”框中。 选中“display frequency tables” 复选框,要求输 出频率分配表。 按“statistic”按扭,打开“sta

7、tistics”对话框,选择 要输出的统计量。 单击Chart 按钮,选择Histogram项,输出直方 图,并选择With normal curve复选框,输出正 态曲线。 按“format”按扭,打开“format”对话框,选择数 值排列顺序。 在主对话框中选“ok”钮。一、主要功能:调用此过程对变量进行描述性统计分析, 计算均值、标准差、全距和均值标准误差 等,并可将原始数据转换成Z分数。2、描述性统计分析(Descriptives) 二、描述统计量分析 按Analyze Descriptive Statistics Descriptives顺序单击,打开 Descriptives 主对

8、话框。如图如选中此框,将对 Variables框中选择 的变量进行标准化 产生相应的Z分值, 并作为新变量保存 到数据窗口,其变 量名在原变量名前 加z。选一个或 多个变量 移入Descriptive 对话框 Options 对话框 基本统计量当Variables框中有多个变量 时,此框确定其输出顺序: 按Variables框中的排列顺 序输出 按各变量的字母顺序输出 按均值的升序排列 按均值的降序排列分布例题分析 已知某高中高一学生对教师九种教学 方法偏爱程度得分(五分制量表记分 ),试对其结果进行描述统计分析。步骤: 按“analyze-descriptive statistics-des

9、criptives” 顺序,打开“descriptives”对话框。 将所测变量移入“variable”栏中。 勾选“save standardized values as variables”复选 框,要求计算变量的Z分值,并保持结果在当 前数据集中。 打开“options”对话框,选择要输出的统计量。 在主对话框中选“ok”钮。3 3、列联表分析、列联表分析( (CrosstabsCrosstabs) )和卡方和卡方 检验检验 功能:统计研究中,变量可分为 定量变量和分类变量,列联表分 析则用于对分类材料提供各种格 式的频数分布描述,并进行简单 的统计推断。列联表分析过程列联表分析程序按A

10、nalyze-Descriptive Statistics-Crosstabs 顺序打开 Crosstabs 主对话框。如图该框中的变量 作为分布表中 的行变量,必 须是数值型或 字符型等分类 变量。该框中的变量作 为控制变量,决 定频数分布表中 的层,可有多个 控制变量,如要 增加新的控制变 量,按Next 键 ,要修改以前的 变量按Previous 键显示每 一组中 各变量 的分类 条形图 。只输出 统计量 ,不输 出多维 列联表 。Crosstabs 对话框进行行和列变量相互独立的假 设检验,有多种检验法。(注 )进行相关 系数的检 验,有两 项结果显 示: Pearson相 关系数和

11、Spearman 相关系数适用于定类变量的统计量: 基于卡方检验基础上对相关性的检验 用来描述相关性 当用自变量预测因变量时,此系数反映这种预测降低错误的比率。 显示不确定系数,表示用一个变量来预测其他变量时降低错误的比率适用于定序变量: Gamma系数反映两个有序变量间的对称相关性。 是Gamma检验的非对称推广。 对有序变量和秩变量相关性的非参数检验。 与Kendalls tau-c相似适用于定序变量: 用于检验相关性 用于检验两个评估人对同一对象的评估是否具有一致系。 检验某事件发生和某因子之间的关系 进行两个相关的二值变量的非参数检验 进行一个二值因素变量和一个二值响应变量的独立性检验

12、。Crosstabs的Statistics 对话框Crosstabs的Cell Display 对话框选择在列联表中输出的统计量, 包括观测量数、百分比、残差输出观测量的实际数量如果行和列变量在统计 上是独立的或不相关的, 那么会在单元格中输出期 望的观测值的数量。输出单元格中观测量的数目占 整行全部观测量数目的百分比输出单元格中观测值的数目占 整列全部观测量数目的百分比输出单元格中观测量的数目占 全部观测量数目的百分比计算非标准化残差 计算标准化残差 计算调整后残差Table Format 对话框决定各行的排列顺序 :各行的排列按升序各行的排列按降序 例题:在一项地区方言调查中,研究人 员发

13、现男性与女性在某些发音方面有一 定差别。男性多使用后鼻音,而女性较 少使用后鼻音。搜集到的数据如下表所 示,试检验性别与后鼻音的使用与否有 无联系。 特征男性女性合计后鼻音455162617无后鼻音183476659合计6386381276步骤: 选择“data-weight case”,通过“weight case”对个案加 权。 依次选中“analyze-descriptive statistics-crosstabs”, 打开“crosstabs”主对话框。 将“发音特征”选入“row”作为行变量,将“性别”选入 “column”作为列变量。 打开“statistics”对话框,选择“c

14、hi-square”要求进行卡方 检验,按“continue”按钮返回主对话框。 打开“cells”,在“count”记数栏中选“observed”(观测值 )和“expected”(期望值),选中percentage(百分比 )三项选项。单击“ok”完成。 注:使用卡方检验时要求单元格中期望频数不少于5,条件不满足 时,可以用Fisher精确检验。比率分析(Ratio) 主要功能:对比分析两个连续性变量,可以计算 并显示多个高度专业化的对比描述统 计值,全方位报告比值之间的状况及 变动趋势。主要指标:成组数据的离散度 Dispersion例题:心理学家在某大学学生中进行了一项词汇效 应实验。

15、他们想要了解大学生在辨认词汇时, 拒绝非词时间是否比接受真词时间长。他们找 了十个使用频率较高的汉语真词,同时用颠倒 部首的方法创造了十个笔画与那十个真词相同 的非词。让六个专业(文理各三)的四年级学 生进行辨认,计算出每位同学接受真词和拒绝 非词的平均时间。每个专业随机抽取十个学生 并统计出其数据。请使用比率分析计算真词- 非词判别所需时间的各项对比指标。步骤: 依次选中“descriptive statistics-ratio statistics” 进入“ratio-statistics”对话框。 将“真词”选入“numerator”(分子)栏内作为相 对比分子变量;将“非词”选入“denominator”( 分母)栏内作为相对比分母变量;将“学生组” 选入“group variable”栏内作为分组变量。 进入“statistics”对话框,在“central tendency”( 集中趋势)中选择“median”。在“dispersion”中 选中AAD(平均绝对差值),COD(离散系 数值)和Median centered COV(中位数为核心 的变差系数值。点击“continue”返回。 点击“ok”完成。

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 商业/管理/HR > 质量控制/管理

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号