连续变量描述统计

上传人:ap****ve 文档编号:120415532 上传时间:2020-02-06 格式:PPT 页数:64 大小:1.38MB
返回 下载 相关 举报
连续变量描述统计_第1页
第1页 / 共64页
连续变量描述统计_第2页
第2页 / 共64页
连续变量描述统计_第3页
第3页 / 共64页
连续变量描述统计_第4页
第4页 / 共64页
连续变量描述统计_第5页
第5页 / 共64页
点击查看更多>>
资源描述

《连续变量描述统计》由会员分享,可在线阅读,更多相关《连续变量描述统计(64页珍藏版)》请在金锄头文库上搜索。

1、SPSS统计分析方法 1 连续变量的统计描述概述 2 集中趋势的描述指标 3 离散趋势的描述指标 4 实例操作 Part2 第四章01连续变量的描述统计 学习要求 学习要求 4 1连续变量的统计描述概述 统计描述的工具 统计图 统计表 统计描述指标 数据分布的特征 连续变量统计描述的常用指标 均值 众数 中位数 极差 四分位差 方差 统计描述指标 集中趋势 离散趋势 4 2集中趋势的描述指标 一组数据向其中心值靠拢的倾向和程度 测度集中趋势就是寻找数据一般水平的代表值或中心值 集中趋势测度 均值 集中趋势的测度值之一 最常用的测度值 一组数据的均衡点所在 设一组数据为 x1 x2 xn 简单算

2、术平均数的计算公式为 集中趋势测度 中位数 集中趋势的测度值之一 排序后处于中间位置上的值 Me 集中趋势测度 众数 集中趋势的测度值之一 出现次数最多的变量值 数据类型与集中趋势测度值 4 3离中趋势的描述指标 数据分布的另一个重要特征 离中趋势的各测度值是对数据离散程度所作的描述 反映各变量值远离其中心值的程度从另一个侧面 从令一侧面说明了集中趋势测度值的代表程度 离中趋势测度 极差 离散程度的测度值之一 一组数据的最大值与最小值之差 计算公式为 R max xi min xi 离中趋势测度 方差 离散程度最常用的测度值 反映了各变量值与均值的平均差异 计算公式 离中趋势测度 四分位差 离

3、中趋势的测度值之一 排序后处于75 和25 位置上的值的差QU QL 数据类型与离中趋势测度值 4 4数据分布的形状测度 峰度 偏态 数据分布的形状测度 偏态 数据分布偏斜程度的测度 计算公式 偏态系数 0为对称分布 偏态系数 0为右偏分布 偏态系数 0为左偏分布 算例 例 已知2007年我国农村居民家庭按纯收入分组的有关数据如下表 试计算偏态系数 计算过程 计算结果 根据上表数据计算得 将计算结果代入公式得 结论 偏态系数为正值 说明农村居民家庭纯收入的分布为右偏分布 农村居民家庭纯收入数据的直方图 结论 说明农村居民家庭纯收入的分布为右偏分布 即收入较少的家庭占据多数 而收入较高的家庭则占

4、少数 数据分布的形状测度 峰度 数据分布扁平程度的测度 计算公式 峰度系数 3扁平程度适中 峰度系数3为尖峰分布 4 5连续变量的统计描述实例操作 例 某班30名学生 统计学 期末考试成绩如下 试对该考试进行统计描述分析 117122124129107117130122110118123126127123118112100125117122126122118108112127123119113120 描述统计过程 SPSS软件中用于连续变量统计描述的工具主要有频率分析 描述分析 探索分析三大过程 频率分析过程 频数分布表是描述性统计中最常用的方法之一 频率分析过程就是专门为产生频数表而设计的

5、频率分析过程不仅可以产生详细的频数表 还可以按要求给出百分位点的数值 以及常用的条图 圆图等统计图 频率分析过程还提供了多变量的比较 统计学 成绩 例 某班30名学生 统计学 期末考试成绩如下 试对该考试进行分析 主对话框 候选变量 待分析变量 统计量子对话框 Std deviation标准差Variance方差Range极差 全距 S E mean均值的标准误Median中位数Mode众数Skewness偏度Kurtosis峰度 结果输出 表格 频数分析过程的表格输出不仅主要有均值 中位数 众数 标准差等等常用的描述统计指标 图表子对话框 图表子对话框主要是定义输出的图形类型 条图 饼图 直

6、方图 结果输出 直方图 格式子对话框 限制分组数 选择两个以上变量作频数表 并对统计量进行对比 定义频数表排列顺序 格式子对话框主要是定义输出频数表的格式 请完成对奥运会射击比赛8名选手决赛成绩分布特征以及离散趋势和集中趋势的对比分析 描述分析过程 它可对变量进行描述性统计分析 计算并列出一系列相应的统计指标 这和其他过程相比并无不同 该过程可将原始数据转换成标准正态分值 并以变量的形式存入数据库供以后分析 特别是离群点的分析 复习 标准分数 standardscore 1 也称标准化值2 对某一个值在一组数据中相对位置的度量3 可用于判断一组数据是否有离群点 outlier 4 用于对变量的

7、标准化处理5 计算公式为 标准分数 性质 z分数只是将原始数据进行了线性变换 它并没有改变一个数据在该组数据中的位置 也没有改变该组数分布的形状 而只是使该组数据均值为0 标准差为1 标准分数 例题分析 作用 经验法则 经验法则表明 当一组数据对称分布时约有68 的数据在平均数加减1个标准差的范围之内约有95 的数据在平均数加减2个标准差的范围之内约有99 的数据在平均数加减3个标准差的范围之内 作用 切比雪夫不等式 Chebyshev sinequality 如果一组数据不是对称分布 经验法则就不再适用 这时可使用切比雪夫不等式 它对任何分布形状的数据都适用切比雪夫不等式提供的是 下界 也就

8、是 所占比例至少是多少 对于任意分布形态的数据 根据切比雪夫不等式 至少有1 1 k2的数据落在平均数加减k个标准差之内 其中k是大于1的任意值 但不一定是整数 切比雪夫不等式 Chebyshev sinequality 对于k 2 3 4 该不等式的含义是至少有75 的数据落在平均数加减2个标准差的范围之内至少有89 的数据落在平均数加减3个标准差的范围之内至少有94 的数据落在平均数加减4个标准差的范围之内 主对话框 候选变量 计算标准分值存储在新的变量 待分析变量 选项子对话框 选项子对话框主要是选择需要输出的描述统计指标 均值 中位数 众数 标准差等等 结果输出 表格 请完成对奥运会射

9、击比赛8名选手决赛成绩的离群点分析 探索分析过程 可对变量进行更深入详尽的描述性统计分析 主要用于对资料的性质 分布特点等完全不清楚时 在常用的描述性统计指标的基础上 它增加了有关数据详细分布特征的文字与图形描述 如茎叶图 箱式图等 主对话框 选入所需分析变量 选定分组变量 选定标签变量 选定结果中包括的内容 候选变量 统计量子对话框 所有以上两个过程有的指标 总体均值的估计值 输出5个最大与最小值 百分位数 绘制子对话框 箱式图的绘制方式 茎叶图和直方图 正态图和正态检验 判断离散程度是否相同 比较合适的变量变换方法 结果输出 表格 结果输出 表格 结果输出 茎叶图 结果输出 箱图 离群点

10、最小值 最大值 中位数 上四分位数 下四分位数 请完成对奥运会射击比赛8名选手决赛成绩的探索性分析 小结 本章主要阐述SPSS软件中用于连续变量统计描述的Explore Frequencies Descriptive三大过程 在实际的数据分析工作中 首要的工作就是去了解数据的整体情况 随后才能考虑作更深入的分析和推断 4 5比率分析 用于对两变量间变量值比率变化的描述 适用于数值变量保险公司 财产保险业务的保费收入与全部业务的保费收入的比例情况分析财产保险业务的保费收入 变量1全部业务的保费收入 变量2变量1 变量2 变量3 比率变量 即 分析比率变量的特征加权比率均值WeightedMean平均绝对离差AAD离散系数COD变异系数COV Thankyou

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号