《描述性统计分析》

上传人:ali****an 文档编号:121623741 上传时间:2020-02-24 格式:PPT 页数:60 大小:1.02MB
返回 下载 相关 举报
《描述性统计分析》_第1页
第1页 / 共60页
《描述性统计分析》_第2页
第2页 / 共60页
《描述性统计分析》_第3页
第3页 / 共60页
《描述性统计分析》_第4页
第4页 / 共60页
《描述性统计分析》_第5页
第5页 / 共60页
点击查看更多>>
资源描述

《《描述性统计分析》》由会员分享,可在线阅读,更多相关《《描述性统计分析》(60页珍藏版)》请在金锄头文库上搜索。

1、描述性统计 分析 主要内容 n描述性统计分析 q频率分析 q对数据进行描述的图形化方法和数值方法 q学习分析数据分布的方法 q应用SPSS进行描述性数据分析的方法 q常用统计图形的绘制方法和解释技巧 q数据标准化 本章学习目标 n掌握数据分析项目的整个过程 n掌握数据的分类方法 n掌握对数据进行描述的图形化方法和数值方法 n学习分析数据分布的方法 n掌握应用SPSS进行描述性数据分析的方法 n掌握常用统计图形的绘制方法和解释技巧 前言 描述性统计和推断性统计 n统计学分为描述性统计分析和推断性统计分析 n描述性统计 q应用分类 制表 图形以及概括性数据指标来概括 数据分布特征的方法 结论不能推

2、及总体 n推断性统计 q推断性统计分析得到的结论适用于总体 统计量 n统计分析往往是从了解数据的基本特征开始的 统计上 需要把样本数据所含信息进行概括 融合和抽象 从而得到反映样本数据的综合 指标 这些指标称为统计量 描述性统计分析指标 n统计量可分为两类 q一类表示数据的中心位置 例如均值 中位数 众 数等 q一类表示数据的离散程度 例如方差 标准差 极 差等用来衡量个体偏离中心的程度 3 1 频率分析 n功能 频率分析主要通过频率分布表 条形图 和直方图 以及集中趋势和离散趋势的各种统 计量来描述数据的分布特征 频率分析意义 n意义 SPSS的频数分析过程 Frequencies 是描述性

3、分析中最基本也是最常用的方法之一 通过频数分析 我们可以得到详细的频数表 以及平均值 最大值 最小值 方差 标准差 极差 平均数标准误 偏度系数和峰度系数 等重要的描述统计量 还可以通过分析得到合 适的统计图 所以进行频数分析不仅可以方便 地对数据按组进行归类整理 还可以对数据的 分布特征形成初步的认识 频率分析术语 n频率 q对于定性观测值时 把它们按照某种原则分成一些 组 每个观测值必须落入一个类并且只能够落入一 个类中 对于给定的类 落入这个类的个案数称为 频率 n落入该类中的个案数和个案总数的比例称为相 对频率 案例 n数据文件Employ Data sav记录了某公司职工 的基本信息

4、 例如性别 民族 出生日期 教 育水平 工资水平 工作年限等 n教育水平为分类变量 它有11个类别 SPSS频率分析 n选择 分析 描述统计 频率 频率分析选项 统计量 频率分析选项 图表 频率分析的结果解释 n频率表格 n条形图 直方图 当堂练习 频率分析实例 n案例3 1身高数据给出了河南省某学校50名高 二学生的身高 试分析该50名学生的身高分布 特征 计算平均值 最大值 最小值 标准差 等统计量 并绘制频数表 直方图 3 2 中心趋势的描述 n均值 尺度数据和定序数据 n中位数 尺度数据和定序数据 n众数 定性数据和尺度数据 n5 截尾均值 尺度数据和定序数据 均值 n均值即数据的算术

5、平均数 是数据中心趋势的 主要度量指标 n设变量有n个测量值 则算术均值 为 均值的特点 n最常用的中心位置度量 n 受极端值影响 n 例 1 3 5 7 9 和 1 3 5 7 14 中位数 n重要的中心位置度量 n在递增排序后的数据列中 q 若数据个数为奇数 中位数是正中央的数 q 若数据个数是偶数 中位数是正中央的两数的平 均值 n不受极端值的影 例如 1 5 7 3 9 众数 n发生频数最高的数据值 n不受极端值的影响 n众数可能不存在 n可能有多个众数 单峰 双峰 多峰 n可用于定量或定性数据 5 截尾均值 n避免了极端值的影响 3 3 离散趋势的描述 n仅仅根据数据的中心趋势指标进

6、行决策是不够 的 例如 如果一个国家的不同家庭收入差距 很少 而另一个国家的家庭收入差距很大 既 存在大量的贫困家庭 也存在许多十分富有的 家庭 那么即使这两个国家的中等收入家庭的 收入完全一样 其家庭收入情况仍然完全不同 例子 n假设我们有以下的三组观测值 q观测A 11 12 13 16 16 17 18 21 q观测B 14 15 15 15 16 16 16 17 q观测C 11 11 11 12 19 20 20 20 n这三组观测值的均值都是15 5 那么这三组数 据是否相似呢 离散趋势 离散趋势的描述 n极差 range n方差 Variance n标准差 S d n分位数 Pe

7、rcentage n变异指标 极差 n极差 最大值 最小值 n受极端值影响较大 方差和标准差 n方差 n标准差 变异系数 n在比较两组数据离散程度大小时 如果数据的 测量尺度相差太大 直接比较二者的标准差并 不合适 n需要首先消除测量尺度和量纲的影响 变异系 数可以剔除这些影响 其计算公式为 分位数 n第p百分位数 q使得至少有p 的数据小于或等于这个值 且 使得至少有 100 p 的数据大于或等于这个 值 q如何计算 n将原数据从小到大排列 n计算i p 100 n n若i是整数 则第p百分位数为第i 与第 i 1 项 的平均 n若i不是整数 则向上取整 总结五数 n最小值 第一个四分位数

8、中位数 第三个四 分位数 最大值 n从这五个值可以大致看出数据分布的中心和离 散程度 而箱图则是这五个数的图形表现 3 4 分布的形状 n偏度 q当偏度系数大于0时 分 布为正偏或右偏 布图 形在右边拖尾 分布图 有很长的右尾 尖峰偏 左 q当偏度系数小于0 分布 为负偏或左偏 即分布 图形在左边拖尾 分布 图有很长的左尾 峰尖 偏右 q当偏度系数为0 分布对 称 峰度 n峰度 n 3 分布为高峰度 即比正态分布的峰要陡 峭 图表 q条形图 q饼图 q直方图 n示例 数据文件 DisasterReason sav q条形图 q饼图 q直方图 q帕累托图 条形图 饼图 帕累托图 直方图 茎叶图 箱图 n描述性 探索 q直方图 q茎叶图 q箱图 n示例 数据Employee Data sav q直方图 q茎叶图 q箱图 直方图和茎叶图 箱图 从旧对话框作图 n重新完成上面两个例子中的图形 箱图除外 饼图 帕累托图 n频率 饼图 n质量控制 排列图 n图 图表构建程序 n图 旧对话框 本章小结 n主要介绍了描述统计分析的方法和技巧 主要 方法有频数分析 描述性分析 探索分析 列 联表分析 作业 n课后题79页1 11题

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 大杂烩/其它

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号