描述性统计分析课件

上传人:w****i 文档编号:91976118 上传时间:2019-07-05 格式:PPT 页数:60 大小:1.02MB
返回 下载 相关 举报
描述性统计分析课件_第1页
第1页 / 共60页
描述性统计分析课件_第2页
第2页 / 共60页
描述性统计分析课件_第3页
第3页 / 共60页
描述性统计分析课件_第4页
第4页 / 共60页
描述性统计分析课件_第5页
第5页 / 共60页
点击查看更多>>
资源描述

《描述性统计分析课件》由会员分享,可在线阅读,更多相关《描述性统计分析课件(60页珍藏版)》请在金锄头文库上搜索。

1、描述性统计 分析,主要内容,描述性统计分析 频率分析 对数据进行描述的图形化方法和数值方法 学习分析数据分布的方法 应用SPSS进行描述性数据分析的方法 常用统计图形的绘制方法和解释技巧 数据标准化,本章学习目标:,掌握数据分析项目的整个过程; 掌握数据的分类方法; 掌握对数据进行描述的图形化方法和数值方法; 学习分析数据分布的方法; 掌握应用SPSS进行描述性数据分析的方法; 掌握常用统计图形的绘制方法和解释技巧,前言:描述性统计和推断性统计,统计学分为描述性统计分析和推断性统计分析 描述性统计 应用分类、制表、图形以及概括性数据指标来概括数据分布特征的方法。结论不能推及总体。 推断性统计

2、推断性统计分析得到的结论适用于总体。,统计量,统计分析往往是从了解数据的基本特征开始的。统计上,需要把样本数据所含信息进行概括、融合和抽象,从而得到反映样本数据的综合指标,这些指标称为统计量。,描述性统计分析指标,统计量可分为两类 一类表示数据的中心位置,例如均值、中位数、众数等 一类表示数据的离散程度,例如方差、标准差、极差等用来衡量个体偏离中心的程度。,3.1 频率分析,功能:频率分析主要通过频率分布表、条形图和直方图,以及集中趋势和离散趋势的各种统计量来描述数据的分布特征,频率分析意义,意义:SPSS的频数分析过程(Frequencies)是描述性分析中最基本也是最常用的方法之一。通过频

3、数分析,我们可以得到详细的频数表以及平均值、最大值、最小值、方差、标准差、极差、平均数标准误、偏度系数和峰度系数等重要的描述统计量,还可以通过分析得到合适的统计图。所以进行频数分析不仅可以方便地对数据按组进行归类整理,还可以对数据的分布特征形成初步的认识。,频率分析术语,频率 对于定性观测值时,把它们按照某种原则分成一些组,每个观测值必须落入一个类并且只能够落入一个类中。对于给定的类,落入这个类的个案数称为频率 落入该类中的个案数和个案总数的比例称为相对频率,案例,数据文件Employ Data.sav记录了某公司职工的基本信息,例如性别、民族、出生日期、教育水平、工资水平、工作年限等。 教育

4、水平为分类变量,它有11个类别。,SPSS频率分析,选择【分析】【描述统计】【频率】,频率分析选项-统计量,频率分析选项-图表,频率分析的结果解释,频率表格 条形图、直方图,当堂练习-频率分析实例,案例3.1身高数据给出了河南省某学校50名高二学生的身高。试分析该50名学生的身高分布特征,计算平均值、最大值、最小值、标准差等统计量,并绘制频数表、直方图。,3.2 中心趋势的描述,均值(尺度数据和定序数据) 中位数(尺度数据和定序数据) 众数(定性数据和尺度数据) 5%截尾均值(尺度数据和定序数据),均值,均值即数据的算术平均数,是数据中心趋势的主要度量指标, 设变量有n个测量值 ,则算术均值为

5、:,均值的特点,最常用的中心位置度量 受极端值影响 例:1,3,5,7,9 和 1,3,5,7,14,中位数,重要的中心位置度量 在递增排序后的数据列中 若数据个数为奇数,中位数是正中央的数 若数据个数是偶数,中位数是正中央的两数的平均值. 不受极端值的影,例如:1,5,7,3,9,众数,发生频数最高的数据值 不受极端值的影响 众数可能不存在 可能有多个众数(单峰,双峰,多峰) 可用于定量或定性数据,5%截尾均值,避免了极端值的影响,3.3 离散趋势的描述,仅仅根据数据的中心趋势指标进行决策是不够的。例如,如果一个国家的不同家庭收入差距很少;而另一个国家的家庭收入差距很大,既存在大量的贫困家庭

6、,也存在许多十分富有的家庭,那么即使这两个国家的中等收入家庭的收入完全一样,其家庭收入情况仍然完全不同。,例子,假设我们有以下的三组观测值: 观测A:11,12,13,16,16,17,18,21 观测B:14,15,15,15,16,16,16,17 观测C:11,11,11,12,19,20,20,20 这三组观测值的均值都是15.5,那么这三组数据是否相似呢?,离散趋势,离散趋势的描述,极差(range) 方差(Variance) 标准差(S.d.) 分位数( Percentage) 变异指标,极差,极差=最大值-最小值 受极端值影响较大,方差和标准差,方差 标准差,变异系数,在比较两组

7、数据离散程度大小时,如果数据的测量尺度相差太大,直接比较二者的标准差并不合适。 需要首先消除测量尺度和量纲的影响。变异系数可以剔除这些影响,其计算公式为:,分位数,第p百分位数 使得至少有p%的数据小于或等于这个值,且使得至少有(100-p)%的数据大于或等于这个值 如何计算? 将原数据从小到大排列 计算i=(p/100)n 若i是整数, 则第p百分位数为第i 与第 i+1 项的平均 若i不是整数,则向上取整。,总结五数,最小值、第一个四分位数、中位数、第三个四分位数、最大值 从这五个值可以大致看出数据分布的中心和离散程度。而箱图则是这五个数的图形表现,3.4 分布的形状,偏度 当偏度系数大于

8、0时,分布为正偏或右偏,布图形在右边拖尾,分布图有很长的右尾,尖峰偏左 当偏度系数小于0,分布为负偏或左偏,即分布图形在左边拖尾,分布图有很长的左尾,峰尖偏右 当偏度系数为0,分布对称,峰度,峰度 3,分布为高峰度,即比正态分布的峰要陡峭; 3,分布为低峰度,即比正态分布的峰要平坦些;=0,分布为正态峰。,3.5 SPSS描述性统计,许多菜单均可进行描述性分析,提供描述性统计指标的输出。例如T检验、方差分析、因子分析等 SPSS自定义表模块也可以产生大部分的描述性统计指标,SPSS中的菜单,专门的描述性统计菜单: 频率(F):该过程将产生频数表,输出频数分布的条形图、饼图或者直方图; 描述(D

9、):该过程则进行一般性的统计描述; 探索(E): 该过程用于对数据概况不清时的探索性分析; 交叉表(C):该过程完成分类数据的统计描述和一般的统计检验,我们常用的检验也包含在该对话框中。,频率:实例,【分析】【描述】【频率】,频率:统计量的选择,频率:结果的解释,描述性子菜单,当堂练习-描述性分析实例,案例3.2体重数据给出了河南省某高校50名大一入学新生的体重。试对该50名学生的体重进行描述性分析,从而了解这50名学生体重的基本特征。,探索子菜单,【分析】【描述统计】【探索】 该菜单可以对不同的组分别给出描述性统计量,探索:选择统计量,探索:图,探索:结果解释(1),探索:结果解释(2),当

10、堂练习-探索分析实例,实例3.3气温数据给出了郑州、泰安两城市2012年各月份的平均气温。试据此对两城市平均气温进行探索性统计分析,研究其基本特征。,设定表格,表格:摘要统计量设置,当堂练习-列联表分析实例,数据文件Employee Data给出了某公司职工的基本信息,据此对职工的教育水平进行列联表分析,研究不同性别的职工教育水平之间有无明显的差别。,3.6统计图进行描述性统计分析,定性数据 条形图 饼图 帕累托图 定量数据 直方图 茎叶图 箱图,频率,描述-频率-图表 条形图 饼图 直方图 示例:数据文件DisasterReason.sav 条形图 饼图 直方图 帕累托图,条形图,饼图,帕累托图,直方图-茎叶图-箱图,描述性-探索 直方图 茎叶图 箱图 示例:数据Employee Data.sav 直方图 茎叶图 箱图,直方图和茎叶图,箱图,从旧对话框作图,重新完成上面两个例子中的图形(箱图除外),饼图-帕累托图,频率- 饼图 质量控制- 排列图 图 - 图表构建程序 图 - 旧对话框,本章小结,主要介绍了描述统计分析的方法和技巧。主要方法有频数分析、描述性分析、探索分析、列联表分析。,作业,课后题79页1-11题,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号