文档详情

王维鸿-Excel在统计中的应用第3章数据描述统计分析

宝路
实名认证
店铺
PPT
1.21MB
约37页
文档ID:48342590
王维鸿-Excel在统计中的应用第3章数据描述统计分析_第1页
1/37

第3章 数据描述统计分析•3.1 集中趋势的测定与分析•3.2 离中趋势的测定与分析•3.3 分布形态的测定与分析•3.4 描述统计工具本章学习目标• Excel描述数据集中趋势的工作表函数及其应用• Excel描述数据离中趋势的工作表函数及其应用• Excel描述数据分布形态的工作表函数及其应用• Excel描述统计工具的内容及其应用3.1 集中趋势的测定与分析•3.1.1 集中趋势的测定内容•3.1.2 用Excel工作表函数描述集中趋势•3.1.3 三种平均数的特点返回首页3.1.1 集中趋势的测定内容•在统计研究中,需要搜集大量数据并对其进行加 工整理,对这些数据进行整理之后发现:大多数 情况下数据都会呈现出一种钟形分布,即各个变 量值与中间位置的距离越近,出现的次数越多; 与中间位置距离越远,出现的次数越少,从而形 成了一种以中间值为中心的集中趋势这个集中 趋势是现象共性的特征,是现象规律性的数量表 现返回本节3.1.2 用Excel工作表函数描述集中趋势•1.均值函数(1)算术平均数2)调和平均数3)几何平均数 •2.中位数(中位次数)函数中位数是指全体数值按大小排列后位于中间的数 值。

语法:MEDIAN(number1,number2, ...)如果参数集合中包含有偶数个数字,函数 MEDIAN()将返回位于中间的两个数的平均值•3.众数函数众数是一组数列中出现次数最多的数值,众数函 数MODE()返回某一数组或数据区域中出现频率 最多的数值与MEDIAN相同,MODE也是一个 位置测量函数语法:MODE(number1,number2, ...)如果数据集合中不含有重复的数据,则MODE() 函数返回错误值N/A•4.最大(小)值函数最大(小)值函数可以返回数据集中的最大(小 )数值语法:MAX(number1,number2,...)MIN(number1,number2, ...)如果参数不包含数字,函数MAX(MIN)返回0 返回本节3.1.3 三种平均数的特点•众数是一组数据中出现次数最多的变量值,它用 于对分类数据的概括性度量,其特点是不受极端 值的影响,但它没有利用全部数据信息,而且还 具有不惟一性一组数据可能有众数,也可能没 有众数;可能有一个众数,也可能有多个众数•中位数是一组数据按大小顺序排序后处于中间位 置上的变量,它主要用于对顺序数据的概括性度 量。

•均值是一组数据的算术平均,它利用了全部数据 信息,是概括一组数据最常用的一个值 •例3-1 某商场家用电器销售情况如图3-1所示•(1)计算各种电器的全年平均销售量,如图3-2 所示•(2)计算各种电器销售量的中位数,如图3-3所 示•(3)计算各种电器销售量的众数,如图3-4所示 图3-1 某商场家用电器销售情况 图3-2 家用电器销售量平均数图3-3 家用电器销售量中位数 图3-4 家用电器销售量众数返回本节3.2 离中趋势的测定与分析•3.2.1 离中趋势的测定内容•3.2.2 用Excel函数计算标准差•3.2.3 四分位数与四分位距返回首页3.2.1 离中趋势的测定内容•在研究现象总体标志的一般水平时,不仅要研究 总体标志的集中趋势,还要研究总体标志的离中 趋势,如研究价格背离价值的平均程度研究离 中趋势可以通过计算标志变异指标来进行标志 变异指标是同统计平均数相联系的一种综合指标 ,用于度量随机变量在取值区间内的分布情况, 主要有平均差、标准差、方差、四分位数、百分 位数等在一般计算中,这些指标计算是比较复 杂的,但在Excel中都有相应的函数,因而使计算 变得很简单。

返回本节3.2.2 用Excel函数计算标准差•1.样本标准差 •2.总体标准差 1.样本标准差 •样本标准差函数用来估算样本的标准偏差,反映 相对于平均值(mean)的离散程度,Excel计算样 本标准差采用不偏估计式(亦即自由度=n-1), 其计算公式为 语法:STDEV(number1,number2,...)2.总体标准差 •总体标准差函数返回以参数形式给出的整个样本 总体的标准偏差,反映相对于平均值(mean)的 离散程度计算总体标准差使用整个总体的变量 ,通常采用偏性估计式(亦即自由度为n),其计 算公式为 语法:STDEVP(number1,number2,...)•例3-2 使用例3-1资料,计算各家电销售量的总体 标准差,如图3-5所示图3-5 计算总体标准差•例3-3 两组工人生产某种零件的产量如图3-6所示 图3-6 两组工人产量 图3-7 计算产量平均数图3-8 计算两组工人产量标准差图3-9 计算两组工人产量标准差系数返回本节3.2.3 四分位数与四分位距四分位数是将中值的前后两部分数值再等分为二,以数值 小的一端算起,前半部的分区点称为第1四分位数,后半 部的分区点称为第3四分位数,而中值即为第2四分位数。

四分位数通常用于在销售额和测量值数据集中对总体进行 分组语法:QUARTILE(array,quart)array:需要求四分位数值的数组或数字型单元格区域quart:决定返回哪一个四分位值Quart值与QUARTILE返回值的对应关系见表3-1所示quart值函数QUARTILE返回值0最小数值1第一个四分位数(第25个百分排位)2中分位数(第50个百分排位)3第三个四分位数(第75个百分排位)4最大数值表3-1 Quart值与QUARTILE返回值的对应关系•例3-4 使用例3-1资料,计算四分位数和四分位距 ,如图3-10所示 图3-10 计算四分位数和四分位距返回本节3.3 分布形态的测定与分析•3.3.1 分布形态的测定内容•3.3.2 用Excel工作表函数描述分布形态返回首页3.3.1 分布形态的测定内容•只用集中趋势和离中趋势来表示所有数据,难免不够准确 分析总体次数的分布形态有助于识别整个总体的数量特 征总体的分布形态可以从两个角度考虑,一是分布的对 称程度,另一个是分布的高低前者的测定参数称为偏度 或偏斜度,后者的测定参数称为峰度•峰度是掌握分布形态的另一指标,它能描述分布的平缓或 陡峭程度。

如果峰度数值等于零,说明分布为正态;如果 峰度数值大于零,说明分布呈陡峭状态;如果峰度数值小 于零,说明分布形态趋于平缓返回本节3.3.2 用Excel工作表函数描述分布形态•1.偏度函数•2.峰度函数1.偏度函数•偏度函数返回分布的偏斜度偏斜度反映以平均 值为中心的分布的不对称程度正偏斜度表示不 对称边的分布更趋向正值,负偏斜度表示不对称 边的分布更趋向负值其计算公式为 语法:SKEW(number1,number2,...)2.峰度函数•峰度函数返回数据集的峰值,表示次数分布高峰 的起伏状态峰值反映与正态分布相比某一分布 的尖锐度或平坦度正峰值表示相对尖锐的分布 ,负峰值表示相对平坦的分布其计算公式为 语法:KURT(number1,number2, ...)•例3-5 使用例3-1资料,计算各家电销售量的偏度 和峰度,如图3-11所示 返回本节3.4 描述统计工具•对于统计数据的一些常用统计量,比如均值、中 位数、众数、标准差、峰度系数、偏度系数等, 可以利用上述统计函数计算但Excel提供了一种 更快捷的方法,就是描述统计工具描述统计分 析工具用于生成数据源区域中数据的单变量统计 分析报表,它可以同时计算出一组数据的多个常 用统计量,提供有关数据集中趋势和离中趋势以 及分布形态等方面的信息。

返回首页•例3-6 调查某企业生产车间10名工人的月工资水 平,资料如图3-12所示用描述统计工具对工人 工资数据进行分析图3-12 工资资料图3-13 “统计描述”对话框图3-14 “描述统计”工具输出结果 返回本节。

下载提示
相似文档
正为您匹配相似的精品文档