第十一章 描述统计分析.doc

上传人:大米 文档编号:555301157 上传时间:2023-05-05 格式:DOC 页数:3 大小:49.01KB
返回 下载 相关 举报
第十一章 描述统计分析.doc_第1页
第1页 / 共3页
第十一章 描述统计分析.doc_第2页
第2页 / 共3页
第十一章 描述统计分析.doc_第3页
第3页 / 共3页
亲,该文档总共3页,全部预览完了,如果喜欢就下载吧!
资源描述

《第十一章 描述统计分析.doc》由会员分享,可在线阅读,更多相关《第十一章 描述统计分析.doc(3页珍藏版)》请在金锄头文库上搜索。

1、第十一章 描述统计分析引:统计分析的目的是研究总体特征。而往往由于客观条件的限制,我们只能够得到从总体中随机抽取的一部分观察对象,称之为样本,只有通过对样本的描述和研究,才有可能对总体进行某种可能的推断。描述统计分析是推断统计分析的基础。一、描述统计分析的基本内容包括:集中趋势分析:众数:出现频率最高的数中位数:将数据排序后位于正中间的数值。适合于所有分布类型的数据分位数:四分位数、中位数、百分位数。理解分位数的含义。均值:一组数据的简单算术平均数或加权算术平均数。适合于正态分布或对成分布资料。几何平均数:算术平均数的变形,专门用来处理特殊数据的平均数,如发展速度调和平均数:算术平均数的一种变

2、形。离散趋势分析极差:数据最大值减去最小值,最简单的离散程度测度值标准差、方差:最常用的离散程度测侧度值,一般适合于正态分布资料最小值、最大值标准误:样本平均数的标准差偏度、峰度测量偏度系数:Skew ness,当分布对称时,偏度系数为0。当偏度系数为正值,可以判断为右偏(正偏),反之,判断为左偏(负偏)。 峰度系数:Kurtosis ,是对数据分布平峰或尖峰程度的测度。峰度是针对标准正态分布而言的。峰度系数为0,表明数据为标准正态分布。若峰度系数大于0,则数据为尖峰分布;反之为平峰分布。统计图形分析:直方图、PP 图、茎叶图、箱线图等上述三种图形是描述统计分析过程中常用的几种图形,是用于观察

3、数据的分布形态的辅助工具。二、菜单介绍:1、frequencies 过程:生成频数分布表,适合于定性资料,以及部分定量资料。2、descriptive:进行一般的描述统计统计分析,包括集中趋势值,离散趋势值,偏度系数,峰度系数等。适合服从正态分布的定量资料。使用频率最高。3、Explore:适合于数据分布状况不清时的探索性数据分析。4、ratio:对连个连续性变量计算相对指标。三、frequencies 过程。例题:书p199注:另要求对该数据作出组距式频数表。例题:对上海市1884-1992年数据进行频数分析。四、descriptive过程主要针对连续性资料,可以计算一系列描述统计量。并且可

4、以将变量的原始数据标准化并以变量的形式保存。五、explore 过程适用于对资料的性质、分布特点完全不清楚时,称之为探索性分析。能计算常用描述统计量,并绘制统计图形,包括茎叶图、箱线图。箱线图:首先找出一组数据的五个特征值,包括最小值、最大值、中位数、两个四分位数(上四分位数和下四分位数),然后,连接两个四分位数构成箱子,最后连接两个极值点与箱子,形成箱式图。可观察数据呈正态分布、左偏分布、右偏分布还是其他类型的分布,如型分布。例:某班学生英语成绩如下:76 90 97 71 70 93 86 83 78 85 81 绘制箱线图如下:茎叶图:将数据分成茎和叶两部分,通常以数据的高位数值为茎,低

5、位为叶,树叶上一般保留数据的最后一个数字,树叶长在树茎上。通过茎叶图,也可以看出数据的分布形状及数据的离散状况。实际上是横放的直方图。适合于数据量较少的情况。该图形的优势,既保留原始数据的信息,又能看出数据的分布状况。这是比直方图优越的地方。【例】某生产车间50名工人日加工零件数如下(单位:个)。试绘茎叶图观察分布特征。117 122 124 129 139 107 117 130 122 125 108 131 125 117 122 133 126 122 118 108 110 118 123 126 133 134 127 123 118 112 112 134 127 123 119

6、 113 120 123 127 135 137 114 120 128 124 115 139 128 124 121树茎树叶7880223477788890012222333344466777889013344579910111213数据个数3132410茎叶图似横置直方图的直方图M-estimators: 用于对集中趋势进行最大稳健估计。当数据中存在异常值较多时,适合于用该估计值代替平均值来反映数据的集中趋势。通常有四种统计量:Huber、Andrew、Hampel、 Tukey。若这四个统计量的结果较为接近,且与均数相差不大,则说明数据分布不太偏,也就说明均值可以代表数据的集中趋势。Levene : 方差齐性检验。适合于对分组数据检验各组间数据是否方差齐。Shapiro wilk 检验:正态性检验的方法之一。当检验一组数据是否服从正态分布,可以运用该检验方法。一般适合于小样本场合。K-S检验:正态性检验的方法之一。当检验一组数据是否服从正态分布,可以运用该检验方法。一般适合于连续性数据,大样本场合。

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 生活休闲 > 科普知识

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号