管理统计学第三章样本数据特征文档资料

上传人:cl****1 文档编号:567638526 上传时间:2024-07-21 格式:PPT 页数:55 大小:432.50KB
返回 下载 相关 举报
管理统计学第三章样本数据特征文档资料_第1页
第1页 / 共55页
管理统计学第三章样本数据特征文档资料_第2页
第2页 / 共55页
管理统计学第三章样本数据特征文档资料_第3页
第3页 / 共55页
管理统计学第三章样本数据特征文档资料_第4页
第4页 / 共55页
管理统计学第三章样本数据特征文档资料_第5页
第5页 / 共55页
点击查看更多>>
资源描述

《管理统计学第三章样本数据特征文档资料》由会员分享,可在线阅读,更多相关《管理统计学第三章样本数据特征文档资料(55页珍藏版)》请在金锄头文库上搜索。

1、第第3章章样本数据特征的初步样本数据特征的初步分析分析Evaluation only.Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0.Copyright 2004-2011 Aspose Pty Ltd.第第3 3章章 样本数据特征的初步分析样本数据特征的初步分析第第3.1节节 样本数据结构的基本特征:频次样本数据结构的基本特征:频次与频率与频率第第3.2节节 观察刻度级样本数据结构的茎叶观察刻度级样本数据结构的茎叶图与直方图方法图与直方图方法第第3.3节节 样本数据的位置特征:对数据中样本数据的位置特征:对数据中心

2、的描述心的描述第第3.4节节 样本数据的离散特征样本数据的离散特征第第3.5节节 样本数据特征的综合表达:箱形样本数据特征的综合表达:箱形图图Evaluation only.Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0.Copyright 2004-2011 Aspose Pty Ltd.第第3.1节节 样本数据结构的基本样本数据结构的基本特征:频次与频率特征:频次与频率一个误区一个误区:聚焦于数据值(样本值)及其变化:聚焦于数据值(样本值)及其变化另一个重要问题另一个重要问题:相同值出现的:相同值出现的频次、频率

3、频次、频率。这是这是数据数据集合的最基本的结构特征。集合的最基本的结构特征。本节讨论这一结构特征:本节讨论这一结构特征:频次频次(Frequency)与与频率频率(Percentage,或,或Relative Frequency)两个紧密相关的不同的概念:两个紧密相关的不同的概念:1)样本数据自身(不论什么测度级的数据)样本数据自身(不论什么测度级的数据)2)同一个数据值(样本值)出现的次数(频次)同一个数据值(样本值)出现的次数(频次)。Evaluation only.Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0

4、.Copyright 2004-2011 Aspose Pty Ltd.3.1.1 频次与频率的基本概念频次与频率的基本概念频次频次:在一个数据集合中,同一个数据:在一个数据集合中,同一个数据值(样本值)出现的次数。值(样本值)出现的次数。频率频率:某样本值的频率:某样本值的频率=该样本值出现的该样本值出现的频次频次/n(该数据集合的数据总个数)(该数据集合的数据总个数)一个例子(下页)一个例子(下页)Evaluation only.Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0.Copyright 2004-201

5、1 Aspose Pty Ltd.例例3.1.1从某城市抽出来的从某城市抽出来的30个商店中,查出个商店中,查出某商品的价格数据:某商品的价格数据:9.98 10.02 10.00 10.04 10.01 9.99 10.05 10.04 10.06 10.0110.03 9.99 9.97 9.93 10.01 10.03 10.03 10.02 10.05 9.999.95 9.96 9.98 10.00 9.97 10.01 10.00 9.99 9.98 10.00 (感觉如何?(感觉如何?乱!乱!)Evaluation only.Created with Aspose.Slides

6、for .NET 3.5 Client Profile 5.2.0.0.Copyright 2004-2011 Aspose Pty Ltd.排序:最基本的整理。排序:最基本的整理。9.93 9.95 9.96 9.97 9.97 9.98 9.98 9.98 9.99 9.99 9.99 9.99 10.00 10.00 10.00 10.00 10.01 10.01 10.01 10.01 10.02 10.02 10.03 10.03 10.03 10.04 10.04 10.05 10.05 10.06简单之至?简单之至?认为容易的,可以试试手工对认为容易的,可以试试手工对300个数据

7、排序个数据排序简单:基于软件。简单:基于软件。Evaluation only.Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0.Copyright 2004-2011 Aspose Pty Ltd.基于排序,能够简单统计频次:基于排序,能够简单统计频次:价格(元)价格(元)9.93 9.94 9.95 9.96 9.97 9.98 9.99 10.00 次数:次数: 1 0 1 1 2 3 4 4 频率频率% 3.33 0 3.33 3.33 6.67 10.00 13.33 13.33价格(元)价格(元)10.01

8、10.02 10.03 10.04 10.05 10.06次数:次数: 4 2 3 2 2 1频率频率% 13.33 6.67 10.0 6.67 6.67 3.33故意故意增加增加了了“9.94元元”这个刻度这个刻度排成一行,看清楚了频率结构特征。排成一行,看清楚了频率结构特征。今后,统计频次、频率,都由机器完成。今后,统计频次、频率,都由机器完成。Evaluation only.Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0.Copyright 2004-2011 Aspose Pty Ltd.上例是刻度级的数据

9、,下面看一个名义级数据上例是刻度级的数据,下面看一个名义级数据的例子。的例子。例例3.1.3 抽样调查后,得到客户家具的基色调抽样调查后,得到客户家具的基色调的数据:的数据:R、Y、R、G、Y、Y、W、Y、G、G、R、Y、Y、R、W G、Y、R、W、Y、G、G、B、R、Y、Y、W、R、R、WR、Y、R、G、Y、Y、W、Y、G、G、R、Y、Y、R、W G、Y、R、W、Y、G、G、B、R、Y、Y、W、R、R、W其中,其中,R表示暗红色,表示暗红色,Y表示淡黄褐色,表示淡黄褐色,G表示表示浅绿色,浅绿色,W表示白色,表示白色,B表示黑色。表示黑色。统计出各个颜色出现的频率如下:统计出各个颜色出现的频

10、率如下:Evaluation only.Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0.Copyright 2004-2011 Aspose Pty Ltd.家具基色家具基色 BGRWY合计合计基色频次基色频次 16851030基色频率基色频率 3.3320.026.716.733.3100当然,也可以统计出顺序级数据集合的当然,也可以统计出顺序级数据集合的频次与频率结构。频次与频率结构。Evaluation only.Created with Aspose.Slides for .NET 3.5 Client Pr

11、ofile 5.2.0.0.Copyright 2004-2011 Aspose Pty Ltd.3.1.2 观察样本数据基本特征(频次与观察样本数据基本特征(频次与频率)的图形方法频率)的图形方法1.表示频次与频率的饼图(表示频次与频率的饼图(Pie Chart)每个不同的样本值所占据的圆心角的大小每个不同的样本值所占据的圆心角的大小由下式计算:由下式计算:在圆圈中,给每个不同的样本值一个与其在圆圈中,给每个不同的样本值一个与其频次(或频率)相当的圆心角:频次(或频率)相当的圆心角: 某样本值对应的圆心角某样本值对应的圆心角=该样本值的该样本值的频率频率360Evaluation only.

12、Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0.Copyright 2004-2011 Aspose Pty Ltd.家具基色调(名义级数据)家具基色调(名义级数据)Evaluation only.Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0.Copyright 2004-2011 Aspose Pty Ltd.某单位职工文化程度的结构(顺序级数据)某单位职工文化程度的结构(顺序级数据)Evaluation only.Created wi

13、th Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0.Copyright 2004-2011 Aspose Pty Ltd.2.表示频次与频率的表示频次与频率的条形图条形图图见下页。图见下页。非常简单:非常简单:1)横坐标横坐标:样本数据的不同值。:样本数据的不同值。顺序级以上,横坐标上的样本数据应从小到大顺序级以上,横坐标上的样本数据应从小到大排列。若是刻度级的,则在排序中,要注意长排列。若是刻度级的,则在排序中,要注意长度的刻度,保持一致的比例。度的刻度,保持一致的比例。2)纵坐标纵坐标:相应样本值出现的频次或频率。:相应样本值出现的频次

14、或频率。Evaluation only.Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0.Copyright 2004-2011 Aspose Pty Ltd.某商品在某商品在30个商店的价格例(注意间距)个商店的价格例(注意间距)Evaluation only.Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0.Copyright 2004-2011 Aspose Pty Ltd.某科室职工文化程度例(有顺序,无间距)某科室职工文化程度例(有顺

15、序,无间距)Evaluation only.Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0.Copyright 2004-2011 Aspose Pty Ltd.家具基色调例(横坐标的色彩无顺序关系)家具基色调例(横坐标的色彩无顺序关系)Evaluation only.Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0.Copyright 2004-2011 Aspose Pty Ltd.3.1.3 样本数据集合的基本特征的延伸:样本数据集合的

16、基本特征的延伸:累积频率累积频率(Cumulative Percentage)1.累积频率的概念(简单)累积频率的概念(简单)设设X1X2Xm,是样本数据集合中的,是样本数据集合中的不不重复重复的样本值(的样本值(mn样本个数)。样本个数)。若把样本值小于等于某个样本数据若把样本值小于等于某个样本数据Xi的频率值,的频率值,都累加起来,就得到都累加起来,就得到“小于等于小于等于Xi”的累积频的累积频率。率。2.表格法表格法表示累积频率(以价格问题为例):表示累积频率(以价格问题为例):Evaluation only.Created with Aspose.Slides for .NET 3.5

17、 Client Profile 5.2.0.0.Copyright 2004-2011 Aspose Pty Ltd.价格(元)价格(元)9.93 9.94 9.95 9.96 9.97 9.98 9.99 10.00 次数:次数: 1 0 1 1 2 3 4 4 频率频率% 3.33 0 3.33 3.33 6.67 10.00 13.33 13.33累积频率累积频率% 3.33 3.33 6.67 10.00 16.67 26.67 40.00 53.33价格(元)价格(元)10.01 10.02 10.03 10.04 10.05 10.06次数:次数: 4 2 3 2 2 1频率频率%

18、 13.33 6.67 10.0 6.67 6.67 3.33累积频率累积频率% 66.67 73.33 83.33 90.00 96.67 100.00讨论:顺序级数据能够计算累积频率吗?讨论:顺序级数据能够计算累积频率吗? 名义级数据能够计算累积频率吗?名义级数据能够计算累积频率吗?为什么?(答案见教材第为什么?(答案见教材第72页)页)Evaluation only.Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0.Copyright 2004-2011 Aspose Pty Ltd.3.累积频率的累积频率的条形

19、图条形图表示表示把条形图的把条形图的纵坐标纵坐标改成改成累积频率累积频率即可。即可。商品价格例:商品价格例:Evaluation only.Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0.Copyright 2004-2011 Aspose Pty Ltd.第第3.2节节 观察观察刻度级刻度级样本数样本数据结构的据结构的茎叶图茎叶图与与直方图直方图方法方法3.2.1茎叶图(茎叶图(Stem-and-Leaf Plot)的概)的概念与作法念与作法1.概念概念“茎茎-叶叶”的含义:按照某规则,把所有的样的含义:按照某规则

20、,把所有的样本值分成本值分成“茎节茎节”和和“叶叶”两个部分。表达为:两个部分。表达为:“茎节茎节叶叶”的形式。的形式。“茎节茎节”末位上的末位上的1所代表的所代表的实际值实际值,就是,就是“茎节茎节”的的宽度宽度。Evaluation only.Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0.Copyright 2004-2011 Aspose Pty Ltd.例如,可用茎叶法,把例如,可用茎叶法,把123表达为表达为1.23(此时,茎节宽(此时,茎节宽=100)此时,此时,123(样本值)(样本值)=1.23(茎

21、叶表达)(茎叶表达)100(茎节宽)(茎节宽)问:若茎节宽度为问:若茎节宽度为10,如何表达,如何表达123?Evaluation only.Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0.Copyright 2004-2011 Aspose Pty Ltd.2.例题与茎叶图的作法例题与茎叶图的作法例例3.2.1 某班级男生的身高(厘米)某班级男生的身高(厘米)171 182 175 177 178 181 185 168 170 175 177180 176 172 165 160 178 186 190 176

22、163 183问:若以问:若以100cm为茎节宽?茎节是多少?对吗?为茎节宽?茎节是多少?对吗?结论结论:样本数据集合中的:样本数据集合中的“茎节茎节”必须是有变化必须是有变化的的 茎节宽应为茎节宽应为10cm把所有的数据都表达为把所有的数据都表达为“茎节茎节叶叶”形式后,把形式后,把相同茎节的数据合并为相同茎节的数据合并为“茎节茎节叶叶1叶叶2”形形式(叶,要从小到大排列),再把式(叶,要从小到大排列),再把不同的茎节不同的茎节从从小到大纵向排列,就得到小到大纵向排列,就得到茎叶图茎叶图:Evaluation only.Created with Aspose.Slides for .NET

23、3.5 Client Profile 5.2.0.0.Copyright 2004-2011 Aspose Pty Ltd.茎茎 叶叶16 0,3,5,817 0,1,2,5,5,6,6,7,7,8,818 0,1,2,3,5,619 0进一步策略(并注明频次)为:进一步策略(并注明频次)为:频次频次 茎茎 叶叶 4 16 0,3,5,8 11 17 0,1,2,5,5,6,6,7,7,8,8 6 18 0,1,2,3,5,6 1 19 0这就是身高数据集合的茎叶图。这就是身高数据集合的茎叶图。问:如果有的茎节右边的叶子太多了,怎么办问:如果有的茎节右边的叶子太多了,怎么办?Evaluatio

24、n only.Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0.Copyright 2004-2011 Aspose Pty Ltd.把把“茎节茎节”砍短一点。砍短一点。例如,把每个茎节分成两段(例如,把每个茎节分成两段(L、H),有),有频次频次 茎茎 节节 2 16L 03 2 16H 58 3 17L 012 8 17H 55667788 4 18L 0123 2 18H 56 1 19L 0“茎节长度茎节长度”的概念:茎节长度的概念:茎节长度=允许覆盖最允许覆盖最大值大值-允许覆盖最小值允许覆盖最小值+1上例中

25、的茎节长度为上例中的茎节长度为5(cm):):04,59上例中的上例中的L、H可以省略。可以省略。事实上,上例的茎节是不必砍短的,事实上,上例的茎节是不必砍短的, 叶并不多叶并不多注意注意:茎节砍短时,要注意茎节等长的原则:茎节砍短时,要注意茎节等长的原则Evaluation only.Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0.Copyright 2004-2011 Aspose Pty Ltd.3.2.2 直方图(直方图(Histogram)的)的概念与作法概念与作法1.条形图的弱点,当刻度级的数据的精度相对

26、高,使条形图的弱点,当刻度级的数据的精度相对高,使得不重复的数据量非常大时,反而让人看不清数据集得不重复的数据量非常大时,反而让人看不清数据集合的结构。例如,身高问题合的结构。例如,身高问题 看不清分布的规律看不清分布的规律Evaluation only.Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0.Copyright 2004-2011 Aspose Pty Ltd.如果我们如果我们对数据适当分组对数据适当分组,再用矩形的高度来表示,再用矩形的高度来表示各组的数据的个数或频率,就有(可看到清楚的分各组的数据的个数

27、或频率,就有(可看到清楚的分布规律):布规律):这就是直方图。各区间长度是这就是直方图。各区间长度是5cm,起点是,起点是157.5cm,终点时,终点时192.5cm。Evaluation only.Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0.Copyright 2004-2011 Aspose Pty Ltd.2.直方图:适用于直方图:适用于大量不重复样本值大量不重复样本值的数的数据集合。据集合。 在绘制直方图时,如何对数据分组,在绘制直方图时,如何对数据分组,如何确定区间长度、区间个数?如何确定如何确定区间长

28、度、区间个数?如何确定区间起点?参见教材。区间起点?参见教材。今后软件可自动完成分组和绘图。今后软件可自动完成分组和绘图。需要掌握的是:直方图与需要掌握的是:直方图与条形图条形图的区别,的区别,各适用于什么数据特点?各适用于什么数据特点?Evaluation only.Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0.Copyright 2004-2011 Aspose Pty Ltd.作直方图时,在区间长度确定后,如何确定区作直方图时,在区间长度确定后,如何确定区间个数?间个数?(数据集合中最大值(数据集合中最大值-

29、 -数据集合中的最小值)数据集合中的最小值)/ /区区间长度,其值间长度,其值4 4舍舍5 5入后加入后加1 1为组的个数。为组的个数。作直方图时,如何确定最左端区间的中心位置作直方图时,如何确定最左端区间的中心位置?取出样本数据集合中的最小值;确定备选的取出样本数据集合中的最小值;确定备选的起始区间的中心位置;在备选区间的中心位置起始区间的中心位置;在备选区间的中心位置中,哪个与最小值接近,就确定为数据分组的中,哪个与最小值接近,就确定为数据分组的起始区间。起始区间。 Evaluation only.Created with Aspose.Slides for .NET 3.5 Client

30、 Profile 5.2.0.0.Copyright 2004-2011 Aspose Pty Ltd.第第3节节 样本数据的样本数据的位置特征位置特征对对数据中心数据中心的描述的描述样本数据的测度级别的样本数据的测度级别的不同不同,需要,需要不同不同的表示的表示“数据集合中心数据集合中心”的概念。的概念。本节将介绍本节将介绍“样本中位数样本中位数”、“样本众数样本众数”和和“样本均值样本均值”三个重要的描述数据集合中心位三个重要的描述数据集合中心位置的基本概念。置的基本概念。Evaluation only.Created with Aspose.Slides for .NET 3.5 Cli

31、ent Profile 5.2.0.0.Copyright 2004-2011 Aspose Pty Ltd.3.3.1 样本众数(样本众数(Sample mode)样本众数样本众数定义定义1:样本数据集合中出现频次最:样本数据集合中出现频次最高的那个样本值,称为样本众数。在一般情况高的那个样本值,称为样本众数。在一般情况下,下,“样本众数样本众数”被简称为被简称为“众数众数”。单一众数:单一众数:P.67。复众数:。复众数:P.67。无众数:。无众数:P.68从条形图,或者频率表、频次表来判断。从条形图,或者频率表、频次表来判断。Evaluation only.Created with As

32、pose.Slides for .NET 3.5 Client Profile 5.2.0.0.Copyright 2004-2011 Aspose Pty Ltd.Evaluation only.Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0.Copyright 2004-2011 Aspose Pty Ltd.众数定义众数定义2:对刻度级的数据,在等区间分组:对刻度级的数据,在等区间分组的直方图中,最高的矩形(即峰的直方图中,最高的矩形(即峰Peak)所表示)所表示的数据区间,称为该数据集合的众数区间,简的数据区

33、间,称为该数据集合的众数区间,简称众数。如:称众数。如:众数区间,也有单一众数和复众数之分。众数区间,也有单一众数和复众数之分。问:众数适用于什么测度?广义与侠义问:众数适用于什么测度?广义与侠义Evaluation only.Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0.Copyright 2004-2011 Aspose Pty Ltd.3.3.2 样本中位数(样本中位数(Sample median)样本中位数:样本中位数: 设,样本数据集合中的所有数据的排序结设,样本数据集合中的所有数据的排序结果为果为X1X

34、2Xn,n为样本容量。样本中位为样本容量。样本中位数,就是上述序列中,处于数,就是上述序列中,处于“正中间位置正中间位置”上上的数据。的数据。两个要素:位与数。两个要素:位与数。正中间位置正中间位置“号码号码”=(n+1)0.5Evaluation only.Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0.Copyright 2004-2011 Aspose Pty Ltd.例例1:17.0 17.1 17.2 17.5 17.5 17.6 17.6 Me=17.5例例2:16.8 17.0 17.1 17.2 17

35、.5 17.5 17.6 17.6 Me=17.35问:中位数适用于什么测度?问:中位数适用于什么测度? 分奇偶个数。分奇偶个数。Evaluation only.Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0.Copyright 2004-2011 Aspose Pty Ltd.3.3.3 样本均值(样本均值(Sample Mean)样本均值(样本均值(Sample Mean)样本均值仅适用于刻度级的数据。样本均值仅适用于刻度级的数据。样本数据集合的样本均值定义为:样本数据集合的样本均值定义为:式中,式中,Xi为样本

36、观察值。为样本观察值。Evaluation only.Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0.Copyright 2004-2011 Aspose Pty Ltd.第第3.4节节 样本数据的离散特征样本数据的离散特征描述数据集合的离散特征的两种方法:描述数据集合的离散特征的两种方法:一、点状描述一、点状描述,如明确样本数据集合中的最小,如明确样本数据集合中的最小值和最大值等;值和最大值等;二、区间描述二、区间描述(基于差值的描述),如样本数(基于差值的描述),如样本数据集合中的最大值与最小值之差。据集合中的最

37、大值与最小值之差。Evaluation only.Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0.Copyright 2004-2011 Aspose Pty Ltd.3.4.1 对样本数据离散特征的点状描述:对样本数据离散特征的点状描述:极值、四分点与百分位点极值、四分点与百分位点1.极大值(极大值(Maximum)与极小值)与极小值(Minimum)极大值与极小值,从一定视角反映了样本极大值与极小值,从一定视角反映了样本数据集合中样本的数据集合中样本的离散离散情况。情况。问:极大值、极小值适用于什么测度?问:极大

38、值、极小值适用于什么测度?另一个另一个位位与数的问题:与数的问题:Evaluation only.Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0.Copyright 2004-2011 Aspose Pty Ltd.2.下四分点(下四分点(Lower quartile)与上四分点)与上四分点(Upper quartile)1)上、下四分点的概念)上、下四分点的概念下四分点使由小到大排序后的数据集合的左下四分点使由小到大排序后的数据集合的左边部分,包含边部分,包含25%的样本总个数,右边部分的样本总个数,右边部分包含包

39、含75%的样本总个数。的样本总个数。上四分点使由小到大排序后的数据集合的左上四分点使由小到大排序后的数据集合的左边部分,包含边部分,包含75%的样本总个数,右边部分的样本总个数,右边部分包含包含25%的样本总个数。的样本总个数。上、下四分点在一定意义上反映了样本数据上、下四分点在一定意义上反映了样本数据的离散情况。的离散情况。Evaluation only.Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0.Copyright 2004-2011 Aspose Pty Ltd.2)上、下四分点(及中位数)的位置)上、下四

40、分点(及中位数)的位置Q1:下四分点,:下四分点,Q3:上四分点,:上四分点,Q2=Me:中中位数,位数,n:该数据集合的数据总个数。:该数据集合的数据总个数。下四分点下四分点Q1的位置的位置=(n+1)0.25正中间正中间Q2的位置的位置=(n+1)0.5上四分点上四分点Q3的位置的位置=(n+1)0.753)上、下四分点()上、下四分点(及中位数及中位数)的值)的值当当Q1、Q2、Q3的位置为整数时,相应整数的位置为整数时,相应整数位置上的样本值,就是当位置上的样本值,就是当Q1、Q2、Q3的值。的值。Evaluation only.Created with Aspose.Slides f

41、or .NET 3.5 Client Profile 5.2.0.0.Copyright 2004-2011 Aspose Pty Ltd.当其不为整数时:当其不为整数时:Q1=Q2位置左边的样本值位置左边的样本值+(Q1位置右边位置右边的样本值的样本值-Q1位置左边的样本值)位置左边的样本值)Q1位位置的小数部分置的小数部分Q3=Q3位置位置左边的样本值左边的样本值+(Q3位置右边位置右边的样本值的样本值-Q3位置左边的样本值)位置左边的样本值)Q3位位置的小数部分置的小数部分Evaluation only.Created with Aspose.Slides for .NET 3.5 Cl

42、ient Profile 5.2.0.0.Copyright 2004-2011 Aspose Pty Ltd.本页公式,可以不讲本页公式,可以不讲3)上、下四分点(及中位数)的值)上、下四分点(及中位数)的值公式表达之二:公式表达之二:Q1=Q1位置左边的样本值位置左边的样本值+(Q1位置右边位置右边的样本值的样本值-Q1位置左边的样本值)位置左边的样本值)(n+1)0.25-(n+1)0.25Q3=Q3位置左边的样本值位置左边的样本值+(Q3位置右边位置右边的样本值的样本值-Q3位置左边的样本值)位置左边的样本值)(n+1)0.75-(n+1)0.75式中,式中,是取整函数,例如,是取整函

43、数,例如,5.75=5Evaluation only.Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0.Copyright 2004-2011 Aspose Pty Ltd.4)例题)例题例例3.4.1数据:数据:99.8,99.9,100.1,100.2,求,求Q1、Q2、Q3的值。的值。下四分点下四分点Q1的位置的位置=(4+1)0.25=1.25,该,该位置左边有位置左边有1个数据(占总数的个数据(占总数的25%)。)。中位数中位数Q2的位置的位置=(4+1)0.5=2.5,该位置,该位置左边有左边有2个数据(占

44、总数的个数据(占总数的50%)。)。上四分点上四分点Q3的位置的位置=(4+1)0.75=3.75,该,该位置左边有位置左边有3个数据(占总数的个数据(占总数的75%)。)。Evaluation only.Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0.Copyright 2004-2011 Aspose Pty Ltd.以下是Q1、Q2、Q3的位置的图形表示:Evaluation only.Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0.

45、Copyright 2004-2011 Aspose Pty Ltd.计算计算Q1、Q2、Q3的值:的值:Q1=99.8+(99.9-99.8)0.25=99.825Q2=Me=99.9+(100.1-99.9)0.5=100.0Q3=100.1+(100.2-100.1)0.75 =100.175当当Q1、Q3的位置不是整数时(也就是的位置不是整数时(也就是n+1不能不能被被4整除时),整除时),Q1、Q3的值是通过四则运算得的值是通过四则运算得到的,所以用到的,所以用Q1、Q3表示离散状况,仅适用于表示离散状况,仅适用于刻度级的数据。刻度级的数据。当当Q1、Q3的位置是整数时(即的位置是整

46、数时(即n+1能被能被4整除时)整除时),Q1、Q3的值就是相应位置上的值,所以用的值就是相应位置上的值,所以用Q1、Q3表示离散状况,适用于顺序级以上的数据。表示离散状况,适用于顺序级以上的数据。Evaluation only.Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0.Copyright 2004-2011 Aspose Pty Ltd.有关上四分点、下四分点和中位数的手工有关上四分点、下四分点和中位数的手工计算,不是很重要的。计算,不是很重要的。很重要的是上四分点、下四分点和中位数很重要的是上四分点、下四分

47、点和中位数的概念。的概念。计算将由计算将由SPSS软件完成。软件完成。百分位点的概念,很容易从四分位点推广百分位点的概念,很容易从四分位点推广得到。得到。Evaluation only.Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0.Copyright 2004-2011 Aspose Pty Ltd.3.4.2 对样本数据离散特征的区间描述:对样本数据离散特征的区间描述:极差、四分距与离差极差、四分距与离差“区间描述区间描述”,必然要做加减运算,因此,必然要做加减运算,因此,区间描述仅适用于刻度级的数据。区间描述仅

48、适用于刻度级的数据。1.极差(极差(Range)极差极差=极大值极大值-极小值极小值它反映了样本数据在数轴上的分布范围。它反映了样本数据在数轴上的分布范围。2.四分位距(四分位距(Interquartile range)四分位距(四分位距(Iqr)=Q3-Q1它反映了样本数据集合中样本值处于中间它反映了样本数据集合中样本值处于中间大小的大小的1/2的数据的分布范围。的数据的分布范围。Evaluation only.Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0.Copyright 2004-2011 Aspose P

49、ty Ltd.3.样本离差(样本离差(Sample deviations)与离差平)与离差平方和(方和(Sun of squared deviations)样本离差被定义为每个样本与样本均值之差:样本离差被定义为每个样本与样本均值之差:xi- ,i=1,2,n样本离差又称样本中心化数据。样本离差又称样本中心化数据。例例3.4.1的样本数据为:的样本数据为:99.8,99.9,100.1,100.2,易知均值为易知均值为100.0,于是,样本离差(中心化数据)依次为:,于是,样本离差(中心化数据)依次为:-0.2,-0.1,0.1,0.2。Evaluation only.Created with

50、 Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0.Copyright 2004-2011 Aspose Pty Ltd.反映数据集合对其均值的总偏差:所有反映数据集合对其均值的总偏差:所有的样本离差之和,存在正负相互抵消的的样本离差之和,存在正负相互抵消的问题,其和必然为零,不可能反映整个问题,其和必然为零,不可能反映整个样本数据对样本均值的偏离情况,所以样本数据对样本均值的偏离情况,所以采用离差平方和的方式来反映样本数据采用离差平方和的方式来反映样本数据对均值的总偏离情况。对均值的总偏离情况。离差平方和被定义为:离差平方和被定义为:Eval

51、uation only.Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0.Copyright 2004-2011 Aspose Pty Ltd.3.4.3 离散状况的统计值描述离散状况的统计值描述1:样本方差(样本方差(Sample variance)为什么用离差平方和除以为什么用离差平方和除以n-1,不除以样,不除以样本个数?本个数?样本标准差(样本标准差(Standard Deviation)的定)的定义是义是Evaluation only.Created with Aspose.Slides for .NET 3

52、.5 Client Profile 5.2.0.0.Copyright 2004-2011 Aspose Pty Ltd.3.4.4 离散状况的统计值描述离散状况的统计值描述2:变异系数变异系数用方差或者标准差来反映数据对平均值用方差或者标准差来反映数据对平均值的离散状况,有一个重要的缺点:不同的离散状况,有一个重要的缺点:不同的度量单位对数字大小有重要影响,只的度量单位对数字大小有重要影响,只有剔除度量单位的影响后,标准差之间有剔除度量单位的影响后,标准差之间的比较,才有意义。的比较,才有意义。样本变异系数定义为:样本标准差与样样本变异系数定义为:样本标准差与样本均值之比:本均值之比:Eva

53、luation only.Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0.Copyright 2004-2011 Aspose Pty Ltd.第第3.5节节 样本数据特征的综合样本数据特征的综合表达:箱形图表达:箱形图箱形图法是综合表达数据的中心特征和离散特箱形图法是综合表达数据的中心特征和离散特征的图形方法。征的图形方法。3.5.1箱形图的基本构造箱形图的基本构造从这个图还可以看出样本数据值分布的偏斜从这个图还可以看出样本数据值分布的偏斜(Skewness)情况。如果左箱体和左胡须都短,)情况。如果左箱体和左胡须

54、都短,则表明数据集聚是左侧,样本数据值的分布向则表明数据集聚是左侧,样本数据值的分布向左偏斜。反之,就是向右偏斜。左偏斜。反之,就是向右偏斜。图图3.5.1是个横卧的箱形图。当然,叶可以竖起是个横卧的箱形图。当然,叶可以竖起来摆放。两者的效果是相同的。来摆放。两者的效果是相同的。Evaluation only.Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0.Copyright 2004-2011 Aspose Pty Ltd.箱形图的构成箱形图的构成3.5.1 箱形图箱形图Evaluation only.Create

55、d with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0.Copyright 2004-2011 Aspose Pty Ltd.修正箱形图的构成修正箱形图的构成3.5.2 修正的箱形图修正的箱形图Evaluation only.Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0.Copyright 2004-2011 Aspose Pty Ltd.例3.2.1身高数据的箱形图例3.5.1在例3.2.1中,加身高213厘米的人Evaluation only.Creat

56、ed with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0.Copyright 2004-2011 Aspose Pty Ltd.在如下茎叶图中在如下茎叶图中 N N16 16 茎宽茎宽0.10.1 1 59 7 1 59 7 3 60 148 3 60 148 5 61 02669 5 61 02669 4 62 0247 4 62 0247 2 63 58 2 63 58 1 64 3 1 64 3a.a.茎宽茎宽0.10.1是什么意思?是什么意思?b.b.在这张茎叶图上显示了多少个数据?在这张茎叶图上显示了多少个数据?c.c.列出头四个数据值。列出头四个数据值。课堂练习课堂练习Evaluation only.Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0.Copyright 2004-2011 Aspose Pty Ltd.

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 医学/心理学 > 基础医学

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号