数据分布特征的描述专业教育

上传人:M****1 文档编号:568846773 上传时间:2024-07-27 格式:PPT 页数:82 大小:2.85MB
返回 下载 相关 举报
数据分布特征的描述专业教育_第1页
第1页 / 共82页
数据分布特征的描述专业教育_第2页
第2页 / 共82页
数据分布特征的描述专业教育_第3页
第3页 / 共82页
数据分布特征的描述专业教育_第4页
第4页 / 共82页
数据分布特征的描述专业教育_第5页
第5页 / 共82页
点击查看更多>>
资源描述

《数据分布特征的描述专业教育》由会员分享,可在线阅读,更多相关《数据分布特征的描述专业教育(82页珍藏版)》请在金锄头文库上搜索。

1、第第3章章 数据分布特征的描述数据分布特征的描述 3.1 集中趋势的度量集中趋势的度量 3.2 离中趋势的测度离中趋势的测度 3.3 偏态与峰度的测度偏态与峰度的测度本章重点:数据分布集中趋势、离中趋势的本章重点:数据分布集中趋势、离中趋势的 测度方法。测度方法。本章难点:本章难点:集中趋势、离中趋势测度值的计算。集中趋势、离中趋势测度值的计算。1高等课堂数据分布的特征数据分布的特征:一、集中趋势:反映数据向其中心靠拢或 聚集程度;二、离中趋势;数据远离中心的趋势(又称离散程度);三、偏态和峰态;偏态是对数据分布对称性的度量;峰度是指数据分布的平峰或尖峰程度(形状)。 2高等课堂数据分布的特征

2、数据分布的特征集中趋势集中趋势集中趋势集中趋势: :反映反映反映反映数据向其中心数据向其中心数据向其中心数据向其中心靠拢或聚集程靠拢或聚集程靠拢或聚集程靠拢或聚集程度度度度 ( (位置位置位置位置) )偏态和峰态;偏偏态和峰态;偏偏态和峰态;偏偏态和峰态;偏态:反映数据偏态:反映数据偏态:反映数据偏态:反映数据偏斜程度;峰度:斜程度;峰度:斜程度;峰度:斜程度;峰度:数据分布的平峰数据分布的平峰数据分布的平峰数据分布的平峰或尖峰程度或尖峰程度或尖峰程度或尖峰程度(形(形(形(形状)状)状)状)离中趋势;数据离中趋势;数据离中趋势;数据离中趋势;数据远离中心的趋势远离中心的趋势远离中心的趋势远离

3、中心的趋势 ( (分散程度分散程度分散程度分散程度) )3高等课堂数据分布特征的测度数据分布特征的测度数据特征的测度数据特征的测度众众众众众众 数数数数数数中位数中位数中位数中位数中位数中位数平均数平均数平均数平均数平均数平均数离散系数离散系数离散系数离散系数离散系数离散系数方差和标准差方差和标准差方差和标准差方差和标准差方差和标准差方差和标准差峰峰峰峰峰峰 态态态态态态四分位差四分位差四分位差四分位差四分位差四分位差异众比率异众比率异众比率异众比率异众比率异众比率偏偏偏偏偏偏 态态态态态态分布的形状分布的形状集中趋势集中趋势离中趋势离中趋势4高等课堂3.1集中趋势的度量集中趋势的度量分类数据

4、-众数顺序数据-中位数和分位数数值型数据-均值 众数、中位数和均值的关系5高等课堂集集 中中 趋趋 势势(central tendency)1.一一组数据向其中心值靠拢的倾向和程度组数据向其中心值靠拢的倾向和程度2.测度集中趋势就是寻找数据水平的代表值或中心值测度集中趋势就是寻找数据水平的代表值或中心值3.不同类型的数据用不同的集中趋势测度值不同类型的数据用不同的集中趋势测度值4.注意注意:低层次数据的测度方法也适用于高层次的数据,:低层次数据的测度方法也适用于高层次的数据,但高层次数据的测度方法往往不适用于低层次的数据。但高层次数据的测度方法往往不适用于低层次的数据。6高等课堂3.1.1分类

5、数据分类数据-众数众数1.一组数据中出现次数最多的变量值2.适合于数据量较多时使用3.不受极端值的影响4.一组数据可能没有众数或有几个众数5.主要用于分类数据,也可用于顺序数据和数值型数据(spss计算)7高等课堂注意注意:众数众数(不惟一性不惟一性)无众数无众数原始数据: 10 5 9 12 6 8一个众数一个众数原始数据: 6 5 9 8 5 5多于一个众数多于一个众数原始数据: 25 28 28 36 42 428高等课堂分类数据的众数分类数据的众数(例题分析例题分析)不同品牌饮料的频数分布不同品牌饮料的频数分布不同品牌饮料的频数分布不同品牌饮料的频数分布 饮料品牌饮料品牌频数频数比例比

6、例百分比百分比(%) 可口可乐可口可乐 旭日升冰茶旭日升冰茶 百事可乐百事可乐 汇源果汁汇源果汁 露露露露1511 9 6 90.300.220.180.120.183022181218合计合计501100解解解解:这这里里的的变变量量为为“ “饮饮料料品品牌牌” ”,这这是是个个分分类类变变量量,不不同同类类型型的的饮饮料料就是变量值就是变量值 所所调调查查的的5050人人中中,购购买买可可口口可可乐乐的的人人数数最最多多,为为1515人人,占占总总被被调调查查人人数数的的30%30%,因因此此众众数数为为“ “可可口口可可乐乐” ”这这一一品品牌牌,即即 MMo o可口可乐可口可乐可口可乐

7、可口可乐9高等课堂顺序数据的众数顺序数据的众数(例题分析例题分析)解解解解:这这里里的的数数据据为为顺顺序序数数据据。变变量量为为“ “回回答类别答类别” ” 甲甲城城市市中中对对住住房房表表示示不不满满意意的的户户数数最最多多,为为108108户户,因因此此众众数数为为“ “不不满满意意” ”这这一类别,即一类别,即 MMo o不满意不满意甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布回答类别回答类别甲城市甲城市户数户数 (户户)百分比百分比 (%) 非常不满意非常不满意 不满意不满意 一般一般 满意满

8、意 非常满意非常满意 24108 93 45 30 836311510合计合计300100.010高等课堂数值型数据众数的确定方法数值型数据众数的确定方法 单变量值分组资料单变量值分组资料某年级某年级83名女生身高资料名女生身高资料 身高身高 人数人数(CM) (人)(人) 152 1 154 2 155 2 156 4 157 1 158 2 159 2 160 12 161 7 162 8 163 4 身高身高 人数人数(CM) (人)(人) 164 3 165 8 166 5 167 3 168 7 169 1 170 5 171 2 172 3 174 1总计总计总计总计 8383 S

9、TATSTAT11高等课堂 身高身高 人数人数 比重比重 (CM) (人)(人) (%) 150-155 3 3.61 155-160 11 13.25 160-165 34 40.96 165-170 24 28.92 170以上以上 11 13.25 总计总计 83 100某年级某年级83名女生身高资料名女生身高资料数值型数据众数的确定方法数值型数据众数的确定方法 组距分组资料组距分组资料STATSTAT12高等课堂众数的计算方法总结:1、观察法(例题分析)2、插值法P76(例题分析)u所谓插值法就是先找到众数所在的组,然后按该组次数与前后相邻两组分布次数之差所占的比重推算众数值。13高等

10、课堂例3.1 某车间实行计件工资,2005年10月120名工人的月工资资料如下表所示:要求:试计算月工资的众数。月工资(元)人数(人)比重(%)由小到大累计次数由大到小累计次数800以下1512.5015120800-10002520.83401051000-1200 4840.0088801200-1400 2016.67108321400-1600 1210.0012012合计120100.0014高等课堂解:从上表中我们可以看出,月工资变量值中最大的字数为48人,即众数组为1000-1200这一组。根据公式,可得:15高等课堂众数的特点n众数是以它在所有变量值中所处的位置确定的一个代表值

11、,它不受分布数列的极大或极小值的影响,从而增强了众数对分布数列的代表性。n众数有可能不存在,也可能存在多个;n众数缺乏敏感性。16高等课堂3.1.2 顺序数据-中位数 和分位数 1中位数:概念:排序后处于中间位置上的值MMe e50%50%特点:不受极端值的影响特点:不受极端值的影响 主要用于顺序数据,也可主要用于顺序数据,也可主要用于顺序数据,也可主要用于顺序数据,也可 用数值型数据,用数值型数据,用数值型数据,用数值型数据, 但不能用于分类数据但不能用于分类数据但不能用于分类数据但不能用于分类数据 各变量值与中位数的离差绝对值之和最小,即各变量值与中位数的离差绝对值之和最小,即17高等课堂

12、顺序数据的中位数顺序数据的中位数 (例题分析例题分析)解:解:解:解:中位数的位置为中位数的位置为 300/2300/2150150 从从累累计计频频数数看看,中中位位数数在在“ “一一般般” ”这这一组别中一组别中 中位数为中位数为 Me=一般一般甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布回答类别回答类别甲城市甲城市户数户数 (户户)累计频数累计频数 非常不满意非常不满意 不满意不满意 一般一般 满意满意 非常满意非常满意 24108 93 45 30 24132225270300合计合计30018

13、高等课堂未分组数值型数据的中位数未分组数值型数据的中位数(奇数个数据的算例)n【例例】 9个家庭的人均月收入数据n原始数据原始数据: 1500 750 780 1080 850 960 2000 1250 1630n排排 序序: 750 780 850 960 1080 1250 1500 1630 2000n位位 置置: 1 2 3 4 5 6 7 8 9中位数中位数 108019高等课堂未分组数值型数据的中位数未分组数值型数据的中位数(偶数个偶数个数据的算例数据的算例)n【例例】:10个家庭的人均月收入数据n排排 序序: 660 750 780 850 960 1080 1250 1500

14、 1630 2000n位位 置置: 1 2 3 4 5 6 7 8 9 10 20高等课堂组距分组数据中组距分组数据中位数的确定方法位数的确定方法 身高身高 fi人数人数 累计累计 (CM) (人)(人) 人数人数 150-155 3 3 155-160 11 14 160-165 34 48 165-170 24 72 170以上以上 11 83 总计总计 83 某年级某年级83名女生身高资料名女生身高资料STATSTAT21高等课堂中位数的计算方法:1、根据未分组数据计算中位数u对于没分组数据,首先要排序,然后根据所在位置确定中位数。22高等课堂2、由分组资料确定中位数:23高等课堂例3.

15、2 某车间实行计件工资,2005年10月120名工人的月工资资料如下表所示:要求:试计算月工资的中位数。月工资(元)人数(人)比重(%)由小到大累计次数由大到小累计次数800以下1512.5015120800-10002520.83401051000-1200 4840.0088801200-1400 2016.67108321400-1600 1210.0012012合计120100.0024高等课堂解:25高等课堂2.顺序数据顺序数据-分位数分位数二分位数(中位数)、四分位数、十分位数和百分位数等。其中主要有四分位数。排位处于 25%和75%位置上的值即 四分位数不受极端值的影响要用于顺序

16、数据,也可用于数值型数据,但不能用于分类数据(各种分位数可由spss计算)QQL LQQMMQQU U25%25%25%25%26高等课堂四分位数的位置四分位数的位置n下四分位数n上四分位数27高等课堂例3.3两个学习小组的统计学考试成绩合并如下:要求:(1)计算前15个学生统计学考试成绩的四分位数;(2)如果增加一个学生的成绩为95分,试计算16个学生统计学考试成绩的四分位数。序号12345678成绩(分) 5861 646872747576序号910 111213141516成绩(分) 7878 8285868690-28高等课堂解(1)QL的位置=N+1/4=15+1/4=4,即QL在第

17、4个位置上,相应的变量值68分就是下四分位数。Qu的位置=3(N+1)/4=3(15+1/4=12,即Qu在第12个位置上,相应的变量值85分就是上四分位数。(2)QL的位置=N+1/4=16+1/4=4.25,即QL QL在第4.25个位置上,采用分割法,得:QL=X4+0.25x(X5-X4)=68+0.25x(72-68)=69(分)同理,可得Qu=85.75(分)29高等课堂3.1.3 数值型数据数值型数据-平均数平均数1.平均数(均值平均数(均值)均值(算术平均数)定义:全部变量值均值(算术平均数)定义:全部变量值之和与变量值个数相除所得的商。通常之和与变量值个数相除所得的商。通常也

18、称为平均数(也称为平均数(average)或均值()或均值(mean又有简单算数平均数和加权平均数之分又有简单算数平均数和加权平均数之分STATSTAT平均数的定义平均数的定义-变量值的一般水平。有算术均值、调变量值的一般水平。有算术均值、调 和均值和几何均值。和均值和几何均值。30高等课堂简单算术平均数与加权算术平均数的计算(simple mean / weighted mean)设一组数据为:设一组数据为: x x1 1 ,x x2 2 , ,x xn n(未分组数据)未分组数据)各组的组中值为:各组的组中值为:MM1 1 ,MM2 2 , ,MMk k (组距分组数据)组距分组数据) 相

19、应的频数为:相应的频数为: f f1 1 , f f2 2 , ,f fk k简单算术均值简单算术均值简单算术均值简单算术均值加权算术均值加权算术均值加权算术均值加权算术均值31高等课堂未分组资料算术平均数的计算:未分组资料算术平均数的计算:算术平均数算术平均数=某变量值总量某变量值总量变量值总数变量值总数数据个数数据个数 nSTATSTAT简单算术平均数简单算术平均数设有数据:设有数据:设有数据:设有数据:32高等课堂 身高身高 组中值组中值 人数人数 比比重重 (cm) xi(cm ) fi(人)(人) (%) 150- 155 152.5 3 3.61 155-160 157.5 11

20、13.25 160-165 162.5 34 40.96 165-170 167.5 24 28.92 170以上以上 172.5 11 13.25 总计总计 - 83 100 分组资料均值的计算:分组资料均值的计算:某年级某年级83名女生身高资料名女生身高资料组距数据组距数据次数次数f频率频率f/f变量值变量值xSTATSTAT加权算加权算术平均术平均数数33高等课堂1.集中趋势的最常用测度值;集中趋势的最常用测度值;2.一组数据的均衡点所在;一组数据的均衡点所在;3.易受极端值的影响;易受极端值的影响;4.各变量值与其均值的离差之和等于零;各变量值与其均值的离差之和等于零;5.由组距分组资

21、料计算的均值有近似值性质;由组距分组资料计算的均值有近似值性质;6.用于数值型数据,不能用于分类数据和顺用于数值型数据,不能用于分类数据和顺序数据序数据算术平均数(均值)特征:算术平均数(均值)特征:34高等课堂2.平均数的另一种表现形式平均数的另一种表现形式:调和平均数 注意:是均值的另一种表现形式 易受极端值的影响计计算公式为原来只是计原来只是计算时使用了算时使用了不同的数据不同的数据!35高等课堂调和平均数调和平均数 (例题分析例题分析)某日三种蔬菜的批发成交数据某日三种蔬菜的批发成交数据蔬菜蔬菜名称名称批发价格批发价格(元元) Mi(已知)已知)成交额成交额(元元) Mi fi(已知)

22、(已知)成交量成交量(公斤公斤)fi甲甲乙乙丙丙1.200.500.801800012500 64001500025000 8000合计合计3690048000【例例例例】某某蔬蔬菜菜批批发发市市场场三三种种蔬蔬菜菜的的日日成成交交数数据据如如表表,计计算算三三种种蔬蔬菜菜该该日的平均批发价格日的平均批发价格36高等课堂3.几何平均数几何平均数(geometric mean)概念: n 个变量值乘积的 n 次方根用途:适用于对比率数据的平均 主要用于计算平均发展速度、平均增长率、 平均比率计算公式为:可看作是均值的一种变形可看作是均值的一种变形37高等课堂几何平均数几何平均数 (例题分析)n

23、【例例】某水泥生产企业1999年的水泥产量为100万吨,2000年与1999年相比增长率为9%,2001年与2000年相比增长率为16%,2002年与2001年相比增长率为20%。求各年的年平均增长率。年平均增长率年平均增长率114.91%-1=114.91%-1=14.91%14.91%38高等课堂3.1.4 众数、中位数和平均数的关系众数、中位数和平均数的关系左偏分布左偏分布左偏分布左偏分布左偏分布左偏分布均值均值均值均值均值均值 中位数中位数中位数中位数中位数中位数 众数众数众数众数众数众数对称分布对称分布对称分布对称分布对称分布对称分布 均值均值均值均值均值均值 = = = 中位数中位

24、数中位数中位数中位数中位数 = = 众数众数众数众数众数众数右偏分布右偏分布右偏分布右偏分布右偏分布右偏分布众数众数众数众数众数众数 中位数中位数中位数中位数中位数中位数均值均值均值均值均值均值对何种数据而言的?对何种数据而言的?39高等课堂均数、中位数、众数三者关系均数、中位数、众数三者关系正态分布时: 均数中位数众数均数中位数众数正偏态分布时:均数均数中位数中位数众数众数负偏态分布时:均数均数中位数中位数众数众数40高等课堂众数、中位数、平均数的众数、中位数、平均数的特点和应用特点和应用1.众数n不受极端值影响n具有不惟一性n数据分布偏斜程度较大时应用2.中位数n不受极端值影响n数据分布偏

25、斜程度较大时应用3.平均数n易受极端值影响n数学性质优良n数据对称分布或接近对称分布时应用41高等课堂习题1、一家汽车零售店中10名员工在某个月售出的汽车数量按升序排列如下:2,4,10,10,12,12,14,15。计算售出汽车数量的(a)均值;(b)中位数;(c)众数。2、八名销售员售出的中央空调数按升序排列如下:5,8,11,11,11,14,16.计算这八名销售员销售量的四分位数。42高等课堂1、解:(a)均值(b)中位数(c)众数为10.43高等课堂2、解:44高等课堂3.2 离中趋势的测度离中趋势的测度1.数据分布的另一个重要特征数据分布的另一个重要特征数据分布的另一个重要特征数据

26、分布的另一个重要特征2.反映各变量值远离其中心值的程度(离散程度)反映各变量值远离其中心值的程度(离散程度)反映各变量值远离其中心值的程度(离散程度)反映各变量值远离其中心值的程度(离散程度)3.从另一个侧面说明了集中趋势测度值的代表程度从另一个侧面说明了集中趋势测度值的代表程度从另一个侧面说明了集中趋势测度值的代表程度从另一个侧面说明了集中趋势测度值的代表程度注注注注意意意意:数数数数据据据据的的的的离离离离散散散散程程程程度度度度越越越越大大大大,集集集集中中中中趋趋趋趋势势势势的的的的测测测测度度度度值值值值对对对对该该该该组组组组数数数数据据据据的的的的代代代代表表表表性性性性越越越越

27、差差差差;数数数数据据据据的的的的离离离离散散散散程程程程度度度度越越越越小小小小,集集集集中趋势的测度值对该组数据的代表性越好。中趋势的测度值对该组数据的代表性越好。中趋势的测度值对该组数据的代表性越好。中趋势的测度值对该组数据的代表性越好。不同类型的数据有不同的离散程度测度值不同类型的数据有不同的离散程度测度值不同类型的数据有不同的离散程度测度值不同类型的数据有不同的离散程度测度值45高等课堂下面是两个总体关于年龄分布的数据,相对而言,那个总体的年龄分布分散,差异大些?n46、47、48、49、50、n51、52、53、54n8、15、20、30、50n70、80、85、92总体1总体24

28、6高等课堂离中趋势;数据远离中趋势;数据远离中趋势;数据远离中趋势;数据远离中心的趋势离中心的趋势离中心的趋势离中心的趋势 ( (分散程度分散程度分散程度分散程度) )总体总体总体总体2 2总体总体147高等课堂n3.2.1) 分类数据:异众比率(分类数据:异众比率(variation ratio)n3.2.2)顺序数据:四分位差()顺序数据:四分位差(quartile range )n3.2.3) 数值型数据:数值型数据:n 极差(极差( range )n 平均差(平均差(mean deviation)n 方差和标准差(方差和标准差( Variance and standard deviat

29、ion)n 相对位置的度量:标准分数(相对位置的度量:标准分数( standard score)n 相对离散程度:离散系数(相对离散程度:离散系数( Coefficient of Variation )3.2离中趋势的测度离中趋势的测度48高等课堂3.2.1分类数据:异众比率分类数据:异众比率 (variation ratio)注意:对分类数据离散程度的测度 非众数组的频数占总频数的比率计算公式为 用于衡量众数的代表性49高等课堂 异众比率异众比率(例题分析例题分析)解:解:解:解: 在在所所调调查查的的5050人人当当中中,购购买买其其他他品品牌牌饮饮料料的的人人数数占占70%70%,异异众

30、众比比率率比比较较大大。因因此此,用用“ “可可口口可可乐乐” ”代代表表消消费费者者购购买买饮饮料料品品牌牌的的状状况况,其代表性不是很好其代表性不是很好不同品牌饮料的频数分布不同品牌饮料的频数分布 饮料品牌饮料品牌频数频数比例比例百分比百分比(%) 可口可乐可口可乐 旭日升冰旭日升冰茶茶 百事可乐百事可乐 汇源果汁汇源果汁 露露露露1511 9 6 90.300.220.180.120.183022181218合计合计50110050高等课堂3.2.2 四分位差四分位差(quartile range )注意:注意:对顺序数据离散程度的测度也称为内距或四分间距上四分位数与下四分位数之差n Q

31、d = QU QL反映了中间反映了中间50%数据的离散程度数据的离散程度不受极端值的影响用于衡量中位数的代表性51高等课堂例:假设某班有3个学习小组,统计学期中考试成绩如下表所示:要求:计算三个小组的四分位差。序号1234567第一小组65657575758585第二小组55657575758595第三小组40556585859510052高等课堂解:由题意,可得:53高等课堂3.2.3数值型数据离散程度的度量数值型数据离散程度的度量1、极差(R) (range)离散程度的最简单测度值易受极端值影响未考虑数据的分布7 7 8 8 9 910107 7 8 8 9 9 1010 R = max(

32、xi) - min(xi)计算公式为计算公式为54高等课堂2、平均差(、平均差(mean deviation各变量值与其均值离差绝对值的平均数各变量值与其均值离差绝对值的平均数能全面反映一组数据的离散程度能全面反映一组数据的离散程度数学性质较差,实际中应用较少数学性质较差,实际中应用较少计算公式为计算公式为未分组数据未分组数据未分组数据未分组数据组距分组数据组距分组数据组距分组数据组距分组数据55高等课堂 平均差平均差(例题分析)某电脑公司销售量数据平均差计算表某电脑公司销售量数据平均差计算表 按销售量分组按销售量分组组中值组中值(Mi)频数频数(fi)140150150 160160 170

33、170 180180 190190 200200 210210 220220 230230 240145155165175185195205215225235 4 91627201710 8 4 540302010 01020304050160270320270 0170200240160250合计合计120204056高等课堂 含含义义:每每天天电电脑脑的的日日销销售售量量有有高高有有低低,与与日日销销售量平均数相比,差异有大有小。售量平均数相比,差异有大有小。 平平均均差差表表明明:以以日日平平均均销销售售量量为为中中心心,每每天销售量与平均日销售量的平均差距为天销售量与平均日销售量的平均

34、差距为17台台.57高等课堂3.方差和标准差(方差和标准差( Variance and standard deviation)方差方差 (variance)各变量值与其平均数离差)各变量值与其平均数离差 平方的平均数平方的平均数58高等课堂方差和标准差(方差和标准差( Variance and standard deviation) 标准差标准差 (standard deviation)即方差的算术)即方差的算术 平方根;平方根;其单位与原变量其单位与原变量X的单位相同的单位相同。59高等课堂样本方差和标准差(记住)样本方差和标准差(记住) (simple variance and stand

35、ard deviation)n未分组数据:组距分组数据:组距分组数据:未分组数据:未分组数据:组距分组数据:组距分组数据:方差的计算公式方差的计算公式方差的计算公式方差的计算公式标准差的计算公式标准差的计算公式标准差的计算公式标准差的计算公式注意:注意:样本方差用自样本方差用自由度由度n-1去除去除!60高等课堂方差和标准差的计算(未分组资料)方差和标准差的计算(未分组资料)编号编号甲甲x xi i乙乙x xi i丙丙x xi i甲甲2 2乙乙2 2丙丙2 21 1440 480 490 1936002304002401002 2460 490 495 2116002401002450253

36、3500 500 500 2500002500002500004 4540 510 505 2916002601002550255 5560 520 510 313600270400260100合计合计25002500 25002500 25002500126040012510001250250标准差标准差50.9915.817.9161高等课堂样本标准差(例题分析)(某电脑公司销售量数据平均差计算表某电脑公司销售量数据平均差计算表 按销售量分组按销售量分组组中值组中值(Mi)频数频数(fi)140150150 160160 170170 180180 190190 200200 210210

37、 220220 230230 240145155165175185195205215225235 4 91627201710 8 4 540302010 01020304050160270320270 0170200240160250合计合计1205540062高等课堂 含义:含义:每一天的销售量与平均数相比,每一天的销售量与平均数相比, 平均相差平均相差21.58台台63高等课堂3.2.4 标准分数标准分数 ( standard score)n n注意注意:n 也称标准化值n 对某一个值某一个值在一组数据中相对位置相对位置的度 量n可用于判断一组数据是否有离群点n用于对变量的标准化处理n 计

38、算公式为64高等课堂标准分数标准分数(性性质)n n注注意意: z z分分分分数数数数只只只只是是是是将将将将原原原原始始始始数数数数据据据据进进进进行行行行了了了了线线线线性性性性变变变变换换换换,它它它它并并并并没没没没有有有有改改改改变变变变一一一一个个个个数数数数据据据据在在在在改改改改组组组组数数数数据据据据中中中中的的的的位位位位置置置置,也也也也没没没没有有有有改改改改变变变变该该该该组组组组数数数数分分分分布布布布的的的的形形形形状状状状,而而而而只只只只是是是是将将将将该该该该组组组组数据变为均值为数据变为均值为数据变为均值为数据变为均值为0 0,标准差为,标准差为,标准差为

39、,标准差为1 1。 65高等课堂标准分数标准分数(性性质)1.均值等于02. 方差等于166高等课堂标准化值标准化值(例题分析例题分析)9个家庭人均月收入标准化值计算表个家庭人均月收入标准化值计算表 家庭编号家庭编号人均月收入(元)人均月收入(元) 标准化值标准化值 z 1234567891500 750 7801080 850 960200012501630 0.695-1.042-0.973-0.278-0.811-0.556 1.853 0.116 0.99667高等课堂3.2.5)离散系数(coefficient of variation)1. 标准差与其相应的均值之比2.对数据相对相

40、对离散程度的测度3.消除了数据水平高低和计量单位的影响消除了数据水平高低和计量单位的影响4. 用于对不同组别数据离散程度的比较5. 计算公式为68高等课堂离散系数离散系数(例题分析例题分析)某管理局所属某管理局所属8家企业的产品销售数据家企业的产品销售数据企业编号企业编号产品销售额(万元)产品销售额(万元)x1销售利润(万元)销售利润(万元)x21234567817022039043048065095010008.112.518.022.026.540.064.069.0【 例例例例 】某某管管理理局局抽抽查查了了所所属属的的8 8家家企企业业,其其产产品品销销售售数数据如表。试比较产品销售额

41、与销售利润的离散程度据如表。试比较产品销售额与销售利润的离散程度69高等课堂结结论论: 计算结果表明,v1 0为右偏分布4. 偏态系数 0为左偏分布73高等课堂-4 -3 -2 -1 0 1 2 3 44kg2kg作用力作用力力臂力臂统计动差(矩):利用力的统计动差(矩):利用力的动差来反映数据分布特征的指标。动差来反映数据分布特征的指标。它以次数它以次数 f 为作用力,以变量为作用力,以变量x 为为力臂,并以总次数为单位计算平力臂,并以总次数为单位计算平均动差。均动差。称为随机变量称为随机变量 x 对对a 的的 k 阶矩(动差)阶矩(动差)。令令a,则称为则称为 k 阶阶原点矩原点矩 k令令

42、a ,则称为则称为 k 阶阶中心矩中心矩 k常用的矩:常用的矩:74高等课堂偏态系数 (skewness coefficient)1.根据原始数据计算2.根据分组数据计算75高等课堂偏态系数 (例题分析) 某电脑公司销售量偏态及峰度计算表某电脑公司销售量偏态及峰度计算表 按销售量份组按销售量份组(台台) 组中值组中值(Mi)频数频数 fi140 150150 160160 170170 180180 190190 200200 210210 220220 230230 240145155165175185195205215225235 4 91627201710 8 4 5-256000-24

43、3000-128000 -27000 0 17000 80000 216000 256000 62500010240000 7290000 2560000 270000 0 170000 1600000 64800001024000031250000合计合计120540000 70100000 76高等课堂结论:结论:结论:结论:偏态系数为正值,但与偏态系数为正值,但与0 0的差异不大,说明的差异不大,说明电脑销售量为轻微右偏分布。电脑销售量为轻微右偏分布。77高等课堂峰态及其测定1.统计学家Pearson于1905年首次提出2.数据分布扁平程度的测度,反映数据分布的尖峭程度(与正态分布比较)

44、。3.峰态系数=0扁平峰度适中4.峰态系数0为尖峰分布78高等课堂偏度(偏度(skewness):度量数):度量数据分布非对称方向及程度的指标。据分布非对称方向及程度的指标。SKSTATSTAT79高等课堂峰态系数 (kurtosis coefficient)1.根据原始数据计算2.根据分组数据计算80高等课堂峰态系数 (例题分析) 某电脑公司销售量偏态及峰度计算表某电脑公司销售量偏态及峰度计算表 按销售量份组按销售量份组(台台) 组中值组中值(Mi)频数频数 fi140 150150 160160 170170 180180 190190 200200 210210 220220 23023

45、0 240145155165175185195205215225235 4 91627201710 8 4 5-256000-243000-128000 -27000 0 17000 80000 216000 256000 62500010240000 7290000 2560000 270000 0 170000 1600000 64800001024000031250000合计合计120540000 70100000 81高等课堂结论:结论:结论:结论:峰态系数为负值,但与峰态系数为负值,但与0 0的差异不大,说明的差异不大,说明电脑销售量为轻微扁平分布电脑销售量为轻微扁平分布82高等课堂

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 医学/心理学 > 基础医学

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号