浙江工商大学统计学课件-4变量分布特征的描述

上传人:汽*** 文档编号:576553444 上传时间:2024-08-20 格式:PPT 页数:61 大小:802KB
返回 下载 相关 举报
浙江工商大学统计学课件-4变量分布特征的描述_第1页
第1页 / 共61页
浙江工商大学统计学课件-4变量分布特征的描述_第2页
第2页 / 共61页
浙江工商大学统计学课件-4变量分布特征的描述_第3页
第3页 / 共61页
浙江工商大学统计学课件-4变量分布特征的描述_第4页
第4页 / 共61页
浙江工商大学统计学课件-4变量分布特征的描述_第5页
第5页 / 共61页
点击查看更多>>
资源描述

《浙江工商大学统计学课件-4变量分布特征的描述》由会员分享,可在线阅读,更多相关《浙江工商大学统计学课件-4变量分布特征的描述(61页珍藏版)》请在金锄头文库上搜索。

1、变量分布特征的描述变量分布特征的描述80.00 90.00 75.00 85.00 65.00 74.00 53.00 82.00 87.00 68.0075.00 80.00 72.00 83.00 74.0070.00 93.00 74.00 82.00 62.00 68.00 45.00 82.00 75.00 84.00 70.00 93.00 74.00 82.00 62.0076.00 84.00 85.00 82.00 89.0072.00 78.00 85.00 68.00 60.00 88.00 70.00 60.00 67.00 72.00 85.00 95.00 76.0

2、0 80.00 72.0080.00 90.00 75.00 85.00 65.00 82.00 86.00 79.00 78.00 68.00 72.00 78.00 85.00 68.00 60.00 75.00 80.00 72.00 83.00 74.0073.00 78.00 76.00 81.00 67.0088.00 70.00 60.00 67.00 72.0070.00 75.00 85.00 84.00 74.00 79.00 82.00 86.00 72.00 69.0064.00 68.00 35.00 80.00 79.0078.00 62.00 64.00 68.0

3、0 76.00问:你选择去哪一城市寻找工作?问:你选择去哪一城市寻找工作? 64.00 68.00 35.00 80.00 79.00 82.00 86.00 79.00 78.00 68.0084.00 82.00 78.00 76.00 72.0068.00 45.00 82.00 75.00 84.00 80.00 84.00 88.00 70.00 74.00 73.00 78.00 76.00 81.00 67.0079.00 82.00 86.00 72.00 69.0080.00 84.00 88.00 70.00 74.00 78.00 62.00 64.00 68.00 76

4、.00 76.00 84.00 85.00 82.00 89.0083.00 84.00 87.00 90.00 88.0085.00 95.00 76.00 80.00 72.00 63.00 65.00 71.00 77.00 79.00 83.00 84.00 87.00 90.00 88.0084.00 82.00 78.00 76.00 72.0070.00 75.00 85.00 84.00 74.00 84.00 82.00 78.00 76.00 72.00 84.00 82.00 78.00 76.00 72.0074.00 53.00 82.00 87.00 68.00 6

5、3.00 65.00 71.00 77.00 79.00例:调查例:调查A、B两市各两市各100名本科毕业生就业当年的日工资水平如下:名本科毕业生就业当年的日工资水平如下:例:某县农业部门组织对例:某县农业部门组织对A、B两个水稻品种分别在两个水稻品种分别在4块地上进块地上进行试验,结果如下:行试验,结果如下: 问:作为主管部门,你建议推广哪个品种?问:作为主管部门,你建议推广哪个品种?A品种品种B品种品种试验地试验地类别类别面积面积(公顷)公顷)总产量总产量(公斤)(公斤)试验地试验地类别类别面积面积(公顷)(公顷)总产量总产量(公斤)(公斤)1类类0.086001类类0.074972类类0

6、.054052类类0.096753类类0.107253类类0.053754类类0.097204类类0.10700变量分布特征的描述变量分布特征的描述变量分布特征的描述变量分布特征的描述集中趋势的描述集中趋势的描述离中趋势的描述离中趋势的描述分布形状的描述分布形状的描述变量分布特征的描述变量分布特征的描述思考题思考题集中趋势的描述集中趋势的描述-平均指标平均指标反映被研究总体的一般水平,即总体频率分布的集合中心。反映被研究总体的一般水平,即总体频率分布的集合中心。 算术平均数算术平均数 数值型平均数数值型平均数 调和平均数调和平均数种类种类 几何平均数几何平均数 众数众数 位置型平均数位置型平均

7、数 中位数中位数 四分位数四分位数比较及适用数据类型比较及适用数据类型比较比较比较比较诗一首:诗一首: 张家有财一千万,九个邻居穷光蛋。张家有财一千万,九个邻居穷光蛋。 平均起来算一算,家家都是张百万。平均起来算一算,家家都是张百万。什么是中国特色:什么是中国特色: 城市象欧洲,农村象非洲城市象欧洲,农村象非洲 中国特色中国特色 = = 欧洲欧洲 + + 非洲非洲数据:数据:2006年年11月,城镇居民家庭人均月可支配收入月,城镇居民家庭人均月可支配收入 全国:全国:964.16元元 浙江:浙江:1308.93元元 平均指标的适用原则:与变异指标结合运用平均指标的适用原则:与变异指标结合运用集

8、中趋势的描述集中趋势的描述-平均指标平均指标平均指标:平均指标:算术平均数算术平均数 (Arithmetic mean)Arithmetic mean)计算:未分组数据计算:未分组数据 按单变量分组数据按单变量分组数据 按组距分组数据按组距分组数据适用:定距级以上数据的集中趋势描述。适用:定距级以上数据的集中趋势描述。平均指标:平均指标:算术平均数算术平均数 (Arithmetic mean)Arithmetic mean) 关于工人日加工零件数的平均水平关于工人日加工零件数的平均水平 例例1:Xi(个):个):105,110,115,120,125,130,135 120(个)(个) 例例2

9、: 120.7(个)(个) 例例3: 123.2(个)(个)Xi(个)个)105110115120125130135Fi(人)人)358141064Xi(个)个)105110110115115120120125125130130135135140Fi(人)人)358141064组中值组中值(个个)107.5112.5117.5122.5127.5132.5137.5统一课件例统一课件例3.2 (1)各变量值与其算术平均数的离差各变量值与其算术平均数的离差之和等于零之和等于零(2)各变量值与其算术平均数的离差各变量值与其算术平均数的离差平方和最小平方和最小(3)两个独立的同性质变量代数和的平两个

10、独立的同性质变量代数和的平均数等于各变量平均数的代数和均数等于各变量平均数的代数和(4)两个独立的同性质变量乘积的平两个独立的同性质变量乘积的平均数等于各变量平均数的乘积均数等于各变量平均数的乘积算术平均数的数学性质算术平均数的数学性质平均指标:平均指标:算术平均数算术平均数 (Arithmetic mean)Arithmetic mean)平均指标:平均指标:调和平均数调和平均数(Harmonic mean)Harmonic mean)计算:未分组数据计算:未分组数据 单变量分组数据单变量分组数据( (组距分组数据组距分组数据 ) ) 适用:定距级以上数据的集中趋势描述适用:定距级以上数据的

11、集中趋势描述平均指标:平均指标:调和平均数调和平均数(Harmonic mean)Harmonic mean)例例1 1:三个工人加工某零件所需时间分别为:三个工人加工某零件所需时间分别为1010、2020、2525分钟,则分钟,则 (1 1)各做)各做1010小时工,平均每零件所耗加工时间?分钟小时工,平均每零件所耗加工时间?分钟 (1 1)平均指标:平均指标:调和平均数调和平均数(Harmonic mean)Harmonic mean)例例1 1:三个工人加工某零件所需时间分别为:三个工人加工某零件所需时间分别为1010、2020、2525分钟,则分钟,则 (2 2)各完成)各完成1010

12、件零件,平均每零件所耗加工时间?分钟件零件,平均每零件所耗加工时间?分钟(2 2)调和平均数与算术平均数的区别仅在于:根据资料条件不同,调和平均数与算术平均数的区别仅在于:根据资料条件不同,采用的计算形式不同采用的计算形式不同 教材教材P64调和平均数与算术平均数的比较调和平均数与算术平均数的比较产值利产值利润率润率()一一 季季 度度二二 季季 度度企业数企业数(个个)实际产值实际产值(万元万元)企业数企业数(个个)实际利润实际利润(万元万元)510305700507101020702050080351420305022500202250合合 计计150487001506474例:设有某行业

13、例:设有某行业150个企业的有关产值和利润资料如表所示,个企业的有关产值和利润资料如表所示,计算该行业一、二季度的平均产值利润率计算该行业一、二季度的平均产值利润率第一季度的平均产值利润率?第一季度的平均产值利润率?第二季度的平均产值利润率?第二季度的平均产值利润率?本质:产值利润率本质:产值利润率=利润总额利润总额 / 产值总额产值总额调和平均数与算术平均数的比较调和平均数与算术平均数的比较一一 季季 度度二二 季季 度度班组班组平均劳动生产平均劳动生产率(件率(件/工时)工时)实际工时实际工时(小时)(小时)平均劳动生产平均劳动生产率(件率(件/工时)工时)实际实际产量产量(件件)1234

14、12162028200320300180243240562400512060005040合计合计 100018560例:某车间各班组工人的平均劳动生产率、实际工时和产例:某车间各班组工人的平均劳动生产率、实际工时和产量数据如表所示,要求计算车间平均劳动生产率量数据如表所示,要求计算车间平均劳动生产率 调和平均数与算术平均数的比较调和平均数与算术平均数的比较第一季度的平均劳动生产率?第一季度的平均劳动生产率?第二季度的平均劳动生产率?第二季度的平均劳动生产率?本质:劳动生产率本质:劳动生产率=总产出总产出(产量产量) / 劳动投入劳动投入(工时工时)件件/ /工时工时 件件/ /工时工时调和平均

15、数与算术平均数的比较调和平均数与算术平均数的比较教材教材P65-67:3、由相对数和平均数计算平均数由相对数和平均数计算平均数与绝对数计算平均数并无本质差异与绝对数计算平均数并无本质差异关键:平均的标志其本质含义是什么关键:平均的标志其本质含义是什么掌握:掌握:调和平均数与算术平均数的比较调和平均数与算术平均数的比较平均指标:平均指标:几何平均数几何平均数(Geometric mean)Geometric mean)计算:未分组数据计算:未分组数据 单变量分组数据单变量分组数据 组距分组数据组距分组数据适用:定距级以上数据的集中趋势描述。适用:定距级以上数据的集中趋势描述。 标志总量表现为各标

16、志的乘积,而不是各标志的加和标志总量表现为各标志的乘积,而不是各标志的加和平均指标:平均指标:几何平均数几何平均数(Geometric mean)Geometric mean)例例1 1:“九五九五”期间,浙江期间,浙江GDPGDP年发展速度(以上年为年发展速度(以上年为100100) “ “九五九五”期间平均发展速度:期间平均发展速度:例例2 2:某投资银行:某投资银行1010年期的投资利息按复利计算。规定第年期的投资利息按复利计算。规定第1 1、2 2年年的年利率为的年利率为3 3,第,第3 35 5年的年利率为年的年利率为5 5,第,第6 61010年的年的年利率为年利率为8 8。则。则

17、1010年的平均年利率为:年的平均年利率为:19961997199819992000发展速度()112.70110.98110.10110.00111.00算术平均数的特点算术平均数的特点 (1)受极端变量值影响大受极端变量值影响大 (2) 依据组距分组数列计算时,组中值有较大假定性依据组距分组数列计算时,组中值有较大假定性调和平均数的特点调和平均数的特点 (1) 易受极端值的影响,且受极小值的影响比受极大值的影易受极端值的影响,且受极小值的影响比受极大值的影响更大。响更大。 (2)只要有一个变量值为零,就不能计算调和平均数。只要有一个变量值为零,就不能计算调和平均数。 (3)依据组距分组数列

18、计算时,组中值有较大假定性依据组距分组数列计算时,组中值有较大假定性 (4)调和平均数应用的范围较小调和平均数应用的范围较小几何平均数、算术平均数和调和平均数的特点几何平均数、算术平均数和调和平均数的特点几何平均数特点几何平均数特点 (1)受极端值的影响较算术平均数小。受极端值的影响较算术平均数小。 (2)如果变量值有负值,计算出的几何平均数就会成为负数如果变量值有负值,计算出的几何平均数就会成为负数或虚数。或虚数。 (3)仅适用于具有等比或近似等比关系的数据。仅适用于具有等比或近似等比关系的数据。 (4)其对数是各变量值对数的算术平均数。其对数是各变量值对数的算术平均数。几何平均数、算术平均

19、数和调和平均数的特点几何平均数、算术平均数和调和平均数的特点几何平均数、算术平均数和调和平均数的关系几何平均数、算术平均数和调和平均数的关系幂平均函数幂平均函数无实际意义无实际意义 教材教材P68平均指标:平均指标:众数众数(ModeMode)众数:众数:样本数据集合中出现频次最高的那个样本值。样本数据集合中出现频次最高的那个样本值。 (众数区间、单一众数和复众数)(众数区间、单一众数和复众数)计算:计算:定类数据定类数据 定序数据定序数据 直接观察直接观察 按单变量分组的定距、定比数据按单变量分组的定距、定比数据 众数:众数:计算:计算: 按组距分组的定距、定比数据:按组距分组的定距、定比数

20、据:参:黄良文统计学参:黄良文统计学原理,中国统原理,中国统计出版社,计出版社,2003平均指标:平均指标:众数众数(ModeMode)众数:众数:计算:计算:注意:注意:1 1、适用于所有类型数据的集中趋势描述、适用于所有类型数据的集中趋势描述 2 2、无众数的情况、无众数的情况平均指标:平均指标:众数众数(ModeMode)平均指标:平均指标:众数众数(ModeMode)例例1 1:某单位职工受教育程度的结构:某单位职工受教育程度的结构 = =大学大学例例2 2:某单位职工受教育程度分析:某单位职工受教育程度分析 = =初中、高中初中、高中小学初中高中大学研究生合计人数(人)1229216

21、比重()6.2512.5012.5056.2512.50100.00小学初中高中大学研究生合计人数(人)1553216比重()6.2531.2531.2518.7512.50100.00平均指标:平均指标:众数众数(Mode) 例例3 3:某:某公司公司3000名职工月收入分布情况名职工月收入分布情况 众数区间:众数区间:10001200 众众 数:数:工资(元)人数(人)累计人数(人)400600600800800100010001200120014001400160016001800180020001503206509504503051403515047011202070252028252

22、9653000众数的特点:众数的特点:(1)众数不受分布数列的极大或极小值的影响。众数不受分布数列的极大或极小值的影响。(2)当分组数列没有任何一组的次数占多数,而是近似于均匀分当分组数列没有任何一组的次数占多数,而是近似于均匀分布时,则该次数分配数列无众数。布时,则该次数分配数列无众数。(3)如果与众数组相比邻的上下两组的次数相等,则众数组的组如果与众数组相比邻的上下两组的次数相等,则众数组的组中值就是众数值;如果与众数组比邻的上一组的次数较多,中值就是众数值;如果与众数组比邻的上一组的次数较多,则众数在众数组内会偏向该组下限;如果与众数组比邻的下则众数在众数组内会偏向该组下限;如果与众数组

23、比邻的下一组的次数较多,则众数在众数组内会偏向该组上限。一组的次数较多,则众数在众数组内会偏向该组上限。(4)缺乏敏感性。缺乏敏感性。平均指标:平均指标:众数众数(Mode)平均指标:平均指标:中位数(中位数(Median)Median)中位数:设数据集合中所有数据的排序结果为:中位数:设数据集合中所有数据的排序结果为: 则序列中处于则序列中处于“正中间位置正中间位置”上的数据为中位数。上的数据为中位数。 即:即: 当当N N为奇数时;为奇数时; 当当N N为偶数时;为偶数时;计算:计算: 定序型数据定序型数据 按单变量分组的定距、定比型数据按单变量分组的定距、定比型数据 排序直接观察排序直接

24、观察中位数:中位数:计算:计算: 按组距分组的定距、定比型数据:按组距分组的定距、定比型数据:参:黄良文统计学参:黄良文统计学原理,中国统原理,中国统计出版社,计出版社,2003累计向上频数曲线累计向上频数曲线平均指标:平均指标:中位数(中位数(Median)Median)中位数:中位数:计算:计算: 注意:注意: N N为奇数时,适用于定序级以上数据的集中趋势描述;为奇数时,适用于定序级以上数据的集中趋势描述; N N为偶数时,适用于定距、定比型数据的集中趋势的描述。为偶数时,适用于定距、定比型数据的集中趋势的描述。平均指标:平均指标:中位数(中位数(Median)Median)平均指标:平

25、均指标:中位数中位数(Median)Median)例例1 1:某单位职工受教育程度:某单位职工受教育程度 例例2 2:某公司:某公司30003000名职工月收入分布名职工月收入分布 小学初中高中大学研究生合计人数(人)1239217累计人数(人)136151717600800100012001400160018002000人数(人)15032065095045030514035累计人数(人) 150770112020702520282529653000平均指标:平均指标:中位数中位数(Median)Median)例例3 3:某公司:某公司30003000名职工月收入分布情况名职工月收入分布情况

26、 工资(元)人数(人)累计人数(人)4006006008008001000100012001200140014001600160018001800200015032065095045030514035150470112020702520282529653000中位数的特点:中位数的特点:(1)中位数是以它在所有标志值中所处的位置确定的全中位数是以它在所有标志值中所处的位置确定的全体单位标志值的代表值,不受分布数列的极大或极体单位标志值的代表值,不受分布数列的极大或极小值影响,从而在一定程度上提高了中位数对分布小值影响,从而在一定程度上提高了中位数对分布数列的代表性。数列的代表性。(2)有些离散

27、型变量的单项式数列,当次数分布偏态时,有些离散型变量的单项式数列,当次数分布偏态时,中位数的代表性会受到影响。中位数的代表性会受到影响。(3)缺乏敏感性。缺乏敏感性。 平均指标:平均指标:中位数中位数(Median)Median)平均指标:平均指标:四分位数(四分位数(Quartile)Quartile)四分位数:四分位数:设数据集合中所有数据的排序结果为:设数据集合中所有数据的排序结果为: 则序列中处于则序列中处于“25“25N”N”位置的数据称为下四分位数位置的数据称为下四分位数 ,处于,处于“75“75N”N”位置的数据称为上四分位数位置的数据称为上四分位数 ,统称为四分位数。,统称为四

28、分位数。 上下四分位数描述了集中分布的区间。上下四分位数描述了集中分布的区间。 ( (类似地有:八分位数、十分位数、百分位数等类似地有:八分位数、十分位数、百分位数等) )适用:适用:( (与中位数相同与中位数相同) ) N N为奇数时,适用于定序级以上数据的描述;为奇数时,适用于定序级以上数据的描述; N N为偶数时,仅适用于定距级以上数据的描述。为偶数时,仅适用于定距级以上数据的描述。25%N50%N75%N1 QL ME QU N教材教材P71-72平均指标平均指标中位数、众数和算术平均数的关系中位数、众数和算术平均数的关系2.在左偏分布时在左偏分布时1.在对称分布时在对称分布时3.在右

29、偏分布时在右偏分布时4.在适度偏态时在适度偏态时众数与算术平均数的距离约为中众数与算术平均数的距离约为中位数与算术平均数距离的位数与算术平均数距离的3 3倍倍例:一组工人的月收入众数为例:一组工人的月收入众数为1700元,月收入的算元,月收入的算术平均数为术平均数为2000元,则月收入的中位数近似值元,则月收入的中位数近似值是多少?是多少?平均指标平均指标平均指标平均指标数据类型定类数据定序数据定距数据定比数据适用的测度值 *众数 中位数 算术平均数 算术平均数四分位数众数调和平均数众数中位数几何平均数四分位数中位数四分位数众数集中趋势的描述集中趋势的描述-变异指变异指标标变异指标:描述总体频

30、率分布的离中趋势或分散程度。变异指标:描述总体频率分布的离中趋势或分散程度。作用:反映现象变动的均匀性和稳定程度作用:反映现象变动的均匀性和稳定程度 说明平均指标的代表性程度说明平均指标的代表性程度 分析总体分布偏离正态的程度分析总体分布偏离正态的程度种类:种类: 异众比率异众比率 平均差平均差 极差极差 标准差标准差 四分位差四分位差 离散系数离散系数比较比较标志变异指标标志变异指标: : 异众比率(异众比率(Variation ratioVariation ratio)异众比率:异众比率:非众数组频数占总频数的比重非众数组频数占总频数的比重计计 算:算:适适 用:用:适用于所有类型的数据,

31、但主要用于定类适用于所有类型的数据,但主要用于定类数据离散程度的描述。数据离散程度的描述。标志变异指标标志变异指标: : 极差极差(Range)Range)极差:极差:又称全距,总体各单位标志值中最大值与最小值之差。又称全距,总体各单位标志值中最大值与最小值之差。计算:计算:未分组或单变量分组数据:未分组或单变量分组数据: 组距分组数据:组距分组数据:适用:适用:适用于定序级以上数据;适用于定序级以上数据; 极差仅受极端变量值的影响,不一定能反映标志值极差仅受极端变量值的影响,不一定能反映标志值离散的一般水平,通常应用于误差控制、波幅控制。离散的一般水平,通常应用于误差控制、波幅控制。 四分位

32、差:四分位差:上四分位数与下四分位数之差,描述分布在中间上四分位数与下四分位数之差,描述分布在中间的的5050数据的离散程度。数据的离散程度。计计 算:算:适适 用:用:适用于定序级以上数据;适用于定序级以上数据; 与极差相比,其优点在于不受极端变量值影响。与极差相比,其优点在于不受极端变量值影响。标志变异指标标志变异指标: : 四分位差四分位差(Quartile deviation)Quartile deviation)平均差:各标志水平与其算术平均数离差绝对值的算术平均数。平均差:各标志水平与其算术平均数离差绝对值的算术平均数。计算:未分组数据:计算:未分组数据: 单变量分组数据:单变量分

33、组数据: 组距分组数据:组距分组数据:适用:适用:定距级以上数据;定距级以上数据; Md能全面能全面准确反映一组数据相对于分布中心(平均数)的离准确反映一组数据相对于分布中心(平均数)的离散程度,但由于绝对值符号的存在给数据处理带来不便,散程度,但由于绝对值符号的存在给数据处理带来不便,实践中较少运用。实践中较少运用。标志变异指标标志变异指标: :平均差平均差( (Mean deviation)Mean deviation)标准差:标志水平与其算术平均数的离差平方的算术平均数的标准差:标志水平与其算术平均数的离差平方的算术平均数的平方根。平方根。计计 算:未分组数据:算:未分组数据: 单变量分

34、组数据:单变量分组数据: 组距分组数据:组距分组数据:方方 差:标准差的平方。差:标准差的平方。适适 用:用:定距级以上数据;定距级以上数据;标志变异指标标志变异指标: :标准差标准差( (Standard deviation)Standard deviation)教材教材P78P78、统一课件统一课件PPT74PPT74关于工人日加工零件数的平均水平关于工人日加工零件数的平均水平例例1:Xi(个):个):105,110,115,120,125,130,135例例2:例例3:标志变异指标标志变异指标: :标准差标准差( (Standard deviation)Standard deviatio

35、n)Xi(个)105110115120125130135Fi(人)358141064Xi(个)105110110115115120120125125130130135135140Fi(人)358141064组中值(个)107.5112.5117.5122.5127.5132.5137.5(总体方差和总体方差和)样本方差:样本方差:未分组原始数据:未分组原始数据:分组数据:分组数据:标志变异指标标志变异指标: :标准差标准差( (Standard deviation)Standard deviation)总方差、组间方差和组内方差总方差、组间方差和组内方差总总 方方 差:总体各标志水平对总平均差

36、:总体各标志水平对总平均数的方差数的方差组间方差:各组平均数对总平均数组间方差:各组平均数对总平均数的方差的方差组内方差:各组内部标志水平对组组内方差:各组内部标志水平对组平均数的方差平均数的方差标志变异指标标志变异指标: : 标准差标准差( (Standard Standard deviation)deviation)三者关系:三者关系:组距式分组数据中的组距式分组数据中的描述的是组间差异,即组中值的离散程度描述的是组间差异,即组中值的离散程度极差、平均差、标准差的关系:极差、平均差、标准差的关系:在总体各标志水平的分布接近正态的条件下:在总体各标志水平的分布接近正态的条件下:在总体各标志水

37、平的分布接近正态的条件下:在总体各标志水平的分布接近正态的条件下: 以此可以作三者间的推算以此可以作三者间的推算 标志变异指标标志变异指标: : 标准差标准差( (Standard Standard deviation)deviation) ( (极差、四分位差、平均差、标准差均为有名数,受计量单位及量极差、四分位差、平均差、标准差均为有名数,受计量单位及量纲的影响而不便于不同总体间离散度的比较纲的影响而不便于不同总体间离散度的比较)离散系数:离散系数:标志变异绝对值与标志算术平均数的比值。标志变异绝对值与标志算术平均数的比值。计计 算:极差系数:算:极差系数: 四分位差系数:四分位差系数:

38、平均差系数:平均差系数: 标准差系数:标准差系数:适适 用:定距级以上数据用:定距级以上数据 通常运用标准差系数通常运用标准差系数标志变异指标标志变异指标: :离散系数离散系数( (Coefficient of variation)Coefficient of variation)例:例:某工厂某工厂120120名工人的日产零件分布:名工人的日产零件分布: 某班级同学的成绩分布:某班级同学的成绩分布:日产零件(个)20222426303233合计合计工人数(人)10122530181510120成绩(分)5565758595合计合计学生数(人)128241550标志变异指标标志变异指标: :离

39、散系数离散系数( (Coefficient of variation)Coefficient of variation)变异指标:变异指标:标志变异指标标志变异指标 数据的类型和所适用的离散程度测度值数据的类型和所适用的离散程度测度值 为该数据类型最适合用的测度值为该数据类型最适合用的测度值数据类型定类数据定序数据定距和定比数据适用的测度值 *异众比率 四分位差 方差或标准差极差 离散系数(比较时用)异众比率平均差极差四分位差异众比率统一课件两例统一课件两例分布变异指标分布变异指标偏斜程度偏斜程度尖峭程度尖峭程度偏态系数偏态系数四分位偏度四分位偏度峰度峰度分位数峰度分位数峰度分布变异指标:分布

40、变异指标:偏态系数偏态系数( (Coefficient of Coefficient of skewnessskewness)偏态系数:描述总体各标志分布的不对称程度。偏态系数:描述总体各标志分布的不对称程度。计计 算:未分组数据:算:未分组数据: 单变量分组数据:单变量分组数据: 组距分组数据:组距分组数据:运运 用:用: ,为对称分布(与正态分布相似);,为对称分布(与正态分布相似); ,为右偏态分布;,为右偏态分布; ,为左偏态分布。,为左偏态分布。 越大,偏斜的程度越大。越大,偏斜的程度越大。例:农村居民家庭按纯收入分组的数据例:农村居民家庭按纯收入分组的数据* *说明居民收入的分布为

41、右偏态分布。说明居民收入的分布为右偏态分布。按纯收入分(元)500以下50010001000150015002000户数比重(%)2.2812.4520.3519.52按纯收入分(元) 20002500250030003000350035004000户数比重(%)14.9310.356.564.13按纯收入分(元) 40004500450050005000以上户数比重(%)2.681.814.94资料来源:中国统计年鉴1998,344页,中国统计出版社,1998。*本表对原数据进行了重新分组整理。分布变异指标:分布变异指标:偏态系数偏态系数( (Coefficient of Coefficie

42、nt of skewnessskewness)四分位偏度:描述总体各标志分布的不对称程度。四分位偏度:描述总体各标志分布的不对称程度。 ( (与偏态系数比较,四分位数据不受极端变量值的影响与偏态系数比较,四分位数据不受极端变量值的影响) )计计 算:算:运运 用:用: ,为对称分布;,为对称分布; ,为右偏态分布;,为右偏态分布; ,为左偏态分布。,为左偏态分布。 越大,偏斜的程度越大。越大,偏斜的程度越大。分布变异指标:分布变异指标:四分位偏度四分位偏度 ( (类似地,可以有八分位偏度、十分位偏度类似地,可以有八分位偏度、十分位偏度) )峰度:峰度:描述总体各标志分布邻近平均数的集中程度,即

43、分布曲描述总体各标志分布邻近平均数的集中程度,即分布曲线的尖峭程度。线的尖峭程度。计算:计算:未分组数据:未分组数据: 单变量分组数据:单变量分组数据: 组距分组数据:组距分组数据:运用:运用: ,与正态分布的尖峭度相同;,与正态分布的尖峭度相同; ,为尖峰分布;,为尖峰分布; ,为平峰分布。,为平峰分布。分布变异指标:分布变异指标:峰度峰度( (Kurtosis)Kurtosis)分布变异指标:分布变异指标:峰度峰度( (Kurtosis)Kurtosis)例:农村居民家庭按纯收入分组的数据例:农村居民家庭按纯收入分组的数据* * 按纯收入分(元)500以下50010001000150015

44、002000户数比重(%)2.2812.4520.3519.52按纯收入分(元) 20002500250030003000350035004000户数比重(%)14.9310.356.564.13按纯收入分(元) 40004500450050005000以上户数比重(%)2.681.814.94由于由于 ,说明居民收入密集地分布于,说明居民收入密集地分布于2142.9元元附近附近分布变异指标:分布变异指标:分位数峰度分位数峰度分位数峰度:描述总体各标志分布的尖峭程度。分位数峰度:描述总体各标志分布的尖峭程度。 ( (与矩法峰度比较,分位数峰度不受极端变量值的影响与矩法峰度比较,分位数峰度不受极

45、端变量值的影响) )计计 算:算:运运 用:用: ,与正态分布的尖峭度相同;,与正态分布的尖峭度相同; ,为尖峰分布;,为尖峰分布; ,为平峰分布。,为平峰分布。思考练习题思考练习题 1、在金融证券领域,一项投资的预期收益率的变化通常用在金融证券领域,一项投资的预期收益率的变化通常用该项投资的风险来衡量。预期收益率的变化越小,投资风险越该项投资的风险来衡量。预期收益率的变化越小,投资风险越低;预期收益率的变化越大,投资风险就越高。下面的两个直低;预期收益率的变化越大,投资风险就越高。下面的两个直方图,分别反映了方图,分别反映了200种商业类股票和种商业类股票和200种高科技类股票的收种高科技类

46、股票的收益率分布:益率分布:(a)商业类股票(b)高科技类股票频 数-30 0 30 60-30 0 30 60 50 25 50 25收益率()收益率()频 数收益率收益率(%)55-88-1010-1212-1515-2020-2525-30股票数股票数(只只)3325248302582200只商业类股票的收益率分布:只商业类股票的收益率分布:收益率收益率(%)50股票数股票数(只只)3105848452592200只科技类股票的收益率分布:只科技类股票的收益率分布:问:你愿意投资哪类股票?问:你愿意投资哪类股票?思考练习题思考练习题思考练习题思考练习题2、某试验站对、某试验站对A、B两个水稻品种分别在两个水稻品种分别在4块地上进块地上进行试验,结果如下:行试验,结果如下: 问:问:A、B两个品种哪个更有推广价值?两个品种哪个更有推广价值?A品种品种B品种品种序号序号面积面积(公顷)(公顷)总产量总产量(公斤)(公斤)序号序号面积面积(公顷)(公顷)总产量总产量(公斤)(公斤)10.0860010.0749720.0540520.0967530.1072530.0537540.0972040.10700

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 研究生课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号