质量管理方法工具培训数据分布

上传人:ni****g 文档编号:568594028 上传时间:2024-07-25 格式:PPT 页数:80 大小:1.28MB
返回 下载 相关 举报
质量管理方法工具培训数据分布_第1页
第1页 / 共80页
质量管理方法工具培训数据分布_第2页
第2页 / 共80页
质量管理方法工具培训数据分布_第3页
第3页 / 共80页
质量管理方法工具培训数据分布_第4页
第4页 / 共80页
质量管理方法工具培训数据分布_第5页
第5页 / 共80页
点击查看更多>>
资源描述

《质量管理方法工具培训数据分布》由会员分享,可在线阅读,更多相关《质量管理方法工具培训数据分布(80页珍藏版)》请在金锄头文库上搜索。

1、常用质量管理方法、工具北京科立特管理咨询公司WWW.QMC.COM.CN QMCQMC.COM.CNWWW.QMC.COM.CN QMCQMC.COM.CN1丰田公司利用统计技术的变化87 88 89 90 91 92公司外发表件数多变量分析试验设计可靠性一般的SQC2n n第一部分:数据分布特征第一部分:数据分布特征n n第二部分:第二部分:QCQC老七种工具老七种工具n n第三部分:第三部分:QCQC新七种工具新七种工具n n第四部分:统计过程控制第四部分:统计过程控制n n第五部分:统计推断第五部分:统计推断n n第六部分:回归分析第六部分:回归分析n n第七部分:方差分析第七部分:方差

2、分析n n第八部分:试验设计第八部分:试验设计主要内容主要内容3第一部分第一部分数据分布特征4数据分布特征的测度n n数据基本统计量数据基本统计量数据基本统计量数据基本统计量n n集中趋势的测度集中趋势的测度集中趋势的测度集中趋势的测度 n n离散程度的测度离散程度的测度离散程度的测度离散程度的测度n n偏态与峰度的测度偏态与峰度的测度偏态与峰度的测度偏态与峰度的测度5学习目标1. 1.掌握数据基本统计量掌握数据基本统计量掌握数据基本统计量掌握数据基本统计量2. 2.掌握集中趋势各测度值的计算方法掌握集中趋势各测度值的计算方法掌握集中趋势各测度值的计算方法掌握集中趋势各测度值的计算方法3. 3

3、.掌握集中趋势不同测度值的特点和应用场合掌握集中趋势不同测度值的特点和应用场合掌握集中趋势不同测度值的特点和应用场合掌握集中趋势不同测度值的特点和应用场合4. 4.掌握离散程度各测度值的计算方法掌握离散程度各测度值的计算方法掌握离散程度各测度值的计算方法掌握离散程度各测度值的计算方法5. 5.掌握离散程度不同测度值的特点和应用场合掌握离散程度不同测度值的特点和应用场合掌握离散程度不同测度值的特点和应用场合掌握离散程度不同测度值的特点和应用场合6. 6.掌握偏态与峰度测度方法掌握偏态与峰度测度方法掌握偏态与峰度测度方法掌握偏态与峰度测度方法7. 7.用软件计算描述统计量并进行分析用软件计算描述统

4、计量并进行分析用软件计算描述统计量并进行分析用软件计算描述统计量并进行分析6基本统计量n n最大值最大值n n最小值最小值n n平均值平均值n n中位数中位数n n众数众数n n标准偏差标准偏差n n偏度偏度n n峰度峰度789数据分布的特征集中趋势集中趋势集中趋势集中趋势 ( (位置位置位置位置) )离中趋势离中趋势离中趋势离中趋势 ( (分散程度分散程度分散程度分散程度) )偏态和峰度偏态和峰度偏态和峰度偏态和峰度(形状)(形状)(形状)(形状)10数据的特征和测度数据的特征和测度数据的特征和测度分布的形状分布的形状离散程度离散程度集中趋势集中趋势众众众众众众 数数数数数数中位数中位数中位

5、数中位数中位数中位数均均均均均均 值值值值值值离散系数离散系数离散系数离散系数离散系数离散系数方差和标准差方差和标准差方差和标准差方差和标准差方差和标准差方差和标准差峰峰峰峰峰峰 度度度度度度四分位差四分位差四分位差四分位差四分位差四分位差异众比率异众比率异众比率异众比率异众比率异众比率偏偏偏偏偏偏 态态态态态态11集中趋势的测度一一. 定类数据:众数定类数据:众数二二. 定序数据:中位数和分位数定序数据:中位数和分位数三三. 定距和定比数据:均值定距和定比数据:均值四四. 众数、中位数和均值的比较众数、中位数和均值的比较12数据特征分布的和测度数据的特征和测度数据的特征和测度分布的形状分布的

6、形状集中趋势集中趋势离散程度离散程度众众众众众众 数数数数数数中位数中位数中位数中位数中位数中位数均均均均均均 值值值值值值离散系数离散系数离散系数离散系数离散系数离散系数方差和标准差方差和标准差方差和标准差方差和标准差方差和标准差方差和标准差峰峰峰峰峰峰 度度度度度度四分位差四分位差四分位差四分位差四分位差四分位差异众比率异众比率异众比率异众比率异众比率异众比率偏偏偏偏偏偏 态态态态态态13集中趋势1. 1.一组数据向其中心值靠拢的倾向和程度一组数据向其中心值靠拢的倾向和程度2. 2.测度集中趋势就是寻找数据一般水平的代表值或中心值测度集中趋势就是寻找数据一般水平的代表值或中心值3. 3.不

7、同类型的数据用不同的集中趋势测度值不同类型的数据用不同的集中趋势测度值4. 4.低层次数据的集中趋势测度值适用于高层次的测量数据,低层次数据的集中趋势测度值适用于高层次的测量数据,反过来,高层次数据的集中趋势测度值并不适用于低层次反过来,高层次数据的集中趋势测度值并不适用于低层次的测量数据的测量数据5. 5.选用哪一个测度值来反映数据的集中趋势,要根据所掌握选用哪一个测度值来反映数据的集中趋势,要根据所掌握的数据的类型来确定的数据的类型来确定14定类数据:众数15众 数1. 1.集中趋势的测度值之一集中趋势的测度值之一2. 2.出现次数最多的变量值出现次数最多的变量值3. 3.不受极端值的影响

8、不受极端值的影响4. 4.可能没有众数或有几个众数可能没有众数或有几个众数5. 5.主要用于定类数据,也可用于定序主要用于定类数据,也可用于定序数据和数值型数据数据和数值型数据16众数的不唯一性无众数无众数原始数据: 10 5 9 12 6 8一个众数一个众数一个众数一个众数原始数据原始数据: 6 : 6 5 5 9 8 9 8 5 55 5多于一个众数多于一个众数多于一个众数多于一个众数原始数据原始数据: 25 : 25 28 2828 28 36 36 42 4242 4217未分组数据的众数表表表表3-1 3-1 某产品缺陷类型的频数分布某产品缺陷类型的频数分布某产品缺陷类型的频数分布某

9、产品缺陷类型的频数分布 1001001 1200200合计合计合计合计56.056.025.525.54.54.58.08.05.05.01.01.00.5600.5600.2550.2550.0450.0450.0800.0800.0500.0500.0100.01011211251519 9161610102 2 裂纹裂纹裂纹裂纹 砂眼砂眼砂眼砂眼 毛刺毛刺毛刺毛刺 划痕划痕划痕划痕 断裂断裂断裂断裂 其他缺陷其他缺陷其他缺陷其他缺陷频率频率频率频率(%)(%)比例比例比例比例人数人数人数人数( (人人人人) )缺陷类型缺陷类型缺陷类型缺陷类型【例】【例】【例】【例】根据下表中的数据,计算

10、缺陷众数根据下表中的数据,计算缺陷众数根据下表中的数据,计算缺陷众数根据下表中的数据,计算缺陷众数解解解解:这这里里的的变变量量为为“ “缺缺陷陷类类型型” ”,这这是是个个定定类类变变量量,不不同同类类型型的的缺缺陷陷就就是是变变量量值值。我我们们看看到到,在在所所统统计计的的报报废废200200个个产产品品当当中中,裂裂纹纹缺缺陷陷数数最最多多,为为112112个个,占占总总被被统统计计个个数数的的56%56%,因因此此众众数数为为“ “裂纹裂纹” ”这一类别,即这一类别,即 MMo o裂纹裂纹裂纹裂纹18未分组数据的众数【例】【例】【例】【例】根据下表中的数据,计算众数根据下表中的数据,

11、计算众数解解解解:这这里里的的数数据据为为定定序序数数据据。变变量量为为“ “回回答答类类别别” ”。客客户户中中对对产产品品表表示示不不满满意意的的户户数数最最多多,为为108108户户,因因此此众众数数为为“ “不不满满意意” ”这这一一类别,即类别,即 MMo o不满意不满意不满意不满意客户客户客户客户回答类别回答类别回答类别回答类别100.0100.0300300合计合计合计合计8 836363131151510102424108108939345453030 非常不满意非常不满意非常不满意非常不满意 不满意不满意不满意不满意 一般一般一般一般 满意满意满意满意 非常满意非常满意非常满

12、意非常满意百分比百分比百分比百分比 (%) (%)个数个数个数个数 ( (户户户户) )表表表表: : 客户对某产品评价的频数分布客户对某产品评价的频数分布客户对某产品评价的频数分布客户对某产品评价的频数分布19分组数据的众数1. 1. 用于数值型分组数据用于数值型分组数据2. 2. 众数的值与相邻两组频数的分布有关众数的值与相邻两组频数的分布有关5.5. 该公式假定众数组的频数在众数组内均匀分布该公式假定众数组的频数在众数组内均匀分布M MMooo3. 3. 3. 相邻两组的频数相等时,众数组的组中值即为众数相邻两组的频数相等时,众数组的组中值即为众数相邻两组的频数相等时,众数组的组中值即为

13、众数4. 4. 相邻两组的频数不相等时,众数采用下列近似相邻两组的频数不相等时,众数采用下列近似公式计算:公式计算:M MMoooM MMooo20分组数据的众数(算例)表表表表3-5 3-5 某车间某车间某车间某车间5050名工人日加工零件数分组表名工人日加工零件数分组表名工人日加工零件数分组表名工人日加工零件数分组表按零件数分组按零件数分组按零件数分组按零件数分组频数(人)频数(人)频数(人)频数(人)累积频数累积频数累积频数累积频数105105 110110110110 115115115115 120120120120 125125125125 130130130130 1351351

14、35135 1401403 35 58 8141410106 64 43 38 816163030404046465050合计合计合计合计5050【例例例例4.14.1】根根 据据 第第 三三章章表表3-53-5中中的的 数数 据据 ,计计 算算 5050名名工工 人人 日日 加加工工 零零 件件 数数的众数的众数21定序数据:中位数和分位数22中位数(概念要点)1. 1.集中趋势的测度值之一集中趋势的测度值之一2. 2.排序后处于中间位置上的值排序后处于中间位置上的值N Ni i 1 1 Xi - Me = 最小MMe e50%50%3.3.不受极端值的影响不受极端值的影响4.4.主要用于定

15、序数据,也可用数值型数据,但不能用于定主要用于定序数据,也可用数值型数据,但不能用于定类数据类数据5.5.各变量值与中位数的离差绝对值之和最小,即各变量值与中位数的离差绝对值之和最小,即23中位数的确定中位数位置中位数位置 1 N2未分组数据:未分组数据:组距分组数据:组距分组数据:中位数位置中位数位置 N224未分组数据的中位数25未分组数据的中位数【例例例例】根根据据表表中中的的数数据据,计计算算客客户户对对产产品品满满意意状状况况评价的中位数评价的中位数解:解:解:解:中位数的位置为:中位数的位置为: (300+1)/2 (300+1)/2150.5150.5从从累累计计频频数数看看,中

16、中位位数数在在“ “一一般般” ”这这一一组组别别中中。因此因此 MMo o一般一般一般一般客户客户客户客户回答类别回答类别回答类别回答类别100.0100.0300300合计合计合计合计8 836363131151510102424108108939345453030 非常不满意非常不满意非常不满意非常不满意 不满意不满意不满意不满意 一般一般一般一般 满意满意满意满意 非常满意非常满意非常满意非常满意百分比百分比百分比百分比 (%) (%)个数个数个数个数 ( (户户户户) )表表表表: : 客户对某产品评价的频数分布客户对某产品评价的频数分布客户对某产品评价的频数分布客户对某产品评价的频

17、数分布26未分组数据的中位数 (5个数据型数据的算例)n n原始数据原始数据: 24 22 21 26 20n n排排 序序: 20 21 22 24 26n n位位 置置: 1 2 3 4 5位置位置 n+125+123中位数中位数 2227未分组数据的中位数 (6个数据型数据的算例)n n原始数据原始数据: 10 5 9 12 6 8n n排排 序序: 5 6 8 9 10 12n n位位 置置: 1 2 3 4 5 6位置位置n+126+123.5中位数中位数 8 + 928.5281. 1.用于数值型分组数据2. 2.根据位置公式确定中位数所在的组3. 3.采用下列近似公式计算:4.

18、该公式假定中位数组的频数在该组内均匀分布分组数据的中位数(要点及计算公式)29分组数据的中位数(算例)表表表表 某车间某车间某车间某车间5050名工人日加工零件数分组表名工人日加工零件数分组表名工人日加工零件数分组表名工人日加工零件数分组表按零件数分组按零件数分组按零件数分组按零件数分组频数(人)频数(人)频数(人)频数(人)累积频数累积频数累积频数累积频数105105 110110110110 115115115115 120120120120 125125125125 130130130130 135135135135 1401403 35 58 8141410106 64 43 38 8

19、16163030404046465050合计合计合计合计5050【 例例例例 】 根根据据 下下 表表 中中的的 数数 据据 ,计计算算50 50 名名工工 人人 日日 加加工工 零零 件件 数数的中位数的中位数30四分位数(概念要点)n n1. 集中趋势的测度值之一n n2. 排序后处于25%和75%位置上的值3. 不受极端值的影响4. 主要用于定序数据,也可用于数值型数据,但不能用于定类数据QQL LQQMMQQU U25%25%25%25%31四分位数(位置的确定)未分组数据:未分组数据:组距分组数据:组距分组数据:下四分位数下四分位数( (QQL L) )位置位置 = =N N+ +1

20、 14 4上四分位数上四分位数( (QQU U) )位置位置 = =3(3(N N+ +1)1)4 4下四分位数下四分位数( (QQL L) )位置位置 = =N N4 4上四分位数上四分位数( (QQL L) )位置位置 = =3 3N N4 432未分组数据的四分位数(定序数据的算例)【例例例例4.44.4】根根据据下下表表中中的的数数据据,计计算算甲甲城城市市家家庭庭对对住住房房满满意意状状况况评评价价的四分位数的四分位数解:解:解:解:下四分位数下四分位数( (Q QL L) )的位置为:的位置为: Q QL L位置位置(300)/4(300)/47575 上四分位数上四分位数( (Q

21、 QL L) )的位置为:的位置为: Q QUU位置位置(3300)/4(3300)/4225225从从累累计计频频数数看看, Q QL L在在“ “不不满满意意” ”这这一一组组别别中中; Q QUU在在“ “满满意意” ”这这一一组别中。因此组别中。因此 Q QL L 不满意不满意不满意不满意 Q QUU 满意满意满意满意甲城市甲城市甲城市甲城市回答类别回答类别回答类别回答类别300300合计合计合计合计24241321322252252702703003002424108108939345453030 非常不满意非常不满意非常不满意非常不满意 不满意不满意不满意不满意 一般一般一般一般

22、满意满意满意满意 非常满意非常满意非常满意非常满意累计频数累计频数累计频数累计频数户数户数户数户数 ( (户户户户) )表表表表 甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布33未分组数据的四分位数 (7个数值型数据的算例)n n原始数据原始数据原始数据原始数据: : 23 23 21 30 32 21 30 32 28 28 25 26 25 26n n排排排排 序序序序: : 21 21 23 23 25 26 28 25 26 28 3030 32 32n n位位位位 置置置置: : 1 1 2

23、3 2 3 4 5 6 7 4 5 6 7 N+N+1 1QL= 237+7+1 1QQL L位置位置 = =4 4= =4 4= 2= 2QQU U位置位置 = =3(3(N+N+1)1)4 43(73(7+ +1)1)4 4 = = 6= 6QU = 3034未分组数据的四分位数 (6个数值型数据的算例)n n原始数据原始数据原始数据原始数据: : 23 2123 21 30 30 28 25 2628 25 26n n排排排排 序序序序: : 21 23 25 26 28 30 21 23 25 26 28 30n n位位位位 置置置置: : 1 2 1 2 3 3 4 4 5 6 5

24、6QQL L= 21+0.75(23-21)= 21+0.75(23-21) = = 22. 522. 5QQL L位置位置 = =N+N+1 14 4= =6+6+1 14 4= 1.75= 1.75QQU U位置位置 = =3(3(N+N+1)1)4 43(63(6+ +1)1)4 4= = 5.25= 5.25QQU U = 28+0.25(30-28)= 28+0.25(30-28) = = 28.528.535数值型分组数据的四分位数(计算公式)上四分位数上四分位数上四分位数上四分位数: : 下四分位数下四分位数下四分位数下四分位数: : 36数值型分组数据的四分位数(计算示例)n

25、nQ QL L位置位置位置位置50/450/412.512.5n nQ QU U位置位置位置位置350/4350/437.537.5表:表:表:表: 某车间某车间某车间某车间5050名工人日加工零件数分组表名工人日加工零件数分组表名工人日加工零件数分组表名工人日加工零件数分组表按零件数分组按零件数分组按零件数分组按零件数分组频数(人)频数(人)频数(人)频数(人)累积频数累积频数累积频数累积频数105105 110110110110 115115115115 120120120120 125125125125 130130130130 135135135135 1401403 35 58 81

26、41410106 64 43 38 816163030404046465050合计合计合计合计5050【例例例例】根根据据下下表表中中的的数数据据,计计算算50 50 名名工人日加工零件数的四分位数工人日加工零件数的四分位数37定距和定比数据:均值38均 值1.集中趋势的测度值之一2.最常用的测度值3.一组数据的均衡点所在4.易受极端值的影响5. 用于数值型数据,不能用于定类数据和定序数据39均值(计算公式)设一组数据为:设一组数据为:X X1 1 ,X X2 2 , ,X XN N 简单均值简单均值简单均值简单均值的计算公式为:的计算公式为:设分组后的数据为:设分组后的数据为:X X1 1

27、,X X2 2 , ,X XK K 相应的频数为:相应的频数为: F F1 1 , F F2 2, ,F FK K加权均值加权均值加权均值加权均值的计算公式为:的计算公式为:40均值1.各变量值与均值的离差之和等于零n n ni i i 1 1 1 ( ( X Xi i - - X X ) = 0) = 0n n ni i i 1 1 1 ( ( X Xi i - - X X ) = ) = 最小最小最小最小2 2 2 2. 各变量值与均值的离差平方和最小41众数、中位数和均值的比较42众数、中位数和均值的关系对称分布对称分布对称分布对称分布对称分布对称分布 均值均值均值均值均值均值 = =

28、= 中位数中位数中位数中位数中位数中位数 = = = 众数众数众数众数众数众数左偏分布左偏分布左偏分布左偏分布左偏分布左偏分布均值均值均值均值均值均值 中位数中位数中位数中位数中位数中位数 众数众数众数众数众数众数右偏分布右偏分布右偏分布右偏分布右偏分布右偏分布众数众数众数众数众数众数 中位数中位数中位数中位数中位数中位数 均值均值均值均值均值均值43 数据类型和所适用的集中趋势测度值数据类型和所适用的集中趋势测度值数据类型和所适用的集中趋势测度值数据类型和所适用的集中趋势测度值数据类型数据类型数据类型数据类型定类数据定类数据定类数据定类数据 定序数据定序数据定序数据定序数据定距数据定距数据定

29、距数据定距数据定比数据定比数据定比数据定比数据适适适适用用用用的的的的测测测测度度度度值值值值众数众数众数众数中位数中位数中位数中位数均值均值均值均值均值均值均值均值四分位数四分位数四分位数四分位数众数众数众数众数调和平均数调和平均数调和平均数调和平均数众数众数众数众数中位数中位数中位数中位数几何平均数几何平均数几何平均数几何平均数四分位数四分位数四分位数四分位数 中位数中位数中位数中位数四分位数四分位数四分位数四分位数众数众数众数众数44离散程度的测度一一. 定类数据:异众比率定类数据:异众比率二二. 定序数据:四分位差定序数据:四分位差三三. 定距和定比数据:方差及标准差定距和定比数据:方

30、差及标准差四四. 相对离散程度:离散系数相对离散程度:离散系数45离中趋势1. 1.数据分布的另一个重要特征数据分布的另一个重要特征2. 2.离中趋势的各测度值就是对数据离散程度所作的描述离中趋势的各测度值就是对数据离散程度所作的描述3. 3.它它所所反反映映的的是是各各变变量量值值远远离离其其中中心心值值的的程程度度,因因此此也也称为离中趋势称为离中趋势4. 4.从另一个侧面说明了集中趋势测度值的代表程度从另一个侧面说明了集中趋势测度值的代表程度5. 5.不同类型的数据有不同的离散程度测度值不同类型的数据有不同的离散程度测度值46数据的特征和测度数据的特征和测度数据的特征和测度分布的形状分布

31、的形状离散程度离散程度集中趋势集中趋势众众众众众众 数数数数数数中位数中位数中位数中位数中位数中位数均均均均均均 值值值值值值离散系数离散系数离散系数离散系数离散系数离散系数方差和标准差方差和标准差方差和标准差方差和标准差方差和标准差方差和标准差峰峰峰峰峰峰 度度度度度度四分位差四分位差四分位差四分位差四分位差四分位差异众比率异众比率异众比率异众比率异众比率异众比率偏偏偏偏偏偏 态态态态态态47定序数据:四分位差48四分位差-概念要点1. 离散程度的测度值之一2. 也称为内距或四分间距3. 上四分位数与下四分位数之差 Q QD D = = Q QU U - - Q QL L4. 反映了中间50

32、%数据的离散程度5. 不受极端值的影响6. 用于衡量中位数的代表程度49四分位差【例例】根根据据表表中中的的数数据据,计计算算甲甲城城市市家家庭庭对对住住房房满满意意状状况况评评价价的的四分位差四分位差解解解解:设设非非常常不不满满意意为为1, 1,不不满满意意为为2, 2, 一一般般为为3, 3, 满满意意为为 4, 4, 非非常常满满意意为为5 5 已已知知 Q QL L不不满满意意2 2,Q QU U满意满意4 4四分位差:四分位差: Q QD D= =Q QU U Q QL L 4 2 4 2 2 2表表表表 甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布甲城市家

33、庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布回答类别回答类别回答类别回答类别甲城市甲城市甲城市甲城市户数户数户数户数 ( (户户户户) )累计频数累计频数累计频数累计频数 非常不满意非常不满意非常不满意非常不满意 不满意不满意不满意不满意 一般一般一般一般 满意满意满意满意 非常满意非常满意非常满意非常满意24241081089393454530302424132132225225270270300300合计合计合计合计30030050定距和定比数据:方差和标准差51极差-概念要点及计算公式1. 1. 一组数据的最大值与最小值之差一组数据的最大值与最小值之差2. 2. 离散程度

34、的最简单测度值离散程度的最简单测度值3. 3. 易受极端值影响易受极端值影响4. 4. 未考虑数据的分布未考虑数据的分布7 7 8 8 9 910107 7 8 8 9 9 1010未分组数据:未分组数据:未分组数据:未分组数据: R R = max(= max(X Xi i) - min() - min(X Xi i) ). .= =组距分组数据:组距分组数据:组距分组数据:组距分组数据:R R 最高组上限最高组上限 - - 最低组下限最低组下限5. 5. 计算公式为:计算公式为:52平均差1. 1. 离散程度的测度值之一离散程度的测度值之一2. 2. 各变量值与其均值离差绝对值的平均数各变

35、量值与其均值离差绝对值的平均数3. 3. 能全面反映一组数据的离散程度能全面反映一组数据的离散程度4. 4. 数学性质较差,实际中应用较少数学性质较差,实际中应用较少5. 5. 计算公式为:计算公式为:未分组数据:未分组数据:未分组数据:未分组数据:组距分组数据组距分组数据组距分组数据组距分组数据:53平均差-计算过程及结果31231247.147.153.553.545.645.69.89.843.043.055.855.857.257.2| |X Xi i- -X X | |F Fi i15.715.710.710.75.75.70.70.74.34.39.39.314.314.3| |

36、X Xi i- - X X | |5050合计合计合计合计3 35 58 8141410106 64 4107.5107.5112.5112.5117.5117.5122.5122.5127.5127.5132.5132.5137.5137.5105105 110110110110 115115115115 120120120120125125125125 130130130130 135135135135 140140频数频数频数频数( (F Fi i) )组中值组中值组中值组中值( (X Xi i) )按零件数分组按零件数分组按零件数分组按零件数分组表表表表 某车间某车间某车间某车间505

37、0名工人日加工零件标准差计算表名工人日加工零件标准差计算表名工人日加工零件标准差计算表名工人日加工零件标准差计算表【例】【例】【例】【例】根据下表中的数据,计算工人日加工零件数的平均差根据下表中的数据,计算工人日加工零件数的平均差54方差和标准差-概念要点1.离散程度的测度值之一离散程度的测度值之一2.最常用的测度值最常用的测度值3.反映了数据的分布反映了数据的分布4.反映了各变量值与均值的平均差异反映了各变量值与均值的平均差异5.根据总体数据计算的,称为总体方差或标准根据总体数据计算的,称为总体方差或标准差;根据样本数据计算的,称为样本方法或差;根据样本数据计算的,称为样本方法或标准差标准差

38、4 6 8 10 124 6 8 10 12X = X = 8.38.355总体方差和标准差计算公式未分组数据:未分组数据:组距分组数据:组距分组数据:未分组数据:未分组数据:组距分组数据:组距分组数据:方差的计算公式方差的计算公式方差的计算公式方差的计算公式标准差的计算公式标准差的计算公式标准差的计算公式标准差的计算公式56总体标准差计算过程及结果总体标准差计算过程及结果3100.53100.5739.47739.47572.45572.45259.92259.926.866.86184.90184.90518.94518.94817.96817.96( (X Xi i- - X X ) )

39、2 2F Fi i246.49246.49114.49114.4932.4932.490.490.4918.4918.4986.4986.49204.49204.49( (X Xi i- - X X ) )2 25050合计合计合计合计3 35 58 8141410106 64 4107.5107.5112.5112.5117.5117.5122.5122.5127.5127.5132.5132.5137.5137.5105105 110110110110 115115115115 120120120120125125125125 130130130130 135135135135 14014

40、0频数频数频数频数( (F Fi i) )组中值组中值组中值组中值( (X Xi i) )按零件数分组按零件数分组按零件数分组按零件数分组表表表表 某车间某车间某车间某车间5050名工人日加工零件标准差计算表名工人日加工零件标准差计算表名工人日加工零件标准差计算表名工人日加工零件标准差计算表【例】【例】【例】【例】根据下表中的数据,计算工人日加工零件数的标准差根据下表中的数据,计算工人日加工零件数的标准差57样本方差和标准差(计算公式)未分组数据:未分组数据:组距分组数据:组距分组数据:未分组数据:未分组数据:组距分组数据:组距分组数据:方差的计算公式方差的计算公式方差的计算公式方差的计算公式

41、标准差的计算公式标准差的计算公式标准差的计算公式标准差的计算公式注意:注意:注意:样本方差用自样本方差用自样本方差用自由度由度由度n-1n-1n-1去除去除去除! !58样本方差自由度(degree of freedom)1. 1.一组数据中可以自由取值的数据的个数一组数据中可以自由取值的数据的个数2. 2.当当样样本本数数据据的的个个数数为为 n n 时时,若若样样本本均均值值 x x 确确定定后后,只只有有n n-1-1个个数数据据可可以以自自由由取取值值,其其中中必必有有一一个个数数据据则则不能自由取值;不能自由取值;3. 3.例例如如,样样本本有有3 3个个数数值值,即即x x1 1=

42、2=2,x x2 2=4=4,x x3 3=9=9,则则 x x = = 5 5。当当 x x = = 5 5 确确定定后后,x x1 1,x x2 2和和x x3 3有有两两个个数数据据可可以以自自由由取取值值,另另一一个个则则不不能能自自由由取取值值,比比如如x x1 1=6=6,x x2 2=7=7,那么那么x x3 3则必然取则必然取2 2,而不能取其他值;,而不能取其他值;4. 4.样样本本方方差差用用自自由由度度去去除除,其其原原因因可可以以从从多多方方面面来来解解释释,从从实实际际应应用用的的角角度度看看,在在抽抽样样估估计计中中,当当我我们们用用样样本本方方差差去去估估计计总总

43、体体方方差差 2 2时时,它它是是 2 2的的无无偏偏估估计量。计量。59样本方差(算例)n n原始数据: 10 5 9 13 6 860样本标准差样本标准差( (算例算例) )n n样本标准差样本标准差原始数据: 10 5 9 13 6 861方差-简化计算公式样本方差:样本方差:总体方差:总体方差:62方差(数学性质)各变量值对均值的方差小于对任意值的方差各变量值对均值的方差小于对任意值的方差各变量值对均值的方差小于对任意值的方差各变量值对均值的方差小于对任意值的方差设设X X0 0为不等于均值的任意数,为不等于均值的任意数,D D2 2为对为对X X0 0的方差,则的方差,则63标准化值

44、-概念要点和计算公式1. 也称标准分数2.给出某一个值在一组数据中的相对位置3.可用于判断一组数据是否有离群点4.用于对变量的标准化处理5. 计算公式为:64偏态与峰度的测度一一. 偏态及其测度偏态及其测度二二. 峰度及其测度峰度及其测度65数据的特征和测度(本节位置)数据的特征和测度数据的特征和测度分布的形状分布的形状离散程度离散程度众众众众众众 数数数数数数中位数中位数中位数中位数中位数中位数均均均均均均 值值值值值值离散系数离散系数离散系数离散系数离散系数离散系数方差和标准差方差和标准差方差和标准差方差和标准差方差和标准差方差和标准差峰峰峰峰峰峰 度度度度度度四分位差四分位差四分位差四分

45、位差四分位差四分位差异众比率异众比率异众比率异众比率异众比率异众比率偏偏偏偏偏偏 态态态态态态集中趋势集中趋势6667偏态与峰度分布的形状扁平分布扁平分布扁平分布扁平分布尖峰分布尖峰分布尖峰分布尖峰分布偏态偏态偏态偏态峰度峰度峰度峰度左偏分布左偏分布左偏分布左偏分布右偏分布右偏分布右偏分布右偏分布与正态分与正态分与正态分与正态分布比较!布比较!布比较!布比较!68偏态-概念要点1.数据分布偏斜程度的测度2.偏态系数等于等于0为对称分布3.偏态系数大于大于0为右偏分布4.偏态系数小于小于0为左偏分布5. 计算公式为:69偏态实例【 例例例例 4 4】 已已 知知 19971997年年我我国国农农

46、村村居居民民家家庭庭按按纯纯收收入入分分组组的的有有关关数数据据如如表表4.94.9。试计算偏态系数试计算偏态系数2.282.2812.4512.4520.3520.3519.5219.5214.9314.9310.3510.356.566.564.134.132.682.681.811.814.944.94500500以下以下以下以下50010005001000100015001000150015002000150020002000250020002500250030002500300030003500300035003500400035004000400045004000450045005

47、0004500500050005000以上以上以上以上户数比重(户数比重(户数比重(户数比重(%)按纯收入分组(元)按纯收入分组(元)按纯收入分组(元)按纯收入分组(元)表表表表4-10 19974-10 1997年年年年农村居民家庭纯收入数据农村居民家庭纯收入数据农村居民家庭纯收入数据农村居民家庭纯收入数据70户户户户户户数数数数数数比比比比比比重重重重重重(%)(%)(%)25252020151510105 5农村居民家庭村收入数据的直方图农村居民家庭村收入数据的直方图农村居民家庭村收入数据的直方图农村居民家庭村收入数据的直方图偏态与峰度按纯收入分组按纯收入分组按纯收入分组按纯收入分组按纯

48、收入分组按纯收入分组( (元元元元元元) )10001000500500150015002000200025002500300030003500350040004000 4500450050005000结论结论结论结论:1. 1. 为右偏分布为右偏分布 2. 2. 峰度略大峰度略大71偏态系数(计算过程)表表表表 农村居民家庭纯收入数据偏态及峰度计算表农村居民家庭纯收入数据偏态及峰度计算表农村居民家庭纯收入数据偏态及峰度计算表农村居民家庭纯收入数据偏态及峰度计算表按纯收入分组按纯收入分组按纯收入分组按纯收入分组(百元)(百元)(百元)(百元)组中值组中值组中值组中值X Xi i户数比重户数比重

49、户数比重户数比重(%)(%)F Fi i( (X Xi i- - X X ) ) F Fi i3 3( (X Xi i- - X X ) ) F Fi i4 45 5以下以下以下以下51051010151015152015202025202525302530303530353540354040454045455045505050以上以上以上以上2.52.57.57.512.512.517.517.522.522.527.527.532.532.537.537.542.542.547.547.552.552.52.282.2812.4512.4520.3520.3519.5219.5214.93

50、14.9310.3510.356.566.564.134.132.682.681.811.814.944.94-154.64-154.64-336.46-336.46-144.87-144.87-11.84-11.840.180.1823.1623.1689.0289.02171.43171.43250.72250.72320.74320.741481.811481.812927.152927.154686.514686.511293.531293.5346.5246.520.200.20140.60140.60985.49985.492755.002755.005282.945282.948

51、361.988361.9846041.3346041.33合计合计合计合计1001001689.251689.2572521.2572521.2572偏态系数 (计算结果)根据上表数据计算得:根据上表数据计算得:根据上表数据计算得:根据上表数据计算得:将计算结果代入得:将计算结果代入得:将计算结果代入得:将计算结果代入得:结论:结论:结论:结论:偏态系数为正值,而且数值较大,说明农村居民家庭纯偏态系数为正值,而且数值较大,说明农村居民家庭纯收入的分布为右偏分布,即收入较少的家庭占据多数,而收入收入的分布为右偏分布,即收入较少的家庭占据多数,而收入较高的家庭则占少数,而且偏斜的程度较大较高的家庭

52、则占少数,而且偏斜的程度较大 7374峰度概念要点1.数据分布扁平程度的测度2.峰度系数等于等于3扁平程度适中3.偏态系数大于大于3为尖峰分布5. 计算公式为:75峰度系数计算实例代入公式得:代入公式得: 【例例】根根据据表表中中的的计计算算结结果果,计计算算农农村村居居民民家家庭庭纯纯收收入分布的峰度系数入分布的峰度系数 结结结结论论论论:由由于于=3.43=3.43,说说明明我我国国农农村村居居民民家家庭庭纯纯收收入入的的分分布布为为尖尖峰峰分分布布,说说明明低低收收入入家家庭庭占占有有较较大大的比重的比重 7677小 节1. 集中趋势各测度值的含义、计算方法、集中趋势各测度值的含义、计算方法、特点和应用场合特点和应用场合2. 离散程度各测度值的含义、计算方法、离散程度各测度值的含义、计算方法、特点和应用场合特点和应用场合3.偏态及峰度的测度方法偏态及峰度的测度方法4.用软件计算描述统计量用软件计算描述统计量78谢谢 谢谢!79个人观点供参考,欢迎讨论

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 工作计划

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号