第4章 数据分布特征的测度

上传人:工**** 文档编号:491909783 上传时间:2023-03-11 格式:DOCX 页数:12 大小:91.29KB
返回 下载 相关 举报
第4章 数据分布特征的测度_第1页
第1页 / 共12页
第4章 数据分布特征的测度_第2页
第2页 / 共12页
第4章 数据分布特征的测度_第3页
第3页 / 共12页
第4章 数据分布特征的测度_第4页
第4页 / 共12页
第4章 数据分布特征的测度_第5页
第5页 / 共12页
点击查看更多>>
资源描述

《第4章 数据分布特征的测度》由会员分享,可在线阅读,更多相关《第4章 数据分布特征的测度(12页珍藏版)》请在金锄头文库上搜索。

1、第四章数据分布特征的测度1概述数据分布特征集中趋势离散趋势分布形状均值位置平均数 一众数全距四分位差方差和标准差 一变异系数偏斜度 峰度2集中趋势的测度一、集中趋势的含义(一)集中趋势的概念集中趋势(Central tendency)是指一组数据向某一中心值靠拢的倾向,测度 集中趋势也就是寻找数据一般水平的代表值或中心值。(二)集中趋势的内容1. 均值(Mean)算术平均数调和平均数几何平均数切尾均值2. 位置平均数中位数四分位数十分位数百分位数3. 众数二、众数1. 概念众数(Mode)是一组数据中出现次数最多的变量值,用心0表示。主要用于 测度定类型数据的集中趋势。2. 单项分组数列Mo

2、F例:为研究广告市场的状况,一家广告公司在某城市随机抽取200人就广告 问题作了邮寄问卷调查,其中的一个问题是:“您比较关心下列哪一类广告? ”商品广告;服务广告;金融广告;房地产广告;招生招聘广告其他广告。表4-1某城市居民关注广告类型的频数分布广告类型人数商品告112服务广告51金融广告9房地产广告16招生招聘广告10其他广告2合计200M 0 =商品告3.组距分组数列 确定众数组一一频数最多的组 计算众数值图4-1 众数值计算示意图可见,众数实际上是频数最大组的下限加上按一定几何比例分配组距所得到 的那段组距,即因为x - 1(x + y) - 1d气+气气+气所以 M。= L + 三;

3、d (下限公式) 12同理,可得上限公式:M = U - do +例:某地区3000家农户的年收入情况资料如下:年收入额(元)农户数(户)50006000240600070004807000800010508000900060090001000027010000110002101100012000120120001300030合计3000向上累计户向下累计户数(户)数(户)240300072027601770228023701230264063028503602970150300030解:气=1050 480 = 570 ;气=1050 - 600 = 450所以 M0 = 7000 + 57

4、(5+(450 x 1000 = 7559 (元)三、位置平均数1. 中位数中位数(Median)是一组数据按从小到大排序后,处于中间位置上的变量值, 用Me表示。中位数是一个位置代表值,它主要用于测度定序数据的集中趋势。2. 根据未分组资料确定中位数 按标志值大小进行排列得(气,A ,气); 计算中间位置(=a);2 计算中位数具体数值。厂标志值个数为奇数时IM =七标志值个数为偶数时x + xn n+2M =e 23. 根据分组资料确定中位数 单项分组资料i计算中位数位置(=M);ii将分组数列的次数进行向上或向下累计;iii选择第一个大于或等于的组即为中位数所在组;iv对应的标志值为中位

5、数。 组距分组资料i、ii、iii同单项分组资料;V计算中位数值:图4-2 中位数值计算示意图设标志值次数在一组内为均匀分布的,运用插值法,得M - L2 S 1_匕 m-1edfm整理得下限公式: f 2 - SM = L +2m-1 x dm上限公式:-Su 2机+1/m例:某地区3000家农户的年收入情况资料如下:年收入额(元)农户数(户)向上累计户数(户)向下累计户数(户)500060002402403000600070004807202760700080001050177022808000900060023701230900010000270264063010000110002102

6、85036011000120001202970150120001300030300030合计3000Me = 7000 + 授%;:20 x 1000 = 7743 (元)2. 四分位数四分位数(Quartile)也称四分位点,它是通过三个点将全部数据等分为四 部分,其中每部分包含25%的数据,处在分位点上的数值就是四分位数。 下四分位数Ql 中位数Qm 上四分位数Qu3. 十分位数和百分位数 十分位数(Decile)是通过九个点将全部数据等分为十部分,其中每部分 包含10%的数据,处在分位点上的数值就是十分位数。 百分位数(Percentile)是通过99个点将全部数据等分为100部分,其中

7、 每部分包含1%的数据,处在分位点上的数值就是百分位数。四、均值1. 算术平均数算术平均数(Arithmetic mean)是全部数据的算术平均,是集中趋势的最主要测度值,用X表示。未分组数列一一简单算术平均数Y x_ x + x +A + x inn例:某机械厂某生产小组6个工人生产某种零件的日产量(件)分别为15、16、17、18、19、20。则平均日产量为15 +16 +17 +18 +19 + 20 105x = 17.5 (件)66分组数列一一加权算术平均数_ x f + x f +A + x f x = 1 122nnf1 +f2+A+fn斗=Yx (f)Yf Yfiii=1i=1

8、例:某机械厂180个工人对某种零件的生产情况资料如下:日产量(件)工人人数(人)日总产量(件)xifixf151015016203201730510185090019407602030600合计18032403240x = 180 (件)180i标志值的选择一一在组距分组数列中以组中值为标志值例:某机械厂180个职工的工资资料如下:月工资(元)组中值xi职工人数(人)fi300400350140400500450190500600550350600700650300700800750260工资总额(元)xf49000850001925001950001950008009008502001700

9、00900100095040380001000110010502021000合计1500946000 xfx = 4 f_ 946000=630.7 (元)1500ii =1ii权数的选择一一xf要有实际意义例:某管理局下属10家企业1995年的产量计划完成情况资料如下:产量计划完 成率()xi企业数 (家)ni计划产量 (吨)fi95410100320110240120150合计10120-=95o0 x4 +10000 x 3 +11000 x 2 + 120g; x 1 = 102 /x 001000_ = 9500 x 10 +10000 x 20 +11000 x 40 + 1200

10、0乂 50 = . 2_x = 0012000=. 0 0 算术平均数的性质i各变量值与算术平均数的离差之和等于零;工(X - X) = 0 ii=1ii各变量值与其算术平均数的离差平方和最小;(x - X)2 = (x - a)2i =1i =12调和平均数调和平均数(Harmonic mean)是均值的另一种表现形式,它是标志值倒数的算术平均数的倒数,用H表示。未分组数列一一简单调和平均数H =11 A 1 寸 1+ +A +Z 一XX工工分组数列一一加权调和平均数H m + m + A + mim +m *. + m m X Xx . 1 X.例:某工厂本月购进某材料四批,每批价格以及采

11、购金额如下:价格(元/公斤)Xi采购金额(元)mi第_批3510000第批4020000第二批4515000第四批505000合计50000采购量(公斤)m : xi i2865003331001219i 50000H = 一 =41.02 (兀) m 1219i=1T3.几何平均数几何平均数(Geometric mean)是N个变量值乘积的N次方根,是标志值对 数的算术平均数的反对数,用G表示。未分组数列一一简单几何平均数G =例:某机械厂有毛坯车间、粗加工车间、精加工车间、装配车间四个流水连续作业的车间。本月份毛坯车间制品合格率为95%,粗加工车间为92%,精加工车间为90%,装配车间为8

12、5%。求该企业平均车间产品合格率。G =妃0.95 x0.92 x0.9O x 0.85 = 0.9043 = 90.43 00分组数列一一加权几何平均数=(L+瓜叩耳A吁=(i=1例:某银行某年实行保值储蓄,各月的利率分配为:有4个月为3%, 2个月为5%,2个月为8%,3个月为10%,1个月为15%。求该银行的平均月利率。G = 4+2+2+3堆1.034 X 1.052 x 1.082 x 1.103 x 1.151 = 1.0682所以,月平均利率为1.0682-1=0.0682=6.82%五、算术平均数、中位数、众数的关系1.对称分布(钟型分布)M =X=M2. 右偏分布(正偏分布)M M3. 左偏分布(负偏分布)X M M2离散趋势的度量、全距 Range1、概念全距是指总体各单位标志值中最大值与最小值之差,又称极差。2、计算1 未分组数列:全距=max(x ) - min(工)2 单项分组数列:全距=气-气3 组距分组数列:全距=最上组的上限一最下组的下限3、优缺点1 优点:计算简便、易于了解。2 缺点:方法粗略,易受极端数值的影响,因而测定的结果往往不能充分 反映现象的实际离散程度。二、四分位差 Quartile deviationQd = Qu - Ql三、平均差 Mean deviation ( A.

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文 > 其它学术论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号