数据分布特征的描述数学课件

上传人:woxinch****an2018 文档编号:44728566 上传时间:2018-06-14 格式:PPT 页数:54 大小:1.10MB
返回 下载 相关 举报
数据分布特征的描述数学课件_第1页
第1页 / 共54页
数据分布特征的描述数学课件_第2页
第2页 / 共54页
数据分布特征的描述数学课件_第3页
第3页 / 共54页
数据分布特征的描述数学课件_第4页
第4页 / 共54页
数据分布特征的描述数学课件_第5页
第5页 / 共54页
点击查看更多>>
资源描述

《数据分布特征的描述数学课件》由会员分享,可在线阅读,更多相关《数据分布特征的描述数学课件(54页珍藏版)》请在金锄头文库上搜索。

1、第 四 章数据分布特征的描述 第 一 节 数据分布集中趋势的测定一、均值/平均数/数值平均数 (mean) (一)概念是反映数据分布集中趋势十分重要的数据, 代表总体单位某一标志值的一般水平 (二)特征1.具有抽象性2.具有代表性 3.反映总体分布的集中趋势 *举例1.某市中学生每周平均上网时间为2.8小时2.某农贸市场2月份牛肉的平均价格为16元/千 克3.某地区“十五”期间经济平均增长率为9.6%(三)均值的种类及计算1.算术平均数*(1)概念算术平均数又称平均值,是用一组数据中所有值之和 除以该组数据的个数(2)基本公式算术平均数的计算*简单算术平均数:针对未分组资料总体平均数样本平均数

2、算术平均数的计算*加权算术平均数概念:是对每个数据都根据其在全组中的重要程度赋 予一定权重后得到的算术平均数计算公式: 未分组数据其中:w表示各组的标志总量,而不是各组变量值出 现的次数,总体和样本加权算术平均数的公式是相同例4-2根据某公司四个品牌数码相 机的销售资料计算平均利润率表4-1 四个品牌数码相机的利润率和销售额资料所以,四个品牌数码相机的平均销售利润率 为因为:*加权算术平均数 分组的加权平均数:根据分组数据计算均值样本均值的计算公式:总体均值的计算公式:表示各组的变量值(或组距式数列的组中值 ) 表示各组变量值出现的频数(即权数)例4-3根据某电脑公司在各市场上销 售量的分组数

3、据,计算电脑销售量的均值。 按销销售量分组组(台 )市场场个数 (fi)组组中值值(Mi)Mi fi 140150 150160 160170 170180 180190 190200 200210 210220 220230 23024049 16 27 20 17 10845145 155 165 175 185 195 205 215 225 235 580 1 395 2 640 4 725 3 700 3 315 2 050 1 720900 1 175合 计计fi 120 Mi fi 22 2002.调和平均数1.问题的由来思考题:三种蔬菜单价分别为2、3和4元/千克,(1)各买一

4、千克平均单价是多少?(2)各买一元的平均单价是多少?2.概念:调和平均数又称倒数平均数,是各个变量值倒数的算 术平均数的倒数3.计算(1)简单调和平均数:针对未分组资料计算公式为:算术平均调和平均2.调和平均数2.加权调和平均数:针对分组资料计算公式为:其中:是一种特殊权数,它不是各组变量值出现的 次数,表示各组标志总量即例4-4根据某商场职工月工资资料 计算月平均工资课堂练习资料甲乙企业职工的工资如下表:要求分别计算甲乙企业职工月工资额的均值算术平均数和调和平均数的关 系* * 联系实质相同调和平均数是算术平均数的变形,两者的基本公式均 为:*区别适用的情况不同当已知平均指标的分母资料、未知

5、分子资料时,采 用加权算术平均法当已知平均指标的分子资料、未知分母资料时,采 用加权调和平均法3.几何平均数(1)概念:几何平均数(geometric mean)又称对称平均 数,它是各变量值乘积的n次方根。 (2)计算基本公式:对数公式: 在实际工作中,由于变量个数较多,通常要应用对数来进行计算。即 (3)几何平均数的应用及特点 *应用条件应用条件a.变量值是相对数据,如比率或发展速度 b.变量值的连乘积等于总比率或总发展速度 *特点a.如果数列中有一个标志值等于零或负值,则无法计算b.受极端值影响较小,故较稳健例4-5 某电器销售公司20002005年销售 量的环比增长率分别为:7.6%、

6、2.5%、0.6、 2.7%和2.2%。求这期间销售量的平均增长速度 ? 表4-4 销售量平均发展速度计算表几何平均数的计算示例几何平均数的计算示例1.采用基本公式计算的销售量平均发展速度为:2.采用对数公式计算的销售量平均发展速度为:所以,销售量的平均增长速度=103.1%-1=3.1% 二、位置平均数(一)中位数(median) 1.概念中位数是将一组数据项按照数值大小升序或者降序排 列后位于中间位置的那个数据,符号为2.中位数的计算方法(1)未分组数据的中位数 将变量值按升序或降序排列,找中间位置的变量值 (2)单项数列的中位数计算各组的累计频数(向上累计或向下累计);根据中 位数位置确

7、定中位数例4-6 计算某公司销售人员月销售冰箱中位数 按月销销售冰箱分组组 (台)销销售人员员数(人)向上累计频计频 数向下累计频计频 数25 30 32 34 36 393 10 14 27 18 83 13 27 54 72 8080 77 67 53 26 8合 计计80中位数的位置即中位数在累计频数为40的那一组内(向上累计或向 下累计均可得出),则2.中位数的计算方法(3)组距数列的中位数:由下列公式近似计算下限公式其中:为总体单位总数为中位数组的下限为中位数组以下的累计频数为中位数组的频数 为中位数组的组 距例4-7 求以下组距数列的中位数 按家庭收入分组(元)家庭数(户)向上累计

8、频率 5 000以下 5 00010 000 10 00015 000 15 00020 000 20 000以上21 45 14 6 621 66 80 86 92 合 计92中位数的近似值为:某地区家庭收入分组表中位数的位置在第46(92/2)位,应在第二组组中位数的特点 是一种位置平均数,不受极端值及开口组的影响 对于分配不对称的数据,中位数比平均值更适合当集 中趋势的代表值 对某些不具有数字特征或不能用数字测定的现象,可 用中位数表示其一般水平例如,对众多的消费者购买数码相机时,分别对价 格、外观、品质的注重程度排序后,可以求出消费者在 乎的中位数因素二、位置平均数(二)众数(mode

9、) 1.概念众数(mode)是指在一组数中出现次数最多的那个数值,符号为2.数据数列的众数分布情况 无众数 如数据数列: 13 7 9 12 6 8一个众数 如数据数列: 6 5 9 8 6 6多个众数 如数据数列: 22 35 27 35 27 363.众数的计算方法*品质变量的众数观察次数,出现次数最多 的变量值就是众数例如:企业的所有制结构分布、人口的城乡分布*数值变量的众数未分组资料观察次数,出现次数最多的数据 就是众数分组资料(1)单项式数列直接观察,次数最多的组的变 量值即为众数例4-8单项式变量数列确定众数 实例某市居民家庭按家庭人口数分组 由上表可以看出,家庭人口数为3人的家庭

10、数最多, 因此本例中家庭人口数的众数为3人 3.众数的计算方法组距数列计算众数:由下列公式近似计算下限公式其中:为众数组与前一组频数之差为众数组的下限为众数组与后一组频数之差为众数组的组距例4-10 组距式数列计算众数示例收入组别人均收入(元)频数(人)1 2 3 4 5 62 000元以下 2 0004 000元 4 0006 000元 6 0008 000元 8 00010 000元 10 000以上23 43 68 32 24 10合 计200其众数的近似值为:某地区的人均月收入调查数据表三、均值、中位数和众数的比 较 (一)均值、中位数和众数的数量关系 1.当数据呈对称分布的,三者合而

11、为一,如图(a) 2.当数据呈左偏分布时,说明数据存在极小值,必然拉 动均值向极小值一方靠,则从左至右依次是均值、中位 数和众数,如图(b) 3.当数据呈右偏分布时,说明数据存在极大值,必然拉 动均值向极大值一方靠,则从左至右依次是众数、中位 数和均值,如图(c) 均值、中位数和众数的数量关 系 1.当数据呈对称分布的,三者合而为一均值、中位数和众数的数量关 系 2.当数据呈左偏分布时,从左至右依次是均值、中位 数和众数 均值、中位数和众数的数量关 系3.当数据呈右偏分布时,从左至右依次是众数、中位数 和均值,如图c 三、均值、中位数和众数的比 较 (二) 均值、众数和中位数的特点及应用场合*

12、均值是对数值型数据计算的,利用了全部数据信息 ,具有优良的数学性质,是实际中应用最广泛的集中趋 势测度值 *中位数是一组数据中间位置上的代表值,其特点 是不受数据极端值的影响,主要适合于作为顺序数据的 集中趋势测度值*众数是一组数据分布的峰值,它也是一种位置代表 值,不受极端值的影响,主要适合于作为分类数据的集 中趋势测度值第 三 节 数据分布离散程度的测定一、极差/全距(一)概念:又称全距,是数据中最大值和最小值之 差。记为 (二)计算1.未分组数据的极差为:表示数据的最大值表示数据的最小值 2.分组数据的极差极差最大组的上限最小组的下限若存在开口组,则: 最大组的上限前一组的上限组距最小组

13、的下限下一组的下限组距其中:例4-11 对人均月收入分组如下:2 000元以下 、2 0004 000元、8 00010 000元、 10 000元以上,计算全距分析:其最小组的下限为0最大组的上限为:则全距为:极差/全距的计算示例(三)修正极差(modified range)1.概念:是去掉极端值后的极差,又称四分位全距(IQR ,inter quartile range ),是中间50的数据的间距 ,即数据分布中第25个和第75个百分位数的间距,也即 第1个和第3个四分位数的间距2.公式:其中:Q3表示第3个四分位数,即第75个百分位数Q1表示第1个四分位数,即第25百分位数 二、平均差(

14、MAD)(一)概念:平均差( mean absolute deviation)是各数据对平均数的离差绝对值的平均数 (二)样本平均差的计算公式为:1.未分组数据:2.分组数据: 三、方差和标准差(一)概念方差(variance)是各变量值与其均值离差平方的平 均数。标准差(standard deviation)是方差的平方根 ,又称“均方差” (二)比较与评价1.其内涵与平均差相似,均为各个数据对其平均数 的平均离差。但平均差采用求绝对值消除正负离差, 标准差采用平方法消除正负离差,在数学处理上标准 差上比平均差更为科学合理2.方差和标准差是测度数值型数据离散程度的最主 要的指标(三)方差和标

15、准差的计算1.总体方差和标准差方 差标准差未 分 组 数 据分 组 数 据例4-12某电脑公司销售量分组数据如下 表,计算销售量的方差和标准差 总体方差和标准差计算示例 某电脑公司销售量分组数据方差计算表总体方差和标准差计算示例根据公式计算可知总体均值为:总体方差为:总体标准差为:2.样本方差和标准差 说明:在大多数统计应用中,都针对样本数据来分析总 体数量特征。因此通常用样本方差来估计总体方差,用 样本标准差来估计总体标准差符号:样本容量用n 表示样本方差用S2 表示样本标准差用S 表示(三)方差和标准差的计算2.样本方差和标准差 方 差标准差未 分 组 数 据分 组 数 据例4-13 根据以下样本数据,计算企业职工 平均工资的标准差。(已知平均工资为=760元) 某企业职工工资分组数据表样本方差和标准差计算示例样本方差为:样本标准差为:四、离散系数/变异系数(一)概念:离散系数(coefficient of variation)是 一组数据的离散指标的绝对数与其相应的均值之比。是 离散指标的相对数形式 (二)表现形式有全距系数、平均差系数和标准差系数。最常用的是标 准差系数 (三)计算公式 总总体标标准差系 数样样本标标准差系数四、离散系数/变异系数(四)应用:用于比较不同总体数据分布的离散程度例题4-13 甲乙

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 其它相关文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号