数据分布特征的描述

上传人:宝路 文档编号:48116757 上传时间:2018-07-10 格式:PPT 页数:90 大小:1.36MB
返回 下载 相关 举报
数据分布特征的描述_第1页
第1页 / 共90页
数据分布特征的描述_第2页
第2页 / 共90页
数据分布特征的描述_第3页
第3页 / 共90页
数据分布特征的描述_第4页
第4页 / 共90页
数据分布特征的描述_第5页
第5页 / 共90页
点击查看更多>>
资源描述

《数据分布特征的描述》由会员分享,可在线阅读,更多相关《数据分布特征的描述(90页珍藏版)》请在金锄头文库上搜索。

1、第五章、数据分布特征的描述【学习目标】o了解测定总体分布集中趋势的意义o熟悉测定总体分布集中趋势、离散 程度的各种指标的概念、特点、计算 方法及其应用o熟悉Excel用于以上各种指标的方 法,正确解释各项指标计算结果的实 际意义第五章、数据分布特征的描述o第一节、总体分布集中趋势的测定o第二节、总体分布离散程度的测定o第三节、Excel在数据分布特征分析 中的应用第一节、总体分布集中趋势的测定通过调查获得、经过整理后展现的数据 已经可以反映出被研究对象的一些状态与特 征,但认知程度还比较肤浅,反映的精确度 不够。为此,我们要使用各类代表性的数量特 征值来准确地描述这些数据。对单变量截面数据的特

2、征描述,主要有 四个方面:集中趋势、离散程度、偏态与峰 度。 集中趋势的现实意义83名女生的身高次数分布从两边向某中次数分布从两边向某中 心值靠拢的程度心值靠拢的程度算术平均数集中趋势的分布涵义集中趋势的分布涵义qq可以反映总体各单位变量的集中趋势和一般水平;可以反映总体各单位变量的集中趋势和一般水平;qq可以对比同类现象在不同的时间、地点和条件下的可以对比同类现象在不同的时间、地点和条件下的 一般水平;一般水平;qq可以分析现象之间的依存关系。可以分析现象之间的依存关系。qq平均指标可被作为评价事物和问题决策的数量标准平均指标可被作为评价事物和问题决策的数量标准 和参考。和参考。集中趋势指标

3、的意义:集中趋势指标的意义:指同质总体中各单位某一数指同质总体中各单位某一数 量标志的一般水平,是对总量标志的一般水平,是对总 体单位间数量差异的抽象化体单位间数量差异的抽象化指一组数据的次数分布从两边向某中指一组数据的次数分布从两边向某中 心值靠拢的程度,心值靠拢的程度,用用平均指标平均指标来反映来反映 。集中趋势集中趋势一、测定总体分布集中趋势的指标及其作用数值平均指标的种类数值平均指标的种类数值平均数数值平均数位置平均数位置平均数平均数平均数算算 术术 平平 均均 数数调调 和和 平平 均均 数数几几 何何 平平 均均 数数中中 位位 数数众众 数数基本形式:基本形式:例:例:直接承担者

4、(一)算术平均数(一)算术平均数二、数值平均数【注意】分子分母必须属于同一个总体:有一 个总体单位就必须有一个标志值与其对应。式中:式中: 为算术平均数为算术平均数; ; 为总体单位总数为总体单位总数 ; 为第为第 个单位的标志值。个单位的标志值。算术平均数的计算方法算术平均数的计算方法1. 1. 简单算术平均数简单算术平均数适用于总体资料未经 分组整理、尚为原始资料 的情况解:平均每人日销售额为:解:平均每人日销售额为:算术平均数的计算方法算术平均数的计算方法某售货小组某售货小组5 5个人,某天的销售额个人,某天的销售额 分别为分别为520520元、元、600600元、元、480480元、元

5、、750750 元、元、440440元,则元,则【例例】式中:式中: 为算术平均数为算术平均数; ; 为第为第 组的次数组的次数 ; 为组数;为组数; 为第为第 组的标志值或组中值组的标志值或组中值 。算术平均数的计算方法算术平均数的计算方法2. 2. 加权算术平均数加权算术平均数适用于总体资料经过适用于总体资料经过 分组整理形成变量数列的分组整理形成变量数列的 情况情况【例例】某企业某日工人的日产量资料如下某企业某日工人的日产量资料如下 : 日产产量(件)工人人数(人)10 11 12 13 1470 100 380 150 100 合计计800计算该企业该日全部工人的平均日产量计算该企业该

6、日全部工人的平均日产量 。算术平均数的计算方法算术平均数的计算方法解:解:算术平均数的计算方法算术平均数的计算方法若上述资料为组距数列,则应取各组的组若上述资料为组距数列,则应取各组的组 中值作为该组的代表值用于计算;此时求中值作为该组的代表值用于计算;此时求 得的算术平均数只是其真值的近似值。得的算术平均数只是其真值的近似值。说说 明明算术平均数的计算方法算术平均数的计算方法分析:分析:成绩绩(分)人数(人) 甲班乙班丙班603912010013920平均成绩绩(分 )619980起到起到权衡轻权衡轻 重的作用重的作用算术平均数的计算方法算术平均数的计算方法决定平均数决定平均数 的变动范围的

7、变动范围当变量值比较大的次数多时,平均数就接近 于变量值大的一方;当变量值比较小的次数 多时,平均数就接近于变量值小的一方。表现为次数、频数、单位数;即表现为次数、频数、单位数;即公式公式 中的中的表现为频率、比重;即公式表现为频率、比重;即公式中的中的算术平均数的计算方法算术平均数的计算方法绝对权数绝对权数相对权数相对权数指指变量数列中各组标志值出现的次变量数列中各组标志值出现的次 数,反映了各组的标志值对平均数数,反映了各组的标志值对平均数 的影响程度。的影响程度。权数权数算术平均数的计算方法算术平均数的计算方法变量值与其算术平均数的离差之 和衡等于零,即:变量值与其算术平均数的离差平 方

8、和为最小,即:算术平均数的主要数学性质算术平均数的主要数学性质离差的概念离差的概念12345678-1-1-213性质的证明各变量值与其平均数离差之和等于零,即:证明: 各变量值与其平均数离差平方之和等于最小 值,即: 证明: 设 为任意数,c为常数(c0),并令 则:因为 ,所以 ,即 :为最小 值。 性质的证明【例】 设设X=X=(2 2,4 4,6 6,8 8),),则其调和平则其调和平 均数可由定义计算如下:均数可由定义计算如下:再求再求算术平均数:算术平均数:求各求各标志值的倒数标志值的倒数 : , , ,再求再求倒数:倒数:是总体各单位标志值倒数的算术平是总体各单位标志值倒数的算术

9、平 均数的倒数,又叫均数的倒数,又叫倒数平均数。倒数平均数。调和平均数调和平均数(二)调和平均数(二)调和平均数生活中的简单例1:假如某种蔬菜在早、中、晚市的每市斤 的单价分别为0.5元、0.4元、0.2元,若 早、中、晚市各买一市斤,其平均价格用 简单算术平均数计算,结果是0.37元。但 若早、中、晚市各买一元钱,其平均价格 是多少?如果现在早、中、晚市所花钱数不再是一元 钱,而是如下表情形,求购进的该种蔬菜的 平均价格?生活中的简单例2:时间单价(元/斤)x 所花钱数(元)m早市 中市 晚市0.5 0.4 0.24 3 2合计 91. 1. 简单调和平均数简单调和平均数 适用于总体资料未经

10、 分组整理、尚为原始资料 的情况式中:式中: 为调和平均数为调和平均数; ; 为变量值为变量值 的个数;的个数; 为第为第 个变量值。个变量值。调和平均数的计算方法调和平均数的计算方法2. 2. 加权调和平均数加权调和平均数适用于总体资料经过分 组整理形成变量数列的情 况式中:式中: 为第为第 组的变量值;组的变量值; 为第为第 组的标志总量。组的标志总量。调和平均数的计算方法调和平均数的计算方法【注】调和平均数是算术平均数的变形当己知各组变量值和标志总量时当己知各组变量值和标志总量时 ,作为算术平均数的变形使用。,作为算术平均数的变形使用。因为:因为:调和平均数的应用调和平均数的应用日日产产

11、产产量(件)量(件)各各组组组组工人日工人日总产总产总产总产 量(件量(件 )1010 1111 1212 1313 1414700700 11001100 45604560 19501950 14001400 合合计计计计97109710【例例】某企业某日工人的日产量资料如下:某企业某日工人的日产量资料如下:计算该企业该日全部工人的平均日产量。计算该企业该日全部工人的平均日产量。调和平均数的应用调和平均数的应用即该企业该日全部工人的平均日产量为即该企业该日全部工人的平均日产量为 12.137512.1375件。件。调和平均数的应用调和平均数的应用解:解:指总体中出现次数最多的变量指总体中出现

12、次数最多的变量 值,用值,用 表示表示, ,它不受极端数它不受极端数 值的影响,用来说明总体中大值的影响,用来说明总体中大 多数总体单位所达到的一般水多数总体单位所达到的一般水 平。平。众数众数(一)众数(一)众数(Mode)不仅可以对定量数据加以计算,而且可以对 定性数据加以确定。众数的优点 具有非常直观的代表意义。例如,说明某次考 试学生成绩最集中的水平;说明城镇居民最普 遍的生活水平等等。三、位置平均数日日产产产产量(件量(件 )工人人数(人工人人数(人 ) 1010 1111 1212 1313 14147070 100100 380380 150150 100100 合合计计计计80

13、0800【例例A A】已知已知某企业某日工人的日产量资料如下某企业某日工人的日产量资料如下: :众数的确定方法众数的确定方法(单项数列)(单项数列)计算该企业该日全部工人日产量的众数。计算该企业该日全部工人日产量的众数。组距数列众数公式组距数列众数公式众数的确定众数的确定 (组距数列)组距数列)【例例B B】某某车间车间5050名工人月产量的资料如下:名工人月产量的资料如下:月产产量(件) 工人人数(人)向上累计计次数 (人) 200以下 200400 400600 600以上3 7 32 83 10 42 50 合计计50计算该车间工人月产量的众数。计算该车间工人月产量的众数。概约众数:众数

14、所在组的 组中值,在本例为500件众数的原理及应用众数的原理及应用83名女生身高原始数据83名女生身高组距数列出生1981.01980.01979.01978.01977.01976.01975.0160140120100806040200没有突出地集 中在某个年份413413名学生出生时间分布直方图名学生出生时间分布直方图众数的原理及应用 (无众数)192.5190.5188.5186.5184.5182.5180.5178.5176.5174.5172.5170.5168.5166.5164.5162.5160.5158.5156.5154.5152.5150.5148.560504030

15、20100413413名学生的身高分布直方图名学生的身高分布直方图(双众数)当数据分布呈现出双众数或多众数时, 可以断定这些数据来源于不同的总体。出现了两个明 显的分布中心q当数据分布存在明显的集中趋势 ,且有显著的极端值时,适合使用 众数;q当数据分布的集中趋势不明显或 存在两个以上分布中心时,不适合 使用众数(前者无众数,后者为双 众数或多众数,也等于没有众数) 。众数的原理及应用众数的原理及应用将总体单位数分为相等的两部分;将总体单位数分为相等的两部分;不不受受极端数值的影响,在总体标志值差异很极端数值的影响,在总体标志值差异很 大时,具有较强的代表性。大时,具有较强的代表性。中位数的作用:中位数的作用:将将总体各单位标志值按大小顺总体各单位标志值按大小顺 序排列后,指处于数列中间位序排列后,指处于数列中间位 置的标志值,用置的标志值,用 表示表示中位数中位数(二)中位数(二)中位数(Median)中位数的位次为:中位数的位次为:即第即第3 3个单位的标志值就是中位数个单位的标志值就是中位数【例例A A】某售货小组某售货小组5 5个人,某天的销售额按个人,某天的销售额按 从小到大的顺序排列为从小到大的顺序排列为440440元、元、480480元、元、520520元元 、600600元、元、750750元,则元,则中位数的确定中位数的确定(未分组资料)(未

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 中学教育 > 教学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号