第三讲 平均数、标准差和变异系数课件

上传人:我*** 文档编号:140892101 上传时间:2020-08-02 格式:PPT 页数:41 大小:192KB
返回 下载 相关 举报
第三讲 平均数、标准差和变异系数课件_第1页
第1页 / 共41页
第三讲 平均数、标准差和变异系数课件_第2页
第2页 / 共41页
第三讲 平均数、标准差和变异系数课件_第3页
第3页 / 共41页
第三讲 平均数、标准差和变异系数课件_第4页
第4页 / 共41页
第三讲 平均数、标准差和变异系数课件_第5页
第5页 / 共41页
点击查看更多>>
资源描述

《第三讲 平均数、标准差和变异系数课件》由会员分享,可在线阅读,更多相关《第三讲 平均数、标准差和变异系数课件(41页珍藏版)》请在金锄头文库上搜索。

1、上章内容回顾,试验资料的整理:检查和核对;制作次数分布表和分布图(柱形图、折线图、条形图,饼图),试验资料搜集常用的方法:调查和试验,试验资料均具有集中性和离散性两种基本特征,平均数是反映集中性的特征数,变异数是反映离散型的特征数,第三章 平均数、标准差和变异系数,平均数(mean)用于反映资料的集中性,即观测值以某一数值为中心而分布的性质。 标准差(standard deviation)与变异系数(variation coefficient)反映资料的离散性,即观测值分散变异的性质。,第一节 平均数,一、平均数的意义和种类 二、算术平均数的计算方法 三、算术平均数的重要特性 四、算术平均数的

2、作用 五、总体平均数,一、平均数的意义和种类,平均数(average)是数据的代表值,表示资料中观察值的中心位置,并且可作为资料的代表而与另一组资料相比较,借以明确二者之间相差的情况。 平均数是统计学中最常用的统计量,用来表明资料中各观测值相对集中较多的中心位置。平均数主要包括有: 算术平均数(arithmetic mean) 中位数(median) 众数(mode) 几何平均数(geometric mean) 调和平均数(harmonic mean),算术平均数: 一个数量资料中各个观察值的总和除以观察值个数所得的商数,称为算术平均数(arithmetic mean),记作 。因其应用广泛,

3、常简称平均数或均数(mean)。均数的大小决定于样本的各观察值。,1、算术平均数,2、中位数,中位数: 将资料内所有观察值从大到小排序,居中间位置的观察值称为中数(median),计作Md。当观测值的个数是偶数时,则以中间两个观测值的平均数作为中位数。当所获得的数据资料呈偏态分布时,中位数的代表性优于算术平均数。 中位数的计算方法因资料是否分组而有所不同。对于未分组资料,先将各观测值由小到大依次排列,找到中间的1个数(n为奇数)或2个数( n为偶数),之后求平均即可。,众数: 资料中最常见的一数,或次数最多一组的中点值,称为众数(mode),记为M0。如棉花纤维检验时所用的主体长度即为众数。,

4、3、众数,众数可能不存在 可能有多个众数 多用于属性数据,几何平均数: 如有n个观察值,其相乘积开n次方,即为几何平均数(geometric mean),用G代表。其计算公式如下:,4、几何平均数,为了计算方便,可将各观测值取对数后相加除以n,得lgG,再求lgG的反对数,即得G值,即:,调和平均数:(harmonic mean)各观测值倒数的 算术平均数 的倒数,称为调和平均数,记为H。即 (4.6),5、调和平均数,对于同一资料: 算术平均数几何平均数调和平均数 上述五种平均数,最常用的是算术平均数。,算术平均数可根据样本大小及分组情况而采用直接法或加权法计算。,(一)直接法,主要用于未经

5、分组资料平均数的计算。,二、算术平均数的计算方法,设某一资料包含n个观测值: x1、x2、xn, 则样本平均数可通过下式计算:,(4.1),简写:,【例1】 某植保站测得10只某类害虫的体重分别为500、520、535、560、585、600、480、510、505、490(mg),求其平均数。,由于 x = 500 + 520 + 535 + 560 + 585 + 600 + 480 + 510 + 505 + 490 = 5285, n =10,得:,即 10只害虫的平均体重为528.5 mg。,(二)加权法,(4.2),式中: xi -第i 组的组中值; fi -第i组的次数;k -分

6、组数,第i组的次数 fi 是权衡第i组组中值 xi 在资料中所占比重大小的数量,因此将 fi 称为是 xi 的“权”,加权法也由此而得名。,对于样本含量 n30 以上且已分组的资料,可以在次数分布表的基础上采用加权法计算平均数,计算公式为:,【例2】 从A、B两小区分别抽取4个和5个小麦麦穗,测得其样本如下,用两种方法计算其平均值,并比较计算结果。,【例3】 140行水稻产量(P38),用两种方法求其平均数,并比较计算结果。 (1)直接法:,(2)加权法:,1、算术平均数的计算与每一个数(值)都有关。 2、如果 是n1个值的平均数, 是n2个值的平均数,那么全部n1n2个值的算术平均数是 (加

7、权平均数),三、算术平均数的重要特性,3、样本各观测值与平均数之差的和为零,即离均差之和等于零。 或简写成,4、样本各观测值与平均数之差的平方和为最小,即离均差平方和为最小。,(常数 ),或简写为:,5、若A为任意常数,,6、平均数是有单位的数值,与原资料单位相同。 注意:必须性状同质时, 才有代表性。,算术平均数是描述观测资料的重要特征数,它的作用主要有以下两点: 1. 指出数据资料的中心位置,标志着资料所代表性状的数量水平和质量水平。 2. 可以作为样本或资料的代表数据与其他资料进行比较。,四、算术平均数的作用,对于总体而言,通常用表示总体平均数,有限总体的平均数为: (4.3) 式中,N

8、 表示总体所包含的个体数。 当一个统计量的数学期望等于所估计的总体参数时,则称此统计量为该总体参数的无偏估计量。 统计学中常用样本平均数( )作为总体平均数()的估计量,并已证明样本平均数是总体平均数的无偏估计量。,五、总体平均数,第二节 变异数,平均数作为样本的代表,其代表性的强弱受样本资料中各观测值变异程度的影响。每个样本有一批观察值,除以平均数作为样本的集中性表现外,还应该考虑样本内各个观察值的变异情况,才能通过样本的观察数据更好地描述样本,乃至描述样本所代表的总体,为此必须有度量变异的统计数。常用的描述变异程度指标有: 1、极差(range) 2、方差(variance) 3、标准差(

9、standard deviation) 4、变异系数(variation coefficient),一、极差,极差(range),又称全距,记作R,是资料中最大观察值与最小观察值的差数。 极差虽可以对资料的变异有所说明,但它只是两个极端数据决定的,没有充分利用资料的全部信息,而且易于受到资料中不正常的极端值的影响。所以用它来代表整个样本的变异度是有缺陷的。,二、方差,为了正确反映资料的变异度,较合理的方法是根据样本全部观察值来度量资料的变异度。这时要选定一个数值作为共同比较的标准。平均数既作为样本的代表值,则以平均数作为比较的标准较为合理,但同时应该考虑各样本观察值偏离平均数的情况,为此这里给

10、出一个各观察值偏离平均数的度量方法。,为 了 准 确 地 表示样本内各个观测值的变异程度 ,人们 首 先会考虑到以平均数为标准,求出各个观测值与平均数的离差,( ) ,称为离均差。 虽然离均差能表示一个观测值偏离平均数的性质和程度,但因为离均差有正、有负 ,离均差之和 为零,即( ) = 0 ,因 而 不 能 用离均差之和 ( )来 表 示 资料中所有观测值的总偏离程度。,为了解决离均差有正 、有负,离均差之和为零的问 题,可先求 离 均 差的绝 对 值 并 将 各 离 均 差 绝对 值 之 和 除以 观 测 值 个 数n 求 得 平 均 绝 对 离差,即|x x |/n。虽然平均绝对离差可以

11、表示资料中各观测值的变异程度 ,但由于平均绝对离差包含绝对值符号 ,使用很不方便,在统计学中未被采用。,我们还可以采用将离均差平方的办法来解决离均差有正、有负,且离均差之和为零的问题。 先将各 个离 均差平方,即 ( )2 ,再求 离均差平方和 , 即 ,简称平方和,记为SS; 由 于 离差平方和 常 随 样 本 大 小 而 改 变 ,为 了 消 除 样 本大小 的 影 响 , 用平方和 除 以 样 本 大 小, 即 ,求出离均差平方和的平均数 ;,为了使所得的统计量是相应总体参数的无 偏估计量,统计学证明,在求离均差平方和的平均数时,分母不用样本含量n,而用自由度 n-1, 于是,我们 采

12、用统计量 表示资料的变异程度。 统计量 称为均方(mean square, 缩写为MS), 又称样本方差,记为S2,即 S2= (4.7),相应的总体参数叫 总体方差 ,记为2。对于有限总体而言,2的计算公式为: (4.8),标准差为方差的正平方根值,用以表示资料的变异度,其单位与观察值的度量单位相同。从样本资料计算标准差的公式为: 同样,样本标准差是总体标准差的估计值。总体标准差用表示:,由于 样本方差 带有原观测单位的 平方单位,在仅表示一个资料中各观测值的变异程度而不作其它分析时,常需要与平均数配合使用,这 时应 将平方单位还原,即应求出样本方差的平方根。统计学上把样本方差 S2 的平方

13、根叫做样本标准差,记为S,即:,三、标准差,由于,所以( 4.9 )式可改写为:,(4.10),相应的总体参数叫总体标准差,记为。对于有限总体而言,的计算公式为: (4.11) 在统计学中,常用样本标准差S估计总体标准差。,四、变异系数,标准差和观察值的单位相同,表示一个样本的变异度。若比较两个样本的变异度,则因单位不同或均数不同,不能用标准差进行直接比较。这时可计算样本的标准差对均数的百分数,称为变异系数(coefficient of variation)。,变异系数是无量纲的量,可以用于不同单位、不同尺度下各样本变异程度的比较。,【例7】 已知某甲品种猪平均体重为 190kg, 标准差为10.5kg,而乙品种猪平均体重为196kg,标准差为8.5kg,试问两个品种的猪,那一个体重变异程度大。,由于,甲品种猪体重的变异系数: 乙品种猪体重的变异系数: 所以,甲品种猪体重的变异程度大于乙品种猪。,注意:变异系数的大小,同时受平均数和标准差两个统计量的影响,因而在利用变异系数表示资料的变异程度时,最好将平均数和标准差也列出。,课后作业,教材23页: 习题2.2;习题2.3;习题2.4;习题2.9,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > PPT模板库 > PPT素材/模板

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号