有限数据统计处理(总体参数估计)第三章剖析

上传人:今*** 文档编号:108187310 上传时间:2019-10-22 格式:PPT 页数:42 大小:1.41MB
返回 下载 相关 举报
有限数据统计处理(总体参数估计)第三章剖析_第1页
第1页 / 共42页
有限数据统计处理(总体参数估计)第三章剖析_第2页
第2页 / 共42页
有限数据统计处理(总体参数估计)第三章剖析_第3页
第3页 / 共42页
有限数据统计处理(总体参数估计)第三章剖析_第4页
第4页 / 共42页
有限数据统计处理(总体参数估计)第三章剖析_第5页
第5页 / 共42页
点击查看更多>>
资源描述

《有限数据统计处理(总体参数估计)第三章剖析》由会员分享,可在线阅读,更多相关《有限数据统计处理(总体参数估计)第三章剖析(42页珍藏版)》请在金锄头文库上搜索。

1、化学化工与生命科学系,任课老师 王丽华,实验设计与数据处理 第三章 有限数据统计处理,3.1,3.2,总体的参数估计,期望值和方差、参数估计,一般统计检验,平均值检验、F检验、离群值检验,内容,总体、个体和样本:,总体(Population):调查研究的事物或现象的全体 个体(Item unit):组成总体的每个元素 样本(Sample):从总体中所抽取的部分个体 样本容量(Sample size):样本中所含个体的数量,示例:有限数据的统计处理,总体,样本,甲,样本容量,平均值,500g,乙,平行测定 3 次,平行测定 4 次,丙,平行测定 4 次,有限数据的处理:,计算,估计,显著性检验,

2、没有系统误差, = T,有系统误差, T,3.1.1 期望值和方差,数据集中趋势的表示:对一B物质客观存在量为T 的分析对象进行分析,得到n 个个别测定值 x1、x2、x3、 xn,,平均值 Average,有限次测量:测量值向平均值 集中,无限次测量:测量值向总体平均值 集中,数据集中趋势和分散程度的表示,数据分散程度的表示:,极差R Range,相对极差R,偏差 Deviation,平均偏差 Mean deviation,相对平均偏差 relative mean deviation,标准偏差 standard deviation,相对标准偏差(变异系数) Relative standard

3、 deviation (Coefficient of variation , CV ),总体标准偏差与标准偏差的比较:,总体标准偏差,标准偏差,无限次测量, 对总体平均值的离散,有限次测量 对平均值的离散,自由度,计算一组数据分散度的独立偏差数,自由度的理解:例如,有三个测量值,求得平均值,也知道x1和x2与平均值的差值,那么,x3与平均值的差值就是确定的了,不是一个独立的变数。,平均值的标准偏差:,S(x)的物理意义:在有限次测量中,每个测量值平均所具有的标准偏差。,对有限次测量:,1、增加测量次数可以提高精密度。,2、增加(过多)测量次数的代价不一定能从减小误差得到补偿。,结论:,期望值和

4、方差,在概率论和统计学中,期望值(或数学期望、或均值,亦简称期望,物理学中称为期待值)是指在一个离散性随机变量试验中每次可能结果的概率乘以其结果的总和。 换句话说,期望值是随机试验在同样的机会下重复多次的结果计算出的等同“期望”的平均值。需要注意的是,期望值并不一定等同于常识中的“期望”“期望值”也许与每一个结果都不相等。(换句话说,期望值是该变量输出值的平均数。期望值并不一定包含于变量的输出值集合里。) 方差(variance)是在概率论和统计方差衡量随机变量或一组数据是离散程度的度量。统计中的方差(样本方差)是各个数据分别与其平均数之差的平方的和的平均数。在许多实际问题中,研究方差即偏离程

5、度有着重要意义。,3.1.2 参数估计,矩估计法,最小二乘法,最大似然法,顺序统计量法,估 计 方 法,点 估 计,区间估计,在实际生活中,我们不能通过去测定无限多次去获得和2但可以利用样本的统计量对总体平均值()和方差(2)进行估算,一、点估计,从总体中抽取一个样本,根据该样本的统计量对总体的未知参数作出一个数值点的估计 例如: 用样本均值作为总体未知均值的估计值就是一个点估计 2. 点估计没有给出估计值接近总体未知参数程度的信息 点估计的方法有矩估计法、顺序统计量法、最大似然法、最小二乘法等,概念要点:,被估计的总体参数,估计量的优良性准则,无偏性:估计量的数学期望等于被估计的总体参数,有

6、效性:一个方差较小的无偏估计量称为一个更有效的估计量。如,与其他估计量样本相比均值是一个更有效的估计量。,充分性:作为估计参数用的统计量已经提取了样本中所有可利用的信息(随着样本容量的增大,估计量越来越接近被估计的总体参数 )。,问题:,在 的某个范围 内包含 的概率 有多大?,对有限次测量,二、区间估计,总体平均值的置信区间,例:, 包含在 区间,几率相对大,几率 相对小,几率为100% 无意义,平均值的置信区间的问题,二、区间估计,在实际测定分析中,为了评价测定结果的可靠性,人们总希望能够估计出实际有限次测定的平均值与真实值的接近程度,即在测量值附近估计出真实值可能存在的范围以及试样含量落

7、在此范围内的概率,从而说明分析结果的可靠程度。由此引出置信区间与置信概率的问题。,置信区间和置信概率,置信区间与置信概率,1. 根据一个样本的观察值给出总体参数的估计范围 给出总体参数落在这一区间的概率 例如: 总体均值落在5070之间,置信度为 95%,概念要点:,置信区间,无限多次测定中才有总体平均值和总体标准偏差,而实际测定为有限次测定,与未知,只能用有限次测定的平均值及标准偏差S来估计。用S代替引起的误差可用校正系数t来补偿。,置信区间和置信概率,总体平均值将包括在 区间内,即包括在X平均值附近的某区间内。 因此称在 的区间为置信区间。 置信区间:在一定置信度下,以测定结果x 为中心的

8、,包括总体平均值在内的可靠性范围。 把测定值在置信区间内出现的概率称为置信概率(P),也称为置信度。,置信水平:,总体未知参数落在区间内的概率 表示为P= (1-)% 为显著性水平,是总体参数未在区间内的概率 常用的置信水平值有 99%, 95%, 90% 相应的为为0.01,0.05.0.10,置信区间与置信水平:,均值的抽样分布,(1 - ) % 区间包含了 % 的区间未包含,置信区间与置信概率,置信区间与置信概率,t 分布表,置信区间和置信概率,结论: (1)根据平均值x,查t可求出可能存在的范围即置信区间。 (2)测定次数越多、精密度越高、S越小,置信区间就越小,算术平均值和总体平均值

9、越接近,算术平均值的可靠性就越大,因此用置信区间表示分析结果更合理。 (3)t越小,置信区间越小,校正系数t与自由度有关,f=n-1,测定次数越多,t越小,当n,t分布曲线为正态分布曲线。,置信区间和置信概率,结论: (4)t值随测定次数的增加而减小,随置信概率的提高而增大。当测定次数较少时,可适当增加测定次数,缩小置信区间,从而使测定值的平均值与总体平均值更接近。 (5)比较两个或多个测定结果的准确程度,应在同一置信概率下进行。,(三)总体平均数的区间估计 1、大样本条件下的区间估计 (1)、总体标准差已知条件下,对总体平均数的区间估计,案例2:某茶叶进出口公司,准备处理一批库存2年的茶叶,

10、出库之前要进行一次检验。检验数据如下;样本容量为64包,样本平均数为每包2公斤,入库记录表明总体标准差为0.2公斤。经理要求在95%的可信度下,估计一下这批茶叶的平均重量在多大范围内?,解: 答:这批茶叶平均重量在1.9512.049公斤,其可信程度为95%。,(2)、总体标准差未知条件下的区间估计 总体标准差未知条件下,一般用样本标准差S代替总体标准差。,案例:某项抽样调查中获得如下资料: N可以视为无限总体,n=81,样本平均数为500,样本标准差为90,求:总体平均数可信度为90%的置信区间。 解: 答:此项调查中,总体平均数的可信度为90%的置信区间是在483.55516.45之间。,

11、2、小样本条件下的区间估计 (1)、总体标准差已知条件下,对总体平均数的区间估计 使用t分布的条件:当样本容量n30,且总体标准差未知时,用样本标准差S代替总体标准差。样本标准差S,计算公式:,例1:从大学一年级学生中随机抽取12名学生,其阅读能力得分为28,32,36,22,34,30,33,25,31,33,29,26。试评估一下大学一年级学生阅读能力的总体平均分数。要求置信度分别是95%和99%。,解:步骤: (1)计算样本平均数: (2)计算样本标准差: (3)计算平均误差: (4)确认自由度:df=12-1=11,误差概率: =1-0.95=0.05,查表,t=2.201,(5)估计

12、总体平均数置信区间: 解释:有95%的把握程度说大学一年级学生阅读能力平均分数在27.31132.523分之间。 当=1-0.99=0.01,查表,t=3.106 29.917-3.1061.184=26.24;29.917+3.1061.184=33.59。,置信区间和置信概率,例:某铵盐含氮量的测定结果x=21.30%,S=0.06%,n=4。求置信概率为95%和99%时平均值的置信区间?若n=10(假定其它数据不变),置信概率为99%时平均值的置信区间为多少?,置信区间和置信概率,注意:例题结果说明 (1)置信概率的高低反映测定值的可靠程度。 置信概率并非越高越好,因为P值增大,t增大,置信区间增大,测定值的精密度降低,100%置信概率就意味着置信区间无限大,肯定会包含总体平均值,但此置信区间毫无意义。 置信概率也不可能太低,因为虽然P减小会使置信区间减小,但测定值的可靠程度降低。 分析化学中置信概率通常选在90%或95%。,置信区间和置信概率,注意:例题结果说明 (2)置信区间的大小反映测定值的精密度。 相同置信概率时,测定次数n增大,置信区间减小,分析结果的精密度将提高。 (3)比较多个测定值的准确程度,应在同一置信概率下进行,否则没有可比性。,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号