不确定度分析培训教程二Prepared by: fjhuangOct.15, 2016第二章 不确定度计算中的统计知识-2-第二章 不确定度计算中的统计知识随机变量 作一次试验 ,其结果有多种可能 .每一种可能结果都可用一个数来表示 ,可把这些数看作为某变量 X的取值范围 ,变量 X称为“ 随机变量 ” ,即 实验结果可用随机变量 X来表示 通俗地讲 ,表示随机现象结果的变量称为随机变量 .常用大写字母 X, Y, Z等表示随机变量 ,它们的取值用相应的小写字母 x, y, z表示 定义:如果某一量 (例如测量结果 )在一定条件下 ,取某一值或在某一范围内取值是一个随机事件 ,则这样的量称作随机变量 3-第二章 不确定度计算中的统计知识 随机变量根据其值的性质不同 ,可分为 离散型和连续型 两种 . 如果随机变量 X的所有可能取值为有限个或可列个 ,且以各种确定的 概率 取这些不同的值 ,则称随机变量 X为离散型随机变量 如果随机变量的所有可能取值充满为某范围内的任何数值 ,且在其取值范围内的任一区间中取值时 ,其概率是确定的 ,则称 X为连续型随机变量 4-第二章 不确定度计算中的统计知识概率 (probability)– 概率与在一段较长时间内的事件发生的相对频率有关– 或与事件发生的可信程度 (degree of belief)有关-----------GBT 3358.1-2009 统计学词汇及符号 第 1部分:一般统计术语与用于概率的术语定义 : 概率是一个 0~1之间隶属于随机事件的实数-5-第二章 不确定度计算中的统计知识概率的频率解释 若对某一个被测量重复测量 ,我们可以得到一系列测量数据 ,这些数据称测得值或观测值 测得值是随机变量,它们分散在某个区间内,概率是测得值在区间内出现的相对频率,即出现的可能性大小的度量 在此定义的基础上奠定了测量不确定度 A类评定的理论基础 。
6-第二章 不确定度计算中的统计知识概率的可信程度的解释 由于测量的不完善或人们对被测量及其影响量的认识不足 ,概率是测量值落在某个区间内的可信度大小的度量 在这个定义中 , 对于那些我们不知道其大小的系统误差 , 可以认为是以一定的概率落在区间的某个位置 , 认为也属于随机变量 或者说 , 某项未知的系统误差落在该区间内的可信程度也可以用概率表征 这是 测量不确定度 B类评定的理论基础-7-第二章 不确定度计算中的统计知识概率的表示方法测量值 x落在 (a,b)区间内的概率可以表示为概率的值在 0到 1之间 P a x b01p-8-第二章 不确定度计算中的统计知识概率分布 (probability distribution) 一个随机变量取任何给定值或属于某一给定值集的概率随取值而变化的函数– 1.随机变量在整个集合中取值的概率等于 1– 2.一个概率分布与单一 (标量 )随机变量有关时称为单变量概率分布 ,与随机变量的向量有关时称为多变量概率分布 .多变量概率分布也称联合分布– 3.一个概率分布可以采用 分布函数 或 概率密度函数 的形式-9-第二章 不确定度计算中的统计知识分布函数对于每个 x值给出了随机变量 X小于或等于 x的概率的一个函数称 分布函数 , 用 F(x)表示 : F (x)= P( X≤ x )0 1 2 31F(x)x1. F (x) 是一个不减的函数2.0 ( ) 1 ,( ) l i m ( ) 0 ;( ) l i m ( ) 1.xxFxF F xF F x 且-10-第二章 不确定度计算中的统计知识概率密度函数分布函数的导数 ( 当导数存在时 ) 称 (连续随机变量的 ) 概率密度函数 , 用 p(x)表示 ,p(x)=dF (x)/dx p(x) dx称 “ 概率元素 ”p(x) dx= P( x< X< x+ dx )-11-第二章 不确定度计算中的统计知识离散型随机变量的概率分布• 要了解离散型随机变量 X的统计规律 , 就必须知道它的一切可能值 xi及取每种可能值的概率 pi• 如果将离散型随机变量 X的一切可能取值 xi及其对应的概率 pi ,记作P(X= xi)= pi , i=1,2,… .• 则称上式为离散型随机变量 X的概率分布或分布Xpi21-1 2 3 4141-12-第二章 不确定度计算中的统计知识概率密度函数• 若已知某个随机变量的概率密度函数 p(x),则测量值 x落在 (a,b)区间内的概率 p可用下式计算• 数学上 , 积分代表了面积 。
由此可见 , 概率 p是概率分布曲线下在 区间 ( a, b )内包含的面积• 当 p=0.9, 表明测量值有 90%的可能性落在该区间内 , 该区间包含了概率分布下总面积的 90%• 当 p=1, 表明测量值以 100%的可能性落在该区间内 , 也就是测量值必定在此区间内 baP a x b p x d x -13-第二章 不确定度计算中的统计知识概率分布的特征参数• 尽管概率分布反映了该随机变量的全貌 ,但在实际使用中更关心代表该概率分布的若干数字特征量 – 期望 ---Expectation– 方差 ---Variance– 标准偏差 ---Standard Deviation-14-第二章 不确定度计算中的统计知识期望 expectation• 期望又称 (概率分布或随机变量的 )均值 (mean)或 期望值(expected value), 有时又称 数学期望 • 常用符号 表示 , 也用 E(X)表示 • 测量值的期望– 离散随机变量– 连续随机变量• 通俗地说:期望值是 无穷多次测量的平均值 1 iiiE X p x ( ) ( )E X x p x d x -15-第二章 不确定度计算中的统计知识• 对于单峰 、 对称的概率分布来说 , 期望值在分布曲线 峰顶 对应的横坐标• 正因为实际上不可能进行无穷多次测量 , 因此 , 测量中 期望值是可望而不可得的 。
1 2 3 • 期望是概率分布曲线与横坐标轴构成面积的重心所在的横坐标 ,因此它是决定随机变量分布的位置的量-16-第二章 不确定度计算中的统计知识1 2 3 三条测量值分布曲线的精密度相同 , 但正确度不同 • 期望与真值之差即为系统误差 , 如果系统误差可以忽略 , 则期望就是被测量的真值• 期望代表了测量的最佳估计值 , 或相对真值的系统误差大小-17-第二章 不确定度计算中的统计知识方差 Variance对于一个随机变量 ,仅用数学期望还不足以充分描述其特性 比如 ,两组测量数据:28,29,30,31,32…… 数学期望 30, 各个数据在 28和 32之间波动10,20,30,40,50…… 数学期望 30, 各个数据在 10和 50之间波动两组数据具有相同的数学期望为 30,但它们具有重要的差别 第 2组数据比第一组数据分散得多 18-第二章 不确定度计算中的统计知识• (随机变量或概率分布的 )方差用符号 σ2表示• 测量值与期望之差是随机误差 ,方差就是随机误差平方的期望值• 方差说明了随机误差的大小和测量值的分散程度 .但由于方差的量纲是单位的平方 ,使用不方便 ,因此引出了标准偏差这个术语 .22 1()l imniinxn 22 ( ) ( )V X E X E X 2( ) ( )x p x d x-19-第二章 不确定度计算中的统计知识标准偏差• 概率分布或随机变量的标准偏差是方差的正平方根值 , 用符号 表示• 标准偏差是无穷多次测量的随机误差平方的算术平均值的正平方根值的极限 ,()VX nxniin 12)(lim-20-第二章 不确定度计算中的统计知识标准偏差是表明测得值分散性的参数 , 小表明测得值比较集中 ,大表明测得值比较分散 .通常 ,测量的重复性或复现性是用标准偏差来表示的 。
1 2 3 123三条误差分布曲线的正确度相同,但精密度不同-21-第二章 不确定度计算中的统计知识 由于标准偏差 是无穷多次测量时的极限值 , 所以又称 总体标准偏差 可见:期望和方差 (或标准偏差 )是表征概率分布的两个特征参数 理想情况下 , 应该以 期望为被测量的测量结果 , 以 标准偏差表示测得值的分散性 .由于期望 、 方差和标准偏差都是以 无穷多次测量 的理想情况定义的 ,因此都是 概念性的术语 ,无法由测量得到 ,2和 22-第二章 不确定度计算中的统计知识有限次测量时 μ和 σ的估计值算术平均值 (arithmetic mean)---------期望的 最佳估计值1211 nniix x xxxnn 在相同测量条件下 ,对某被测量 X进行有限次独立重复测量 ,得到一系列测量值 ,算术平均值为12, , . . . , nx x x-23-第二章 不确定度计算中的统计知识算术平均值是期望的最佳估计值• 由大数定理证明 , 测量值的算术平均值是其期望的最佳估计值• 大数定理: 212, , ,l im | - | 1nnx x x nnPx设 为 个 独随 变 则 当 时 术敛 术为 数立 且 同 期 望 和 同 方 差 的机 量 , , 其 算 平 均 值 依 概 率收 于 , 亦 即 算 平 均 值 和 期 望 的 差 异 很 小 是一 必 然 事 件 。
式 中 任 意 小 正-24-第二章 不确定度计算中的统计知识算术平均值若干个独立同分布的随机变量的平均值以无限接近于1的概率接近于其期望 所以 是期望 的最佳估计值 即使在同一条件下对同一量进行多组测量 ,每组的平均值都不相同 ,说明 算术平均值本身也是随机变量 由于有限次测量时的算术平均值是其期望的最佳估计值 .因此 ,通常用算术平均值作为测量结果的值 X-25-第二章 不确定度计算中的统计知识自由度在统计学中 , 自由度指的是计算某一统计量时 ,取值不受限制的变量个数 . 通常 df=n-k 其中 n为样本数量 , k为被限制的条件数或变量个数 , 或计算某一统计量时用到其它独立统计量的个数 自由度通常用于抽样分布中当以样本的统计量来估计总体的参数时 ,样本中独立或能自由变化的自变量的个数 , 称为该统计量的自由度在估计总体的方差时 ,使用的是离差平方和 .只要 n-1个数的离差平方和确定了 ,方差也就确定了 ;因为在均值确定后 ,如果知道了其中 n-1个数的值 ,第 n个数的值也就确定了 .这里 ,均值就相当于一个限制条件 ,由于加了这个限制条件 ,估计总体方差的自由度为n-1.-26-第二章 不确定度计算中的统计知识自由度定义 : 在方差计算中 , 和的项数减去对和的限制数 。
自由度的表示:用 ν 表示 【 JJF1059.1-3.31】自由度的意义:在标准偏差的计算中 , 测量次数越少 , s的可靠性越差 , 测量次数越多 , s的可靠性越好 , 所以测量次数的多少反映了 s的可靠程度 也就是说自由度愈大 , 标准差愈可信赖 所以 , 自由度的大小就直接反映了不确定度的评定质量 不确定度计算中的自由度-27-第二章 不确定度计算中的统计知识实验标准偏差 (experimental standard。