实验数据分析方法－金锄头文库

资源描述

《实验数据分析方法》由会员分享，可在线阅读，更多相关《实验数据分析方法（32页珍藏版）》请在金锄头文库上搜索。

1、实验数据处理方法第三部分：统计学方法,第十二章最大似然法(Maximum Likelihood method),第十二章最大似然法(Maximum Likelihood Method),点估计的方法之一，是参数估计中常用的方法，具有以下的特点：,在一定的条件下，ML估计式满足一致性、无偏性、有效性等要求；当样本容量n时，ML估计式满足正态分布方差容易计算；用ML方法可较容易地得到参数的估计式；,本章内容：,最大似然原理；用ML方法求解参数估计问题的步骤；ML估计式的特性；如何计算ML估计值的方差；利用似然函数进行区间估计,第十二章最大似然法(Maximum Likelyhood Meth

2、od),12.1 最大似然原理,12.1 最大似然原理,(一) 似然函数的定义,p.d.f：f(x|)测量量：x = x1, x2, , xn ,(二) 最大似然原理,未知参数的最佳估计值应满足如下的条件：,位于的允许取值范围；对于给定的一组测量值，使L取极大值：,12.1 最大似然原理,(三)估计值的求法,似然方程：,极大值条件：,因为lnL是L的单调上升函数，lnL和L具有相同的极大值点，所以，LlnL，求和运算比乘积运算容易处理,似然方程：,极大值条件：,如果有k个位置参数， = 1, 2, , k,k阶似然方程,估计值：,12.1 最大似然原理,极大值条件：二次矩阵是负定的(

3、Negative definite),第十二章最大似然法(Maximum Likelyhood Method),12.2 用ML方法进行参数估计的步骤,12.2 用ML方法进行参数估计的步骤,构造概率密度函数；构造似然函数；求似然函数的极大值。,12.2 用ML方法进行参数估计的步骤,（一）构造概率密度函数,物理系统的特性：某些量的理论概率分布函数实验的条件：分辨率、探测效率,ML方法中所需的p.d.f,例：不变质量谱分析：e+e-J/K+K-,通过测量K+K-的动量，可得到K+K-的不变质量分布，对该分布进行统计分析，可得到衰变过程中产生的共振态的信息；描述不变质量m的分布的p.d.f应包

4、含对该分布有贡献的物理过程,12.2 用ML方法进行参数估计的步骤,1. 信号事例：,在不变质量为m0处出现共振态X的弹性散射振幅可用Breit-Wigner公式描述：,：X的宽度，m0：X的静质量，m：K+K-的不变质量,（1）如果较小,实验结果包含质量分辨率和探测效率的影响，，故必须对理论公式进行修正,12.2 用ML方法进行参数估计的步骤,(m)：效率函数，因(m)随m的变化较小，故(m)常数 R(m,m)：分辨率函数，真值为m时，获得测量值m的概率,其中：,：质量分辨率,因此，窄共振峰的p.d.f为,12.2 用ML方法进行参数估计的步骤,（1）如果较大，宽共振峰,如果在衰变过程中存

5、在着多个宽共振，则可能存在仙湖干涉的现象，设有Namp个相干的共振峰，则描述这些共振峰的p.d.f为,因为，所以R(m,m) (m-m),k-1：相位差k-1：第k个相干的共振峰事例数/第一个相干的共振峰的事例数,12.2 用ML方法进行参数估计的步骤,2. 本底事例：相空间本底、粒子误判本底、其它衰变道本底等,fps(m,)：相空间函数,Pi(x)：i阶Legendre多项式,bi：未知参数,12.2 用ML方法进行参数估计的步骤,如果衰变过程中：NBW个窄共振峰、Namp个相干共振峰，则m的pdf,其中：CBW、Camp、Cback为归一化常数，保证,：第k个窄共振峰事例数/总事例数,：

6、Namp个相干共振峰事例数/总事例数,BES分析软件BWFIT程序中使用的p.d.f,（二）构造似然函数,12.2 用ML方法进行参数估计的步骤,设对某物理系统进行了n次测量，x1、x2、xn,根据需要可对,在实验条件一定的条件下，事例的产生率为常数，,在时间t内获得n个事例的概率为泊松分布。,观测到n个事例，且测量量为x1、x2、xn的联合概率为,条件：必须能够精确确定,进行变化：,1. 广义似然函数（Generalized Likelihood Function）,总事例数n也是随机变量，服从平均值为的泊松分布：,广义似然函数，,优点：n对增加了附加的限制,12.2 用ML方法进行参数估计

7、的步骤,2. 数据分类情况下的似然函数,对实验数据进行分间隔处理，（如作成直方图）然后用ML方法对分类,后的数据进行处理。,优点：减小了数据量，使得对,的计算速度加快,缺点：由于将原,简化为少量的几个“平均”pdf的乘积，使得,参数估计的精度下降。,设将x的变化范围分成了N个间隔,：第i个间隔内的事例数,：某事例落入第i个间隔的概率,N个事例分布于N个间隔内，每个间隔内的事例数为n1、n2、nN,的概率满足多项式分布：,12.2 用ML方法进行参数估计的步骤,：间隔的宽度,取对数并只保留与有关的项,分间隔的似然函数（Binned Likelihood Function）,(1) N很大，,很小

8、，,(2) 如果在某一间隔内的变化不是很大，则用,得到的的精度是可接受的,12.2 用ML方法进行参数估计的步骤,例：估计粒子的平均寿命,（三）求似然函数的极大值,1. 求解似然方程：,一般情况下无解析解，只能用数值解法。,2. 用CERN程序MINUIT求解函数,的极小值，得,的估计式及其误差,探测K0粒子的产生和衰变。假定探测器无限大，则K0粒子在t时刻衰变的p.d.f,12.2 用ML方法进行参数估计的步骤,：粒子的平均寿命，为未知参数。K0的飞行时间ti,L：飞行距离，p：动量，E：能量，c：光速,对于n个观测事例：,当,时，LF取极大值。,第十二章最大似然法(Maximum Li

9、kelyhood Method),12.3 ML估计式的特性,1. 参数变换不变性,12.3 ML估计式的特性,参量来求LF的极大值，则所得的估计值亦为,如果,，则有,2. 一致性（consistency）,在一般条件下，ML估计值满足一致性条件，即,，当,时。,3. 无偏性（unbiassedness）,在某些特殊情况下，ML估计式是无偏的，即,在一般条件下，ML估计式不满足无偏性：,故当样本容量,时，ML估计式总是无偏的。,但其偏差,12.3 ML估计式的特性,如果的充分估计式t存在，则用ML方法一定能得到该估计式。,4. 充分性（sufficiency）,充分必要条件,即只依赖于t,5.

10、有效性（Efficiency）,如果的有效估计式t存在，则用ML方法一定能得到该估计式。,充分必要条件,6. 渐近正态性（Asympototic normality）,在样本容量很大时，的ML估计值满足渐近正态分布，其平均值,为的真值0，方差为最小方差限（MVB）。,第十二章最大似然法(Maximum Likelyhood Method),12.4 ML估计式的方差,12.3 ML估计式的方差,对ML估计值的误差的估计依赖于p.d.f的性质和样本的大小，不同,（一）方差估计的一般方法（适合于任何容量的样本）,通过求解似然方程,的方法适用于不同的样本；大样本公式，小样本公式。,统计误差：如果

11、p.d.f是纯理论公式，即没有对实验条件进行修正，,则由ML得到的误差为统计误差。,否则：误差统计误差实验误差,LF :,，得i的估计式,是随机变量,的函数,的真值：,12.3 ML估计式的方差,1.,此式与上式等价。,如果p.d.f和,估计式的方差。,2. 由,是,分母为归一化因子。,和,的协方差,的表达式已知，则无需任何数据就可求出,可导出,的概率分布,：雅可比行列式,3. 在给定的样本下，可认为,的概率分布函数,，而,12.3 ML估计式的方差,时，ML估计值服从正态分布N(,MVB),如果,b(）:偏差,由有效性条件,样本容量,的方差由MVB给出：,如果,是的无偏估计， b(）= 0

12、,（二）充分ML估计式的方差,是参数的充分估计式（从而也是有效估计式）。则,（三）大样本的ML估计式的方差,正态分布中变量和平均值是对称的,参数服从N(,MVB),12.3 ML估计式的方差,不同的公式给出的方差不同，因此，在给出实验结果,在一般情况下，,将式中的L 用p.d.f代替可得到方差的平均值,用此式可以估计：欲达到一定的误差，需进行的实验次数n。,指明误差是如何计算的,时，,MVB:,应由（一）中的公式求解，但很难得到,的解析解，只能用数值方法。,第十二章最大似然法(Maximum Likelyhood Method),12.5 利用似然函数进行区间估计,12.5 利用似然函数进行

13、区间估计,不同的公式给出的方差不同，因此，在给出实验结果,在一般情况下，,将式中的L 用p.d.f代替可得到方差的平均值,用此式可以估计：欲达到一定的误差，需进行的实验次数n。,指明误差是如何计算的,时，,应由（一）中的公式求解，但很难得到,的解析解，只能用数值方法。,ML估计式,的误差可用区间估计方法来估计,12.5 利用似然函数进行区间估计,其中为的真值落入a,b间的概率，取相对,对称的区间,在一般情况下，当测量次数无限大时，似然函数L 将与样本变量无关,且呈正态分布,的真值落入a,b间的可信度,，有,12.5 利用似然函数进行区间估计,是抛物线lnL ()与直线,例：,的两个交点,求解出这两个交点即可得到,的误差,实验结果,误差,MINUIT程序中误差定义量,ML方法,如果测量次数 n 为有限数，则LF 将不是正态型,12.5 利用似然函数进行区间估计,用上述方法求出g的似然区间,小结：1）最大似然原理：,为变量g的ML估计值，,ML估计值变换不变性,2）应用步骤：构造似然函数，求解似然方程,3）ML估计值的性质：一致性、无偏性、有效性和充分性,变量变换不变性、渐近正态性,4）ML估计值方差的求法：不同的方法有各自的适用范围，,给出不同的结果,5）似然区间估计给出,的误差：求解,与直线,的两个交点,

展开阅读全文